E-SPL: Evolutionary System Prompt Learning

Source: arXiv:2602.14697v3 (February 2026) Utility: 0.90 Authors: Lunjun Zhang, Ryan Chen, Bradly C. Stadie

Description

E-SPL is a method for jointly improving LLM contexts (system prompts) and weights via RL and evolutionary optimization. It enables agentic systems to self-improve from experience.

Core Innovation: Simultaneous optimization of declarative knowledge (in prompts) and procedural knowledge (in weights).

Tools Used

llm - For prompt mutation and crossover generation
rl_framework - PPO, GRPO, or other RL algorithms for weight updates
evaluator - Task performance measurement
sqlite-kg - Knowledge graph for storing prompt evolution history

Instructions for Agents

E-SPL: Evolutionary System Prompt Learning

Source: arXiv:2602.14697v3 (February 2026) Utility: 0.90 Authors: Lunjun Zhang, Ryan Chen, Bradly C. Stadie

Description

E-SPL is a method for jointly improving LLM contexts (system prompts) and weights via RL and evolutionary optimization. It enables agentic systems to self-improve from experience.

Core Innovation: Simultaneous optimization of declarative knowledge (in prompts) and procedural knowledge (in weights).

Tools Used

llm - For prompt mutation and crossover generation
rl_framework - PPO, GRPO, or other RL algorithms for weight updates
evaluator - Task performance measurement
sqlite-kg - Knowledge graph for storing prompt evolution history

Task	Baseline	E-SPL	Improvement
AIME → BeyondAIME	38.8%	45.1%	+6.3%
Reflective Evolution	40.0%	45.1%	+5.1%
Reasoning tasks	-	↑	Consistent gains

Espl Evolutionary System Prompt

E-SPL: Evolutionary System Prompt Learning

Description

Tools Used

Instructions for Agents

Espl Evolutionary System Prompt

E-SPL: Evolutionary System Prompt Learning

Description

Tools Used

Instructions for Agents

Examples

Example 1: Self-Improving Reasoning Agent

Example 2: Multi-Task Agent Optimization

Activation Keywords

Key Concepts

1. Dual Optimization Loop

2. Genetic Operators for Prompts

3. Performance-Based Selection

Implementation Guide

Step 1: Initialize Prompt Population

Step 2: Parallel Trajectory Sampling

Step 3: RL Weight Update

Step 4: Prompt Evolution

Step 5: Repeat Until Convergence

Results (Paper)

When to Use

Integration with Existing Workflows

Self-Evolution Workflow

Knowledge Architecture

Code Reference

Limitations

Continuous Learning V2

Continuous Learning V2

Continuous Learning V2

Continuous Learning

Continuous Learning

Pytorch Patterns

Espl Evolutionary System Prompt

E-SPL: Evolutionary System Prompt Learning

Description

Tools Used

Instructions for Agents

Espl Evolutionary System Prompt

E-SPL: Evolutionary System Prompt Learning

Description

Tools Used

Instructions for Agents

Examples

Example 1: Self-Improving Reasoning Agent

Example 2: Multi-Task Agent Optimization

Activation Keywords

Key Concepts

1. Dual Optimization Loop

2. Genetic Operators for Prompts

3. Performance-Based Selection

Implementation Guide

Step 1: Initialize Prompt Population

Step 2: Parallel Trajectory Sampling

Step 3: RL Weight Update

Step 4: Prompt Evolution

Step 5: Repeat Until Convergence

Results (Paper)

When to Use

Integration with Existing Workflows

Self-Evolution Workflow

Knowledge Architecture

Code Reference

Limitations

Related Skills

Continuous Learning V2

Continuous Learning V2

Continuous Learning V2

Continuous Learning

Continuous Learning

Pytorch Patterns