Generate high-quality synthetic instruction-response pairs at scale for fine-tuning LLMs. Covers Self-Instruct (bootstrapping from seed tasks), Evol-Instruct (iteratively evolving complexity), and distillation-based generation (using strong model outputs as training data). Includes quality filtering, deduplication, and formatting for training pipelines.

When to use this skill

Use this skill when:

bootstrapping an instruction-tuning dataset from a small set of seed examples (Self-Instruct)
evolving instructions for increasing complexity and diversity (Evol-Instruct / WizardLM approach)
distilling outputs from a strong model (GPT-4, Claude) into training data for a smaller model
generating domain-specific synthetic data: code, math, reasoning chains, or multi-turn conversations
filtering and deduplicating generated data for training quality
running batch inference with vLLM or API calls for large-scale generation

Do not use this skill when

the task is fine-tuning on the generated data — prefer instruction-tuning

When to use this skill

Use this skill when:

bootstrapping an instruction-tuning dataset from a small set of seed examples (Self-Instruct)
evolving instructions for increasing complexity and diversity (Evol-Instruct / WizardLM approach)
distilling outputs from a strong model (GPT-4, Claude) into training data for a smaller model
generating domain-specific synthetic data: code, math, reasoning chains, or multi-turn conversations
filtering and deduplicating generated data for training quality
running batch inference with vLLM or API calls for large-scale generation

Do not use this skill when

the task is fine-tuning on the generated data — prefer instruction-tuning

from openai import OpenAI client = OpenAI() response = client.chat.completions.create( model="gpt-4o", messages=[{"role": "user", "content": instruction}], temperature=0.7, max_tokens=2048, )

Purpose

When to use this skill

Do not use this skill when

Purpose

When to use this skill

Do not use this skill when

Operating procedure

Decision rules

Output requirements

References

Failure handling

Continuous Learning V2

Continuous Learning V2

Continuous Learning V2

Continuous Learning

Continuous Learning

Pytorch Patterns

Purpose

When to use this skill

Do not use this skill when

Purpose

When to use this skill

Do not use this skill when

Operating procedure

Decision rules

Output requirements

References

Related skills

Failure handling

Continuous Learning V2

Continuous Learning V2

Continuous Learning V2

Continuous Learning

Continuous Learning

Pytorch Patterns