Name: Self Learning
Author: Salahsr01

Self Learning

Systeme d'auto-apprentissage et d'experimentation pour l'agent Promethia. Utiliser quand les resultats sont en dessous des objectifs, quand il faut tester une nouvelle technique, analyser pourquoi quelque chose n'a pas marche, optimiser une campagne, ou ameliorer une strategie. Ce skill est le moteur d'amelioration continue de l'agent - il fait de l'agent un systeme qui apprend de ses erreurs et s'ameliore avec le temps.

Salahsr010 星标2026年2月19日

职业
分类: 机器学习

Auto-Apprentissage et Experimentation

Principe fondamental

L'agent ne repete JAMAIS une strategie qui echoue sans la modifier. L'agent teste TOUJOURS au moins une variante a chaque nouveau cycle. L'agent documente TOUT : succes, echecs, hypotheses, resultats.

Boucle d'apprentissage (OODA Loop adapte)

A chaque cycle heartbeat (30 min) :

1. OBSERVER : Lire memory/metrics/current.md
   → Quels sont les chiffres actuels vs objectifs ?

2. ORIENTER : Analyser les ecarts
   → Pourquoi le taux de reponse est en dessous de 8% ?
   → Quel pattern commun dans les emails qui marchent ?
   → Quel pattern commun dans les emails qui echouent ?

3. DECIDER : Choisir une action d'amelioration
   → Tester un nouveau framework (PAS → AIDA)
   → Changer le timing d'envoi (matin → apres-midi)
   → Modifier l'accroche (trigger different)
   → Cibler un nouveau segment

4. AGIR : Executer le test et documenter
   → Lancer la variante sur un petit batch (20-50 prospects)
   → Stocker l'experience dans memory/experiments/

Auto-Apprentissage et Experimentation

Principe fondamental

L'agent ne repete JAMAIS une strategie qui echoue sans la modifier. L'agent teste TOUJOURS au moins une variante a chaque nouveau cycle. L'agent documente TOUT : succes, echecs, hypotheses, resultats.

Boucle d'apprentissage (OODA Loop adapte)

A chaque cycle heartbeat (30 min) :

1. OBSERVER : Lire memory/metrics/current.md
   → Quels sont les chiffres actuels vs objectifs ?

2. ORIENTER : Analyser les ecarts
   → Pourquoi le taux de reponse est en dessous de 8% ?
   → Quel pattern commun dans les emails qui marchent ?
   → Quel pattern commun dans les emails qui echouent ?

3. DECIDER : Choisir une action d'amelioration
   → Tester un nouveau framework (PAS → AIDA)
   → Changer le timing d'envoi (matin → apres-midi)
   → Modifier l'accroche (trigger different)
   → Cibler un nouveau segment

4. AGIR : Executer le test et documenter
   → Lancer la variante sur un petit batch (20-50 prospects)
   → Stocker l'experience dans memory/experiments/

Self Learning

Auto-Apprentissage et Experimentation

Principe fondamental

Boucle d'apprentissage (OODA Loop adapte)

A chaque cycle heartbeat (30 min) :

Self Learning

Auto-Apprentissage et Experimentation

Principe fondamental

Boucle d'apprentissage (OODA Loop adapte)

A chaque cycle heartbeat (30 min) :

Systeme d'experimentation (Multi-Armed Bandit)

Principe

Variables a tester

Format d'une experience

Playbook evolutif

Concept

Detection automatique des problemes

Seuils d'alerte (declencher un cycle d'apprentissage)

Actions par type de probleme

Reflexion (apres chaque batch de 50 emails)

Metriques d'apprentissage

Continuous Learning V2

Continuous Learning V2

Continuous Learning V2

Continuous Learning

Continuous Learning

Pytorch Patterns