管理 AI 日记回复的 prompt 版本,支持 A/B 对比测试和 LLM 自动评分。
使用
# 列出所有 prompt 版本
python ~/dev/dear-diary-skills/ai-prompt-lab/scripts/prompt_lab.py list
# 保存一个 prompt 版本(从文件读取)
python ~/dev/dear-diary-skills/ai-prompt-lab/scripts/prompt_lab.py save \
--name v2-empathy --file prompt.txt --type reply
# 用同一输入对比两个版本的输出
python ~/dev/dear-diary-skills/ai-prompt-lab/scripts/prompt_lab.py test \
--v1 v1-default --v2 v2-empathy --input "今天和朋友吵架了,心情很差"
# LLM-as-judge 自动评分对比
python ~/dev/dear-diary-skills/ai-prompt-lab/scripts/prompt_lab.py judge \
--v1 v1-default --v2 v2-empathy --input "今天和朋友吵架了"
Prompt 类型
| 类型 | 说明 | 对应 aiService.ts |
|---|
reply | 日记回复 prompt | analyzeDiarySentiment |
summary | 摘要 prompt | analyzeDiarySentiment (summary) |
|