Name: Exam Gen
Author: cintia09

Skills suchen.../

Exam Gen | Skills Pool

三份一致 → 高置信度采纳，但仍需抽验计算过程

两份一致、一份不同 → 追问链：

分歧: 卷A和卷C答案为B，卷B答案为D
Why 1: 卷B的解题过程哪一步和A/C不同？
→ 定位具体分歧步骤
Why 2: 该步骤的推导是否正确？代入验算
→ 确认谁对谁错
Why 3: 错误版本的题目本身是否有问题（条件不足/多解）？
→ 如果是题目问题，三份可能都不对
结论: 采纳正确版本，或修正题目后重新求解

三份都不同 → 红旗！题目很可能有歧义或过难：

Why 1: 三个不同答案分别是怎么得出的？
Why 2: 题目条件是否充分？是否存在多解？
Why 3: 如果题目有缺陷，能否微调条件使答案唯一？
结论: 修正题目 或 从备选题库替换

时机	汇报内容
任务启动	"开始生成X科试卷，预计N分钟，流程：三路生成→交叉质询→组卷"
每个子代理完成	"卷A(GPT-5.2)已完成/卷B(Opus-4.5)已完成，还剩X个"
交叉质询开始	"三份试卷已收齐，开始交叉质询..."
质询完成	"质询完成，X题需修正/替换，开始组卷"
最终交付	"试卷已生成，文件路径：...，附质检摘要"

cron add:
  name: "exam-progress-{科目}"
  schedule: { kind: "every", everyMs: 120000 }  # 每2分钟
  sessionTarget: "isolated"
  payload:
    kind: "agentTurn"
    message: |
      检查试卷生成进度。
      用 sessions_list 查看以下label的子代理状态：
      - {route-A-label}
      - {route-B-label}  
      - {route-C-label}
      - {review-label}（如已启动）
      - {assemble-label}（如已启动）
      
      对每个子代理：
      1. 是否已完成？（看sessions_list的状态）
      2. 如已完成，用sessions_history读最后一条消息，提取关键信息（结构是否合规、有无硬伤）
      3. 如还在跑，报告已用时间
      
      汇总后发飞书通知用户，格式：
      📝 {科目}试卷生成进度
      ✅ 路A(GPT-5.2): 已完成，结构合规
      ⏳ 路B(Opus-4.5): 进行中(已2分钟)
      ⏳ 路C(Opus-4.6): 排队中
      下一步: 等路B/C完成后启动交叉质询
      
      如果全部子代理已完成且组卷也完成，发送最终通知并自行删除此cron job（cron remove）。
    model: "github-copilot/gpt-4.1"  # 轻量模型够用
    timeoutSeconds: 60
  delivery: { mode: "none" }  # 由任务自己发飞书，不要announce

\documentclass[12pt,a4paper]{article}
\usepackage[UTF8]{ctex}
\usepackage{geometry}
\usepackage{amsmath,amssymb,amsthm}
\usepackage{tikz,pgfplots}
\usepackage{enumitem}
\usepackage{fancyhdr}
\usetikzlibrary{calc,patterns,angles,quotes,arrows.meta,3d,positioning}
\pgfplotsset{compat=1.18}
\geometry{left=2.5cm,right=2.5cm,top=2.5cm,bottom=2.5cm}
% ... 题目内容 ...
% \newpage
% ... 参考答案与解析 ...
\end{document}

xelatex -interaction=nonstopmode 试卷.tex
# 如需交叉引用，跑第二遍
xelatex -interaction=nonstopmode 试卷.tex

pandoc 试卷.md -o 试卷.pdf \
  --pdf-engine=xelatex \
  -V CJKmainfont="Noto Sans CJK SC" \
  -V geometry:margin=2cm \
  -V geometry:a4paper \
  -V fontsize=11pt \
  -V linestretch=1.3 \
  --columns=80

xelatex -interaction=nonstopmode 试卷.tex
# 如需交叉引用，跑第二遍
xelatex -interaction=nonstopmode 试卷.tex

# 正确示例
行内公式用单美元号：已知 $a_n = 2n - 1$，求 $S_n$。
独立公式用双美元号：
$$S_n = \frac{n(a_1 + a_n)}{2}$$

# 错误示例（pandoc不兼容）
行内公式用 \(a_n = 2n - 1\)  ← 不要用
独立公式用 \[S_n = ...\]  ← 不要用

子代理	推荐模型	说明
卷A	`openai/gpt-5.2`	擅长长内容生成
卷B	`github-copilot/claude-opus-4.5`	推理严谨
卷C	`github-copilot/claude-opus-4.6`	综合能力强

Exam Gen

通用试卷生成（exam-gen）

1. 触发场景

2. 输入（必须收集的信息）

必填

选填（强烈建议）

Exam Gen

通用试卷生成（exam-gen）

1. 触发场景

2. 输入（必须收集的信息）

必填

选填（强烈建议）

3. 若未提供结构：先"查标准结构"再出题

3.5 出题前必做功课（三查）

一查：考试大纲/课程标准

二查：教科书内容

三查：最新真实试卷

参考资料存储

子代理prompt中必须包含

4. 生成策略：多模型交叉生成 + 交叉验收 + 组卷

4.1 三路并行生成

4.2 交叉质询（核心环节，必须做）

质询流程（5轮）

交叉质询的执行方式

4.4 进度汇报（必须做）

4.5 Cron进度追踪（长任务必起）

启动方式

关键规则

何时不需要cron

4.6 组卷输出

5. 质检清单（交付前必过）

5.1 结构与分值

5.2 答案唯一性与可判定性

5.3 难度梯度

5.4 题面质量与图形

5.5 进度汇报（必须做）

5.6 PDF交付前检查

6. 输出规范

⚠️ 默认输出格式：LaTeX + TikZ（必须带图）

LaTeX+TikZ要求

LaTeX文件结构模板

编译命令

长文件写入策略

Markdown仅作备用

7. 参考真题结构（优先级最高）

8. 踩坑经验（血泪总结）

8.1 生成质量类

8.2 格式与工程类

8.3 流程类

9. PDF生成方案

9.1 推荐方案：pandoc + xelatex

9.2 不要用weasyprint

9.3 LaTeX版直接编译

10. Markdown公式书写规范

Update Skills

Eval Harness

Ecc Tools Cost Audit

Code Tour

Rules Distill

Design System