基于微单元模板与脚本批量生成并合并论文内容。Invoke when需要按微单元拆分逐单元写作并用 scripts/generate_all_offline.py 与 scripts/merge.py 自动生成论文。
scripts/generate_all_offline.py 与 scripts/merge.py,自动完成:微单元生成 → 合并 → 编号与交叉引用检查,生成可交付的论文草稿。problem-doc-model-selector),并且完成了数据计算与占位符填充,下一步需要系统地“写完所有文字”的场景。scripts/generate_all_offline.py
paper_output/tasks.json,需要批量产出微单元文本文件时。paper_output/micro_units/*.txt 和 paper_output/generate_log.json。scripts/merge.py
paper_output/final_paper.md 和 paper_output/ref_check.md。paper_output/tasks.json(由 quality-assurance-auditor/scripts/pipeline.py 生成)。step3_filled_placeholder.py 中的 PLACEHOLDER,用于把题目、模型名、结果数值写进正文。A_题意对齐.md、B_论文大纲.md、C_评分点对齐表.md、D_模型路线.json,用于指导每个微单元的写作侧重点与交叉引用。paper_output/micro_units/*.txt:每个微单元对应一个文本文件,文件名包含编号(如 ABS-1.txt)。paper_output/generate_log.json:记录每个单元的生成长度与输出路径。paper_output/final_paper.md:按任务清单顺序合并后的完整论文草稿。paper_output/ref_check.md:交叉引用与编号检查报告。problem_files/(由 QA 检查是否为空)。paper_output/tasks.json,并写入 paper_output/。quality-assurance-auditor(先生成 paper_output/tasks.json)。quality-assurance-auditor。paper-workflow-orchestrator。context-memory-keeper 以获取最新的全局约束与风格要求;特别注意检查 External Resources / Literature,确保引用的文献与 memory 中的记录一致。context-memory-keeper,更新项目进度为“论文草稿已生成”,并记录 final_paper.md 的路径。paper_output/tasks.json 已存在且可读;否则必须先调用 quality-assurance-auditor。paper_output/final_paper.md 为唯一权威合并稿;不要在根目录或其他目录另起“final_paper.md”,避免引用混乱。paper_output/final_paper.md 与 paper_output/ref_check.md 同时存在;若 ref_check.md 报断链,则视为未完成,需要修复后重跑合并。cumcm_detailed.md 中读取:
ABS-1-1、ABS-1-2、BG-1-1 等)依次调用大模型,传入:
paper_output/micro_units/,未通过的单元记录失败原因以便重试。scripts/generate_all_offline.py:
paper_output/tasks.json,逐微单元生成离线文本并写入 paper_output/micro_units/*.txt。scripts/merge.py:
paper_output/tasks.json 的顺序读取各微单元文件并合并。python-docx 库,在合并的同时直接写入 .docx 文件。$E=mc^2$),需用户使用 MathType 或 Word 自带工具渲染。ref_check.md 中会给出具体位置与建议修正方式。final_paper.md,本技能建议:
C_评分点对齐表.md:检查每个评分点至少在论文中出现一次对应的文字与图表。generate_all.py 局部重跑。problem-doc-model-selector:
paper-structured-composer:
paper-structured-composer 在章节/小节层面规划与拆分;本技能进一步细化到“句级微单元”,更适合需要精准控制字数与评分点覆盖的场景。paper-workflow-orchestrator:
paper-workflow-orchestrator 从全流程角度串联“赛题解析→数据计算→占位符→微单元→合并”;本技能专注于其中“微单元生成与合并”这一段。cumcm_detailed.md 中的拆分粒度,本技能依然适用。paper-structured-composer 在段落层面生成,不必动用完整微单元系统。以下内容用于“更细粒度微单元/接入 LLM 生成”的扩展模式;当前离线脚本不会读取。
本文件将论文拆成“章→节→段→句”四级,共 200+ 微单元,每单元给出:
可直接喂给 LLM 逐单元生成,最后自动合并。
请在整个写作过程中始终使用以下占位符,并在首次出现时替换为真实值(需在 step3_filled_placeholder.py 中定义):
| 微单元编号 | 句序 | 角色 | 输入占位符 | 输出字数 | 验收标准 | 交叉引用 |
|---|---|---|---|---|---|---|
| ABS-1-1 | 第1句 | 背景专家 | {{宏观背景}} | 15-20 | 包含{{背景关键词}}与应用领域 | 无 |
| ABS-1-2 | 第2句 | 背景专家 | {{行业痛点}} | 15-20 | 引用数据或现状说明问题的紧迫性 | 无 |
| ABS-1-3 | 第3句 | 背景专家 | {{研究价值}} | 15-20 | 明确本文方法的核心优势(如无损、高效、精准) | 无 |
| ABS-2-1 | 第4句 | 模型综述 | {{三问概述}} | 20-25 | 被动语态,概括全文解决的主要任务 | 无 |
| ABS-3-1 | 第5句 | 问题一专家 | {{问题一模型}} | 20-25 | 出现该模型的核心术语(如“规划”、“回归”、“微分方程”) | 见第1章式(1) |
| ABS-3-2 | 第6句 | 问题一专家 | {{问题一算法}} | 20-25 | 明确具体算法名称(如“遗传算法”、“最小二乘”) | 见第5章图3 |
| ABS-3-3 | 第7句 | 问题一专家 | {{问题一结果}} | 20-25 | 给出关键数值结果+单位 | 见第6章表2 |
| ABS-4-1 | 第8句 | 问题二专家 | {{问题二模型}} | 20-25 | 描述进阶模型的改进点 | 见第1章式(3) |
| ABS-4-2 | 第9句 | 问题二专家 | {{问题二算法}} | 20-25 | 提及求解策略或优化方法 | 见第5章算法2 |
| ABS-4-3 | 第10句 | 问题二专家 | {{问题二结果}} | 20-25 | 给出核心指标的改善幅度或具体数值 | 见第6章表3 |
| … | … | … | … | … | … | … |
| ABS-6-4 | 第48句 | 展望专家 | {{未来工作}} | 15-20 | 提出一种具体的可扩展方向 | 无 |
生成方法:
| 微单元 | 段内句 | 角色 | 输入 | 字数 | 验收 | 引用 |
|---|---|---|---|---|---|---|
| BG-1-1 | 1 | 宏观叙事 | {{宏观政策/趋势}} | 25-30 | 引用国家政策、行业白皮书或统计数据 | 政府文件 |
| BG-1-2 | 2 | 宏观叙事 | {{研究对象现状}} | 25-30 | 描述市场规模、发展趋势或社会影响 | 文献 [1] |
| BG-1-3 | 3 | 宏观叙事 | {{现有方法局限}} | 25-30 | 对比传统方法的不足(成本高/效率低/精度差) | 文献 [2] |
| … | … | … | … | … | … | … |
| BG-4-8 | 32 | 微观落脚 | {{具体任务目标}} | 25-30 | 明确题目要求的具体技术指标或决策目标 | 实验数据 |
按“问题一/二/三”再细分,每问 3 段:(1)重述原文→(2)学术化转写→(3)可计算任务定义
例:
| 微单元 | 句 | 角色 | 输入 | 字数 | 验收 | 引用 |
|---|---|---|---|---|---|---|
| PR1-1 | 1 | 原文引用 | 原题 Q1 一句 | ≤30 | 双引号+括号出处 | 题面 |
| PR1-2 | 2 | 学术转写 | “建立…模型”→“构建…定量框架” | 25-30 | 动词升级,将通俗语言转化为数学术语 | 无 |
| PR1-3 | 3 | 任务定义 | 输入:{{输入变量}};输出:{{输出变量}} | 20-25 | 清晰定义I/O,使用符号列表 | 见符号表 |
…以下同理,共 96 句。
每问 8 段,每段 8 句,按“漏斗”逻辑:(1)本质判定→(2)数据特征→(3)模型动机→(4)算法理由→(5)指标选取→(6)验证方案→(7)难点预告→(8)小结
例(问题一第1段):
| 微单元 | 句 | 角色 | 输入 | 字数 | 验收 | 引用 |
|---|---|---|---|---|---|---|
| AN1-1-1 | 1 | 本质判定 | {{问题一数学本质}} | 20-25 | 判定为:优化/预测/分类/评价/机理 | 文献 [3] |
| AN1-1-2 | 2 | 本质判定 | {{关键理论依据}} | 20-25 | 提及核心公式或定理名称 | 式(1) |
| … | … | … | … | … | … | … |
| AN1-1-8 | 8 | 小结 | “综上,Q1 为{{任务类型}}任务” | 15-20 | 总结任务类型,承上启下 | 无 |
每条假设拆 8 句:(1)必要性→(2)合理性→(3)简化范围→(4)影响评估→(5)数据支持→(6)反例排除→(7)文献佐证→(8)符号约定
例:假设1“{{假设1标题}}”
| 微单元 | 句 | 角色 | 输入 | 字数 | 验收 | 引用 |
|---|---|---|---|---|---|---|
| AS1-1 | 1 | 必要性 | {{假设1内容}} | 15-20 | 用“为简化…”或“考虑到…”开头 | 无 |
| AS1-2 | 2 | 合理性 | {{假设1合理性依据}} | 15-20 | 给出数据统计特征或物理常识支撑 | 附件数据 |
| … | … | … | … | … | … | … |
| AS1-8 | 8 | 符号 | 用 {{相关符号}} 表示 | ≤15 | 与符号表定义一致 | 符号表 |
每行=1 句,共 N 行,每句格式:
| 微单元 | 句 | 角色 | 输入 | 字数 | 验收 | 引用 |
|---|---|---|---|---|---|---|
| SYM-i | 1 | 表格行 | 符号、定义、单位 | 20-30 | LaTeX 格式正确,单位规范 | 无 |
每句格式:“汉字 --- 符号”
每问 24 段,按“通用建模模板”拆:
| 段序 | 段主题 | 句数 | 微单元示例 | 验收要点 |
|---|---|---|---|---|
| 1 | 机理/原理分析 | 24 | MD1-1-1~24 | 阐述变量间的逻辑或物理关系,引入{{核心变量}} |
| 2 | 数学推导/构建 | 24 | MD1-2-1~24 | 建立方程、目标函数或约束条件,推出核心公式 |
| 3 | 算法流程/策略 | 24 | MD1-3-1~24 | 描述求解步骤,给出流程图引用 |
| 4 | 核心求解过程 | 24 | MD1-4-1~24 | 展示关键代码逻辑或中间计算结果 |
| 5 | 优化/改进/联立 | 24 | MD1-5-1~24 | 处理复杂情况、多目标或参数调整 |
| 6 | 误差/不确定性 | 24 | MD1-6-1~24 | 分析误差来源或参数敏感性 |
| 7 | 结果展示 | 24 | MD1-7-1~24 | 呈现最终数值、表格或分类结果 |
| 8 | 小结 | 24 | MD1-8-1~24 | 回应问题一,重申核心结论 |
每句 15-25 字,共 192 句。
同上结构,重点在于:
重点在于:
每问 8 段:
每问 6 段:
每问 4 段:
按 GB/T 7714-2015 生成 10-15 条,每句 20-30 字。
每函数 1 段,每段 16 句:功能说明→输入参数→输出结果→关键逻辑→注释→示例调用→结果截图→小结
每图 1 段,每段 8 句:图题→坐标含义→颜色说明→图例解释→读图结论→与其他图对比→正文引用→文件路径
提供脚本:
scripts/generate_micro_unit.py运行后得到:
{
"unit_id": "ABS-1-1",
"text": "本文针对{{行业/领域}}中的{{核心问题}},通过建立{{模型名称}},利用{{算法名称}},解决了{{具体难点}},对{{应用价值}}具有重要的指导意义。",
"pass": true,
"msg": ""
}
pass=false 的单元,给出重跑提示;.md 文件;final_paper.md(完整论文)unit_log.json(每单元校验日志)ref_check.md(引用断链报告)quality-assurance-auditor,生成 paper_output/tasks.json;step3_filled_placeholder.py(可选);python .trae/skills/paper-micro-unit-generator/scripts/generate_all_offline.py 生成 paper_output/micro_units/*.txt;python .trae/skills/paper-micro-unit-generator/scripts/merge.py 生成 paper_output/final_paper.md;quality-assurance-auditor 对全文做一致性与评分点审计(可选但推荐)。 占位,合并脚本自动编号。本提示词共拆出 ≈2000 个微单元,总字数 ≈1.5 万中文字,可直接生成 国赛一等奖篇幅与深度 的完整论文。
提供脚本:
scripts/merge.py