Name: Paper Micro Unit Generator
Author: yushui2022

论文微单元批量生成与合并器

目标

配合 scripts/generate_all_offline.py 与 scripts/merge.py，自动完成：微单元生成 → 合并 → 编号与交叉引用检查，生成可交付的论文草稿。

适用时机

用户已经明确采用 CUMCM 风格的细粒度拆分模板，希望把一篇大论文拆成大量小片段，逐步生成并自动合并时。
已经有题意对齐与模型路线（例如来自 problem-doc-model-selector），并且完成了数据计算与占位符填充，下一步需要系统地“写完所有文字”的场景。

脚本清单（本技能实际会用到的）

scripts/generate_all_offline.py
- 何时用：已有 paper_output/tasks.json，需要批量产出微单元文本文件时。
- 做什么：生成 paper_output/micro_units/*.txt 和 paper_output/generate_log.json。
scripts/merge.py
- 何时用：微单元已生成（或部分生成），需要合并成一份可读的论文草稿时。
- 做什么：生成 paper_output/final_paper.md 和 paper_output/ref_check.md。

论文微单元批量生成与合并器

目标

配合 scripts/generate_all_offline.py 与 scripts/merge.py，自动完成：微单元生成 → 合并 → 编号与交叉引用检查，生成可交付的论文草稿。

适用时机

用户已经明确采用 CUMCM 风格的细粒度拆分模板，希望把一篇大论文拆成大量小片段，逐步生成并自动合并时。
已经有题意对齐与模型路线（例如来自 problem-doc-model-selector），并且完成了数据计算与占位符填充，下一步需要系统地“写完所有文字”的场景。

脚本清单（本技能实际会用到的）

scripts/generate_all_offline.py
- 何时用：已有 paper_output/tasks.json，需要批量产出微单元文本文件时。
- 做什么：生成 paper_output/micro_units/*.txt 和 paper_output/generate_log.json。
scripts/merge.py
- 何时用：微单元已生成（或部分生成），需要合并成一份可读的论文草稿时。
- 做什么：生成 paper_output/final_paper.md 和 paper_output/ref_check.md。

微单元编号	句序	角色	输入占位符	输出字数	验收标准	交叉引用
ABS-1-1	第1句	背景专家	{{宏观背景}}	15-20	包含{{背景关键词}}与应用领域	无
ABS-1-2	第2句	背景专家	{{行业痛点}}	15-20	引用数据或现状说明问题的紧迫性	无
ABS-1-3	第3句	背景专家	{{研究价值}}	15-20	明确本文方法的核心优势（如无损、高效、精准）	无
ABS-2-1	第4句	模型综述	{{三问概述}}	20-25	被动语态，概括全文解决的主要任务	无
ABS-3-1	第5句	问题一专家	{{问题一模型}}	20-25	出现该模型的核心术语（如“规划”、“回归”、“微分方程”）	见第1章式(1)
ABS-3-2	第6句	问题一专家	{{问题一算法}}	20-25	明确具体算法名称（如“遗传算法”、“最小二乘”）	见第5章图3
ABS-3-3	第7句	问题一专家	{{问题一结果}}	20-25	给出关键数值结果+单位	见第6章表2
ABS-4-1	第8句	问题二专家	{{问题二模型}}	20-25	描述进阶模型的改进点	见第1章式(3)
ABS-4-2	第9句	问题二专家	{{问题二算法}}	20-25	提及求解策略或优化方法	见第5章算法2
ABS-4-3	第10句	问题二专家	{{问题二结果}}	20-25	给出核心指标的改善幅度或具体数值	见第6章表3
…	…	…	…	…	…	…
ABS-6-4	第48句	展望专家	{{未来工作}}	15-20	提出一种具体的可扩展方向	无

微单元	段内句	角色	输入	字数	验收	引用
BG-1-1	1	宏观叙事	{{宏观政策/趋势}}	25-30	引用国家政策、行业白皮书或统计数据	政府文件
BG-1-2	2	宏观叙事	{{研究对象现状}}	25-30	描述市场规模、发展趋势或社会影响	文献 [1]
BG-1-3	3	宏观叙事	{{现有方法局限}}	25-30	对比传统方法的不足（成本高/效率低/精度差）	文献 [2]
…	…	…	…	…	…	…
BG-4-8	32	微观落脚	{{具体任务目标}}	25-30	明确题目要求的具体技术指标或决策目标	实验数据

微单元	句	角色	输入	字数	验收	引用
PR1-1	1	原文引用	原题 Q1 一句	≤30	双引号+括号出处	题面
PR1-2	2	学术转写	“建立…模型”→“构建…定量框架”	25-30	动词升级，将通俗语言转化为数学术语	无
PR1-3	3	任务定义	输入：{{输入变量}}；输出：{{输出变量}}	20-25	清晰定义I/O，使用符号列表	见符号表

微单元	句	角色	输入	字数	验收	引用
AN1-1-1	1	本质判定	{{问题一数学本质}}	20-25	判定为：优化/预测/分类/评价/机理	文献 [3]
AN1-1-2	2	本质判定	{{关键理论依据}}	20-25	提及核心公式或定理名称	式(1)
…	…	…	…	…	…	…
AN1-1-8	8	小结	“综上，Q1 为{{任务类型}}任务”	15-20	总结任务类型，承上启下	无

微单元	句	角色	输入	字数	验收	引用
AS1-1	1	必要性	{{假设1内容}}	15-20	用“为简化…”或“考虑到…”开头	无
AS1-2	2	合理性	{{假设1合理性依据}}	15-20	给出数据统计特征或物理常识支撑	附件数据
…	…	…	…	…	…	…
AS1-8	8	符号	用 {{相关符号}} 表示	≤15	与符号表定义一致	符号表

段序	段主题	句数	微单元示例	验收要点
1	机理/原理分析	24	MD1-1-1~24	阐述变量间的逻辑或物理关系，引入{{核心变量}}
2	数学推导/构建	24	MD1-2-1~24	建立方程、目标函数或约束条件，推出核心公式
3	算法流程/策略	24	MD1-3-1~24	描述求解步骤，给出流程图引用
4	核心求解过程	24	MD1-4-1~24	展示关键代码逻辑或中间计算结果
5	优化/改进/联立	24	MD1-5-1~24	处理复杂情况、多目标或参数调整
6	误差/不确定性	24	MD1-6-1~24	分析误差来源或参数敏感性
7	结果展示	24	MD1-7-1~24	呈现最终数值、表格或分类结果
8	小结	24	MD1-8-1~24	回应问题一，重申核心结论

Paper Micro Unit Generator

论文微单元批量生成与合并器

目标

适用时机

脚本清单（本技能实际会用到的）

Paper Micro Unit Generator

论文微单元批量生成与合并器

目标

适用时机

脚本清单（本技能实际会用到的）

输入

输出

目录约定（与项目全局对齐）

前后衔接

约束（必须遵守）

工作流程

1. 准备微单元模板与占位符

2. 单元级生成策略

3. 批量生成脚本协同

4. 合并与自动编号

5. 验收与调整

与其他技能的关系

防跑偏检查

何时不必使用本技能

附录 A：扩展材料（可选）

CUMCM 论文分步生成提示词（超详细版）

0. 前置公共变量

1. 摘要（≈800 字，6 段，48 句）

2. 问题重述（≈1500 字，2 节，12 段，96 句）

2.1 问题背景（≈400 字，4 段，32 句）

2.2 问题提出（≈1100 字，8 段，64 句）

3. 问题分析（≈1000 字，3 节，24 段，192 句）

4. 模型假设（≈600 字，6 条，48 句）

5. 符号说明（≈800 字，表格+清单，2 节，16 段，128 句）

5.1 符号定义表（自动脚本生成）

5.2 纯文本对照清单（自动脚本生成）

6. 模型建立与求解（≈3000 字，3 节，72 段，576 句）

6.1 问题一（基础模型，8 段，192 句）

6.2 问题二（进阶/复杂模型，8 段，192 句）

6.3 问题三（综合评价/推广/应用，8 段，192 句）

7. 结果分析与可视化（≈1500 字，3 节，24 段，192 句）

8. 模型检验（≈1200 字，3 节，18 段，144 句）

9. 结论与建议（≈800 字，3 节，12 段，96 句）

10. 不足与展望（≈600 字，2 段，48 句）

11. 参考文献（≈400 字，自动脚本）

12. 附录（≈2000 字，代码+图表）

12.1 核心代码（Python/MATLAB）

12.2 附加图表

自动化脚本

合并流程

使用步骤

扩展说明

附录 B：合并脚本

Feishu Doc

Summarize

Nano Pdf

Diffs

Customs Trade Compliance

Nutrient Document Processing