基于代码仓库、笔记、实验数据或论文要求,全自动智能撰写学术论文初稿的主线管线。强制分章逐批检索代码、分步输出,内置规避上下文超限机制和人工审核卡点,无缝衔接格式化引擎。内置严格的学术 Prompt 准则与多模态图表检索能力。
本 Skill 专用于 Pipeline D。解决"有项目、有数据但没时间写规范八股文"的痛点,将源码或离散数据提炼串联成结构完整的学术论文初稿,严格控制幻觉和上下文崩溃,并绝对保障顶级学术论文的遣词造句与深度论证标准。
物料存放在工作区,包括:
resources/samples/:要求文件或参考的优秀范例文献(PDF/DOCX/MD),非必须但如有则优先。resources/outline.md:大纲定义文件(在第一阶段由系统生成,供用户自由提件与修改)。<用户代码/数据目录>:论文本体依托的大型项目/数据集目录及其各类脚本日志。本工程严格采用 延迟加载 (Lazy Loading) 和 按需检索 (Just-in-Time Context) 设计哲学,避免大型项目全量读取导致的上下文溢出。
[!IMPORTANT] 大模型在执行所有的章节输出时,必须在系统层强制包裹以下 Prompt 约束,严禁出现诸如“毒舌”、“兄弟”、“代码长这样”等随意字眼或过度拟人化的表达。
在撰写任何正文时,必须带入以下系统人设框架:
Role: Act as an expert academic researcher and post-graduate thesis advisor in the domain of Computer Science & Software Engineering. Guidelines for Tone & Style:
- Maintain Formality: 采用绝对客观、第三人称陈述、精确无歧义的学术性书写风格(Formal, objective, and precise)。杜绝口语化、第一人称情绪发散及非专业俳语。
- Academic Rigor: 从算法复杂度、时空开销、架构解耦 (Decoupling) 等维度对工程代码进行学术升华。必须突出"为什么 (Design Rationale)"和"权衡 (Trade-offs)",而非仅仅陈述"是什么"。
- Rich Formatting: 当列举功能集、API 规范、硬件配置或测试基准时,必须强制输出标准的 Markdown 表格 (Tables) 进行横向维度的专业化对比。
- Visual & Diagram Evidence: 禁止干枯的纯文字堆砌。针对任何架构交互、时序调用或组件流转,必须使用
Mermaid.js时序图/状态机或架构图。
[!CAUTION] 铁律 (IRON RULE):知识隔离指令(详见主 SKILL.md §11) 用户提供的项目代码和素材是唯一的事实来源 (Source of Truth)。Agent 禁止使用自身训练数据中的"记忆"来填补任何信息空缺。如果某个技术细节在项目代码中找不到依据,必须标注
[素材缺口]并暂停该段落,而非凭想象补全。
当用户提供了会议特定的“要求说明(Call for Papers)”或“参考样例”时,首先通过局部精读提取该会议或期刊习惯的八股文结构、次级标题命名偏好、图表归纳频次及典型引用规范。
outline.md综合用户的初步想法、工程的根目录 README.md 与参考范例,生成 resources/outline.md。内容必须囊括:
生成大纲后,必须调用 notify_user 强阻断大模型执行流等待人工确认或修改。
grep_search 或检索特定算法核心类。[!CAUTION] 撰写 Implementation (核心代码实现) 的避坑指南:
- 拒绝无脑贴代码:严禁连续抛出超过 30 行的代码。代码块展示必须“极尽精简”,只摘录状态机扭转、核心事务拦截或特定的核心算法。
- 深度分析架构设计:必须配有“代码逻辑解析”:如使用了什么设计模式?为何采用该异步库?如何防范死锁?
- 图文并茂:在进入核心逻辑解析前,先调用互联网搜索查证最权威的高清架构原理图(如 TCP握手图、LLM Transformer 图例等),或渲染核心流程的 Mermaid 序列图,再进行行级别的精剖。
outline.md 获取素材并用平实考究的学术语言撰写为 resources/md/section_{current_unit}.md。在所有分章生成完毕后,不要急于交由自动排版,必须依次执行以下三个门禁:
wc -m 或 Python 脚本)精确计算生成的合并 .md 的中文字符总量。![ 和 |---|(表格)标记,统计其实际数量。必须确保每个大章节至少具有 1-2 张架构配图与对应的 1-2 份三线比对表格。grep 排查是否存在未处理的 [TODO] 或极短的空壳章节。物理 QA 通过后,必须执行主 SKILL.md §9 定义的 7 模式阻断清单,逐项检查实现漏洞伪装、数据编造、方法论漂移、引文幻觉、捷径依赖、空壳章节、重复论述。全部通过后生成 resources/integrity_report.md。
诚信门禁通过后,Agent 必须切换为 6 种审稿人人格(结构/技术/语言/数据/格式/魔鬼辩护人)进行多维度评分。语言审稿人环节必须执行主 SKILL.md §12 的中文 AI 高频词 25 词警报、句式多样性检测、清嗓子开头检测与标点控制等子规则。总分 ≥ 80 方可移交排版;< 80 则返工修订并重新评分,并使用主 SKILL.md §13 的分数轨迹追踪确保每轮修订不出现维度退化。
[!CAUTION] 严禁使用 Pandoc 进行 Markdown 到 Word 的一键直转! Pandoc 会丢失所有针对中国学位论文或顶会要求的高度定制化格式(如三线表渲染、首行缩进强绑定等)。
resources/compiled_paper.md。config.json 的 pipeline 标记为 "C"(表示 MD 已就绪)。docx/SKILL.md 中定义的 docx-js (Node引擎) 进行排版组装,或者在生成后使用原生的 unpack -> edit XML -> pack 底层手术替换格式文件,确保所有的排版参数 100% 对齐(如严格的中英文字体映射与学术表格规范)。