双层模式阅读科研论文并校验笔记——先忠实对齐原文、再解释物理图景,内置校验流程。支持 LaTeX 源码和 PDF 输入,可自定义存放目录。 Use when the user asks to read, interpret, or explain research paper sections, equations, or LaTeX fragments, or says "读", "先读", "新论文", "读论文", "读公式", "检查", "校验".
双层阅读:忠实对齐原文 + 帮助理解物理。
首次使用或遇到新论文时,向用户确认以下信息(若当前项目有 workspace rule 已指定,则以 workspace rule 为准,跳过询问):
| 格式 | 推荐度 | 说明 |
|---|---|---|
| LaTeX 源码 | ⭐ 推荐 | 公式精确、段落清晰、可逐句编号 |
| 可用 | 公式可能乱码、段落边界模糊、表格易丢失 |
PDF 输入时提醒用户:「PDF 提取的文本可能有公式乱码或段落错位,建议优先使用 LaTeX 源码。」
询问用户论文和笔记的存放位置。默认结构:
<project-root>/
├── papers/<id>/ # 原始文献(只存不改)
│ ├── main.tex / paper.pdf
│ └── figures/
├── readings/<id>/ # 阅读笔记(每篇一个文件夹)
│ ├── §1.md, §2.md, ...
│ ├── 总纲.md
│ ├── 故事版.md
│ └── 图表版.md
└── index.md # 文献索引
用户可自定义目录名(如 literature/ 代替 papers/)。确认后在会话中记住配置。
用户说「读 §X」时,按 subsection 为单位输出。若无 subsection,按 3–5 段为一个自然单位。
每个单位包含 6 栏目:
原文的完整、逐字英文(verbatim)。每个段落编号 [¶N]。
... 省略、多段合并\cite 替换为作者名,句子本身不可删减逐句直译,紧贴原文语序。每段编号 [¶N 译],与 [¶N] 成对。
通俗重述,标注逻辑角色和限定词。
物理图景概述:物理对象、过程、控制参数、近似、推进了论文哪一步。
列出公式,每个给出:
非平凡操作(多了导数、特定分解等)必须解释物理或几何来源。
标出:原文直说 / 忠实重述 / Agent 补充 / 仍然模糊。
「读 §2」→ 从 §2.1 开始,完成后等用户说「下一段」继续 §2.2。
对追问的片段展开完整 7 栏目:
遇到公式按此顺序输出:
动机回答的是"为什么要这么写",不是解释符号:
涉及非平凡数学操作(为什么多了导数、为什么取 Fourier 变换)时,必须解释物理或几何来源。
每句解释必须标明来源:
| 口令 | 动作 |
|---|---|
读 §X | 逐段输出 6 栏目,写入笔记文件 |
读公式 (X) | 按公式处理规则输出 8 步 |
鸟瞰 §X | 快速概览结构、假设、结论(不逐句) |
串联公式 | 梳理关键公式的推导依赖关系 |
回顾 | 总结最近读过内容的逻辑推进线 |
批判 | 审视关键假设、近似、跳步 |
下一段 | 继续当前 section 的下一段 |
检查 §X | 六步校验:原文完整性、翻译忠实度、物理正确性、公式准确性、来源标注、追问质量 |
检查总纲 | 校验总纲中的一句话问题、核心想法、关键数字、结论/局限 |
检查图表版 | 校验图表版中的图描述、物理解释、来源标注、图间逻辑衔接 |
写总纲 | 五问总纲,输出到 总纲.md |
写故事版 | 通俗物理叙事,输出到 故事版.md |
写图表版 | 逐图逐表解读,输出到 图表版.md |
先读 / 新论文 | 快速通读,一次性生成 总纲 → 故事版 → 图表版,然后自动校验 |
以下操作完成后,必须自动运行对应的校验,不需要用户额外说「检查」:
| 触发操作 | 自动执行的校验 |
|---|---|
先读 / 新论文 | 依次校验总纲 → 故事版 → 图表版 |
写总纲 | 校验总纲 |
写故事版 | 校验故事版(物理正确性 + 来源标注) |
写图表版 | 校验图表版 |
读 §X 写入笔记后 | 校验该节笔记 |
校验发现问题时当场修正,修正记录追加到文件末尾。
| 文件 | 定位 | 阅读时间 |
|---|---|---|
总纲.md | 全局理解 | 5 分钟 |
故事版.md | 物理直觉 | 20 分钟 |
图表版.md | 证据链条 | 30 分钟 |
§N.md | 逐句精读 | 按需 |
# <论文标题> — 五问总纲
## 1. 问题是什么(What problem)
> 一句话版:______
### 领域原来有什么问题
### 为什么重要
### 以前的方法为什么不够
## 2. 核心想法(Why it works)
> 这个方法之所以有效,是因为 ______
### 关键洞察
### 与现有方法的本质区别
## 3. 技术实现(How it is done)
### 方法流水线:problem → observation → idea → method → result
### 解析部分(一段话)
### 数值部分(一段话)
### 关键近似和假设
## 4. 证据(What evidence)
### 最重要的 3 张图(每张一句话)
### 关键数字
## 5. 结论与影响
### 核心结论(≤3 条)
### 对领域的影响
### 局限性和开放问题
## 6.(进阶)如果我是作者,我怎么想到这个 idea?
problem → observation → insight → method 的思维链
生成图表版时,自动将论文图片(PDF/PS/EPS)转为 WebP(存在原目录),并在 Markdown 中用相对路径引用。转换命令:
cd papers/<id>/
for f in *.pdf *.ps *.eps; do
[ -f "$f" ] && magick -density 200 "$f" -resize '800x800>' -quality 80 -flatten -strip "${f%.*}.webp"
done
每张图的格式:
## Figure X — 一句话标题
**文件**:`figX.webp` | **对应章节**:§Y | **关键公式**:Eq.Z

### 图说什么
(caption 忠实翻译 + 补充)
### 怎么看
(横轴纵轴、关键曲线/区域、特征)
### 需要理解的物理
(公式、概念、近似条件,标注 [原文]/[补充])
# <论文标题>
- **arXiv**: <id>
- **作者**: ...
- **阅读日期**: YYYY-MM-DD
## Section X: <标题>
(按 6 栏目模板输出)
## 关键公式汇总
检查 / 校验 / check 触发)对笔记进行逐项校验。必须回到原始源文件核对,不能凭记忆判断。
逐段将笔记中的 Original Text 与源文件比对:
✅ ¶1 — 原文正确
⚠️ ¶3 — 遗漏:原文还提到 XXX
❌ ¶7 — 公式 (X) 符号抄错:原文是 A,笔记写成 B
检查 Literal Translation 是否忠实:
✅ ¶1 译 — 忠实
⚠️ ¶6 译 — "mainly because" 的"主要"被省略
❌ ¶9 译 — 原文 "suggests"(暗示),译成了"证明",语气过强
检查 Faithful Paraphrase、Physics Meaning、追问中的物理内容:
## 校验结果
- 原文引用:X/Y 段正确,Z 处有问题
- 翻译忠实度:整体良好 / 有 N 处需修正
- 物理内容:正确 / 有 N 处需注意
- 来源标注:准确 / 有 N 处需修正
... 省略。[¶N] + [¶N 译],禁止多段合并。[¶N] 后紧跟 [¶N 译]。$...$,独立 $$...$$。> 引用语法,直接写正文。[¶1] / [¶1 译]。### 标题分隔。index.md 追加记录(arXiv ID / 标题 / 主题 / 阅读日期)。index.md 由主 agent 统一更新:子 agent 不直接写 index.md,而是在返回结果中附带论文元信息(arXiv ID、标题、主题),由主 agent 汇总后一次性写入,避免重复和冲突。