论文阅读辅助工具。将 PDF 论文通过 MinerU 转换为 Markdown,翻译为中文,生成结构化研究报告和三遍阅读法指南。触发条件:用户提到阅读论文、读论文、paper reading、论文翻译、论文解读、/paper-reading 等。
本 skill 提供一站式论文阅读辅助流程,拆分为四个独立 Phase(阶段)。 每个 Phase 是一个自然的对话断点,用户可以在任意 Phase 间暂停或跳过。
| Phase | 名称 | 对话轮次 | 产出 |
|---|---|---|---|
| Phase 1 | PDF → Markdown | 1 轮 | markdown/full.md + images/ |
| Phase 2 | 全文翻译 | 1 轮(长论文最多 2 轮) | translated/full_cn.md |
| Phase 3 | 阅读指南 + 报告 | 1 轮 | reading_guide.md + report.md |
| Phase 4 | 质量抽检 | 1 轮 | 抽检报告(对话输出) |
产出优先级:
full_cn.md(全文翻译)> (阅读指南)> (研究报告)
reading_guide.mdreport.md/paper-reading <pdf_path>用户提供一个 PDF 文件路径,可以是:
docs/AIOpsLab.pdfE:\papers\my_paper.pdfpaper_reading/
└── {paper_name}_{YYYYMMDD_HHmmss}/
├── original.pdf # 原始 PDF 副本
├── progress.json # 进度追踪文件(自动管理)
├── markdown/ # Phase 1 产物
│ ├── full.md # 完整 Markdown(英文原文)
│ └── images/ # 提取的图片
├── translated/ # Phase 2 产物
│ └── full_cn.md # 中文翻译版本(含图片引用)
├── reading_guide.md # Phase 3 产物
└── report.md # Phase 3 产物
每个论文目录下维护 progress.json,记录执行状态:
{
"paper_name": "gfs",
"pdf_path": "papers/docs/gfs.pdf",
"output_dir": "paper_reading/gfs_20260405_235854",
"phases": {
"phase1_conversion": "done",
"phase2_translation": "in_progress",
"phase3_guides": "pending",
"phase4_qa": "pending"
}
}
每次开始时,先读取 progress.json 确定从哪里继续。
准备解析论文:{pdf_filename}
请确认(直接回车使用默认值):
1. MinerU 模型版本:vlm(高精度,默认)/ pipeline(轻量快速)
2. 论文语言:en(默认)| ch | japan | korean 等
3. 输出目录:paper_reading/{paper_name}_{timestamp}/(默认)
是否使用默认设置开始?(Y/n/自定义)
original.pdfprogress.jsonpython .agents/skills/paper-reading/scripts/mineru_convert.py "<pdf_path>" "<output_dir>/markdown" --model-version vlm --language en
🔒 安全规则:
api_key/key.txt,由脚本自动读取api_key/ 已在 .gitignore 排除FALLBACK: API 失败时可用 MinerU 桌面客户端手动转换
更新 progress.json,报告结果并提示进入 Phase 2。
核心原则:一次对话尽量翻译完全文。只有超长论文(>40页)才拆为 2 次。
完整性是最高优先级。漏翻、压缩、概括都是不可接受的。每个段落都必须完整翻译。
view_file 分段读取 markdown/full.md(每次 ~200 行)translated/full_cn.mdprogress.json 记录断点,告知用户 continue在 full_cn.md 顶部添加元信息头:
> **翻译信息**
> - 原文:{pdf_filename}
> - 翻译时间:{YYYY-MM-DD HH:mm}
> - 翻译方式:AI 辅助全文翻译
> - 图片位置:../markdown/images/
---
 → English(中文),后续可直接用中文或缩写Figure 1(图1)参照 templates/reading_guide_template.md 模板,生成 reading_guide.md。
要求:
第一遍速读(15-20分钟)
第二遍通读(45-60分钟)
第三遍精读(60-90分钟)
参照 templates/report_template.md 模板,生成 report.md。
所有产出完成后,进行抽样检查确保质量。不需要逐行全扫描,挑选代表性片段即可。
full.md 对比:
full.md 和 full_cn.md 的章节结构(标题数量是否一致)../markdown/images/python .agents/skills/paper-reading/scripts/quality_check.py <output_dir>
脚本自动执行以下检查并输出报告:
如发现问题,修复后重新运行脚本直到全部通过。
如果流程中断,下次用户提到同一论文时:
paper_reading/ 下已有目录progress.json 确定断点api_key/key.txtapi_key/key.txt 中的 Token 绝不暴露到代码、日志、对话中api_key/ 目录已被 .gitignore 排除用户:/paper-reading docs/AIOpsLab.pdf
用户:帮我阅读这篇论文 docs/attention_is_all_you_need.pdf
用户:continue (继续翻译 / 下一阶段)
用户:继续翻译 gfs (恢复中断的翻译)