学术论文结构化阅读、拆解与分析工具。基于12个阅读要素(研究背景、研究问题、研究结论、文献综合、文献批评、研究方法、理论视角与理论框架、一致性发现、不一致性发现、研究贡献、研究不足、未来研究展望)对论文进行深度拆解,结果保存为Excel文件。当用户提到需要针对论文/文献/paper进行拆解、解析、分析、阅读、梳理,并上传或告知一篇或多篇论文的本地文件路径(PDF、Word等)时触发此skill。
基于12个阅读要素对学术论文进行结构化拆解,结果保存为Excel文件存储于论文所在文件夹中。
pdftotext 命令提取文本阅读论文后,逐一提取12个阅读要素。要素定义详见 references/reading_elements.md。
提取要点:
如论文中某要素未明确提及,标注"论文未明确提及"并尝试基于论文内容进行合理推断,推断内容用括号标注。
分析完成后,将结果保存为Excel文件,存放于被分析论文所在的文件夹中。
使用 scripts/export_excel.py 脚本生成Excel。先用 Python 将分析数据写入临时JSON文件,再调用脚本。
生成文件名:论文拆解_<论文简称>.xlsx,包含一个工作表。
构造JSON数据并调用脚本:
python3 <skill_path>/scripts/export_excel.py --mode single --output "<论文所在文件夹>/论文拆解_<论文简称>.xlsx" --json '<json_string>'
JSON结构:
{
"title": "论文标题",
"author": "作者",
"source": "期刊/来源",
"year": "年份",
"elements": {
"研究背景": "内容...",
"研究问题": "内容...",
"研究结论": "内容...",
"文献综合": "内容...",
"文献批评": "内容...",
"研究方法": "内容...",
"理论视角与理论框架": "内容...",
"一致性发现": "内容...",
"不一致性发现": "内容...",
"研究贡献": "内容...",
"研究不足": "内容...",
"未来研究展望": "内容..."
}
}
生成文件名:论文拆解汇总_<N>篇.xlsx,包含每篇论文的独立工作表 + 最后一个"横向对比汇总"工作表。
python3 <skill_path>/scripts/export_excel.py --mode multi --output "<论文所在文件夹>/论文拆解汇总_<N>篇.xlsx" --json '<json_string>'
JSON结构:
{
"papers": [
{ "title": "...", "author": "...", "source": "...", "year": "...", "elements": { ... } },
...
],
"summary": {
"paper_labels": ["论文A简称", "论文B简称", ...],
"elements": {
"研究背景": ["论文A精简版", "论文B精简版", ...],
...12个要素各一个数组...
}
}
}
重要:由于JSON字符串可能很长,使用Python将JSON写入临时文件,再用 --json "$(cat /tmp/paper_data.json)" 传入,或直接在Python中调用脚本。推荐方式:
import json, subprocess
data = { ... } # 构造好的数据
with open("/tmp/_paper_analysis.json", "w") as f:
json.dump(data, f, ensure_ascii=False)
subprocess.run(["python3", "<skill_path>/scripts/export_excel.py",
"--mode", "multi",
"--output", "<输出路径>",
"--json", json.dumps(data, ensure_ascii=False)])
在保存Excel后,同时在对话中以markdown表格简要呈现分析结果,并告知用户Excel文件的保存路径。