高精度论文检索与检阅系统,支持多源检索、智能筛选、结构化摘要、BibTeX 导出、CCF 评级与综合评分
Paper Review Pro 是一款面向科研工作者的智能论文检索与分析工具。它不仅能从 arXiv 和 Semantic Scholar 多源检索论文,还能自动筛选核心文献、生成结构化摘要、评估论文权威性,并输出完整的研究领域分析报告。
适用场景:
| 特性 | 说明 |
|---|---|
| 多源检索 | 同时检索 arXiv + Semantic Scholar,覆盖预印本与正式发表 |
| 智能筛选 | 相关度 + 权威度综合评分,自动识别高价值论文 |
| CCF 评级 | 内置 CCF(中国计算机学会)推荐目录,自动标注 A/B/C 类 |
| 结构化摘要 | LLM 自动生成:研究问题、方法、结论、创新点 |
| 基于 Top-K 论文智能生成扩展检索词,发现相关子领域 |
| 一键导出 | 自动生成 BibTeX 文件,支持 Zotero/Mendeley 导入 |
| 完整报告 | 检索完成后自动生成研究领域分析报告 |
| 健壮性 | 多层错误处理与回退机制,确保稳定运行 |
cd ~/.openclaw/workspace/skills/paper-review-pro
python scripts/config.py
python scripts/review.py --query "LLM reasoning" --retrieve_number 20 --keep_topk 5 --year 2024
| 参数 | 必需 | 默认值 | 说明 |
|---|---|---|---|
--query | ✅ | - | 检索关键词 |
--retrieve_number | ❌ | 10 | 初始检索数量 |
--keep_topk | ❌ | 3 | 保留核心论文数量 |
--year | ❌ | 2025 | 截止年份(检索该年及之后) |
--expand_query_number | ❌ | 2 | 每个扩展词保留的论文数量 |
检索完成后,你将获得:
~/.openclaw/paper-review-pro/papers/bibtex_{query}_{timestamp}.bib~/.openclaw/paper-review-pro/reports/检索源:
去重机制:基于论文标题和 DOI 进行本地去重,避免重复结果。
评分公式:
综合分数 = 相关度 × (1 - weight) + 权威度 × weight
| 参数 | 说明 | 默认值 |
|---|---|---|
| 相关度 | 查询关键词与标题/摘要的匹配度 | - |
| 权威度 | 基于发表状态和 CCF 评级 | - |
| weight | 权威度权重 | 0.3 |
权威度评分标准:
| 等级 | 说明 | 分数 |
|---|---|---|
| CCF-A | 顶级会议/期刊(NeurIPS, ICML, CVPR, ACL 等) | 1.0 |
| CCF-B | 优秀会议/期刊 | 0.8 |
| CCF-C | 良好会议/期刊 | 0.6 |
| 已发表未评级 | 有 venue 但未匹配 CCF | 0.5 |
| preprint | 预印本(arXiv 等) | 0.3 |
数据库规模:422 个 venue(会议 275 个,期刊 147 个)
代表性收录:
使用 LLM 自动生成四要素摘要:
| 要素 | 说明 |
|---|---|
| 研究问题 | 论文要解决的核心问题 |
| 方法 | 采用的技术路线/算法 |
| 结论 | 主要发现/实验结果 |
| 创新点 | 与已有工作的区别 |
基于 Top-K 核心论文的内容分析,生成语义相关的扩展检索词,帮助发现:
自动生成,支持一键导入 Zotero/Mendeley。
导入 Zotero:
.bib 文件位置:~/.openclaw/paper-review-pro/config.json
{
"default_n": 10,
"default_k": 2,
"min_year": 2025,
"default_p": 2,
"authority_weight": 0.3,
"llm": {
"enabled": true,
"provider": "gateway",
"gateway_url": "http://localhost:14940",
"gateway_model": "dashscope/qwen3.5-plus"
}
}
python scripts/config.py --default_n 20 --default_k 3 --min_year 2024 --authority-weight 0.3
| 参数 | 说明 |
|---|---|
--query | 检索关键词(必需) |
--retrieve_number | 初始检索数量 |
--keep_topk | 保留核心论文数量 |
--year | 截止年份 |
--expand_query_number | 每个扩展词保留数量 |
| 参数 | 说明 | 默认 |
|---|---|---|
--no-bibtex | 禁用 BibTeX 导出 | 启用 |
--no-authority | 禁用权威度评分 | 启用 |
--authority-weight | 权威度权重 (0.0-1.0) | 0.3 |
--use-api | 使用在线 API 查询发表状态 | 禁用 |
--no-llm | 禁用 LLM 功能 | 启用 |
本系统设计有多层错误处理机制,确保在各种异常情况下仍能稳定运行。
arXiv API (首选)
↓ [失败]
arXiv 网页爬取 (回退)
↓ [失败]
跳过 arXiv,仅使用 Semantic Scholar
网页爬取保护:
OpenClaw Gateway API (首选)
↓ [401/网络错误]
Dashscope API (备用)
↓ [失败]
规则提取 Fallback
Fallback 行为:
保证:即使 LLM 完全不可用,系统也能正常运行,不会中断。
在线 API 查询 (--use-api)
↓ [失败/未启用]
本地数据库匹配
↓ [未匹配]
标记为"未评级"
TimeoutMonitor 监控所有关键步骤:
所有外部 API 请求均支持自动重试:
python scripts/review.py --query "transformer attention" --retrieve_number 20 --keep_topk 5 --year 2020
python scripts/review.py --query "novel architecture" --keep_topk 5 --no-authority
python scripts/review.py --query "deep learning survey" --keep_topk 10 --authority-weight 0.5
python scripts/review.py --query "quick test" --retrieve_number 5 --no-llm
python scripts/review.py --query "recent paper" --keep_topk 5 --use-api
# 运行完整测试套件
python scripts/test_publication_status.py
# 测试特定 venue
python scripts/test_publication_status.py --title "论文标题" --venue "IEEE Transactions on Multimedia"
# 显示数据库统计
python scripts/test_publication_status.py --show-db
python scripts/core/bibtex.py --title "Test Paper" --authors "John Doe" --year 2025 --publication "CVPR" --ccf-rank A
详细模块说明请参考 reference/ 目录:
| 文档 | 内容 |
|---|---|
reference/LLM_INTEGRATION.md | LLM 功能集成(摘要生成、查询扩展) |
reference/BIBTEX_EXPORT.md | BibTeX 导出模块说明 |
reference/PUBLICATION_STATUS.md | 发表状态与 CCF 评级模块 |
reference/SCORING_SYSTEM.md | 综合评分系统说明 |
reference/BUGFIXES.md | 重要修复说明 |
CCF 评级数据库:当前使用本地数据库,覆盖常见计算机领域会议/期刊。如需扩展,请编辑 scripts/core/publication_status.py 中的评级字典。
BibTeX 文件位置:生成的 .bib 文件保存在 ~/.openclaw/paper-review-pro/papers/ 目录,文件名格式:bibtex_{查询关键词}_{时间戳}.bib。
权威度权重建议:
--no-authority 禁用在线 API 查询:--use-api 参数通过 Semantic Scholar API 查询发表信息,更准确但会增加检索时间(约 2-5 秒/篇)。
arXiv 速率限制:arXiv API 有速率限制,建议检索间隔 ≥3 秒。网页爬取作为回退方案,超时保护 60 秒。
LLM 配置:首次使用前请确保 OpenClaw Gateway 或 Dashscope API 已正确配置。如未配置,系统自动降级到规则 Fallback。
详见 CHANGELOG.md(如有)或项目发布说明。
版本: 2026-03-29
许可: MIT
维护: OpenClaw Community