每日科研文献日报生成与管理。当用户请求生成科研日报、更新文献收集脚本或分析研究趋势时激活。支持:(1) 自动抓取 PubMed/bioRxiv/arXiv 最新文献,(2) 语义筛选 AI/生信/病原/真菌等领域,(3) LLM 智能总结与编辑排版,(4) 中文格式报告输出与定时任务管理。
自动化生成 生命科学×AI 交叉领域 的每日科研文献日报,包含:
# 方式 1:直接使用脚本
~/.openclaw/skills/literature-daily-report/scripts/literature_collector.py
# 方式 2:通过项目目录运行
cd ~/.openclaw/workspace/projects/literature-collector && ./run.sh
编辑配置文件 config.yaml:
output_dir: ~/.openclaw/workspace/literature
search_queries: # 搜索关键词组合
- "metagenomics AND machine learning"
- "fungal pathogen AND bioinformatics"
- "single-cell AND deep learning"
high_impact_journals:
- Nature
- Cell
- Science
- Bioinformatics
fetch_articles_with_abstracts)从三大数据库获取最新文献及摘要:
| 来源 | API | 查询范围 | 特点 |
|---|---|---|---|
| PubMed | EUtils | 最近 1 天 | 已发表论文,有 PMID |
| bioRxiv | REST API | 最近 1 天 | 预印本,DOI 格式 |
| arXiv | Export API | 最近 1 天 | CS/Q-Bio 类别 |
执行逻辑:
for query in SEARCH_QUERIES:
articles = fetch_pubmed(query) # PubMed
biorxiv = fetch_biorxiv() # bioRxiv
arxiv = fetch_arxiv() # arXiv
all_articles.extend(...)
categorize_article)根据关键词匹配筛选目标领域:
CATEGORY_KEYWORDS = {
"单细胞组学": ["single-cell", "scRNA-seq", "spatial transcriptomics"],
"宏基因组学": ["metagenomics", "microbiome", "16S"],
"病原真菌": ["fungal", "pathogen", "Candida", "Aspergillus"],
"生信方法": ["bioinformatics", "algorithm", "pipeline", "tool"],
"AI/ML": ["machine learning", "deep learning", "transformer"],
"基因组学": ["genomics", "genome", "pan-genome"],
}
优先级评分:
generate_summary)基于摘要生成结构化中文总结:
【研究目的】
【样本与方法】
【研究结果】
【创新性】
优化要点:
【】 标签包裹各部分generate_mark_report_v2)生成完整的 Markdown 日报结构:
# 📚 每日文献速递 - YYYY-MM-DD
## 📰 编辑前言
- 日期统计
- 来源分布
- 热点领域概览
## ⭐ 重点推荐 (8 篇)
- 带标签分类
- 结构化摘要
- DOI 链接
## 📖 完整文献列表
- 按来源分组
- 详细元数据
## 📝 编辑总结
- 今日趋势分析
- 编者点评
- 关注建议
literature-daily-report/
├── SKILL.md # 本说明文档
├── scripts/
│ └── literature_collector.py # 主收集脚本
└── references/
├── categories.md # 领域分类标准
├── workflows.md # 工作流指南
└── api_docs.md # API 参考文档
# 输出目录
~/.openclaw/workspace/literature/
├── literature-YYYY-MM-DD.md # 当日报告
└── latest.md # 最新报告索引
# ClawLib 同步目录
~/.openclaw/workspace/ClawLib/科研日报/
├── literature-YYYY-MM-DD.md # 当日报告(自动同步)
└── latest.md # 最新报告(自动同步)
生成日报后会自动同步到 ClawLib:
literature-{date}.md → ClawLib/科研日报/latest.md → ClawLib/科研日报/文献收集完成后会自动录入 BioCiaoLab Group Library:
功能特点:
literature-daily + 日期 + 分类(如 单细胞组学, 宏基因组学)BioCiaoLab Group Library 配置:
export ZOTERO_API_KEY="your-api-key"
export ZOTERO_GROUP_ID="your-group-id" # BioCiaoLab
获取方式:
在 SEARCH_QUERIES 中添加新主题:
SEARCH_QUERIES = [
'(epigenetics[Title/Abstract]) AND ((deep learning[Title/Abstract]))',
'(CAR-T[Title/Abstract]) AND ((single-cell[Title/Abstract]))',
]
修改 generate_mark_report_v2() 中的标题层级和标签风格。
添加 crontab 自动发送日报:
# 每天早上 9 点生成并发送到飞书
0 1 * * * cd ~/.openclaw/workspace/projects/literature-collector && ./run.sh
遇到问题?检查:
time.sleep() 延时literature/abstract_cache.json 缓存状态