优先通过 USPTO PPUBS 官方导出接口下载美国专利 PDF,必要时回退 Google Patents,并保存到 inbox-patent
优先通过 USPTO PPUBS 官方导出接口下载美国专利 PDF,并在必要时回退到 Google Patents 页面抓取,自动保存到 data/inbox-patent/ 目录,供后续 pipeline ingest 入库。
常与 patent-search 配合使用:先用 patent-search 发现专利,再用 patent-fetch 或 --fetch 参数下载 PDF。
US20240176406A1),优先走 USPTO 官方导出scholaraio pipeline ingest 走专利入库流程scholaraio patent-fetch US20240176406A1
scholaraio patent-fetch "https://patents.google.com/patent/US20240176406A1"
# 方式一:搜索后根据提示手动下载
scholaraio patent-search "neural network" --count 5
# 输出中每条结果会显示:下载: scholaraio patent-fetch <公开号>
# 方式二:搜索时自动下载所有结果 PDF
scholaraio patent-search "neural network" --count 5 --fetch
已下载: /path/to/data/inbox-patent/US20240176406A1.pdf (1679017 bytes)
已保存到: /path/to/data/inbox-patent/US20240176406A1.pdf
如果文件已存在:
文件已存在: /path/to/data/inbox-patent/US20240176406A1.pdf
已保存到: /path/to/data/inbox-patent/US20240176406A1.pdf
如果页面没有 PDF 链接:
未在该页面找到 PDF 下载链接
# 1. 搜索专利
scholaraio patent-search "quantum computing" --count 10
# 2. 根据公开号下载目标专利 PDF
scholaraio patent-fetch US20230123456A1
# 3. 走正常专利入库流程(自动按公开号去重、标记 patent 类型)
scholaraio pipeline ingest
# 4. 本地检索
scholaraio search "voltage overshoot"
# 1. 搜索并自动下载前 5 条结果的 PDF
scholaraio patent-search "quantum computing" --count 5 --fetch
# 2. 直接入库
scholaraio pipeline ingest
页面请求超时或下载失败
未在该页面找到 PDF 下载链接
下载失败
data/inbox-patent/ 目录是否有写入权限scholaraio patent-search — USPTO 专利搜索(发现专利公开号,支持 --fetch 自动下载)scholaraio pipeline ingest — 将 inbox-patent 中的 PDF 入库scholaraio search / scholaraio vsearch — 本地知识库检索