PDF 论文翻译写入飞书知识库

将一篇 PDF 论文（通常为英文学术论文）翻译为中文，并写入用户指定的飞书知识库页面下，保持原论文格式，图片插入原位置。

输入信息

用户需要提供以下信息（如果未提供则主动询问）：

PDF 文件路径 - 论文 PDF 的本地路径
飞书 App ID 和 App Secret - 飞书开放平台应用凭证（已保存在记忆中则无需再次提供）
目标知识库 URL 或父节点 token - 飞书知识库中的目标位置
文档标题（可选）- 如不提供则从论文标题翻译生成

工作流程

Step 1: 准备工作

检查 PyMuPDF 是否安装：pip3 install PyMuPDF -q
确认 Pillow 已安装

Step 2: 读取 PDF 内容

使用 Read 工具逐页读取 PDF（每次最多 20 页）
记录论文的完整结构：标题、摘要、各章节、图表位置
特别标注每个图表（Figure/Table）所在的页码和大致位置（左列/右列/全宽/上方/下方）

Step 3: 获取飞书 Access Token

PDF 论文翻译写入飞书知识库

将一篇 PDF 论文（通常为英文学术论文）翻译为中文，并写入用户指定的飞书知识库页面下，保持原论文格式，图片插入原位置。

输入信息

用户需要提供以下信息（如果未提供则主动询问）：

PDF 文件路径 - 论文 PDF 的本地路径
飞书 App ID 和 App Secret - 飞书开放平台应用凭证（已保存在记忆中则无需再次提供）
目标知识库 URL 或父节点 token - 飞书知识库中的目标位置
文档标题（可选）- 如不提供则从论文标题翻译生成

工作流程

Step 1: 准备工作

检查 PyMuPDF 是否安装：pip3 install PyMuPDF -q
确认 Pillow 已安装

Step 2: 读取 PDF 内容

使用 Read 工具逐页读取 PDF（每次最多 20 页）
记录论文的完整结构：标题、摘要、各章节、图表位置
特别标注每个图表（Figure/Table）所在的页码和大致位置（左列/右列/全宽/上方/下方）

图片类型	工具	原因
照片（机器人、任务场景）	`pdfimages`	提取 PDF 嵌入的原始高清照片，无需裁剪
图表（柱状图、折线图）	PyMuPDF 渲染 + 裁剪	矢量绘制，pdfimages 无法提取
架构图（流程图、框图）	PyMuPDF 渲染 + 裁剪	包含矢量元素和文字标签

block_type	字段名	说明
2	`text`	文本段落
3	`heading1`	一级标题
4	`heading2`	二级标题
5	`heading3`	三级标题
22	`divider`	分割线（传空 `{}`）
27	`image`	图片（创建时传空 `{}`，不可直接传 token）

Pdf To Feishu

PDF 论文翻译写入飞书知识库

输入信息

工作流程

Step 1: 准备工作

Step 2: 读取 PDF 内容

Step 3: 获取飞书 Access Token

Pdf To Feishu

PDF 论文翻译写入飞书知识库

输入信息

工作流程

Step 1: 准备工作

Step 2: 读取 PDF 内容

Step 3: 获取飞书 Access Token

Step 4: 获取知识库空间信息

Step 5: 创建知识库文档节点

Step 6: 从 PDF 提取图片

Step 7: 写入文档内容

Step 8: 修正图片（如有错误）

Step 9: 删除多余内容

Block 类型速查

公式排版规则

注意事项

翻译原则

Step 10: 逐章 Review 精翻（关键步骤！）

Step 11: 名词解释子页面（按需）

11a. 创建名词解释子页面（仅首次）

11b. 为每个术语写入解释条目

11c. 在主文档中添加跳转链接（关键步骤！）

11d. 术语选取建议

Feishu Doc

Summarize

Nano Pdf

Diffs

Customs Trade Compliance

Nutrient Document Processing