用于将语音转写项目的复杂文件结构整理、合并为适合 Obsidian 归档的 Markdown 文档。此技能依赖 Agent 的认知能力来识别文件逻辑,并使用通用脚本执行合并。
此技能将散乱的语音转写项目文件整理成结构清晰的 Markdown 文档,便于在 Obsidian 等知识库中归档。
它采用 "Agent 规划 + 脚本执行" 的模式:
当用户要求将一个包含多个原始音频、数十个转写分段、以及各种说明文档的目录“整理归档”时使用。
首先,使用 list_directory (必要时配合 glob) 扫描目标项目目录。
你需要回答以下问题:
1-原始文件 或类似目录)5-最终输出,文件名包含行号如 _1-200)
5-最终输出 中非分段的 Markdown 文件)基于你的分析,构建一个 JSON 配置文件。不要直接输出给用户,而是准备写入临时文件。
JSON 结构定义:
{
"output_dir": "目标项目路径/obsidian_archive",
"tasks": [
{
"filename": "1-原始录音汇总.md",
"title": "原始录音汇总",
"sections": [
{
"title": "文件1.txt",
"path": "绝对路径或相对路径/文件1.txt",
"syntax": "text"
}
]
},
{
"filename": "2-最终输出脚本汇总.md",
"title": "最终输出脚本汇总",
"sections": [
{
"title": "Part 1 (1-200)",
"path": "路径/output_1-200.txt",
"syntax": "text"
},
{
"title": "Part 2 (201-400)",
"path": "路径/output_201-400.txt",
"syntax": "text"
}
// Agent 必须确保这里的顺序是正确的!
]
}
// ... 继续为“整理要求汇总”和“知识整理汇总”创建任务
]
}
使用 write_file 将 JSON 配置保存为临时文件,例如 merge_plan.json。
调用脚本执行合并:
python3 .gemini/skills/long-audio-to-obsidian/scripts/doc_merger.py merge_plan.json
(注意:请根据实际安装位置调整脚本路径)
检查脚本输出,确认生成成功。
删除临时文件 merge_plan.json。
脚本生成的只是标准文件名的中间产物。为了方便 Obsidian 使用,你需要进行最后一步的人工智能优化:
2024-01-01 会议转写 - 项目 A)。run_shell_command 的 mv 命令,将 obsidian_archive 中的标准文件重命名为带前缀的格式。
1-原始录音汇总.md -> {标题} 1 原始录音汇总.md2-最终输出脚本汇总.md -> {标题} 2 最终输出脚本汇总.md{标题}.md 的新文件。[[文件名]])。索引页内容示例:
相关文档:
[[2024-01-01 会议转写 - 项目 A 1 原始录音汇总]]
[[2024-01-01 会议转写 - 项目 A 2 最终输出脚本汇总]]
...
请按照以下四个维度组织输出文件(对应 JSON 中的 4 个 task):
0-工作日志.md)3-校对和术语表.md)4-分段主题.md)2-要求和信息/*)问题和回答-xxx.md)。path 推荐使用绝对路径,或者相对于执行 doc_merger.py 时的相对路径。