将任意多媒体文档导入 Obsidian 知识库。支持 PPT、PDF、DOCX、图片等格式,自动提取每一页/每一张图片,使用多模态模型理解内容,生成文字描述后存入 OB。适用于:(1) 整理培训课件 (2) 迁移笔记到 OB (3) 将图片资料转为结构化知识。
将 PPT、PDF、DOCX、图片等多媒体文档导入 Obsidian,每页/每张图片自动生成文字描述。
brew install pandoc poppler
pip install python-pptx pillow
# MiniMax
export MINIMAX_API_KEY="your-key"
export MINIMAX_API_HOST="https://api.minimaxi.com"
# OpenAI
export OPENAI_API_KEY="your-key"
# Anthropic
export ANTHROPIC_API_KEY="your-key"
python3 <skill>/scripts/media_to_obsidian.py <源文件/目录> <输出OB目录> [options]
参数:
--format ppt|pdf|docx|image|all : 指定格式,默认 all--model minimax|openai|anthropic : 指定模型,默认 minimax--category 分类名 : 指定输出分类目录# 导入 PPT 课件
python3 ~/.openclaw/workspace/skills/multimedia-to-obsidian/scripts/media_to_obsidian.py \
/path/to/培训课件.pptx \
/path/to/Obsidian \
--format ppt --category 培训
# 导入图片到 OB
python3 ~/.openclaw/workspace/skills/multimedia-to-obsidian/scripts/media_to_obsidian.py \
/path/to/images/ \
/path/to/Obsidian \
--format image --category 素材
# 批量导入目录下的所有文档
python3 ~/.openclaw/workspace/skills/multimedia-to-obsidian/scripts/media_to_obsidian.py \
/path/to/documents/ \
/path/to/Obsidian
Obsidian仓库/
├── 培训/
│ └── 培训课件.md (含每页图片理解)
├── 素材/
│ └── 图片1.md
│ └── 图片2.md
└── 导入/
└── 文档名.md