本地视频转文字 - 使用 OpenAI Whisper 进行语音识别,完全免费、离线运行、保护隐私
🎬 一键转录本地视频/音频为文字稿
使用 OpenAI Whisper 进行本地语音识别,完全免费、离线运行、保护隐私。
v1.0.3+ 无需手动安装! 首次运行时会自动检测并安装 Whisper 引擎(约 300MB,一次性)。
如果自动安装失败,可手动安装:
pip3 install openai-whisper -i https://pypi.tuna.tsinghua.edu.cn/simple
💡 安装大小:约 200-300 MB ⏱️ 安装时间:5-10 分钟(首次需下载模型)
# 基础用法(自动检测语言)
python transcribe.py /path/to/video.mp4
# 指定中文
python transcribe.py /path/to/video.mp4 base zh
# 转录 + AI 总结
python transcribe.py /path/to/video.mp4 --summarize
# 输出到指定目录 + 总结
python transcribe.py /path/to/video.mp4 base zh --summarize
/transcribe /path/to/video.mp4 --summarize
转录完成后会生成以下文件(在同一目录):
| 文件 | 格式 | 说明 |
|---|---|---|
视频名.txt | 纯文本 | 无时间戳的文字稿 |
视频名.srt | SRT 字幕 | 带时间戳,可导入剪映/PR |
视频名.vtt | WebVTT | 网页字幕格式 |
视频名_summary.json | JSON | AI 内容总结(使用 --summarize 时生成) |
# 只输出文字,不生成字幕
whisper video.mp4 --output_format txt
# 指定输出语言(翻译为英文)
whisper video.mp4 --task translate
# 调整温度(越高越随机,0 最确定)
whisper video.mp4 --temperature 0
# 显示详细日志
whisper video.mp4 --verbose True
完整选项:whisper --help
遇到问题或有建议?欢迎反馈!
作者: Seven
版本: 1.0.3
更新时间: 2026-03-18