Ai Podcast Dual Host

使用此 skill 当用户想要将 URL、PDF 或任意主题生成带有双声道 TTS 音频的双人对话播客。适用于双人讨论节目、指定主持人 persona（如鲁豫、罗永浩、李诞风格）、或将文章与资料转化为可收听音频内容的场景。

职业
分类: 大语言模型与 AI

AI 双主持人播客生成器 v2.2

将任意 URL / PDF / 主题转化为结构化双主持人对谈内容 + 双声道 TTS 音频。

核心特性

生成摘要展示：生成完成后自动展示内容亮点、段落结构和输出文件
流式脚本生成：解决长文本动态字数超时问题，成功率100%
可选外部研究引擎：支持由 OpenClaw / Claude Code 等主 Agent 调用 Sub-Agent 完成真实网络检索
统一研究引擎（本地Fallback）：单 Agent 完成从泛化检索到大纲构建的全流程
三层Persona配置：风格对标预设 / 一句话生成 / 文档提取，支持固定主持人+可变嘉宾模式
TTS 2.0 优化：WebSocket连接复用、引用上文、智能重试、动态超时
多种输入源：主题、URL、PDF三种输入方式
5种风格模板：高效传达、发散漫谈、深度对谈、观点交锋、喜剧风格
双声道立体声：A左声道、B右声道，收听体验更佳
动态字数控制：默认约8-12分钟（2500字），支持由大纲或用户参数扩展

触发条件

当用户有以下需求时，使用此 skill：

场景	示例
生成播客

AI 双主持人播客生成器 v2.2

将任意 URL / PDF / 主题转化为结构化双主持人对谈内容 + 双声道 TTS 音频。

核心特性

生成摘要展示：生成完成后自动展示内容亮点、段落结构和输出文件
流式脚本生成：解决长文本动态字数超时问题，成功率100%
可选外部研究引擎：支持由 OpenClaw / Claude Code 等主 Agent 调用 Sub-Agent 完成真实网络检索
统一研究引擎（本地Fallback）：单 Agent 完成从泛化检索到大纲构建的全流程
三层Persona配置：风格对标预设 / 一句话生成 / 文档提取，支持固定主持人+可变嘉宾模式
TTS 2.0 优化：WebSocket连接复用、引用上文、智能重试、动态超时
多种输入源：主题、URL、PDF三种输入方式
5种风格模板：高效传达、发散漫谈、深度对谈、观点交锋、喜剧风格
双声道立体声：A左声道、B右声道，收听体验更佳
动态字数控制：默认约8-12分钟（2500字），支持由大纲或用户参数扩展

触发条件

当用户有以下需求时，使用此 skill：

场景	示例
生成播客

参数	类型	说明
`source`	str	输入内容：主题文本 / URL / PDF文件路径
`source_type`	str	输入类型：`topic` / `url` / `pdf`

参数	类型	默认值	说明
`style`	str	`auto`	对话风格：`auto` / 深度对谈 / 观点交锋 / 发散漫谈 / 高效传达 / 喜剧风格
`persona_config`	dict	None	自定义主持人配置（覆盖默认）
`research_package`	dict	None	外部 Sub-Agent 提供的 Research Package（提供时跳过本地 Research）
`output_dir`	str	`./output`	输出目录
`verbose`	bool	True	是否打印详细日志
`skip_audio`	bool	False	是否跳过音频生成
`pause_before_audio`	bool	False	是否在音频生成前暂停，等待用户确认
`target_length`	int	None	显式指定目标字数（优先级最高），默认由大纲动态计算

文件	格式	说明
`podcast_{session_id}.json`	JSON	完整数据（research + script）
`podcast_{session_id}.md`	Markdown	可读对话格式
`podcast_{session_id}.mp3`	MP3	双声道音频（TTS配置后）

阶段	时间	说明
Research	~10-15s	单次API调用
Script (流式)	~60-300s	2000-8000+字符（动态），无超时
TTS (优化后)	~60-300s	40-200句，连接复用
总计	~4-10分钟	生成8-35分钟播客

Ai Podcast Dual Host

AI 双主持人播客生成器 v2.2

核心特性

触发条件

Ai Podcast Dual Host

AI 双主持人播客生成器 v2.2

核心特性

触发条件

使用方法

命令行

Python API — 本地完整模式

Python API — Sub-Agent Research 注入模式

自然语言 Persona 处理

Persona 使用决策树

1. 首次使用检测

2. 非首次使用

推荐调用方式

输入参数

必需参数

可选参数

输出格式

返回数据

生成文件

前置条件

Sub-Agent 模式

性能指标

测试

相关文档

Openai Whisper

Voice Call

Prose

Clawhub

Sherpa Onnx Tts

Openai Whisper Api