智能语音合成服务,支持音色克隆、拟人化语义适配配音、流式实时生成、多语言与方言支持,提供 1.7B/0.6B 双模型选择
文本准备
选择音色
执行合成
scripts/tts_generate.py 进行语音生成验证输出
准备参考音频
提取音色特征
scripts/voice_clone.py 提取音色特征使用克隆音色
文本分段
流式生成
scripts/tts_generate.py 启用流式模式实时合并
文本情绪分析
语音参数调整
生成验证
python scripts/tts_generate.py \
--text "你好,欢迎使用语音合成服务" \
--output_path ./output/hello.wav \
--model_size 1.7B \
--voice default
python scripts/voice_clone.py \
--reference_audio ./reference.wav \
--voice_name my_voice \
--output_dir ./voices
python scripts/tts_generate.py \
--text "今天真是太开心了!" \
--output_path ./output/happy.wav \
--emotion happy \
--speed 1.2 \
--pitch 1.1
python scripts/tts_generate.py \
--text_file ./long_text.txt \
--output_path ./output/stream_output.wav \
--streaming true