专为InfiniteTalk项目设计的小省导购员数字人带货提示词生成技能,基于四大智能体协同(提示词生成师、质量管控师、知识库运维师、跨环节适配师),生成适配Image-to-Video模式的结构化提示词(角色固定特征+动作时序+场景环境+音频匹配+光影氛围+技术约束),支持9:16竖屏、5s/幕、音频同步(Suno+chinese-wav2vec2-base)、一致性管控(角色/视觉/情绪),直接对接模型推理流程
提示词生成师负责生成适配InfiniteTalk的结构化提示词:
:
生成流程:
输出格式:
prompt参数)质量管控师负责核查提示词质量:
核查维度:
技术参数匹配度:
角色一致性:
音频匹配性:
光影可实现性:
核查结果:
知识库运维师负责归档提示词和知识库更新:
归档内容:
归档格式:
跨环节适配师负责跨工具集成和音频/图片适配:
音频集成:
Suno音乐生成:
chinese-wav2vec2-base编码:
导购员语音生成:
图片集成:
AI绘画生成:
参考图适配:
init_image参数输入InfiniteTalk推理对接:
功能说明:生成产品推荐场景的五幕提示词
执行方式:提示词生成师(智能体自然语言生成)
关键参数:
输出:五幕中文提示词、参数配置表
功能说明:核查提示词质量
执行方式:质量管控师(智能体分析推理)
核查维度:技术参数匹配度、角色一致性、音频匹配性、光影可实现性
输出:质检报告(pass/fail)、问题清单(如不通过)
功能说明:Suno音乐→InfiniteTalk音频对接
执行方式:跨环节适配师(智能体理解+自然语言指导)
关键步骤:
输出:音频编码文件、视频生成结果