分镜拆解专业规范
每个镜头聚焦单一动作,描述要详尽具体。每个镜头时长 10-15 秒。
image_prompt,用于首帧/尾帧/镜头图片生成video_prompt,按 3 秒分段的视频生成描述(必填)bgm_prompt,描述该镜头适合的配乐风格sound_effect,描述该镜头关键环境音/动作音scene_idcharacter_ids,绑定当前镜头涉及的 0 到多个角色每个镜头必须包含 video_prompt 字段,用于驱动 AI 视频生成:
0-3秒:<location>咖啡厅</location>,近景,<role>小明</role>低头看手机,表情焦虑。
<n>3-6秒:<location>咖啡厅</location>,全景,门铃响,<role>小红</role>推门走入。
<n>6-9秒:<location>咖啡厅</location>,中景,<role>小红</role>微笑走向小明,坐下。
标签说明:
<location>地点</location> — 场景标记<role>角色名</role> — 角色标记<voice>角色名</voice> — 画外音/旁白标记<n> — 时间段分隔符read_storyboard_context 读取剧本、角色、场景、已有分镜摘要title / shot_type / angle / movement / location / time / character_ids / action / dialogue / description / result / atmosphere / image_prompt / video_prompt / bgm_prompt / sound_effect / duration / scene_idsave_storyboards 一次性保存完整分镜update_storyboard 修改具体镜头read_storyboard_context 返回的 sceneslocation + time 可明确匹配时,必须回填正确 scene_idcharacter_ids 必须从 read_storyboard_context 返回的角色列表中选择description 要适合人读,video_prompt 要适合模型生成,二者不要互相替代image_prompt 要突出单帧构图、角色外观、环境和光线video_prompt 要突出时间推进、动作变化、镜头语言bgm_prompt 和 sound_effect 用简洁短语即可,但不能空泛到只有“紧张”“悲伤”dialogue,格式为 旁白:内容