AI video generation studio with script writing, storyboarding, character management, and prompt engineering for Alibaba Cloud Wan 2.7.
完整的 AI 视频创作工作室。从剧本到成片的完整工作流,基于阿里云百炼 Wan 2.7 系列。
| 模块 | 功能 |
|---|---|
| 📝 剧本助手 | 从想法到完整剧本,自动结构化 |
| 👤 角色管理 | 定义角色、分配 reference、自动编号 |
| 🎞️ 分镜脚本 | 自动生成标准分镜表(镜头/景别/运动/时长/内容) |
| 🎬 视频生成 | t2v / i2v(首帧/首尾帧/续写) / r2v / videoedit 全模式 |
| 🔧 Prompt 工程 | 内置提示词模板、风格库、镜头语言库 |
| ✨ 专业特性 | 1080P、音频同步、首尾帧控制、指令编辑、视频续写 |
| 模型 | 功能 | 输入 | 分辨率 | 时长 | 首选场景 |
|---|---|---|---|---|---|
| wan2.7-t2v ⭐ | 文生视频 | 文本 + 音频(可选) | 720P/1080P |
| 2-15s |
| 从零生成视频 |
| wan2.7-i2v ⭐ | 图生视频 | 首帧/首尾帧/首段视频 + 音频(可选) | 720P/1080P | 2-15s | 图片动起来、过渡、续写 |
| wan2.7-videoedit ⭐ | 视频编辑 | 视频 + 文本指令 + 参考图(可选) | 720P/1080P | 2-10s | 指令编辑、风格转换、替换 |
| wan2.6-r2v-flash | 参考生视频 | 参考图/视频(最多5个) + 文本 | 720P/1080P | 2-10s | 角色复刻表演 |
⚠️ Wan 2.7 使用 HTTP 调用,DashScope SDK 暂不支持 wan2.7 模型。 ⚠️ Wan 2.7 全系列最高 1080P(非 4K),单段最长 15 秒。
【片名】一句话概括故事
【时长】10s / 15s / ...(单段)或 N 分钟(多段拼接)
【风格】3D卡通 / 写实电影 / 水墨 / 赛博朋克 / ...
【角色】角色1:描述 | 角色2:描述 | ...
【场景】主要场景描述
【分镜】镜头1 → 镜头2 → 镜头3 → ...
Wan 2.7 单段最长 15 秒,制作长视频需分镜拆分:
3 分钟视频 = 12-18 个镜头 × 10-15 秒/段
流程:剧本 → 分镜 → 逐段生成 → ffmpeg 拼接 → 配乐
角色一致性:每个镜头使用相同的首帧参考图
每个镜头必须包含以下要素:
镜头X [时长X秒]
- 景别:全景 / 中景 / 近景 / 特写
- 角度:平视 / 仰视 / 俯视 / 鸟瞰
- 运动:固定 / 推 / 拉 / 摇 / 移 / 跟 / 升 / 降
- 内容:画面描述(主体 + 动作 + 环境 + 光影 + 情绪)
文生视频(t2v)Prompt 公式:
[景别] + [主体] + [动作] + [环境] + [光影] + [氛围/情绪] + [风格]
示例:
近景,一位穿着白色连衣裙的少女站在海边,微风吹起她的长发和裙摆,
夕阳的金色余晖洒在她身上,海面波光粼粼,背景是粉紫色的晚霞,
氛围宁静温柔,电影质感,浅景深
Wan 2.7 多镜头叙事 Prompt(无需 shot_type 参数):
直接在 prompt 中用时间戳描述分镜:
第1个镜头[0-3秒] 全景:雨夜的纽约街头,霓虹灯闪烁。
第2个镜头[3-6秒] 中景:侦探进入老旧建筑,雨水打湿外套。
第3个镜头[6-9秒] 特写:侦探眼神坚毅专注,远处传来警笛声。
参考生视频(r2v)Prompt 公式(多角色):
wan2.7: 视频1/图1的角色 + 动作/台词 + 视频2/图2的角色 + 反应 + 环境
wan2.6: character1 + 动作/台词 + character2 + 反应 + 环境
| 镜头 | 时长 | 景别 | 角度 | 运动 | 画面描述 |
|---|---|---|---|---|---|
| 1 | 3s | 全景 | 俯视 | 缓慢推进 | 城市天际线,黄昏,灯光渐次亮起 |
| 2 | 2s | 中景 | 平视 | 固定 | 主角站在窗前,背影,手中端着咖啡杯 |
| 3 | 3s | 近景 | 侧视 | 缓慢右摇 | 主角转头望向窗外,表情若有所思 |
| 4 | 2s | 特写 | 平视 | 固定 | 咖啡杯中升起的袅袅热气 |
| 5 | 5s | 中景→全景 | 平视 | 缓慢拉远 | 主角放下杯子,走向门口,镜头跟随拉远 |
| 景别 | 画面范围 | 用途 |
|---|---|---|
| 大远景 | 环境为主,人物很小 | 交代场景、氛围 |
| 全景 | 人物全身 + 部分环境 | 人物与环境关系 |
| 中景 | 人物膝盖以上 | 叙事主力,对话场景 |
| 近景 | 人物胸部以上 | 表情、情绪 |
| 特写 | 面部/手部/物体细节 | 强调关键元素 |
| 大特写 | 眼睛/嘴唇/微小细节 | 极致情绪表达 |
| 运动 | 效果 | 示例 |
|---|---|---|
| 固定 | 稳定、客观 | 对话、静物 |
| 推 | 聚焦、紧张 | 发现、揭示 |
| 拉 | 远离、释然 | 结局、离别 |
| 摇 | 环视、搜索 | 探索、观察 |
| 移 | 跟随、流动 | 行走、奔跑 |
| 跟 | 伴随、沉浸 | 追逐、同行 |
| 升 | 开阔、升华 | 高潮、领悟 |
| 降 | 回归、压抑 | 失落、沉思 |
| 风格 | 描述 |
|---|---|
| 自然光 | 日光、黄昏、黎明,温暖真实 |
| 电影光 | 三点布光,专业质感 |
| 低照度 | 暗调、霓虹、赛博朋克 |
| 逆光 | 轮廓光、剪影、唯美 |
| 顶光 | 戏剧性、悬疑感 |
| 侧光 | 立体感、质感突出 |
想从零开始生成 → t2v(文生视频)
有一张图想动起来 → i2v - 首帧生视频
有首帧和尾帧图 → i2v - 首尾帧生视频
有已有视频想续写 → i2v - 视频续写
有参考视频/图复刻角色 → r2v(参考生视频,wan2.6-r2v)
想编辑已有视频 → videoedit(指令式编辑)
# 基础用法 - 单镜头
/video --mode t2v "近景,一只布偶猫坐在窗台上,午后阳光洒在它身上"
# 多镜头叙事 - 直接在 prompt 中描述
/video --mode t2v \
"第1个镜头[0-3秒] 全景:森林深处,阳光透过树冠。
第2个镜头[3-6秒] 中景:一只布偶猫从草丛中探出头。
第3个镜头[6-9秒] 特写:猫的眼睛闪着好奇的光。" \
--duration 9 --resolution 1080P --ratio 16:9
# 带音频
/video --mode t2v "prompt" --audio https://example.com/bgm.mp3 --duration 10
# 反向提示词
/video --mode t2v "一只猫在花园" --negative-prompt "花朵,文字,水印"
# 首帧生视频
/video --mode i2v "prompt" --first first_frame.jpg --duration 10
# 首尾帧生视频(精确控制起止画面)
/video --mode i2v "prompt" --first start.jpg --last end.jpg --duration 10
# 首帧 + 音频驱动
/video --mode i2v "prompt" --first face.jpg --audio voice.mp3 --duration 10
# 视频续写(基于已有视频生成后续)
/video --mode i2v "一个女孩对镜自拍后背着书包出门" \
--first-clip clip1.mp4 --duration 10
# 首段视频 + 尾帧续写
/video --mode i2v "prompt" \
--first-clip clip1.mp4 --last end.jpg --duration 10
⚠️ Wan 2.7 暂无独立 R2V 模型,当前使用 wan2.6-r2v-flash
wan2.6 角色引用方式:character1、character2...
# 单角色
/video --mode r2v --ref character.mp4 \
"character1在花园里散步,享受阳光"
# 多角色互动(最多5个角色)
/video --mode r2v \
--ref girl.mp4 --ref boy.mp4 \
"character1对character2说:你好!character2笑着回应" \
--duration 10 --shot-type multi
# 多角色 + 道具 + 背景
/video --mode r2v \
--ref char1.mp4 --ref char2.mp4 --ref guitar.jpg --ref cafe.jpg \
"character1抱着character3弹奏,character2坐在对面倾听,背景是character4" \
--duration 10 --shot-type multi
# 无声视频
/video --mode r2v --ref character.mp4 \
"character1在跳舞" \
--duration 5 --shot-type multi --no-audio
# 风格转换
/video --mode videoedit "将整个画面转换为黏土风格" \
--video original.mp4 --duration 5
# 内容替换(参考图)
/video --mode videoedit "将视频中女孩的衣服替换为图片中的衣服" \
--video original.mp4 --ref-image clothes.png --duration 5
# 运镜调整
/video --mode videoedit "在结尾添加缓慢推进效果" \
--video original.mp4 --duration 8
# 保留原声
/video --mode videoedit "添加雨天气效果" \
--video original.mp4 --audio-setting origin --duration 5
步骤 1:剧本
【片名】咖啡厅相遇
【时长】10秒
【风格】日系小清新,温暖柔和
【角色】女孩:黑色长发,白衬衫,20岁 | 男孩:短发,蓝毛衣,20岁
【场景】街角咖啡厅,午后阳光,木质桌椅,窗边绿植
【分镜】
镜头1[3s] 全景→中景 推:女孩坐在窗边看书,阳光透过玻璃
镜头2[3s] 中景 固定:男孩推门进来,风铃响起,女孩抬头
镜头3[4s] 近景 缓慢右摇:男孩走向女孩,两人相视而笑
步骤 2:wan2.7-t2v 一键生成
/video --mode t2v \
"第1个镜头[0-3秒] 全景推近:女孩坐在咖啡厅窗边看书,午后的阳光透过玻璃洒在她身上。
第2个镜头[3-6秒] 中景固定:男孩推门进来,风铃响起,女孩抬头看向他。
第3个镜头[6-10秒] 近景缓慢右摇:男孩走向女孩,两人相视而笑。
日系小清新风格,温暖柔和的光线,木质桌椅,窗边绿植" \
--duration 10 --resolution 1080P --ratio 16:9
| 参数 | 说明 | 默认值 |
|---|---|---|
--mode | t2v | t2v |
--duration | 时长 [2, 15] 秒 | 5 |
--resolution | 720P / 1080P | 1080P |
--ratio | 16:9 / 9:16 / 1:1 / 4:3 / 3:4 | 16:9 |
--audio | 音频 URL (wav/mp3, 2-30s) | 无(自动配音) |
--negative-prompt | 反向提示词 | 无 |
--prompt-extend | 智能改写 | true |
--seed | 随机种子 | random |
--watermark | AI 水印 | off |
| 参数 | 说明 | 默认值 |
|---|---|---|
--mode | i2v | i2v |
--first | 首帧图像 URL | - |
--last | 尾帧图像 URL | - |
--first-clip | 首段视频 URL(续写用) | - |
--audio | 驱动音频 URL (wav/mp3, 2-30s) | 无(自动配音) |
--duration | 时长 [2, 15] 秒 | 5 |
--resolution | 720P / 1080P | 1080P |
--negative-prompt | 反向提示词 | 无 |
| 参数 | 说明 | 默认值 |
|---|---|---|
--mode | videoedit | videoedit |
--video | 待编辑视频 URL | - |
--ref-image | 参考图像 URL(最多3张) | - |
--duration | 时长 [2, 10] 秒 | 输入视频时长 |
--resolution | 720P / 1080P | 1080P |
--audio-setting | auto / origin | auto |
| 参数 | 说明 | 默认值 |
|---|---|---|
--mode | r2v | r2v |
--ref | 参考文件 URL(可重复,最多5个) | - |
--duration | 时长 [2, 10] 秒 | 5 |
--size | 1280720 / 19201080 等 | 1920*1080 |
--shot-type | single / multi | single |
--no-audio | 无声视频 | 有声 |
| 档位 | 16:9 | 9:16 | 1:1 | 4:3 | 3:4 |
|---|---|---|---|---|---|
| 720P | 1280×720 | 720×1280 | 960×960 | 1104×832 | 832×1104 |
| 1080P | 1920×1080 | 1080×1920 | 1440×1440 | 1648×1248 | 1248×1648 |