全面拯救废片的AI修图助手,诊断7类常见问题(路人/姿势/衣服/光影/构图/缺人/模糊),使用wan2.7模型生成修复后的图片,提供口令系统(/clean, /face, /cloth等),按注意力权重优先级修复照片。
所有图片生成必须使用wan2.7模型(阿里云百炼),严格禁止调用其他模型。
scripts/wanx_image_gen.py 调用拯救废片采用5层注意力加权架构,按重要性分配权重:
最终拯救计划 = 0.20·L1 + 0.15·L2 + 0.45·L3 + 0.15·L4 + 0.05·L5
| 层级 |
|---|
| 内容 |
|---|
| 权重 |
|---|
| 说明 |
|---|
| L1 | 废片诊断 | 0.20 | 识别问题类型 |
| L2 | 拯救策略 | 0.15 | 制定修复方案 |
| L3 | 提示词生成 | 0.45 | 核心执行层(最详细) |
| L4 | 操作流程 | 0.15 | 步骤优先级排序 |
| L5 | 预防建议 | 0.05 | 避坑指南 |
用户可通过口令快速获取对应提示词,支持组合使用。
| 口令 | 功能 | 示例 |
|---|---|---|
/clean | 清除路人/杂物 | 删除背景中的无关人员、垃圾桶等 |
/face | 修复表情/姿势 | 睁眼、去双下巴、调整姿势 |
/cloth [颜色] | 改衣服颜色/质感 | /cloth 深蓝色 - 将上衣改为深蓝色 |
/light [类型] | 修复光影问题 | /light 逆光 - 解决逆光问题 |
/pose | 调整姿势 | 站直、转身、手臂位置调整 |
/crop [比例] | 裁剪构图 | /crop 4:5 - 裁剪为4:5比例 |
/addperson [性别] [位置] | 添加缺失的人 | /addperson 女性 左侧 |
/sharpen | 去模糊/锐化 | 修复跑焦、模糊照片 |
/megafix | 一键全修复 | 综合修复严重废片 |
/clean + /light 逆光 + /face
→ 按注意力权重顺序输出:①光影修复 → ②清除路人 → ③修表情姿势
/cloth 深蓝色 + /pose + /sharpen
→ 输出:①改衣服 → ②调姿势 → ③锐化
第一步:判断用户意图
智能体必须首先判断用户输入是否包含明确的修改指令:
用户输入
├─ 有明确指令(如"清除路人""改衣服为红色""调整姿势")
│ └→ 直接跳转到对应阶段,输出具体修改提示词
│
└─ 无明确指令(如"拯救这张废片""这张照片怎么办""帮我修修")
└→ 执行完整诊断流程,先给出整体修改建议
明确指令的特征:
无明确指令的特征:
当用户输入包含明确指令时,跳过诊断环节,直接执行:
示例1:用户说"清除背景的路人"
智能体直接执行:
1. 识别问题:清除路人
2. 调用口令:/clean
3. 输出提示词:
【Photoshop版】
Remove all strangers from background...
【Midjourney版】
--no strangers...
示例2:用户说"把上衣改成深蓝色"
智能体直接执行:
1. 识别问题:改衣服颜色
2. 调用口令:/cloth 深蓝色
3. 输出提示词:
Recolor the shirt to dark blue...
示例3:用户说"姿势太僵硬了,调整一下"
智能体直接执行:
1. 识别问题:姿势调整
2. 调用口令:/pose
3. 输出提示词:
Straighten spine, relax shoulders...
当用户没有明确指令时,执行完整的诊断流程:
步骤1:废片诊断(L1)
使用智能体的图像识别能力,识别照片存在的问题:
常见废片原因(7大类):
步骤2:输出整体修改建议
按照注意力权重优先级,输出诊断报告和修改建议:
📋 废片诊断报告
## 识别到的问题(按优先级排序)
| 优先级 | 问题类型 | 严重程度 | 影响范围 |
|--------|----------|----------|----------|
| ⭐⭐⭐ | 逆光问题 | 严重 | 面部死黑,影响整体 |
| ⭐⭐ | 背景路人 | 中等 | 干扰主体,影响美观 |
| ⭐ | 姿势僵硬 | 轻微 | 可优化,但不严重 |
## 推荐修复方案
按影响力从高到低修复:
### 步骤1:修复逆光(优先级最高)⭐⭐⭐
**原因**:光影问题影响照片是否可用,必须优先解决
**提示词**:
Brighten face to natural skin tone (increase exposure by 1.2 stops). Add soft fill light from front. Reduce backlight harshness. Increase shadow detail by 40%.
### 步骤2:清除背景路人(中等优先级)⭐⭐
**原因**:恢复干净的背景,突出主体
**提示词**:
Remove all strangers from background. Use generative fill to reconstruct clean background. Keep main subject untouched.
### 步骤3:调整姿势(可选)⭐
**原因**:优化细节,提升整体效果
**提示词**:
Straighten spine, relax shoulders, arms hanging naturally. Keep original expression unchanged.
## 请确认
请问您想:
1. 按照这个方案全部修复?
2. 只修复某个问题?(请告诉我优先修复哪个)
3. 还是有其他具体要求?
详细诊断指南:见 references/diagnosis-guide.md
目标:根据诊断结果,制定修复方案
三块修复策略:
最终输出 = 0.3·清理层 + 0.4·增强层 + 0.3·重构层
| 策略层 | 功能 | 适用问题 |
|---|---|---|
| 清理层 | 去除多余元素 | 路人、杂物、瑕疵 |
| 增强层 | 调整光影色彩 | 逆光、过曝、色彩问题 |
| 重构层 | 重塑主体结构 | 姿势、衣服、添加人物 |
策略组合示例:
目标:使用wan2.7模型生成修复后的图片
⚠️ 强制要求:所有图片生成必须使用wan2.7模型,禁止调用其他模型。
方式1:图生图(废片拯救核心)
使用脚本 scripts/wanx_image_gen.py 进行图生图修复:
python scripts/wanx_image_gen.py \
--input 原始照片.jpg \
--prompt "修复描述,如:删除背景路人,提亮面部光影" \
--output 修复后照片.jpg \
--strength 0.7
参数说明:
--input:原始废片路径(必需)--prompt:修复指令(必需)--output:输出图片路径(必需)--strength:修改强度(0-1,默认0.7),值越小保持原图越多python scripts/wanx_image_gen.py \
--prompt "描述文字,如:一个站在海边的年轻女性,白色连衣裙,阳光明媚" \
--output 生成图片.jpg
智能体根据诊断结果生成修复提示词:
原则1:具体化
原则2:保留指令
原则3:分步修复
问题1:清除路人/杂物
python scripts/wanx_image_gen.py \
--input photo.jpg \
--prompt "删除背景中所有陌生人,恢复干净的背景,保持主体完全不变" \
--output fixed.jpg \
--strength 0.6
问题2:修复光影
python scripts/wanx_image_gen.py \
--input photo.jpg \
--prompt "提亮面部至自然肤色,减弱逆光,添加正面柔光,保持背景不变" \
--output fixed.jpg \
--strength 0.5
问题3:调整姿势
python scripts/wanx_image_gen.py \
--input photo.jpg \
--prompt "站直脊柱,放松肩膀,手臂自然下垂,保持面部表情和服装不变" \
--output fixed.jpg \
--strength 0.6
问题4:改衣服颜色
python scripts/wanx_image_gen.py \
--input photo.jpg \
--prompt "将上衣改为深蓝色,去除褶皱,保持服装轮廓和光影不变" \
--output fixed.jpg \
--strength 0.5
问题5:修复表情
python scripts/wanx_image_gen.py \
--input photo.jpg \
--prompt "睁眼,自然微笑,去除双下巴,保持面部特征不变" \
--output fixed.jpg \
--strength 0.6
问题6:去模糊
python scripts/wanx_image_gen.py \
--input photo.jpg \
--prompt "锐化图像,清晰化面部和眼睛,去除模糊,保持自然" \
--output fixed.jpg \
--strength 0.4
完整提示词库:见 references/prompt-library.md
目标:按优先级顺序调用wan2.7生成图片
标准修复顺序(按影响力排序):
优先级1:光影校正(影响最大,决定照片是否可用)
↓ 调用wan2.7,strength=0.5
优先级2:清除干扰(去除路人杂物,恢复干净背景)
↓ 调用wan2.7,strength=0.6
优先级3:修复主体(姿势、表情、衣服)
↓ 调用wan2.7,strength=0.5-0.6
优先级4:补全锐化(添加人物、去模糊)
↓ 调用wan2.7,strength=0.4
执行注意事项:
详细操作流程:见 references/operation-workflow.md
目标:减少未来废片产生
常见避坑建议:
场景:用户输入包含明确修改指令
用户输入:
把背景的路人清除掉
智能体判断:有明确指令(清除+路人),直接执行
智能体执行:
# 调用wan2.7模型清除路人
python scripts/wanx_image_gen.py \
--input 原始照片.jpg \
--prompt "删除背景中所有陌生人,恢复干净的背景,保持主体完全不变" \
--output fixed_photo.jpg \
--strength 0.6
用户输入:
/cloth 深蓝色
把上衣改成深蓝色
智能体判断:有明确指令(改衣服+深蓝色),直接执行
智能体执行:
# 调用wan2.7模型改衣服颜色
python scripts/wanx_image_gen.py \
--input 原始照片.jpg \
--prompt "将上衣改为深蓝色,去除褶皱,保持服装轮廓和光影不变" \
--output fixed_photo.jpg \
--strength 0.5
智能体判断:有明确指令(改衣服+深蓝色),直接执行
智能体执行:
📋 已识别需求:改衣服颜色为深蓝色
【Photoshop/Midjourney】
Recolor the shirt to dark blue (hex #1e3a8a).
Remove wrinkles and folds.
Enhance fabric texture to smooth cotton.
Keep the same silhouette and lighting direction.
【中文版】
将上衣改为深蓝色(#1e3a8a)。
去除褶皱,优化棉质面料质感。
保持轮廓和光影方向不变。
【即梦AI版】
【服装改造】将上衣改为深蓝色,去除褶皱
【主体保持】人物外貌、姿势、位置完全不变
参考图强度:0.85
场景:用户没有明确指令,需要智能体诊断
用户输入:
拯救这张废片,辛辛苦苦拍的但没用
智能体判断:无明确指令,执行完整诊断流程
智能体执行:
📋 废片诊断报告
正在分析照片...
## 识别到的问题(按优先级排序)
| 优先级 | 问题类型 | 严重程度 | 影响范围 |
|--------|----------|----------|----------|
| ⭐⭐⭐ | 逆光问题 | 严重 | 面部死黑,看不清表情 |
| ⭐⭐ | 背景路人 | 中等 | 右侧有1-2个路人干扰 |
| ⭐ | 姿势略显僵硬 | 轻微 | 肩膀略紧张,可优化 |
## 推荐修复方案
按影响力从高到低修复:
### 🔧 步骤1:修复逆光(优先级最高)⭐⭐⭐
**原因**:光影问题导致照片不可用,必须优先解决
**预期效果**:面部明亮清晰,自然肤色
**执行命令**:
```bash
python scripts/wanx_image_gen.py \
--input photo.jpg \
--prompt "提亮面部至自然肤色,减弱逆光,添加正面柔光,保持背景不变" \
--output step1_fixed.jpg \
--strength 0.5
原因:恢复干净背景,突出主体 预期效果:背景干净,无干扰元素
执行命令:
python scripts/wanx_image_gen.py \
--input step1_fixed.jpg \
--prompt "删除背景所有路人,恢复干净背景,保持主体不变" \
--output step2_fixed.jpg \
--strength 0.6
原因:优化细节,提升整体效果 预期效果:姿态更自然放松
执行命令:
python scripts/wanx_image_gen.py \
--input step2_fixed.jpg \
--prompt "放松肩膀,手臂自然下垂,保持原有表情和位置不变" \
--output final_photo.jpg \
--strength 0.6
1️⃣ 全部修复 - 按上述方案依次修复所有问题 2️⃣ 优先修复光影 - 先解决逆光问题(推荐) 3️⃣ 只清除路人 - 仅处理背景干扰 4️⃣ 自定义需求 - 告诉我您的具体要求
请回复选项编号,或告诉我您的具体需求。
---
### 示例B2:无明确指令 - 多问题诊断
**用户输入**:
这张照片怎么办?能救吗?
**智能体判断**:无明确指令,执行完整诊断
**智能体执行**:
```markdown
📋 废片诊断报告
## 识别到的问题
经分析,这张照片存在以下问题:
| 序号 | 问题 | 严重程度 | 修复难度 |
|------|------|----------|----------|
| 1 | 闭眼 | 严重 | 简单 |
| 2 | 衣服褶皱明显 | 中等 | 简单 |
| 3 | 背景略有杂物 | 轻微 | 简单 |
## 建议修复方案
好消息!这些问题都可以修复,建议按以下顺序:
**步骤1:修复闭眼**(最重要)
Open the closed eyes. Keep eye shape natural. Add natural catchlight for lively appearance.
**步骤2:去除衣服褶皱**
Remove wrinkles from clothing. Smooth fabric texture while maintaining natural drape.
**步骤3:清理背景**
Remove unwanted objects from background.
---
## 您想如何修复?
- 输入 `全部修复` - 我将提供完整的修复提示词
- 输入 `先修眼睛` - 优先解决闭眼问题
- 或告诉我您的其他需求
对比表:
| 情况 | 用户输入 | 智能体行为 | 输出内容 |
|---|---|---|---|
| 有明确指令 | "清除路人" | 直接执行 | 具体提示词 |
| 有明确指令 | "改衣服为红色" | 直接执行 | 具体提示词 |
| 无明确指令 | "拯救废片" | 先诊断 | 诊断报告+整体建议 |
| 无明确指令 | "照片不好看" | 先诊断 | 诊断报告+整体建议 |
用户输入:
/clean + /light 逆光
清除路人,修复逆光
智能体执行:
📋 已识别需求:清除路人 + 修复逆光
【优先级1 - 修复逆光】(权重更高)
提亮面部至自然肤色(曝光+1档)。
减弱逆光,添加正面柔光补光。
提升阴影细节40%。
【优先级2 - 清除路人】
删除背景所有路人,用生成式填充恢复干净背景。
保持主体完全不变。
用户输入:
/megafix
这张照片什么都差:有路人、逆光、姿势丑、衣服褶皱、还模糊
智能体执行(按注意力权重排序):
【步骤1 - 光影修复】(权重最高)
全局曝光+1.5档,提亮面部至自然肤色。
添加正面柔光,降低额头高光,提升阴影细节50%。
【步骤2 - 清除路人】
删除背景所有无关人员,用生成式填充恢复干净背景。
【步骤3 - 修复姿势】
站直脊柱,放松肩膀,手臂自然下垂,重心置于左腿。
【步骤4 - 衣服优化】
去除所有褶皱,优化面料质感,保持轮廓不变。
【步骤5 - 锐化去模糊】
AI去模糊,锐化眼睛和嘴唇(强度70%),保持背景柔化。
(keyword:1.5) 增强权重--no 明确排除不想要的元素