Skill-Datei

Jimliu Baoyu Skills Baoyu Image Gen

Name: Jimliu Baoyu Skills Baoyu Image Gen
Author: openakita

Generate AI images using multiple providers (OpenAI DALL-E, Google Imagen, DashScope/Tongyi Wanxiang, Replicate). Supports various aspect ratios, quality presets, batch generation, and provider-specific prompt engineering techniques.

openakita1,643 Sterne06.04.2026

Beruf
Kategorien: LLM & AI

Skill-Inhalt

Baoyu Image Gen — AI 图像生成

When to Use

用户要求生成图片、插图、海报、封面、图标等视觉内容
需要为文章、PPT、网站创建配图
需要特定比例的图片（社交媒体封面、手机壁纸等）
需要批量生成多张图片并选择
需要针对不同 AI 绘图服务编写优化 prompt
需要将自然语言描述转换为高质量 AI 图片

Prerequisites

API 密钥配置

至少需要配置一个图像生成服务的 API 密钥。在 .env 文件或环境变量中设置：

环境变量	服务商	获取方式
`OPENAI_API_KEY`	OpenAI DALL-E 3	https://platform.openai.com/api-keys
`GOOGLE_API_KEY`	Google Imagen 3

Verwandte Skills

Jimliu Baoyu Skills Baoyu Image Gen | Skills Pool

依赖	用途	安装方式
`openai`	OpenAI SDK	`pip install openai`
`google-genai`	Google Gemini/Imagen SDK	`pip install google-genai`
`dashscope`	通义万象 SDK	`pip install dashscope`
`replicate`	Replicate SDK	`pip install replicate`

能力	DALL-E 3	Imagen 3	通义万象	Replicate (Flux)
图片质量	★★★★★	★★★★★	★★★★	★★★★★
中文 prompt	★★★	★★★	★★★★★	★★
文字渲染	★★★★	★★★★	★★★	★★★
速度	中等	快	快	慢
价格	较贵	中等	便宜	按模型
尺寸灵活度	3 种固定	多种	多种	自定义
风格多样性	★★★★★	★★★★	★★★★	★★★★★

比例	像素（示例）	适用场景
1:1	1024×1024	头像、图标、社交媒体帖子
16:9	1792×1024	PPT 配图、YouTube 封面、桌面壁纸
4:3	1365×1024	传统幻灯片、相册
9:16	1024×1792	手机壁纸、Instagram Stories、短视频封面
3:2	1536×1024	摄影风格、杂志插图
2:3	1024×1536	海报、书籍封面

预设	说明	适用场景
`draft`	快速草稿，低分辨率	方案探索、快速迭代
`standard`	标准质量	日常使用、网页配图
`hd`	高清，细节丰富	正式出版、印刷
`ultra`	最高质量，最长等待	海报、展览

要素	默认值	说明
主题	—	图片的核心内容
风格	写实	摄影、插画、水彩、赛博朋克、扁平化等
比例	1:1	根据用途自动推断
质量	standard	draft/standard/hd/ultra
服务商	auto	自动选择或用户指定

[主体描述], [环境/背景], [风格], [光线], [构图], [色调], [细节描述]

A cozy coffee shop interior with warm lighting,
morning sunlight streaming through large windows,
a steaming cup of latte on a wooden table with an open book,
shot on 35mm film, soft warm tones,
shallow depth of field, photorealistic

from openai import OpenAI
client = OpenAI()

response = client.images.generate(
    model="dall-e-3",
    prompt="一只橘猫坐在窗台上看雨，窗外是东京夜景，赛博朋克风格，霓虹灯倒映在雨滴中",
    size="1792x1024",
    quality="hd",
    n=1
)
image_url = response.data[0].url
revised_prompt = response.data[0].revised_prompt

from google import genai
client = genai.Client()

response = client.models.generate_images(
    model='imagen-3.0-generate-002',
    prompt='A serene Japanese garden in autumn, koi fish swimming in a crystal clear pond, maple trees with red and orange leaves',
    config=genai.types.GenerateImagesConfig(
        number_of_images=1,
        aspect_ratio='16:9'
    )
)

for image in response.generated_images:
    image.image.save('garden.png')

import dashscope

response = dashscope.ImageSynthesis.call(
    api_key=os.getenv('DASHSCOPE_API_KEY'),
    model='wanx-v1',
    input={
        'prompt': '一座雪山下的小木屋，温暖的灯光从窗户透出，天空中有极光，油画风格',
        'negative_prompt': '低质量, 模糊, 变形'
    },
    parameters={
        'size': '1024*1024',
        'n': 1,
        'style': '<oil painting>'
    }
)

image_url = response.output.results[0].url

import replicate

output = replicate.run(
    "black-forest-labs/flux-1.1-pro",
    input={
        "prompt": "An astronaut riding a horse on Mars, cinematic lighting, 8k resolution, hyperdetailed",
        "aspect_ratio": "16:9",
        "output_format": "png",
        "safety_tolerance": 2
    }
)

{描述关键词}_{服务商}_{比例}_{日期时间}.png

📸 图片已生成
- 文件：./images/coffee_shop_dalle3_16x9.png
- 服务商：DALL-E 3
- 尺寸：1792 × 1024 (16:9)
- 质量：HD
- Prompt：[实际使用的 prompt]
- 耗时：8.3s
- 费用估算：$0.08

from PIL import Image, ImageDraw, ImageFont

img = Image.open('base_image.png')
draw = ImageDraw.Draw(img)
font = ImageFont.truetype('msyh.ttc', size=48)
draw.text((100, 50), '标题文字', fill='white', font=font)
img.save('final_image.png')

依赖	用途	安装方式
Python ≥ 3.10	运行生成脚本	系统预装
`httpx`	HTTP 请求	`pip install httpx`
`Pillow`	图片处理	`pip install Pillow`

参数	说明
数量	2-8 张（默认 4）
变体策略	same-prompt（同 prompt 不同种子）/ varied-prompt（不同风格变体）

服务商	单张费用（约）
DALL-E 3 HD	$0.08
DALL-E 3 Standard	$0.04
Imagen 3	$0.03
通义万象	¥0.04
Flux Pro	$0.05

Jimliu Baoyu Skills Baoyu Image Gen

Baoyu Image Gen — AI 图像生成

When to Use

Prerequisites

API 密钥配置

Jimliu Baoyu Skills Baoyu Image Gen

Baoyu Image Gen — AI 图像生成

When to Use

Prerequisites

API 密钥配置

必需依赖

可选依赖

Instructions

服务商能力对比

服务商自动选择策略

宽高比速查

质量预设

Workflows

Workflow 1: 单张图片生成

Workflow 2: 批量生成

Workflow 3: Prompt 优化咨询

Prompt 工程指南

通用 Prompt 结构

DALL-E 3 专用技巧

Google Imagen 3 专用技巧

通义万象专用技巧

Replicate (Flux) 专用技巧

Output Format

文件命名

输出内容

多图对比输出

Common Pitfalls

1. API Key 未配置

2. Prompt 过于模糊

3. 比例与用途不匹配

4. 中文 prompt 发给 Flux/Replicate

5. 图片中文字乱码

6. 费用失控

7. 内容安全限制

EXTEND.md 扩展

Openai Whisper

Voice Call

Prose

Clawhub

Sherpa Onnx Tts

Openai Whisper Api