AI画像生成。「画像作って」「バナー作って」「ロゴ生成」と言われた時に使用。GPT Image 1.5(総合1位)+ Geminiフォールバック。プロンプト自動強化(SCS構造)付き。
python generate.py で生成スクリプトパス: _shared/skills/generate-image/generate.py
python _shared/skills/generate-image/generate.py "プロンプト"
python _shared/skills/generate-image/generate.py "プロンプト" \
--model gpt-image \
--aspect-ratio 16:9 \
--output filename.png \
--purpose "ウェブバナー"
python _shared/skills/generate-image/generate.py "背景を青に変更" \
--input-image generated-images/original.png
ポイント: AI画像にテキストを描かせない → Pillowで日本語フォント合成
python3 _shared/skills/generate-image/generate.py \
"iPhone買取をテーマにした写真。木目調デスクの上にiPhoneと査定書が並ぶ。自然光" \
--aspect-ratio 3:2 \
--purpose "ブログ記事のヒーロー画像" \
--text "iPhone買取完全ガイド|50|40|64|#FFFFFF|bold" \
--text "最新相場と高く売るコツ|50|60|32|#E0E0E0|regular" \
--output article-hero.png
--text 指定時は 自動的に AI画像内のテキスト描画が抑制されます。
python3 _shared/skills/generate-image/generate.py "背景画像のプロンプト" \
--text "メインテキスト|50|15|80|#1a2744|bold" \
--text "サブテキスト|50|80|26|#555555|regular" \
--text "CTAボタン|50|90|30|#FFFFFF|bold|#22c55e|16|12"
テキスト|x%|y%|size|color|weight|bg_color|padding|radius
| フィールド | 必須 | デフォルト | 説明 |
|---|---|---|---|
| テキスト | ○ | - | 表示文字列 |
| x | 50 | 水平位置(0-100%、中央揃え) | |
| y | 50 | 垂直位置(0-100%) | |
| size | 48 | フォントサイズ | |
| color | #FFFFFF | テキスト色 | |
| weight | bold | bold/regular/light | |
| bg_color | なし | 背景色(CTAボタン用) | |
| padding | 12 | 背景余白 | |
| radius | 8 | 角丸半径 |
注意: python3で実行すること(pythonはuv環境でPillow未対応の場合あり)
| モデル | --model | プロバイダ | 特徴 |
|---|---|---|---|
| Auto (デフォルト) | auto | - | GPT Image → Pro → Flash |
| GPT Image 1.5 | gpt-image | OpenAI | 総合品質1位・ロゴ/テキスト◎ |
| Pro | pro | Gemini | 高品質・現在503中 |
| Flash | flash | Gemini | 安定・高速・無料枠 |
| オプション | 値 | 説明 |
|---|---|---|
--model | auto/gpt-image/pro/flash | モデル選択 |
--aspect-ratio | 1:1, 16:9, 9:16, 3:4 等 | アスペクト比 |
--size | 2K, 4K | 解像度(Geminiのみ) |
--quality | low/medium/high | GPT Image品質(デフォルト: high) |
--output | ファイル名 | 出力ファイル名(省略時は自動生成) |
--output-dir | ディレクトリ | 出力先(デフォルト: generated-images/) |
--input-image | パス | 画像編集用入力画像 |
--purpose | テキスト | 用途(プロンプト強化に反映) |
--text | 書式文字列 | テキスト合成(複数可、Pillow使用) |
--no-text-in-image | - | AI画像内テキスト描画禁止(--text時は自動有効) |
--no-enhance | - | プロンプト強化スキップ |
-v | - | 詳細ログ |
自動的にGemini 2.5 Flashでプロンプトを強化。--no-enhanceで無効化。
| 要素 | 内容 | 例 |
|---|---|---|
| Subject | 主題・特徴 | "Golden retriever puppy, fluffy fur" |
| Context | 背景・環境 | "sunlit park, cherry blossoms, morning" |
| Style | 美的方向性 | "photorealistic, golden hour, 85mm lens" |
JSON → Readツールで画像確認 → ユーザーに表示。
自動検索: 環境変数 → .env.local → .mcp.json
| 層 | 内容 | 例 |
|---|---|---|
| 1. Subject | 主題 | "Golden retriever puppy" |
| 2. Description | 文脈 | "running in a park, cherry blossoms" |
| 3. Style | 美的方向性 | "photorealistic, golden hour" |
| 4. Constraints | 技術指定 | "4K, --ar 16:9" |
Create a clean, minimalist Japanese-style web banner for [商品].
Aspect ratio [1200x628/1080x1080]. Background [soft white/beige].
Center a photorealistic [被写体]. Text: [位置] "[テキスト]" in [フォント].
Overall [natural/refreshing/trustworthy] feel. High resolution.
| 要素 | 内容 |
|---|---|
| デザイン | ミニマル、余白多め |
| 色使い | パステル調、緑・青・ベージュ |
| フォント | ゴシック/丸ゴシック、短く簡潔 |
| 写真 | ライフスタイル、笑顔の人物 |
| 順位 | ツール | 特徴 |
|---|---|---|
| 1 | Qwen Image 2.5 | オープンソース最高性能 |
| 2 | Midjourney v7 | アーティスティック |
| 3 | Nano Banana Pro | テキスト精度、Gemini統合 |
| 4 | Ideogram | グラフィックス |
| 5 | FLUX.1 / SD | オープンソース |
| ツール | Tips |
|---|---|
| Midjourney | --ar 16:9, --v 7, --s 250 |
| Stable Diffusion | 重み付け (keyword:1.5) |
| Nano Banana | 日本語OK、テキスト指定得意 |