Use this skill when a user provides an image (local file or URL) and wants a detailed Traditional Chinese description of the image content. Prefer this skill for requests like "describe this image", "what's in this picture", "OCR this screenshot", "辨識這張圖", "描述這張照片", or when extracting text from screenshots or photos.
此技能使用 Gemini Interactions API 的原生圖片理解能力,分析圖片並產生繁體中文(zh-TW)Markdown 描述,包含圖片場景描述、文字辨識(OCR)與關鍵物件列表。支援本地檔案路徑、遠端 URL 與 data URI。
GEMINI_API_KEY 環境變數必須已設定直接執行預建置腳本 — 不需要 npm install 或其他額外設定:
node .agents/skills/image-describer/scripts/describe.js <image-path-or-url>
GEMINI_API_KEY=your_api_key node .agents/skills/image-describer/scripts/describe.js "https://example.com/photo.jpg"
GEMINI_API_KEY=your_api_key node .agents/skills/image-describer/scripts/describe.js "./photos/screenshot.png"
GEMINI_API_KEY=your_api_key node .agents/skills/image-describer/scripts/describe.js "data:image/png;base64,iVBOR..."
設定 IMAGE_DESCRIBER_DRY_RUN=1 可在不呼叫 Gemini API 的情況下,預覽解析後的輸入 metadata:
IMAGE_DESCRIBER_DRY_RUN=1 node .agents/skills/image-describer/scripts/describe.js "https://example.com/photo.jpg"
輸出為繁體中文 Markdown,包含以下區段:
⚠️ skill 腳本位於 repo 根目錄。若 cwd 不在 repo root,先獨立執行 git rev-parse --show-toplevel 取得路徑,再 cd 到該路徑後執行。禁止使用 $(...) 語法。
GEMINI_API_KEY。node .agents/skills/image-describer/scripts/describe.js "<image-path-or-url>"
file:// URL,腳本會自動轉換為 Base64 data URI。GEMINI_API_KEY 未設定,腳本會以代碼 1 結束並印出錯誤訊息。scripts/describe.js 是預建置的零依賴 bundle(由 Bun 從 src/describe.js 建置)。gemini-3-flash-preview(快速、平衡,適合圖片理解)。image part 的 uri 傳入。data:<mime>;base64,... URI 後傳送。IMAGE_DESCRIBER_DRY_RUN=1 可預覽解析後的輸入 metadata,不呼叫 Gemini API。若需修改腳本,編輯 src/describe.js 後重新建置:
cd .agents/skills/image-describer
bun install
bun build src/describe.js --outfile scripts/describe.js --target node --minify