Name: Midscene Yaml Generator
Author: lee-117

Midscene Yaml Generator | Skills Pool

PuppeteerAgent

.js

.ts

检测条件	环境类型	执行命令
当前目录有 `scripts/midscene-run.js`	项目内	`node scripts/midscene-run.js <file>`
当前目录无 `scripts/midscene-run.js`	外部项目	`npx @midscene/web <file> --headed`

# 检测方式（生成前自动执行）
ls scripts/midscene-run.js 2>/dev/null && echo "PROJECT" || echo "EXTERNAL"

# AI 模型（必须）
MIDSCENE_MODEL_BASE_URL=https://ark.cn-beijing.volces.com/api/v3
MIDSCENE_MODEL_API_KEY=sk-your-key
MIDSCENE_MODEL_NAME=doubao-seed-2.0

# Chrome 路径（可选，自动检测失败时设置）
# Windows 示例:
# PUPPETEER_EXECUTABLE_PATH=C:\Program Files\Google\Chrome\Application\chrome.exe
# Mac 示例:
# PUPPETEER_EXECUTABLE_PATH=/Applications/Google Chrome.app/Contents/MacOS/Google Chrome
# Linux 示例:
# PUPPETEER_EXECUTABLE_PATH=/usr/bin/google-chrome

node scripts/health-check.js

用户需求 → 检测项目上下文（项目内 or 外部项目）
         → [Generator] 生成 YAML
         → [Generator] 自动 dry-run 验证
         → 验证失败？→ [Generator] 自动修复
         → [Runner] 执行
         → 执行失败？→ [Runner] 分析 + 修复 YAML → 重新执行
         → 成功 → 展示报告摘要

用户说...	正确响应
"生成一个 YAML"	Generator: 生成 → dry-run → 输出文件路径
"运行这个 YAML"	提示用户使用 Runner: `node scripts/midscene-run.js <file>`
"生成并运行一个自动化脚本"	Generator: 生成 → dry-run → 输出 `[GENERATED]`，然后提示用户用 Runner 执行
"写个脚本/程序/代码来自动化 XXX"	Generator: 生成 YAML 文件（不是 JS/TS 脚本） → dry-run
"自动化 XXX"	Generator: 生成 YAML → dry-run → 输出文件路径

用户描述	平台	YAML 配置
"打开网页/网站/URL"	Web	`web: { url: "...", headless: false }`
"测试 Android 应用"	Android	`android: { deviceId: "..." }` + `launch: "包名"`
"测试 iOS 应用"	iOS	`ios: { wdaPort: 8100 }` + `launch: "bundleId"`
"桌面自动化"	Computer	`computer: { ... }`

场景	推荐动作	理由
已知精确操作（"点击登录按钮"、"输入用户名"）	`aiTap`/`aiInput` 等即时动作	更快、更可靠、更可预测
提取数据	`aiQuery`/`aiBoolean`/`aiNumber`/`aiString`	返回结构化数据
验证状态	`aiAssert` / `aiWaitFor`	专用断言/等待 API
探索性/多步骤操作（"完成整个结账流程"）	`ai:`	AI 自动规划路径，仅用于步骤不确定的场景

Midscene Yaml Generator

Midscene YAML Generator

硬约束 — 绝不违反

Midscene Yaml Generator

Midscene YAML Generator

硬约束 — 绝不违反

红旗自检 — 发现自己在做以下事情时立即停止

关键规则（必读）

首次使用

项目上下文检测（重要）

.env 配置

典型工作流

用户意图决策树

职责范围

触发条件

工作流程

第 1 步：分析需求复杂度

第 2 步：确定目标平台

第 3 步：自然语言 → YAML 转换

动作选择优先级（重要）

Liquid Glass Design

Compose Multiplatform Patterns

Foundation Models On Device

Swiftui Patterns

Foundation Models On Device

Swiftui Patterns