ヘッドレスブラウザ操作CLI。Webページを開いて閲覧・操作・ログイン・スクリーンショット撮影ができる。 Use when: ブラウザでサイトを開く、Webアプリの操作・確認、ログイン操作、スクショ撮影、画面のUI確認が必要なとき。
Vercel Labs製のヘッドレスブラウザ自動操作ツール。Webページを開いて操作・情報取得・スクリーンショット撮影ができる。
未インストールの場合、以下を実行:
npm install -g agent-browser && agent-browser install
npm install -g agent-browser: CLI本体のインストールagent-browser install: Chrome for Testing のダウンロード(初回のみ、Linux では --with-deps を追加)インストール確認:
agent-browser --help
1. open <url> → ページを開く
2. snapshot -i → インタラクティブ要素のスナップショット取得(@e1, @e2 等のref付き)
3. click/fill/scroll → refを使って操作
4. snapshot -i → 操作後の状態を再確認
5. screenshot → 必要に応じてスクリーンショット保存
重要: 操作前に必ず snapshot -i でrefを取得すること。
agent-browser open <url>
agent-browser back
agent-browser forward
agent-browser reload
agent-browser close
agent-browser snapshot # 全体
agent-browser snapshot -i # インタラクティブ要素のみ(推奨)
agent-browser snapshot -c # コンパクト表示
agent-browser snapshot -d 3 # 深さ制限
agent-browser click @e1
agent-browser dblclick @e1
agent-browser fill @e2 "入力テキスト" # 既存テキストをクリアして入力
agent-browser type @e2 "追記テキスト" # 既存テキストに追記
agent-browser hover @e1
agent-browser check @e1 # チェックボックスON
agent-browser uncheck @e1 # チェックボックスOFF
agent-browser select @e1 "value" # プルダウン選択
agent-browser press Enter # キー入力
agent-browser scroll down 500 # スクロール
agent-browser scrollintoview @e1 # 要素が見えるまでスクロール
agent-browser wait 1500 # ミリ秒待機
agent-browser wait @e1 # 要素が表示されるまで待機
agent-browser wait --text "成功" # テキストが出現するまで待機
agent-browser wait --load networkidle # ネットワーク待機
agent-browser get title # ページタイトル
agent-browser get url # 現在のURL
agent-browser get text @e1 # 要素のテキスト
agent-browser get value @e1 # 入力要素の値
agent-browser screenshot # 現在のビューポート
agent-browser screenshot path.png # 指定パスに保存
agent-browser screenshot --full # ページ全体
agent-browser screenshot --annotate # 要素アノテーション付き
スクリーンショットは自分の attachments/ に保存して応答に含める:
agent-browser screenshot ~/.animaworks/animas/{自分の名前}/attachments/screenshot.png
ref番号が不明な場合、ロール名やラベルで要素を探して操作:
agent-browser find role button click --name "送信"
agent-browser find label "メールアドレス" fill "[email protected]"
agent-browser find text "ログイン" click
agent-browser state save auth.json # ログイン状態等を保存
agent-browser state load auth.json # 保存した状態を復元
agent-browser --session s1 open site.com # 名前付きセッション
agent-browser session list # セッション一覧
agent-browser open <url> --headed # ブラウザウィンドウを表示(GUIあり環境のみ)
agent-browser console # コンソールログ表示
agent-browser errors # エラーログ表示
agent-browser snapshot -i --json # JSON形式で出力
--headed でGUI表示も可能)AGENT_BROWSER_DEFAULT_TIMEOUT 環境変数で変更可)