Name: Browser Control
Author: joungwoo-lee

Browser Control | Skills Pool

python3 .claude/skills/browser-control/scripts/open_url.py \
  --url "https://example.com" \
  --out outputs/browser/open.json

python3 .claude/skills/browser-control/scripts/snapshot_dom.py \
  --url "https://example.com" \
  --out outputs/browser/snapshot.json

python3 .claude/skills/browser-control/scripts/act_click_type.py \
  --url "https://example.com" \
  --actions '[{"type":"click","selector":"text=More information"}]' \
  --out outputs/browser/act.json

python3 .claude/skills/browser-control/scripts/wait_for.py \
  --url "https://example.com" \
  --selector "h1" \
  --timeout-ms 10000 \
  --out outputs/browser/wait.json

python3 .claude/skills/browser-control/scripts/screenshot.py \
  --url "https://example.com" \
  --image outputs/browser/page.png \
  --out outputs/browser/screenshot.json

Skip DOM snapshot when URL pattern is known

Search engines (Naver, Google) have predictable URL patterns. Build the URL directly instead of snapshotting + typing + pressing Enter.

# BAD: 3 steps (snapshot → type/click/press → screenshot) = high token cost
python3 .claude/skills/browser-control/scripts/snapshot_dom.py --url "https://www.naver.com" ...
python3 .claude/skills/browser-control/scripts/act_click_type.py --url "https://www.naver.com" --actions '[...]' ...
python3 .claude/skills/browser-control/scripts/screenshot.py --url "https://search.naver.com/..." ...

# GOOD: 1 step = low token cost
python3 .claude/skills/browser-control/scripts/screenshot.py \
  --url "https://search.naver.com/search.naver?query=%EC%98%A4%ED%94%88%ED%81%B4%EB%A1%9C" \
  --image outputs/browser/result.png \
  --out outputs/browser/screenshot.json

Never Read the full snapshot JSON into context

Snapshot JSON can be hundreds of lines. Filter with jq in Bash instead of using the Read tool.

python3 .claude/skills/browser-control/scripts/snapshot_dom.py \
  --url "https://example.com" --out /dev/stdout \
  | jq '.items[] | select(.tag=="input")'

Combine actions into a single call
- Use one act_click_type.py call with multiple actions array instead of calling the script multiple times.
Screenshot only when needed
- If you only need text data (e.g. link URLs, page title), use snapshot_dom.py with jq filtering instead of a screenshot.

{
  "write_allowed_hosts": ["docs.openclaw.ai", "github.com"],
  "read_blocked_hosts": ["facebook.com", "x.com"]
}

Browser Control

Browser Control (Claude Code)

Prerequisites

Scripts

Recommended flow

Browser Control

Browser Control (Claude Code)

Prerequisites

Scripts

Recommended flow

Commands

Open URL

Snapshot candidates

Actions (click/type/press)

Wait for UI state

Screenshot

Token optimization tips

Policy (read/write access control)

Rules

Oracle

Blucli

Peekaboo

Add Dock Band

Add Fallback Commands

Add Adaptive Card Form