Name: Baoyu Url To Markdown
Author: JimLiu

스킬 검색.../

Baoyu Url To Markdown | Skills Pool

# macOS, Linux, WSL, Git Bash
test -f .baoyu-skills/baoyu-url-to-markdown/EXTEND.md && echo "project"
test -f "${XDG_CONFIG_HOME:-$HOME/.config}/baoyu-skills/baoyu-url-to-markdown/EXTEND.md" && echo "xdg"
test -f "$HOME/.baoyu-skills/baoyu-url-to-markdown/EXTEND.md" && echo "user"

# PowerShell (Windows)
if (Test-Path .baoyu-skills/baoyu-url-to-markdown/EXTEND.md) { "project" }
$xdg = if ($env:XDG_CONFIG_HOME) { $env:XDG_CONFIG_HOME } else { "$HOME/.config" }
if (Test-Path "$xdg/baoyu-skills/baoyu-url-to-markdown/EXTEND.md") { "xdg" }
if (Test-Path "$HOME/.baoyu-skills/baoyu-url-to-markdown/EXTEND.md") { "user" }

EXTEND.md key	CLI argument	Notes
`download_media: 1`	`--download-media`	Requires `--output` to be set
`default_output_dir: ./posts/`	Agent constructs `--output ./posts/{domain}/{slug}.md`	Agent generates path, not a direct CLI flag

# Default: headless capture, markdown to stdout
${READER} <url>

# Save to file
${READER} <url> --output article.md

# Save with media download
${READER} <url> --output article.md --download-media

# Headless mode (explicit)
${READER} <url> --headless --output article.md

# Wait for interaction (login/CAPTCHA) — auto-detect and continue
${READER} <url> --wait-for interaction --output article.md

# Wait for interaction — manual control (Enter to continue)
${READER} <url> --wait-for force --output article.md

# JSON output
${READER} <url> --format json --output article.json

# Force specific adapter
${READER} <url> --adapter youtube --output transcript.md

# Connect to existing Chrome
${READER} <url> --cdp-url http://localhost:9222 --output article.md

# Debug artifacts
${READER} <url> --output article.md --debug-dir ./debug/

Option	Description
`<url>`	URL to fetch
`--output <path>`	Output file path (default: stdout)
`--format <type>`	Output format: `markdown` (default) or `json`
`--json`	Shorthand for `--format json`
`--adapter <name>`	Force adapter: `x`, `youtube`, `hn`, or `generic` (default: auto-detect)
`--headless`	Force headless Chrome (no visible window)
`--wait-for <mode>`	Interaction wait mode: `none` (default), `interaction`, or `force`
`--wait-for-interaction`	Alias for `--wait-for interaction`
`--wait-for-login`	Alias for `--wait-for interaction`
`--timeout <ms>`	Page load timeout (default: 30000)
`--interaction-timeout <ms>`	Login/CAPTCHA wait timeout (default: 600000 = 10 min)
`--interaction-poll-interval <ms>`	Poll interval for interaction checks (default: 1500)
`--download-media`	Download images/videos to local `imgs/` and `videos/`, rewrite markdown links. Requires `--output`
`--media-dir <dir>`	Base directory for downloaded media (default: same as `--output` directory)
`--cdp-url <url>`	Reuse existing Chrome DevTools Protocol endpoint
`--browser-path <path>`	Custom Chrome/Chromium binary path
`--chrome-profile-dir <path>`	Chrome user data directory (default: `BAOYU_CHROME_PROFILE_DIR` env or `./baoyu-skills/chrome-profile`)
`--debug-dir <dir>`	Write debug artifacts (document.json, markdown.md, page.html, network.json)

Mode	Behavior	Use When
Default	Headless Chrome, auto-extract on network idle	Public pages, static content
`--headless`	Explicit headless (same as default)	Clarify intent
`--wait-for interaction`	Opens visible Chrome, auto-detects login/CAPTCHA gates, waits for them to clear, then continues	Login-required, CAPTCHA-protected
`--wait-for force`	Opens visible Chrome, auto-detects OR accepts Enter keypress to continue	Complex flows, lazy loading, paywalls

Adapter	URLs	Key Features
`x`	x.com, twitter.com	Tweets, threads, X Articles, media, login detection
`youtube`	youtube.com, youtu.be	Transcript/captions, chapters, cover image, metadata
`hn`	news.ycombinator.com	Threaded comments, story metadata, nested replies
`generic`	Any URL (fallback)	Defuddle extraction, Readability fallback, auto-scroll, network idle detection

Path	Location
`.baoyu-skills/baoyu-url-to-markdown/EXTEND.md`	Project directory
`$HOME/.baoyu-skills/baoyu-url-to-markdown/EXTEND.md`	User home

Result	Action
Found	Read, parse, apply settings
Not found	MUST run first-time setup (see below) — do NOT silently create defaults

Key	Default	Values	Description
`download_media`	`ask`	`ask` / `1` / `0`	`ask` = prompt each time, `1` = always download, `0` = never
`default_output_dir`	empty	path or empty	Default output directory (empty = `./url-to-markdown/`)

Setting	Behavior
`1` (always)	Run CLI with `--download-media --output <path>`
`0` (never)	Run CLI with `--output <path>` (no media download)
`ask` (default)	Follow the ask-each-time flow below

Baoyu Url To Markdown

URL to Markdown

CLI Setup

Preferences (EXTEND.md)

Baoyu Url To Markdown

URL to Markdown

CLI Setup

Preferences (EXTEND.md)

First-Time Setup (BLOCKING)

Supported Keys

Features

Usage

Options

Capture Modes

Agent Quality Gate

Quality checks the agent must perform

Recovery workflow the agent must follow

Output Path Generation

Output Format

Built-in Adapters

Media Download Workflow

Ask-Each-Time Flow

Environment Variables

YouTube Notes

X/Twitter Notes

Hacker News Notes

Extension Support

Feishu Doc

Summarize

Nano Pdf

Diffs

Customs Trade Compliance

Nutrient Document Processing