Name: Tinyscraper
Author: openclaw

TinyScraper - 静态网站镜像工具

纯 Python3 标准库，无额外依赖

📁 目录结构

TinyScraper/
├── SKILL.md
├── bin/
│   └── tinyscraper       # CLI 入口
├── lib/
│   └── crawler.py        # 核心爬虫逻辑
├── conf/
│   └── .tinyscraper.conf # 配置文件
├── assets/

├── scripts/
│   └── test_crawler.py   # 自动化测试
└── references/
    └── SPEC.md           # 格式标准文档

🎯 Skill 职责

将目标网站完整镜像到本地，包括：

HTML 页面（保持目录结构）
JS、CSS、图片、字体等静态资源
HTML/CSS 中的相对路径自动重写
外部链接保留原值，不处理

🔖 触发场景

用户要求"下载网站"、"镜像网站"、"离线保存网页"
用户提供 URL 并要求"爬取整个网站"
用户要求"抓取网站所有资源"

TinyScraper - 静态网站镜像工具

纯 Python3 标准库，无额外依赖

📁 目录结构

TinyScraper/
├── SKILL.md
├── bin/
│   └── tinyscraper       # CLI 入口
├── lib/
│   └── crawler.py        # 核心爬虫逻辑
├── conf/
│   └── .tinyscraper.conf # 配置文件
├── assets/

├── scripts/
│   └── test_crawler.py   # 自动化测试
└── references/
    └── SPEC.md           # 格式标准文档

🎯 Skill 职责

将目标网站完整镜像到本地，包括：

HTML 页面（保持目录结构）
JS、CSS、图片、字体等静态资源
HTML/CSS 中的相对路径自动重写
外部链接保留原值，不处理

🔖 触发场景

用户要求"下载网站"、"镜像网站"、"离线保存网页"
用户提供 URL 并要求"爬取整个网站"
用户要求"抓取网站所有资源"

URL	本地路径
`/`	`index.html`
`/about`	`about/index.html`
`/page?id=1`	`page/index.html`
`/style.css?v=1.2`	`style.css`（去重）
`/page#section`	`#` 锚点去除，视为同一文件

Tinyscraper

TinyScraper - 静态网站镜像工具

📁 目录结构

🎯 Skill 职责

🔖 触发场景

Tinyscraper

TinyScraper - 静态网站镜像工具

📁 目录结构

🎯 Skill 职责

🔖 触发场景

📋 执行步骤

1. 确认目标

2. 启动爬取

3. 监控进度

4. 完成后

⚙️ 命令详解

📦 输出标准

目录结构

路径规范

资源重写规则

日志输出

⚠️ 局限性

Sherlock

Domain Name Brainstormer

Bmad Domain Research

Claimable Postgres

Active Directory Attacks

Gws Gmail Watch