Пример: /scrape-aa — полный цикл Пример: /scrape-aa --skip-done — только недостающие данные Пример: /scrape-aa --limit 20 — первые 20 моделей (для теста)

Предусловия

Зависимости установлены: pip install -r requirements.txt (из корня репо)
Переменные окружения в .env в рабочей директории: HF_TOKEN (опционально)
Firecrawl CLI доступен (используется aa_benchmarks_scraper.py)

Алгоритм

Шаг 1 — Bulk scraping (список моделей + базовые данные)

python scrape-aa/aa_bulk_scraper.py --output data/aa_models.json

Если добавляется --resume — продолжит с последней позиции. Если добавляется --benchmarks-only — пропустить этот шаг.

Собирает для каждой модели:

Предусловия

Зависимости установлены: pip install -r requirements.txt (из корня репо)
Переменные окружения в .env в рабочей директории: HF_TOKEN (опционально)
Firecrawl CLI доступен (используется aa_benchmarks_scraper.py)

Алгоритм

Шаг 1 — Bulk scraping (список моделей + базовые данные)

python scrape-aa/aa_bulk_scraper.py --output data/aa_models.json

Если добавляется --resume — продолжит с последней позиции. Если добавляется --benchmarks-only — пропустить этот шаг.

Собирает для каждой модели:

Ситуация	Действие
Шаг 1 упал на середине	Перезапустить с `--resume`
429 от HF API	Скрипты сами делают retry с backoff; подождать
Модель без HF страницы	Записывается с `hf_config: null`, не критично
Firecrawl недоступен	`aa_benchmarks_scraper` упадёт; остальные шаги независимы

Флаг	Описание
`--limit N`	Обработать только первые N моделей (тест)
`--skip-done`	Пропустить модели с уже заполненными данными
`--benchmarks-only`	Только шаг 3 (бенчмарки)
`--resume`	Продолжить bulk scraping с последней позиции

Scrape Aa

Предусловия

Алгоритм

Шаг 1 — Bulk scraping (список моделей + базовые данные)

Scrape Aa

Предусловия

Алгоритм

Шаг 1 — Bulk scraping (список моделей + базовые данные)

Шаг 2 — Обогащение метаданными

Шаг 3 — Бенчмарки (Selenium/Firecrawl)

Шаг 4 — Обновить дашборд

Обработка ошибок

Флаги

Выходные файлы

После завершения

Visualization Expert

Data Analyst

Huggingface Hub

Multi Reviewer Patterns

Dbt Transformation Patterns

Startup Financial Modeling