Name: Data Science
Author: Compdeep

搵技能.../

project/
  data/
    raw/            (original, immutable inputs)
    processed/      (cleaned, ready for analysis)
    outputs/        (figures, tables, reports)
  src/
    load.py         (read raw data, handle encodings, parse dates)
    clean.py        (drop nulls, fix types, normalize, handle outliers)
    analyze.py      (the main computation — groupby, stats, model)
    plot.py         (figures — matplotlib or seaborn)
    report.py       (assemble final output — markdown or HTML)
    utils.py        (shared helpers — only if genuinely reused)
  requirements.txt
  README.md

"setup": [
  "python3 -m venv project/.venv",
  "project/.venv/bin/pip install pandas numpy matplotlib seaborn scikit-learn"
]

"interfaces": {
  "raw_input": {"columns": ["user_id", "event_time", "event_type", "amount"], "source": "data/raw/events.csv"},
  "cleaned": {"columns": ["user_id", "timestamp", "event", "amount_usd"], "location": "data/processed/events_clean.parquet"},
  "analysis_output": {"columns": ["user_id", "total_events", "total_spend"], "location": "data/outputs/user_summary.csv"}
}

{"goal": "load and parse raw CSV", "task_files": ["src/load.py"], "execute": "cd project && .venv/bin/python -m src.load"}
{"goal": "clean and normalize", "task_files": ["src/clean.py"], "execute": "cd project && .venv/bin/python -m src.clean", "depends_on_tasks": [0]}

Data Science | Skills Pool

Data Science

Data Science

When to Use

Planning Guidance

Architect Guidance

Coder Guidance

Visualization Expert

Data Analyst

Huggingface Hub

Multi Reviewer Patterns

Dbt Transformation Patterns

Startup Financial Modeling