Name: Data Alchemist
Author: smouj

Data Alchemist Skill

Purpose

Data Alchemist transforms raw, messy datasets into structured, actionable insights through automated ETL (Extract, Transform, Load) pipelines. It performs data validation, transformation, enrichment, and analysis without requiring manual scripting for common data operations.

Real Use Cases

CSV to PostgreSQL Pipeline: Automatically ingest a messy CSV with inconsistent headers, missing values, and type mismatches, validate against a schema, clean, and load to PostgreSQL with full audit trail.
API Data Enrichment: Extract data from REST endpoints, merge with existing datasets, apply transformations (geocoding, categorization, sentiment analysis), and export to dashboard-ready Parquet files.
Data Quality Audit: Scan production databases for anomalies, check for null thresholds, validate foreign key relationships, and generate a comprehensive quality report with failed rows extracted.
: Take high-frequency sensor data (millions of rows), resample to business intervals, calculate rolling statistics, detect outliers using IQR, and produce trend reports.

Data Alchemist Skill

Purpose

Real Use Cases

CSV to PostgreSQL Pipeline: Automatically ingest a messy CSV with inconsistent headers, missing values, and type mismatches, validate against a schema, clean, and load to PostgreSQL with full audit trail.
API Data Enrichment: Extract data from REST endpoints, merge with existing datasets, apply transformations (geocoding, categorization, sentiment analysis), and export to dashboard-ready Parquet files.
Data Quality Audit: Scan production databases for anomalies, check for null thresholds, validate foreign key relationships, and generate a comprehensive quality report with failed rows extracted.
: Take high-frequency sensor data (millions of rows), resample to business intervals, calculate rolling statistics, detect outliers using IQR, and produce trend reports.

Data Alchemist

Data Alchemist Skill

Purpose

Real Use Cases

Data Alchemist

Data Alchemist Skill

Purpose

Real Use Cases

Scope

Core Commands

Extended Commands

Work Process

Step 1: Assessment

Step 2: Schema Definition

Step 3: Validation

Step 4: Transformation Pipeline

Deep Research

Data Analyst

Academic Researcher

Data Scientist

Biopython

Binary Analysis Patterns