Name: Eda
Author: argythana

Exploratory Data Analysis (EDA)

Analyze tabular datasets to understand distributions, data quality, and patterns.

When to Use

Analysis

Column Distribution	Value counts, percentages, cardinality assessment
Missing Data	Null counts, patterns (MCAR/MAR/MNAR)
Class Balance	Imbalance detection for classification targets
Summary Stats	Count, unique, nulls per column

Level	Criteria	Action
Low	≤10 unique	Good for categorical encoding
Medium	11-100 or <1% of rows	May need encoding strategy
High	>100 and <50% of rows	Consider grouping/binning
Very High	>50% of rows	Likely identifier, exclude

Percentage	Assessment
0%	No missing data
<1%	Minimal - safe to drop or impute
1-5%	Some - consider imputation strategy
>5%	Significant - investigate pattern