Name: Clean Summons Export
Author: racmac57

Skills suchen.../

Clean Summons Export | Skills Pool

df = pd.read_csv(
    src,
    sep=";",                   # NOT comma — default pd.read_csv gives 1-column garbage
    dtype=str,                 # parse all as string first; coerce later per column
    na_values=["", " ", "NA"],
    on_bad_lines="warn",       # 1 malformed row per sample — log not fail
    encoding="utf-8",
)

text_cols = df.select_dtypes(include=["object"]).columns
df[text_cols] = df[text_cols].apply(lambda s: s.str.strip())

known_empty = [
    "Court Street 2", "Hours Of Operation", "Vehicle VIN", "Unit Code",
    "Officer Middle Name", "Defendant Middle Name", "Vehicle Sub Model",
    "Vehicle Color 2", "Officer Rank", "Defendant Prefix", "Defendant Suffix",
]
df = df.drop(columns=[c for c in known_empty if c in df.columns])

df["Offense Date"] = pd.to_datetime(df["Offense Date"], errors="coerce")
df["Charge Time"] = df["Charge Time"].astype(str).str.zfill(4).str[:2] + ":" + df["Charge Time"].astype(str).str.zfill(4).str[2:4]
# etc.

is_parking = df["Case Type Code"] == "P"
df["Meter Number"] = df["Meter Number/Speed MPH Zone Number"].where(is_parking)
df["Speed MPH Zone"] = df["Meter Number/Speed MPH Zone Number"].where(~is_parking)
df = df.drop(columns=["Meter Number/Speed MPH Zone Number"])
# Repeat for Area/Speed MPH and Visibility/Is Commercial Vehicle

Column	Type	Source
`Date`	date	`Offense Date.dt.normalize()`
`MonthKey`	string (YYYY-MM)	`Offense Date.dt.strftime("%Y-%m")` — joins to `___DimMonth[MonthKey]`
`CaseTypeCode`	string	`Case Type Code` (P or M)
`Metric`	string	"Parking Summons" if P else "Moving Summons"
`OfficerBadge`	string	`Officer Badge Number`
`OffenseCode`	string	`Offense Code`
`OffenseDescription`	string	`Offense Description`
`PleadingAmount`	numeric	`Pleading Amount` (coerce to float)
`Value`	int	Literal `1` (S4 shim)

slim = pd.DataFrame({
    "Date": df["Offense Date"].dt.normalize(),
    "MonthKey": df["Offense Date"].dt.strftime("%Y-%m"),
    "CaseTypeCode": df["Case Type Code"],
    "Metric": df["Case Type Code"].map({"P": "Parking Summons", "M": "Moving Summons"}).fillna("Other Summons"),
    "OfficerBadge": df["Officer Badge Number"],
    "OffenseCode": df["Offense Code"],
    "OffenseDescription": df["Offense Description"],
    "PleadingAmount": pd.to_numeric(df["Pleading Amount"], errors="coerce"),
    "Value": 1,
})
slim = slim.dropna(subset=["Date"])

slim.to_csv(PROJECT_ROOT / "Data_Load" / "summons_slim_for_powerbi.csv", index=False)

Slim file → Data_Load/summons_slim_for_powerbi.csv (overwrites — this file is idempotent)

Diff report (stdout):

# Summons Cleanup Report — 2026_03_eticket_export.csv
- Input rows: 4,160 | Slim output rows: 4,159 (1 row dropped: null Offense Date)
- Delimiter: ; (as expected)
- Trailing-whitespace strips: 16 columns, ~1,100 rows total
- Empty columns dropped: 11
- Slash-column splits: 3 (Meter/Speed, Area/Speed, Visibility/Commercial)
- Parking (P): 3,204 rows | Moving (M): 955 rows
- Output: Data_Load/summons_slim_for_powerbi.csv
- ⚠  1 malformed row skipped at source parse — investigate 2026_03_eticket_export.csv line ~<N>

Clean Summons Export

When to trigger

Inputs

Transformations (apply in order)

1. Read with semicolon delimiter

Clean Summons Export

When to trigger

Inputs

Transformations (apply in order)

1. Read with semicolon delimiter

2. Strip whitespace on text columns

3. Drop fully-null columns (11 known)

4. Parse 4 date formats

5. Resolve dual-purpose slash columns

6. Emit slim schema for DAX join

7. Write slim CSV

Outputs

Hard rules

Known gotchas (codified)

Clickhouse Io

Clickhouse Io

Claude Devfleet

Clickhouse Io

Ai First Engineering

Postgres Patterns

Clean Summons Export

When to trigger

Inputs

Transformations (apply in order)

1. Read with semicolon delimiter

Clean Summons Export

When to trigger

Inputs

Transformations (apply in order)

1. Read with semicolon delimiter

2. Strip whitespace on text columns

3. Drop fully-null columns (11 known)

4. Parse 4 date formats

5. Resolve dual-purpose slash columns

6. Emit slim schema for DAX join

7. Write slim CSV

Outputs

Hard rules

Known gotchas (codified)

Related skills

Clickhouse Io

Clickhouse Io

Claude Devfleet

Clickhouse Io

Ai First Engineering

Postgres Patterns