Name: Filter Csv Columns
Author: gehtalexey

Skills suchen.../

Filter Csv Columns | Skills Pool

Title at Company (start_date - end_date) [X yrs]: description || Title at Company (dates) [X yrs]: description

School Name, Degree in Field of Study | School Name, Degree in Field

Skill1, Skill2, Skill3, ...

/filter-csv-columns "C:\data\raw_profiles.csv" "C:\data\filtered_profiles.csv"

import pandas as pd
import re
from datetime import datetime

df = pd.read_csv(input_file)

# Find all job/edu/skill column numbers
job_nums = sorted(set(int(re.match(r'^job_(\d+)_', col).group(1)) for col in df.columns if re.match(r'^job_(\d+)_', col)))
edu_nums = sorted(set(int(re.match(r'^edu_(\d+)_', col).group(1)) for col in df.columns if re.match(r'^edu_(\d+)_', col)))
skill_cols = [col for col in df.columns if re.match(r'^skill_\d+_name$', col)]

# Function to calculate years from date string to today
def calc_years_to_today(date_str):
    if pd.isna(date_str) or not str(date_str).strip():
        return None
    try:
        dt = datetime.strptime(str(date_str).strip(), '%d %b %Y')
        years = (datetime.now() - dt).days / 365.25
        return round(years, 1)
    except:
        return None

# Current position - CALCULATE years from start date
df['current_title'] = df.get('job_1_job_title', '')
df['current_company'] = df.get('job_1_job_company_name', '')
df['current_start_date'] = df.get('job_1_job_start_date', '')
df['current_years_in_role'] = df['job_1_job_start_date'].apply(calc_years_to_today)
df['current_description'] = df.get('job_1_job_description', '')

# Combine functions for skills, jobs, education
# - For past positions: calculate years from start_date to end_date
# - For skills: combine all skill_N_name columns
# - For education: combine school, degree, field

# Final columns
cols = ['first_name', 'last_name', 'headline', 'location', 'current_title',
        'current_company', 'current_start_date', 'current_years_in_role',
        'current_description', 'summary', 'past_positions', 'education',
        'skills', 'public_url']
df_filtered = df[cols]
df_filtered.to_csv(output_file, index=False)

Filter Csv Columns

Filter CSV Columns for Screening

Task

Output Columns (14 total)

Filter Csv Columns

Filter CSV Columns for Screening

Task

Output Columns (14 total)

Logic

Current Position

Past Positions (job_2, job_3, etc.)

Education (edu_1, edu_2, etc.)

Skills (skill_1_name, skill_2_name, etc.)

Example Usage

Python Implementation

Session Logs

OpenClaw Test Heap Leaks

Node Connect

Openclaw Qa Testing

Openclaw Secret Scanning Maintainer

Flags