데이터 분석 프로젝트의 탐색적 분석(EDA), 데이터 정제, 통계 분석, 시각화, 보고서 작성을 에이전트 팀이 협업하여 한 번에 수행하는 풀 분석 파이프라인. '데이터 분석해줘', 'EDA 해줘', '탐색적 분석', '통계 분석', '데이터 시각화', '분석 보고서 써줘', 'CSV 분석', '데이터 인사이트 뽑아줘', '데이터 정제', '이상치 분석' 등 데이터 분석 전반에 이 스킬을 사용한다. 단, 실시간 데이터 스트리밍, ML 모델 학습/배포, BI 대시보드 서버 구축은 이 스킬의 범위가 아니다.
데이터의 탐색→정제→분석→시각화→보고서를 에이전트 팀이 협업하여 한 번에 수행한다.
에이전트 팀 — 5명이 SendMessage로 직접 통신하며 교차 검증한다.
| 에이전트 | 파일 | 역할 | 타입 |
|---|---|---|---|
| explorer | .claude/agents/explorer.md | 탐색적 분석, 데이터 프로파일링 | general-purpose |
| cleaner | .claude/agents/cleaner.md | 데이터 정제, 변환 파이프라인 | general-purpose |
| analyst | .claude/agents/analyst.md | 통계 분석, 인사이트 도출 | general-purpose |
| visualizer | .claude/agents/visualizer.md | 차트 설계, 시각화 코드 생성 | general-purpose |
| reporter |
.claude/agents/reporter.md| 최종 보고서 작성, 품질 검증 |
| general-purpose |
_workspace/ 디렉토리와 _workspace/scripts/ 하위 디렉토리를 생성한다_workspace/00_input.md에 저장한다_workspace/data/에 복사한다_workspace/에 복사하고 해당 Phase를 건너뛴다| 순서 | 작업 | 담당 | 의존 | 산출물 |
|---|---|---|---|---|
| 1 | 탐색적 분석 | explorer | 없음 | 01_exploration_report.md |
| 2 | 데이터 정제 | cleaner | 작업 1 | 02_cleaning_log.md, scripts/02_cleaning.py |
| 3a | 통계 분석 | analyst | 작업 2 | 03_analysis_results.md, scripts/03_analysis.py |
| 3b | EDA 시각화 | visualizer | 작업 1 | 04_visualizations.md (EDA 부분) |
| 4 | 분석 결과 시각화 | visualizer | 작업 3a | 04_visualizations.md (분석 부분), scripts/04_viz_*.py |
| 5 | 최종 보고서 | reporter | 작업 3a, 4 | 05_final_report.md |
작업 3a(분석)와 3b(EDA 시각화)는 병렬 실행한다.
팀원 간 소통 흐름:
_workspace/ 내 모든 파일을 확인한다01_exploration_report.md02_cleaning_log.md03_analysis_results.md04_visualizations.md05_final_report.mdscripts/ 디렉토리| 사용자 요청 패턴 | 실행 모드 | 투입 에이전트 |
|---|---|---|
| "데이터 분석해줘", "풀 분석" | 풀 파이프라인 | 5명 전원 |
| "EDA만 해줘", "데이터 탐색" | 탐색 모드 | explorer + visualizer |
| "데이터 정제해줘", "클리닝" | 정제 모드 | explorer + cleaner |
| "통계 분석만", "가설 검정" | 분석 모드 | analyst + visualizer + reporter |
| "시각화만 해줘", "차트 그려줘" | 시각화 모드 | visualizer 단독 |
| "분석 보고서 써줘" (기존 분석 있음) | 보고서 모드 | reporter 단독 |
기존 파일 활용: 이미 정제된 데이터가 있으면 explorer와 cleaner를 건너뛴다. 분석 결과가 있으면 analyst를 건너뛰고 시각화와 보고서만 진행한다.
| 전략 | 방식 | 용도 |
|---|---|---|
| 파일 기반 | _workspace/ 디렉토리 | 주요 산출물 및 데이터 저장 |
| 메시지 기반 | SendMessage | 핵심 정보 전달, 수정 요청 |
| 코드 기반 | _workspace/scripts/ | 재현 가능한 분석 스크립트 |
파일명 컨벤션: {순번}_{산출물}.{확장자}
| 에러 유형 | 전략 |
|---|---|
| 파일 읽기 실패 | 인코딩 순차 시도(UTF-8→CP949→EUC-KR→Latin-1), 구분자 자동 탐지 |
| 대용량 데이터(>1GB) | 샘플링 후 분석, chunk 처리, 전체 통계는 dask 사용 |
| 분석 가정 불충족 | 비모수 대안 자동 전환, 전환 이유를 보고서에 명시 |
| 시각화 한글 깨짐 | OS별 한글 폰트 설정 코드 자동 삽입 |
| 에이전트 실패 | 1회 재시도 후 실패 시 해당 산출물 없이 진행, 보고서에 누락 명시 |
| reporter 불일치 발견 | 해당 에이전트에 수정 요청 → 재작업 → 재검증 (최대 2회) |
프롬프트: "이 매출 CSV 파일을 분석해서 매출 하락 원인을 찾아줘" 기대 결과:
프롬프트: "이미 정제된 데이터가 있어. 통계 분석이랑 시각화만 해줘" + 정제 데이터 파일 첨부 기대 결과:
_workspace/data/에 복사프롬프트: "이 엑셀 파일 분석해줘" (결측 50% 이상 변수 다수, 이상치 대량) 기대 결과:
| 스킬 | 경로 | 강화 대상 에이전트 | 역할 |
|---|---|---|---|
| statistical-tests-selector | .claude/skills/statistical-tests-selector/skill.md | analyst | 검정 선택 트리, t-검정/ANOVA/카이제곱, 효과 크기, 검정력 |
| visualization-chooser | .claude/skills/visualization-chooser/skill.md | visualizer | 차트 유형 매트릭스, matplotlib/seaborn/plotly 패턴, 안티패턴 |