기술 통계, 추세 분석, 이상값 탐지, 가설 검정 등 통계적 방법을 적용합니다. 분포 분석, 유의성 검정, 이상 탐지, 상관관계 계산, 통계 결과 해석 시 사용합니다.
기술 통계, 추세 분석, 이상값 탐지, 가설 검정, 그리고 통계적 주장을 할 때 주의해야 할 상황에 대한 가이드를 제공합니다.
데이터 특성에 맞는 중심 측도를 선택합니다:
| 상황 | 사용할 측도 | 이유 |
|---|---|---|
| 대칭 분포, 이상값 없음 | 평균(Mean) | 가장 효율적인 추정량 |
| 치우친 분포 | 중앙값(Median) | 이상값에 강건함 |
| 범주형 또는 순서형 데이터 | 최빈값(Mode) | 비수치형 데이터의 유일한 옵션 |
| 이상값이 있는 고도 왜곡 데이터 (예: 사용자당 매출) | 중앙값 + 평균 | 둘 다 보고; 차이가 왜도를 나타냄 |
비즈니스 지표에는 항상 평균과 중앙값을 함께 보고합니다. 두 값이 크게 차이난다면 데이터가 편향되어 있으며, 평균만으로는 오해를 줄 수 있습니다.
평균만으로는 부족한 정보를 보완하기 위해 핵심 백분위수를 보고합니다: