통계이론/통계이론
EDA. 양적자료분석. 기술통계량 - 대표값
dragontigerps
2018. 12. 28. 14:35
대표값
- 대표값은 전체 데이터와 동일하지 않다. 하지만 비슷할 수는 있다.
- 우리가 보지못한 데이터는 대표값과 비슷하게 생겼을 것이다 ~ 라고 추측이 가능함
1) 평균(Mean) : 데이터의 합 / 데이터의 자유도
- 이상치(OUTLIER)가 있을 때 대표값 역할을 하지 못한다.
- 대표값 역할을 잘할 때 : 데이터의 분포가 정규분표의 형태 일 때
2) 절사평균(Trimmed Mean) : 양 끝에 0 ~ 50 %를 제외한 평균 => 평가할 때 자주 사용한다.
- 이상치(OUTLIER)가 있을 때도 대표값 역할이 가능하다.
3) 중위수(Median) : 중앙값(홀수일 때) / (n1+n2)/2 (짝수일 때)
- 이상치(OUTLIER)가 있을 때도 대표값 역할이 가능하다.
- 대표값 역할을 잘할 때 : 이상치가 있을 때
4) 최빈수(Mode)(= 최빈값) : 동일한 데이터가 가장 많은 값
- 최빈수는 2번 이상 나와야 한다.
- 대표값 역할을 잘할 때 : 1,1,2,2,2,2,3,3,3,3,4 => 2 and 3
2019/01/02 - [데이터 분석/통계이론] - EDA(Exploratory Data Analysis)
2019/01/02 - [데이터 분석/통계이론] - EDA. 양적자료분석. 기술통계량 - 분포의 모양
2018/12/28 - [데이터 분석/통계이론] - EDA. 양적자료분석. 기술통계량 - 산포
2018/12/28 - [데이터 분석/통계이론] - EDA. 양적자료분석. 기술통계량 - 대표값