통계이론/통계이론

EDA. 양적자료분석. 기술통계량 - 대표값

dragontigerps 2018. 12. 28. 14:35
대표값
  • 대표값은 전체 데이터와 동일하지 않다.  하지만 비슷할 수는 있다.
  • 우리가 보지못한 데이터는 대표값과 비슷하게 생겼을 것이다 ~ 라고 추측이 가능함


1) 평균(Mean) : 데이터의 합 / 데이터의 자유도

    • 이상치(OUTLIER)가 있을 때 대표값 역할을 하지 못한다.
    • 대표값 역할을 잘할 때 : 데이터의 분포가 정규분표의 형태 일 때

2) 절사평균(Trimmed Mean) :  양 끝에 0 ~ 50 %를 제외한 평균 => 평가할 때 자주 사용한다.  

    • 이상치(OUTLIER)가 있을 때도 대표값 역할이 가능하다.

3) 중위수(Median) :  중앙값(홀수일 때)  / (n1+n2)/2 (짝수일 때)

    • 이상치(OUTLIER)가 있을 때도 대표값 역할이 가능하다.
    • 대표값 역할을 잘할 때 : 이상치가 있을 때

4) 최빈수(Mode)(= 최빈값)  : 동일한 데이터가 가장 많은 값

    • 최빈수는 2번 이상 나와야 한다.
    • 대표값 역할을 잘할 때 : 1,1,2,2,2,2,3,3,3,3,4 => 2 and 3