1. EDA(Exploratory Data Analysis) : 탐색적 자료(데이터 분석) 분석
- 데이터에 있는 특징을 알아내는 작업
- 어려운 통계 이론 사용하기 보다는 쉬운 통계를 이용해서 데이터에 숨겨져 있는 특징을 알아내는 분석 방법
- 데이터 분석의 목적 : 예측(prediction), 분류(classification)
2. 일변량(Uni-variate) 질적 자료의 분석
일변량 = 하나의 열(변수) , 질적 자료 = 범주형 자료
1.1 표 = 빈도표
(1) 빈도(Frequency)
(2) 백분율(Percent)
1.2 그래프
(1) 막대그래프(Bar Plot)
(2) 원그래프(Pie Chart)
3. 일변량 양적 자료의 분석
2.1. 표 - 빈도표 = Frequency Table
(1) 구간의 빈도
(2) 구간의 백분율
2.2 그래프
(1) 히스토그램(Historgram)
(2) 상자그림(Boxplot)
2.3 기술통계량 - 요약통계량
(1) 중심 = 대표값
(2) 흩어짐 = 산포 = 다름
(3) 분포의 모양
2019/01/02 - [데이터 분석/통계이론] - EDA. 양적자료분석. 기술통계량 - 분포의 모양
2018/12/28 - [데이터 분석/통계이론] - EDA. 양적자료분석. 기술통계량 - 산포
2018/12/28 - [데이터 분석/통계이론] - EDA. 양적자료분석. 기술통계량 - 대표값
'통계이론 > 통계이론' 카테고리의 다른 글
가설검정. 정규분포 (0) | 2019.01.03 |
---|---|
통계기초. 모집단 (0) | 2019.01.03 |
EDA. 양적자료분석. 기술통계량 - 분포의 모양 (0) | 2019.01.02 |
통계기초. 자유도(작성중) (0) | 2018.12.28 |
EDA. 양적자료분석. 기술통계량 - 산포 (0) | 2018.12.28 |