통계이론/통계이론

EDA(Exploratory Data Analysis)

dragontigerps 2019. 1. 2. 14:10

1. EDA(Exploratory Data Analysis) : 탐색적 자료(데이터 분석) 분석

  • 데이터에 있는 특징을 알아내는 작업
  • 어려운 통계 이론 사용하기 보다는 쉬운 통계를 이용해서 데이터에 숨겨져 있는 특징을 알아내는 분석 방법
  • 데이터 분석의 목적 : 예측(prediction), 분류(classification)


2. 일변량(Uni-variate) 질적 자료의 분석

일변량  = 하나의 열(변수) , 질적 자료 = 범주형 자료


1.1 표 = 빈도표

(1) 빈도(Frequency)

(2) 백분율(Percent)


1.2 그래프

(1) 막대그래프(Bar Plot)

(2) 원그래프(Pie Chart)


3. 일변량 양적 자료의 분석


2.1. 표 - 빈도표 = Frequency Table

(1) 구간의 빈도

(2) 구간의 백분율


2.2 그래프

(1) 히스토그램(Historgram)

(2) 상자그림(Boxplot)


2.3 기술통계량 - 요약통계량

(1) 중심 = 대표값

(2) 흩어짐 = 산포 = 다름

(3) 분포의 모양


2019/01/02 - [데이터 분석/통계이론] - EDA. 양적자료분석. 기술통계량 - 분포의 모양

2018/12/28 - [데이터 분석/통계이론] - EDA. 양적자료분석. 기술통계량 - 산포

2018/12/28 - [데이터 분석/통계이론] - EDA. 양적자료분석. 기술통계량 - 대표값