[데이터 탐색] 1. 기본적 데이터 탐색
탐색적 데이터 분석 EDA (Exploratory Data Analysis) 1) Four R's - 저항성 (Resistance) : 오류점, 이상값이 데이터에 포함되에도 영향을 적게 받는 성질 - 잔차 해석 (Residual) : 관찰 값들이 주 경향으로부터 얼마나 벗어난 정도 - 자료 재표현 (Re-expression) : 로그 변환, 제곱근 변환, 역수 변환 등 분포의 대칭성, 선형성, 분산의 안정성을 위해 변환 - 현시성 (Grapic Representation) : 이해하기 쉽도록 시각적으로 표현 2) 개별 변수 탐색 방법 범주형 데이터 빈도수, 최빈값, 비율, 백분율 중심성, 변동성 막대형 그래프 (Bar plot) 수치형 데이터 평균, 분산, 표준 편차, 첨도, 왜도 중심성, 변동성, 정규..