ML모델의 성능에는 알고리즘의 우수성, 파라미터 최적화보다 데이터를 올바르게 파악하고 효과적으로 가공하는 것이 더 중요!
EDA(Exploratory Data Analysis), 즉 탐색적 데이터 분석과 데이터 시각화는 구별해야 한다. EDA단계에서 시각화를 하기도 하지만 본 목적은 분석 결과를 커뮤니케이션하기 위함!
기술통계와 데이터 시각화를 통해 데이터의 특성을 파악하는 것. 극단적인 해석은 피해야하며 지나친 추론이나 자의적 해석도 지양해야 함.
[ EDA의 주요 목적 ]