EDA 2

머신러닝 & 딥러닝 기초 16편 | EDA(탐색적 데이터 분석)

목차1. EDA 개념2. EDA 목적3. EDA 주요 단계4. 데이터 기본 구조 파악5. 기초 통계량 활용6. EDA 결과 1. EDA란EDA(Exploratory Data Analysis)는 데이터를 시각적으로 탐색, 통계적으로 분석하여 데이터의 구조와 특징을 이해하는 과정이다.데이터 분석을 시작하기 전에 수행하는 초기 분석 단계이다. EDA를 통해 다음과 같은 내용을 확인할 수 있다.데이터 분포변수 간 관계이상치결측값이를 통해 데이터의 문제점을 발견하고 분석 및 머신러닝 모델링에 필요한 준비를 수행할 수 있다. 2. EDA 목적EDA의 주요 목적은 다음과 같다. 데이터의 기본 특성 이해데이터 정리가설 수립목적설명데이터의 기본 특성 이해데이터 분포, 데이터 범위, 이상치 존재 여부, 결측값 여부 등을..

머신러닝 & 딥러닝 기초 15편 | EDA(탐색적 데이터 분석)와 주요 시각화 기법

목차1. EDA란2. EDA에서 사용하는 주요 시각화 기법3. 산점도 (Scatter Plot)4. 히트맵 (Heatmap)5. 페어플롯 (Pair Plot)6. 카운트플롯 (Count Plot) 1. EDA란EDA(Exploratory Data Analysis)는 데이터를 시각적으로 분석하여 데이터의 특징을 탐색하는 과정이다. 데이터 분석을 수행하기 전에 데이터를 다양한 관점에서 살펴보며 다음과 같은 요소를 확인한다.데이터 분포변수 간 관계데이터 패턴이상치EDA를 통해 데이터의 특성을 이해하고, 이후 데이터 분석이나 머신러닝 모델링의 방향을 결정할 수 있다.EDA에서는 다양한 시각화 기법을 활용하여 데이터를 직관적으로 분석한다. 2. EDA에서 사용하는 주요 시각화 기법시각화 기법목적산점도 (Scat..