DimensionalityReduction 2

머신러닝 & 딥러닝 기초 28편 | PCA(Principal Component Analysis, 주성분 분석)

목차1. PCA(Principal Component Analysis, 주성분 분석)란?2. PCA의 장점과 한계3. PCA의 핵심 아이디어4. PCA 작동 원리5. 중요 개념 정리6. PCA 예제 1. PCA(Principal Component Analysis, 주성분 분석)란? PCA는 고차원 데이터를 더 적은 차원으로 줄이면서도, 데이터가 가지고 있는 중요한 정보는 최대한 유지하려는 차원 축소 기법이다.머신러닝에서 데이터의 특성(feature)이 많아질수록 계산량이 증가하고, 불필요한 정보나 중복 정보가 섞여 모델 성능이 오히려 나빠질 수 있다.또한, 사람이 데이터를 직접 이해하거나 시각화하기도 어려워진다.이런 경우 PCA를 사용하면 여려 특성을 더 적은 수의 새로운 축으로 바꾸어 데이터를 간단하게 ..

머신러닝 & 딥러닝 기초 27편 | 차원축소(Dimensionality Reduction)

목차1. 차원 축소(Dimensionality Redcution)2. 왜 차원 축소가 필요할까?3. 차원 축소 활용 예시4. 차원 축소의 두 가지 방식5. 차원 축소의 핵심 아이디어6. 차원 축소 주요 기법 1. 차원 축소(Dimensionality Reduction)차원 축소는 데이터의 특징(Feature) 개수를 줄이면서도 중요한 정보는 최대한 유지하는 방법이다. 즉, 불필요한 정보는 제거하고, 핵심 정보만 남겨서 데이터를 더 효율적으로 표현하는 과정이라고 할 수 있다. 머신러닝 모델을 사용할 때, 특징(feature)이 너무 많으면 다음과 같은 문제가 발생한다.계산 속도 저하과적합(Overfitting) 발생모델 해석 어려움따라서 차원 축소는 효율성과 성능을 동시에 개선하는 핵심 기법이다. 장점연산..