scikitlearn 2

머신러닝 기초 26편 | DBSCAN과 Isolation Forest (밀도 기반 군집화와 이상치 탐지)

목차1. DBSCAN2. DBSCAN 주요 매개변수3. DBSCAN 동작 원리4. DBSCAN 예제5. Isolation Forest란6. Isolation Forest 작동 원리7. Isolation Forest 장단점8. Isolation Forest 예제9. DBSCAN + Isolation Forest 함께 사용하기 1. DBSCAN(Density-Based Spatial Clustring of Applications with Noise)DBSCAN은 밀도 기반 군집화 알고리즘이다.기존의 K-Means와 달리 클러스터 개수를 미리 지정할 필요가 없으며, 데이터가 밀집된 영역을 기준으로 자동으로 군집을 형성한다. 또한, DBSCAN은 노이즈 데이터(이상치)를 자동으로 탐지할 수 있다는 특징이 있..

머신러닝 & 딥러닝 기초 20편 | 지도 학습 - 선형 회귀, 성능 평가

목차1. 회귀 알고리즘2. 선형회귀(Linear Regression) 2-1 기본 원리 2-2 경사 하강법(Grdient Descent) 2-3 학습 과정3. 성능 평가(Metrics)4. Scikit-learn을 사용한 선형 회귀 학습5. 과적합(Overfitting)과 과소적합(Underfittin) 1. 회귀 알고리즘회귀(Regression)는 연속적인 숫자 값을 예측하는 데 사용되는 지도학습 알고리즘이다. 예를 들어, 다음과 같은 문제에서 사용된다.집 가격 예측매물 예측시험 점수 예측 등이러한 문제의 특징은 출력값이 숫자 형태의 연속적인 값이라는 것이다. 예시입력 데이터예측 결과공부 시간시험 점수집 크기집 가격광고비매출 회귀의 특징출력값이 연속적인 숫자 값이다.독립 변수(입력 변수)가 종속..