pandas 3

머신러닝 & 딥러닝 기초 10편 | 평균, 중앙값, 최빈값 (statistics, pandas)

목차1. 개요2. 평균(Mean) 2-1 평균의 특징 2-2 평균의 단점3. 중앙값(Median) 3-1 중앙값의 특징4. 최빈값(Mode) 4-1 최빈값의 특징 4-2 최빈값의 단점5. statistics 를 이용하여 계산하기6. pandas를 이용하여 계산하기7. statistics vs pandas 비교 1. 개요평균, 중앙값, 최빈값은 데이터의 중심 경향(Central Tendency)을 나타내는 대표값이다.중심 경향이란 확률 분포의 중심값 또는 대표값으로, 데이터 집합 내의 중심 위치를 파악한 값을 의미한다. 데이터 분석에서는 전체 데이터를 하나의 대표값으로 요약할 필요가 있으며, 이때 가장 많이 사용되는 값이 3가지가 있다.평균(mean) : 모든 데이터를 더한 후 데이터의 개수로 나..

머신러닝 & 딥러닝 기초 9편 | 데이터 통합, 조인(merge, concat)

목차1. 개요2. merge 2-1 merge 예제3. concat 3-1 concat 예제 1. 개요데이터프레임을 연결한다는 것은 여러 데이터프레임을 세로로 쌓거나, 가로로 나란히 배치하는 것을 의미한다. 데이터프레임을 연결하는 데 사용되는 Pandas 메서드는 아래와 같다.merge() : 기준 열을 기반으로 데이터를 합치는 메서드concat() : 특정 축(행 또는 열)을 따라 데이터를 연결하는 메서드즉, 아래와 같이 이해할 수 있다.merge : 공통 열을 기준으로 데이터를 결합 (SQL JOIN 방식)concat : 단순히 데이터를 이어 붙이는 방식 2. mergemerge는 두 DataFrame을 공통된 열(key)을 기준으로 연결하는 메서드이다.데이터베이스에서의 join과 비슷하게 Da..

파이썬 기초 13편 | 판다스(Pandas) 기본 문법

목차1. 판다스(Pandas)란2. 데이터 분석 과정에서의 판다스 역할3. Series와 DataFrame4. DataFrame 생성5. 데이터 확인 5-1 head() 5-2 tail() 5-3 shape 5-4 info()6. 데이터 선택과 필터링 6-1 특정 열 선택 6-2 조건 필터링7. 데이터 조작 7-1 열 추가 7-2 행 추가 7-3 데이터 수정8. 결측치 처리 8-1 결측치 확인 8-2 결측치 채우기 8-3 결측치 행 삭제9. 데이터 정렬10. 그룹화(groupby) 10-1 합계 10-2 평균11. 파일 입출력 11-1 CSV 저장 11-2 CSV 읽기12. 판다스가 중요한 이유 1. 판다스(Pandas)란판다스(Pandas)는 데이터 분석 및 데이터 조작에..

Python 2026.03.10