Bootcamp 3일차
Data Frame concat / merge
데이터를 분석하다보면 여기저기 흩어진 데이터를 합치는 과정이 필요하다.
데이터를 합치는 방법은 크게 두가지로 나뉜다.
1. Pandas.concat
Concat은 두 DataFrame을 행 또는 열 방향으로 붙이는 것을 의미한다.
주의할 점은 두 DataFrame에 동일한 행, 열의 이름이 있어야한다. 그렇지 않을 경우 비어있는 부분은 결측 값이 생긴다.
pandas.concat(objs, axis=0, join='outer', ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=False, copy=True)
- axis : 축 ( 0 = column, 1 = row) / 0이 defalt
- join : join방법 (outer : 합집합, inner : 교집합)
- ignore_index (False : 기존 index 유지, True : 기존 index 무시)
- keys : 원본 데이터 컬럼명 지정(?)
2. Pandas.DataFrame.merge
merge는 두 DataFrame에 공통적인 key값을 기준으로 데이터를 병합하는 것을 의미한다.
DataFrame.merge(right, how='inner', on=None)
- left / right : merge할 DataFrame 객체 이름
- how : join 방법 (inner : 교집합, outer : 합집합, left / right : 차집합)
- on : 기준열
추가할 내용
*melt
*loc, iloc
'AI > Data Analysis, Statistics' 카테고리의 다른 글
Sprint2_t-test (0) | 2021.01.05 |
---|---|
Sprint1_Sprint challenge (0) | 2021.01.05 |
Section1_Data Visualize (0) | 2021.01.02 |
Feature Engineering (0) | 2020.12.29 |
EDA(Exploratory Data Analysis) (0) | 2020.12.28 |