본문 바로가기

AI/Data Analysis, Statistics

Section1_Data Manipulation

Bootcamp 3일차

Data Frame concat / merge

 

데이터를 분석하다보면 여기저기 흩어진 데이터를 합치는 과정이 필요하다.

데이터를 합치는 방법은 크게 두가지로 나뉜다.

 

1. Pandas.concat

Concat은 두 DataFrame을 행 또는 열 방향으로 붙이는 것을 의미한다. 

주의할 점은 두 DataFrame에 동일한 행, 열의 이름이 있어야한다. 그렇지 않을 경우 비어있는 부분은 결측 값이 생긴다.

pandas.concat(objs, axis=0, join='outer', ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=False, copy=True)
  • axis : 축 ( 0 = column, 1 = row) / 0이 defalt
  • join : join방법 (outer : 합집합, inner : 교집합)
  • ignore_index (False : 기존 index 유지, True : 기존 index 무시)
  • keys : 원본 데이터 컬럼명 지정(?)

2. Pandas.DataFrame.merge

merge는 두 DataFrame에 공통적인 key값을 기준으로 데이터를 병합하는 것을 의미한다.

DataFrame.merge(right, how='inner', on=None)
  • left / right : merge할 DataFrame 객체 이름
  • how : join 방법 (inner : 교집합, outer : 합집합, left / right : 차집합)
  • on : 기준열

 

추가할 내용

 

*melt

*loc, iloc

'AI > Data Analysis, Statistics' 카테고리의 다른 글

Sprint2_t-test  (0) 2021.01.05
Sprint1_Sprint challenge  (0) 2021.01.05
Section1_Data Visualize  (0) 2021.01.02
Feature Engineering  (0) 2020.12.29
EDA(Exploratory Data Analysis)  (0) 2020.12.28