본문 바로가기

Data Science/Python

dataframe 자주 쓰는 것들

데이터 전처리 할 때 자주 쓰는 것들인데 자꾸 까먹어서 정리해둬야겠다... 시간 아껴야지 +_+

(계속 추가)

 

 - 특정 컬럼이 null 값인 데이터 삭제 하기 

dele = data[data['age'].isnull()].index
data = data.drop(dele)

 

 - null 값을 특정 값으로 변환하기

data['age'] = data['age'].fillna('0')

 

- 특정 값 치환하기

data['name'] = data['name'].str.replace("groot", "rocket")

 

- 데이터 형 변환

data['age'] = data['age'].astype(int)

 

- 특정 컬럼에서 특정 값 찾기

data[data['age'] == 25]

 

- 특정 컬럼에서 중복 데이터가 있으면 삭제하기

data = data.drop_duplicates(['name'])