데이터 전처리 할 때 자주 쓰는 것들인데 자꾸 까먹어서 정리해둬야겠다... 시간 아껴야지 +_+
(계속 추가)
- 특정 컬럼이 null 값인 데이터 삭제 하기
dele = data[data['age'].isnull()].index
data = data.drop(dele)
- null 값을 특정 값으로 변환하기
data['age'] = data['age'].fillna('0')
- 특정 값 치환하기
data['name'] = data['name'].str.replace("groot", "rocket")
- 데이터 형 변환
data['age'] = data['age'].astype(int)
- 특정 컬럼에서 특정 값 찾기
data[data['age'] == 25]
- 특정 컬럼에서 중복 데이터가 있으면 삭제하기
data = data.drop_duplicates(['name'])
'Data Science > Python' 카테고리의 다른 글
정부 API로 josn 파싱하기 (0) | 2021.03.02 |
---|---|
지수 표기 숫자로 변환하여 표현하기 (0) | 2021.02.23 |
Python으로 하는 EDA(Exploratory Data Analysis) (0) | 2021.01.31 |
Python 결측치 처리 (0) | 2021.01.14 |
python으로 카이제곱 검정 (0) | 2021.01.06 |