공부, 자격증/빅데이터분석기사 실기
[빅분기] 데이터 전처리-평균, 최빈값, 컬럼 삭제
구경이
2023. 6. 10. 15:38
반응형
- 평균값, 최빈값 대치
# 전처리
# age 평균값으로 대치
a_mean = int(df['Age'].mean())
print(a_mean)
df["Age"].fillna(a_mean, inplace=True)
# embarked 최빈값
e_mode = df["Embarked"].mode()[0]
# print(e_mode)
df["Embarked"].fillna(e_mode, inplace = True)
# 데이터 프레임 결측값 유무 확인
df.info()
- 결측치가 많은 컬럼 삭제
df1 = df.drop("Cabin", axis = 1)
df1.info()
- 열 이름으로 삭제하기
df.drop('Cabin', axis=1)
# 또는아래 방법으로 삭제 가능
df.drop('Cabin', axis='columns')
# 리스트를 사용해서 여러 개의 열을 한 번에 삭제 하기
df1 = df.drop(['Age', 'Cabin'], axis=1)
반응형