공부, 자격증/빅데이터분석기사 실기

[빅분기] 데이터 전처리-평균, 최빈값, 컬럼 삭제

구경이 2023. 6. 10. 15:38
반응형
  • 평균값, 최빈값 대치 
# 전처리 
# age 평균값으로 대치 
a_mean = int(df['Age'].mean())
print(a_mean)

df["Age"].fillna(a_mean, inplace=True)

# embarked 최빈값 
e_mode = df["Embarked"].mode()[0]
# print(e_mode)
df["Embarked"].fillna(e_mode, inplace = True)

# 데이터 프레임 결측값 유무 확인 
df.info()

 

  • 결측치가 많은 컬럼 삭제 
df1 = df.drop("Cabin", axis = 1)
df1.info()

 

- 열 이름으로 삭제하기 

df.drop('Cabin', axis=1)

# 또는아래 방법으로 삭제 가능 
df.drop('Cabin', axis='columns') 

# 리스트를 사용해서 여러 개의 열을 한 번에 삭제 하기 
df1 = df.drop(['Age', 'Cabin'], axis=1)

 

 

 

반응형