공부, 자격증/빅데이터분석기사 실기

[빅분기] 결측치 확인, 대체

구경이 2023. 6. 6. 19:59
반응형
  • 결측치 확인

데이터 셋의 결측치 확인

print(df.isnull().sum()) # 컬럼별 결측치 확인
df.info() # 데이터프레임 구조 확인

 

 

결측치가 있는 행 전체를 데이터셋에서 제거 

df_1 = df.dropna(axis=0) # 결측치가 있는 모든 행 제거

print(df1.isnull().sum().sum() # 데이터프레임 결측치 전체 
df_1.shape # 데이터프레임 크기

 

  • dropna() 함수 

- df.dropna(axis = 0) : 결측치가 있는 모든 행 삭제

- df.dropna(axis = 1) : 결측치가 있는 모든 열 삭제 

- df.dropna(subset=["Age"], axis=0) : age 열의 결측치가 있는 모든 행 삭제 

 

 

 

 

반응형