반응형
- 평균값, 최빈값 대치
# 전처리
# age 평균값으로 대치
a_mean = int(df['Age'].mean())
print(a_mean)
df["Age"].fillna(a_mean, inplace=True)
# embarked 최빈값
e_mode = df["Embarked"].mode()[0]
# print(e_mode)
df["Embarked"].fillna(e_mode, inplace = True)
# 데이터 프레임 결측값 유무 확인
df.info()
- 결측치가 많은 컬럼 삭제
df1 = df.drop("Cabin", axis = 1)
df1.info()
- 열 이름으로 삭제하기
df.drop('Cabin', axis=1)
# 또는아래 방법으로 삭제 가능
df.drop('Cabin', axis='columns')
# 리스트를 사용해서 여러 개의 열을 한 번에 삭제 하기
df1 = df.drop(['Age', 'Cabin'], axis=1)
반응형
'공부, 자격증 > 빅데이터분석기사 실기' 카테고리의 다른 글
이기적 빅분기 실기 모의고사 작업형 1회 문제 데이터셋 (0) | 2023.06.22 |
---|---|
[빅분기] 인프런 강의 추천!!! (0) | 2023.06.14 |
[빅분기] 분석 데이터셋 준비, 수행, 성능 평가 (9) | 2023.06.10 |
[빅분기] 레이블 인코딩, 파생변수 생성 (0) | 2023.06.10 |
[빅분기] 결측치 확인, 대체 (0) | 2023.06.06 |