본문 바로가기

공부, 자격증/AdsP

데이터분석준전문가 민트책 오답노트 정리 시작!

반응형

제가 시험을 볼때 정리한 오답노트 입니다.

저는 2022년도에 봤는데, 2023년도 민트책을 검색해봤는데 책이 이쁘네요 !

아래 책이 제가 본 책입니다. 

시간이 꽤 흘러 제가 어떤 식으로 정리를 했었는지 기억이 잘 안납니다 ㅠㅠ 

두서 없이...

올릴 가능성이 있어 미리 양해 부탁드립니다

이제 오답노트 공유를 시작합니다 !!!! 

 

EDA의 4가지 주제

- 저항성의 강조

- 잔차 계산

- 자료변수의 재표현

- 그래프를 통한 현시성


공간분석(spatial analysis)

- 지도위에 공간과 관계된 속성을 다양한 표현으로 시각화하는 방법

이상값의 인식 방법
1) ESD (Extreme studentized Deviation)
-평균으로부터 3 표준편차 떨어진 값 (각 0.15%)
2) 기하평균-2.5 × 표준편차 < data < 기하평균+2.5 x표준편차
3) 사분위수 이용하여 제거하기 (상자 그림의 outer fence밖에 있는 값 제거)
이상값 정의 : Q1-1.5( Q3-Q1) < data < Q3+1.5(Q3-Q 1) 를 벗어나는 데이터

 

결정계수(R^2) 구하기

R^2 = SSE/SST 

 

이번 글은 간단하게 작성하고 이후 글에서 이어서 작성하겠습니다!

반응형