본문 바로가기
IT 자격증/빅데이터분석기사

빅분기 용어정리 (ADSP)

by _><- 2022. 6. 18.

DIKW 피라미드

데이터 사이언스 : 과학과 인문의 교차로
- 한계 : 해석필요, 가정에 근거

의사결정을 가로막는 요인
- 고정관념
- 편향된 생각 (Bias)
- 프레이밍 효과 (Framing Effect)

KDD 분석 방법론

CRISP-DM 분석 방법론

하향식 접근방법 : 분석 과제가 먼저
상향식 접근방법: 데이터 기반 분석

분석과제 5가지 관리
- Data size, ,Data complexity, Speed, ,Analytic complexity, Accuracy & Precision

3V : 크기 Volume , 다양성 Variety, 속도 Velocity
4V: 가치 Value

탐식적 분석 (EDA)

결측값 : 데이터가 비어있는 경우


가지치기
앙상블기법
 - 배깅
 - 부스팅 : 예측력이 약한 모형들을 결함하여 강한 예측모형을 만드는 방법
 - 랜덤포레스트 : 
 
 
 
 

반응형

'IT 자격증 > 빅데이터분석기사' 카테고리의 다른 글

빅데이터분석기사 응시환경 체험  (0) 2022.06.25
빅분기 용어정리 (ADP)  (0) 2022.06.19
데이터 읽어오기, 저장하기  (0) 2022.06.02
사분위수 구하기  (0) 2022.05.31
결측치 확인  (0) 2022.05.31