IT 자격증/빅데이터분석기사

빅분기 용어정리 (ADSP)

->^_^<- 2022. 6. 18. 21:03
반응형

DIKW 피라미드

데이터 사이언스 : 과학과 인문의 교차로
- 한계 : 해석필요, 가정에 근거

의사결정을 가로막는 요인
- 고정관념
- 편향된 생각 (Bias)
- 프레이밍 효과 (Framing Effect)

KDD 분석 방법론

CRISP-DM 분석 방법론

하향식 접근방법 : 분석 과제가 먼저
상향식 접근방법: 데이터 기반 분석

분석과제 5가지 관리
- Data size, ,Data complexity, Speed, ,Analytic complexity, Accuracy & Precision

3V : 크기 Volume , 다양성 Variety, 속도 Velocity
4V: 가치 Value

탐식적 분석 (EDA)

결측값 : 데이터가 비어있는 경우


가지치기
앙상블기법
 - 배깅
 - 부스팅 : 예측력이 약한 모형들을 결함하여 강한 예측모형을 만드는 방법
 - 랜덤포레스트 : 
 
 
 
 

728x90