DIKW 피라미드
데이터 사이언스 : 과학과 인문의 교차로
- 한계 : 해석필요, 가정에 근거
의사결정을 가로막는 요인
- 고정관념
- 편향된 생각 (Bias)
- 프레이밍 효과 (Framing Effect)
KDD 분석 방법론
CRISP-DM 분석 방법론
하향식 접근방법 : 분석 과제가 먼저
상향식 접근방법: 데이터 기반 분석
분석과제 5가지 관리
- Data size, ,Data complexity, Speed, ,Analytic complexity, Accuracy & Precision
3V : 크기 Volume , 다양성 Variety, 속도 Velocity
4V: 가치 Value
탐식적 분석 (EDA)
결측값 : 데이터가 비어있는 경우
가지치기
앙상블기법
- 배깅
- 부스팅 : 예측력이 약한 모형들을 결함하여 강한 예측모형을 만드는 방법
- 랜덤포레스트 :
반응형
'IT 자격증 > 빅데이터분석기사' 카테고리의 다른 글
빅데이터분석기사 응시환경 체험 (0) | 2022.06.25 |
---|---|
빅분기 용어정리 (ADP) (0) | 2022.06.19 |
데이터 읽어오기, 저장하기 (0) | 2022.06.02 |
사분위수 구하기 (0) | 2022.05.31 |
결측치 확인 (0) | 2022.05.31 |