본문 바로가기
728x90

IT 자격증/빅데이터분석기사18

빅데이터분석기사 응시환경 체험 https://dataq.goorm.io/exam/116674/%EC%B2%B4%ED%97%98%ED%95%98%EA%B8%B0/quiz/1 구름EDU - 모두를 위한 맞춤형 IT교육 구름EDU는 모두를 위한 맞춤형 IT교육 플랫폼입니다. 개인/학교/기업 및 기관 별 최적화된 IT교육 솔루션을 경험해보세요. 기초부터 실무 프로그래밍 교육, 전국 초중고/대학교 온라인 강의, 기업/ edu.goorm.io # print문으로 데이터나 함수값이 ... 으로 생략되어 보일 경우 옵션설정 pd.options.display.max_columns = None # 분석한 데이터 중간에 백업 x_train_backup = x_train.copy() # 시험환경 유형2 작성샘플 코드 # 출력을 원하실 경우 print() .. 2022. 6. 25.
빅분기 용어정리 (ADP) 텍스트 마이닝 정확도 : 정답이라고 예측한 결과 중 실제로 정답인 것의 비율 재현율 : 실제로 정답인 것들 중에서 정답이라고 올바르게 분석한 결과의 비율 ETL : 데이터의 이동 및 변환 절차와 관련된 업계 표준 용어이다. 2022. 6. 19.
빅분기 용어정리 (ADSP) DIKW 피라미드 데이터 사이언스 : 과학과 인문의 교차로 - 한계 : 해석필요, 가정에 근거 의사결정을 가로막는 요인 - 고정관념 - 편향된 생각 (Bias) - 프레이밍 효과 (Framing Effect) KDD 분석 방법론 CRISP-DM 분석 방법론 하향식 접근방법 : 분석 과제가 먼저 상향식 접근방법: 데이터 기반 분석 분석과제 5가지 관리 - Data size, ,Data complexity, Speed, ,Analytic complexity, Accuracy & Precision 3V : 크기 Volume , 다양성 Variety, 속도 Velocity 4V: 가치 Value 탐식적 분석 (EDA) 결측값 : 데이터가 비어있는 경우 가지치기 앙상블기법 - 배깅 - 부스팅 : 예측력이 약한 모.. 2022. 6. 18.
데이터 읽어오기, 저장하기 import pandas as pd data = pd.read_csv('data.csv') 전처리 등 작업 수행 후 data.to_csv('result.csv', index = False) 2022. 6. 2.
사분위수 구하기 # 불필요한 컬럼 제거 drop 함수 이용 data.drop(columns=['CHAS','RAD']) # 각 컬럼별 IQR(Inter Quantile Range) 구하기 describe() 함수로 기초통계량을 구하여 변수에 저장 data_col12_desc = data_col12.describe() print(data_col12_desc) CRIM ZN INDUS NOX RM AGE \ count 506.000000 506.000000 506.000000 506.000000 491.000000 506.000000 mean 3.613524 11.363636 11.136779 0.554695 6.285102 68.574901 std 8.601545 23.322453 6.860353 0.115878 0.70.. 2022. 5. 31.
728x90