본문 바로가기
IT 자격증/빅데이터분석기사

학습데이터와 테스트데이터 분리하기

by _><- 2022. 5. 20.
반응형

# sklearn라이브러리의 model_selection 모듈의 train_test_split() 함수

from sklearn.model_selection import train_test_split

 

# train_test_split() 함수는

- 파라미터

독립변수들의 데이터셋 X, 종속변수들의 데이터셋 Y, 테스트데이터로 분리할 비율값

- 리턴값

독립변수인 학습데이터, 독립변수인 테스트데이터, 종속변수인 학습데이터, 종속변수인 테스트데이터 순으로 리턴

ex) x_train, x_test, y_train, y_test = train_test_split(X, Y, test_size = 0.3)

. x_train과 y_train의 경우 같은 데이터쌍이고, 인덱스번호가 동일

 x_test와 y_test도 같은 데이터쌍이고 인덱스번호 동일

반응형

'IT 자격증 > 빅데이터분석기사' 카테고리의 다른 글

분류모델링  (0) 2022.05.31
예측모델링  (0) 2022.05.21
조건문으로 파생변수 만들기  (0) 2022.05.20
데이터 크기변환  (0) 2022.05.19
코랩을 이용한 데이터 전처리  (0) 2022.05.06