반응형
# sklearn라이브러리의 model_selection 모듈의 train_test_split() 함수
from sklearn.model_selection import train_test_split
# train_test_split() 함수는
- 파라미터
독립변수들의 데이터셋 X, 종속변수들의 데이터셋 Y, 테스트데이터로 분리할 비율값
- 리턴값
독립변수인 학습데이터, 독립변수인 테스트데이터, 종속변수인 학습데이터, 종속변수인 테스트데이터 순으로 리턴
ex) x_train, x_test, y_train, y_test = train_test_split(X, Y, test_size = 0.3)
. x_train과 y_train의 경우 같은 데이터쌍이고, 인덱스번호가 동일
x_test와 y_test도 같은 데이터쌍이고 인덱스번호 동일
반응형
'IT 자격증 > 빅데이터분석기사' 카테고리의 다른 글
분류모델링 (0) | 2022.05.31 |
---|---|
예측모델링 (0) | 2022.05.21 |
조건문으로 파생변수 만들기 (0) | 2022.05.20 |
데이터 크기변환 (0) | 2022.05.19 |
코랩을 이용한 데이터 전처리 (0) | 2022.05.06 |