본문 바로가기
독서

StandardScaler

by _><- 2022. 6. 6.
반응형
# sklearn 패키지의 StandardScaler 이용
 
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
data_stdd = scaler.fit_transform(data)
print(type(data_stdd))

결과값이 ndarray
DataFrame으로 변경 필요

data_stdd = pd.DataFrame(data_stdd, columns = data.columns)
 
 
# 특정 범위의 값을 추출
 
print((data_stdd['DIS'] > 0.4) & (data_stdd['DIS']<0.6))
data_stdd = data_stdd[(data_stdd['DIS'] > 0.4) & (data_stdd['DIS']<0.6)]
print(round(data_stdd['DIS'].mean(),2))
 
 

# train data에서 학습된 mean값과 variance값을 test data에 적용하기 위해서
x_test 데이터에는 fit_transform()을 적용하지 않고 transform() 함수를 적용

from sklearn.preprocessing import StandardScaler 
scaler = StandardScaler()
x_train = pd.DataFrame(scaler.fit_transform(x_train), columns = x_train.columns)
 
 
 x_test = pd.DataFrame(scaler.transform(x_test), columns = x_test.columns)
반응형

'독서' 카테고리의 다른 글

데이터분석 연습  (0) 2022.06.06
유니크한 값 구하기  (0) 2022.06.06
빈도값 구하기  (0) 2022.06.05
MinMaxScaler  (0) 2022.06.05
오름차순/내림차순  (0) 2022.06.05