반응형
# sklearn 패키지의 StandardScaler 이용
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
data_stdd = scaler.fit_transform(data)
print(type(data_stdd))
결과값이 ndarray
DataFrame으로 변경 필요
data_stdd = pd.DataFrame(data_stdd, columns = data.columns)
# 특정 범위의 값을 추출
print((data_stdd['DIS'] > 0.4) & (data_stdd['DIS']<0.6))
data_stdd = data_stdd[(data_stdd['DIS'] > 0.4) & (data_stdd['DIS']<0.6)]
print(round(data_stdd['DIS'].mean(),2))
# train data에서 학습된 mean값과 variance값을 test data에 적용하기 위해서
x_test 데이터에는 fit_transform()을 적용하지 않고 transform() 함수를 적용
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
x_train = pd.DataFrame(scaler.fit_transform(x_train), columns = x_train.columns)
x_test = pd.DataFrame(scaler.transform(x_test), columns = x_test.columns)
반응형
'독서' 카테고리의 다른 글
데이터분석 연습 (0) | 2022.06.06 |
---|---|
유니크한 값 구하기 (0) | 2022.06.06 |
빈도값 구하기 (0) | 2022.06.05 |
MinMaxScaler (0) | 2022.06.05 |
오름차순/내림차순 (0) | 2022.06.05 |