② 모으기_읽기
MinMaxScaler
->^_^<-
2022. 6. 5. 20:22
반응형
# sklearn의 MinMaxScaler함수 이용
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
data_minmax = scaler.fit_transform(data)
print(type(data_minmax))
데이터타입이 ndarray이기 때문에 DataFrame으로 변환 필요
data_minmax = pd.DataFrame(data_minmax, columns = data.columns)
print(data_minmax)
# 기초통계량으로 minmax값을 확인한다
print(data_minmax['MEDV'].describe())
count 506.000000
mean 0.389618
std 0.204380
min 0.000000
25% 0.267222
50% 0.360000
75% 0.444444
max 1.000000
Name: MEDV, dtype: float64
# 분산이 0.5보다 큰 값의 개수는 count() 함수를 활용한다
print(data_minmax[data_minmax['MEDV'] > 0.5]['MEDV'].count())
반응형