본문 바로가기
독서

MinMaxScaler

by _><- 2022. 6. 5.
반응형

# sklearn의 MinMaxScaler함수 이용

from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
data_minmax = scaler.fit_transform(data)
print(type(data_minmax))
 
데이터타입이 ndarray이기 때문에 DataFrame으로 변환 필요
 
 
data_minmax = pd.DataFrame(data_minmax, columns = data.columns)
print(data_minmax)
 
 
# 기초통계량으로 minmax값을 확인한다
print(data_minmax['MEDV'].describe())
 
 
count    506.000000
mean       0.389618
std        0.204380
min        0.000000
25%        0.267222
50%        0.360000
75%        0.444444
max        1.000000
Name: MEDV, dtype: float64


# 분산이 0.5보다 큰 값의 개수는 count() 함수를 활용한다

print(data_minmax[data_minmax['MEDV'] > 0.5]['MEDV'].count())

반응형

'독서' 카테고리의 다른 글

StandardScaler  (0) 2022.06.06
빈도값 구하기  (0) 2022.06.05
오름차순/내림차순  (0) 2022.06.05
그룹별 집계, 요약하기  (0) 2022.06.03
순위 구하기  (0) 2022.06.02