728x90
# Normalization 함수
- 데이터의 단위나 스케일이 크게 차이나는 경우 정확한 예측을 위해 크기를 유사하게 위치시키는 방법
# 정규화 방식
- Min-Max Normalization (최소-최대 정규화)
. 최소-최대 정규화는 데이터를 정규화하는 가장 일반적인 방법
. 모든 feature에 대해 각각의 최소값 0, 최대값 1로, 그리고 다른 값들은 0과 1 사이의 값으로 변환
. 단점 : 모든 feature들의 스케일이 동일하지만, 이상치(outlier)를 잘 처리하지 못함
- Z-Score Normalization (Z-점수 정규화)
. Z-점수 정규화는 이상치(outlier) 문제를 피하는 데이터 정규화 전략
X라는 값을 Z-점수로 바꿔주는 식 : (X - 평균) / 표준편차
. 단점 : 이상치(outlier)를 잘 처리하지만, 정확히 동일한 척도로 정규화 된 데이터를 생성하지 않음
반응형
'호기심_메모' 카테고리의 다른 글
WPA2 해킹과정 설명 (0) | 2021.08.14 |
---|---|
교회 실시간 방송 환경 세팅 (0) | 2021.08.14 |
[virtualbox] invalidarg E_Invalidarg (0x80070057) (0) | 2021.08.13 |
졍스의 클라우드보안 책 후기 (0) | 2021.08.13 |
VMware ESXi 보안 취약점(CVE-2020-3992, CVE-2019-5544) (0) | 2021.08.13 |