본문 바로가기
호기심_메모

정규화

by 겸손하게 빚진자로, 밝게 인사 2021. 8. 13.
728x90

# Normalization 함수

- 데이터의 단위나 스케일이 크게 차이나는 경우 정확한 예측을 위해 크기를 유사하게 위치시키는 방법

# 정규화 방식

- Min-Max Normalization (최소-최대 정규화)

. 최소-최대 정규화는 데이터를 정규화하는 가장 일반적인 방법

. 모든 feature에 대해 각각의 최소값 0, 최대값 1로, 그리고 다른 값들은 0과 1 사이의 값으로 변환

. 단점 : 모든 feature들의 스케일이 동일하지만, 이상치(outlier)를 잘 처리하지 못함

 

- Z-Score Normalization (Z-점수 정규화)

. Z-점수 정규화는 이상치(outlier) 문제를 피하는 데이터 정규화 전략

X라는 값을 Z-점수로 바꿔주는 식 : (X - 평균) / 표준편차

. 단점 : 이상치(outlier)를 잘 처리하지만, 정확히 동일한 척도로 정규화 된 데이터를 생성하지 않음

반응형