->^_^<- 2022. 5. 31. 13:30
반응형

1. 결측치 값을 평균값으로 대체

isnull() 함수 : 결측치 확인

  . False : 결측치 아님, True : 결측치

 

isnull().sum() 함수 : 결측치 숫자 확인

 

copy() : 데이터를 복사

data_mean = data['RM'].copy()   // 결측치가 있는 컬럼데이터만 복사
data_mean.head(3)
rm_mean = data_mean.mean()
print(rm_mean)
 
mean() : 데이터의 평균을 구하는 함수, avg()함수가 아님
 
fillna() : 결측치를 채우는 함수 
 
print(data_mean.fillna(rm_mean, inplace = False))  // 실제 데이터를 변경하지 않고 임시로 적용
print(data_mean.isnull().sum())
 
 
print(data_mean.fillna(rm_mean, inplace = True))
print(data_mean.isnull().sum())
 

 

2. 결측치를 삭제

dropna() 함수 : 결측치 데이터 삭제

data_del = data['RM'].copy()
print(data_del.isnull().sum())
print(data_del.shape)
 
data_del.dropna(inplace=True)
print(data_del.shape)
반응형
댓글수0