본문 바로가기
IT 자격증/빅데이터분석기사

결측치 확인

by ->^_^<- 2022. 5. 31.
728x90

1. 결측치 값을 평균값으로 대체

isnull() 함수 : 결측치 확인

  . False : 결측치 아님, True : 결측치

 

isnull().sum() 함수 : 결측치 숫자 확인

 

copy() : 데이터를 복사

data_mean = data['RM'].copy()   // 결측치가 있는 컬럼데이터만 복사
data_mean.head(3)
rm_mean = data_mean.mean()
print(rm_mean)
 
mean() : 데이터의 평균을 구하는 함수, avg()함수가 아님
 
fillna() : 결측치를 채우는 함수 
 
print(data_mean.fillna(rm_mean, inplace = False))  // 실제 데이터를 변경하지 않고 임시로 적용
print(data_mean.isnull().sum())
 
 
print(data_mean.fillna(rm_mean, inplace = True))
print(data_mean.isnull().sum())
 

 

2. 결측치를 삭제

dropna() 함수 : 결측치 데이터 삭제

data_del = data['RM'].copy()
print(data_del.isnull().sum())
print(data_del.shape)
 
data_del.dropna(inplace=True)
print(data_del.shape)
반응형

'IT 자격증 > 빅데이터분석기사' 카테고리의 다른 글

데이터 읽어오기, 저장하기  (0) 2022.06.02
사분위수 구하기  (0) 2022.05.31
Top 10 구하기  (0) 2022.05.31
분류모델링  (0) 2022.05.31
분류모델링  (0) 2022.05.31