728x90
1. 결측치 값을 평균값으로 대체
isnull() 함수 : 결측치 확인
. False : 결측치 아님, True : 결측치
isnull().sum() 함수 : 결측치 숫자 확인
copy() : 데이터를 복사
data_mean = data['RM'].copy() // 결측치가 있는 컬럼데이터만 복사
data_mean.head(3)
rm_mean = data_mean.mean()
print(rm_mean)
mean() : 데이터의 평균을 구하는 함수, avg()함수가 아님
fillna() : 결측치를 채우는 함수
print(data_mean.fillna(rm_mean, inplace = False)) // 실제 데이터를 변경하지 않고 임시로 적용
print(data_mean.isnull().sum())
print(data_mean.fillna(rm_mean, inplace = True))
print(data_mean.isnull().sum())
2. 결측치를 삭제
dropna() 함수 : 결측치 데이터 삭제
data_del = data['RM'].copy()
print(data_del.isnull().sum())
print(data_del.shape)
data_del.dropna(inplace=True)
print(data_del.shape)
반응형
'IT 자격증 > 빅데이터분석기사' 카테고리의 다른 글
데이터 읽어오기, 저장하기 (0) | 2022.06.02 |
---|---|
사분위수 구하기 (0) | 2022.05.31 |
Top 10 구하기 (0) | 2022.05.31 |
분류모델링 (0) | 2022.05.31 |
분류모델링 (0) | 2022.05.31 |