그룹별 집계, 요약하기

① 읽고_학습하기 (Input)

그룹별 집계, 요약하기

->^_^<- 2022. 6. 3. 17:06

# 특정 조건을 만족하는 데이터만 출력

tax_median = data['TAX'].median()

print(data[data['TAX'] > tax_median])

# 조건을 만족하는 데이터 중 특정한 컬럼 데이터만 추출

data_new = data[data['TAX'] > tax_median][['CHAS','RAD']]

# 그룹별 집계
어떤 데이터들이 있는지 unique()함수로 확인

print(data_new['CHAS'].unique())

print(data_new['RAD'].unique())

groupby()함수를 이용하여 그룹핑을 하고

함수 뒤에 수행할 대상과 수행할 작업 정의 필요

data_new2 = data_new.groupby(['CHAS','RAD'])['CHAS'].count()

print(data_new2)

CHAS  RAD
0     1        3
      2        2
      3        5
      4       33
      5       51
      6       17
      24     124
1     5        7
      24       8
Name: CHAS, dtype: int64

그룹별 집계된 count 결과가 Dataframe이 아닌 Series 타입이라 결과값의 컬럼명을 지정하기 위해서 Dataframe으로 변경

print(type(data_new2))

data_new3 = pd.DataFrame(data_new2)

print(data_new3)

print(type(data_new3))

<class 'pandas.core.series.Series'>
          CHAS
CHAS RAD      
0    1       3
     2       2
     3       5
     4      33
     5      51
     6      17
     24    124
1    5       7
     24      8
<class 'pandas.core.frame.DataFrame'>

data_new3.shape

(9, 1)

data_new3.columns = ['COUNT']

print(data_new3)

          COUNT
CHAS RAD       
0    1        3
     2        2
     3        5
     4       33
     5       51
     6       17
     24     124
1    5        7
     24       8

댓글수0