본문 바로가기
반응형

빚진 자처럼, 한결같이1775

파이썬 패키지명을 찾는 방법 파이썬 구조 : 패키지 > 모듈명 > 함수 > 파라미터 완벽하게 모듈명이나 함수, 파라미터를 보여주지는 않지만 유추하는데 도움이 되는 기능들 # 패키지 pandas, numpy, sklearn 등 # 모듈명 찾기 : dir 키워드 활용, 모든 모듈명이 나오지는 않기 때문에 어느정도 암기 필요 import pandas print(dir(pandas) ['BooleanDtype', 'Categorical', 'CategoricalDtype', 'CategoricalIndex', 'DataFrame', 'DateOffset', 'DatetimeIndex', 'DatetimeTZDtype', 'ExcelFile', 'ExcelWriter', 'Flags', 'Float32Dtype', 'Float64Dtype'.. 2022. 6. 2.
중국어 입력기 sougou # 한국어 중국어 윈도우 + space 키를 누르면 한국어와 중국어입력기 sougou가 전환된다. # 중국어 영어 중국어 입력기 활성화 상태에서 shift 키로 중국어와 영어 전환이 가능하다. # 한자입력 중국어 입력 시 한자를 선택할 때는 번호나 space 키를 누른다. 엔터키를 누르면 영어로 입력됨 # 부호입력 방법 2022. 6. 2.
데이터 읽어오기, 저장하기 import pandas as pd data = pd.read_csv('data.csv') 전처리 등 작업 수행 후 data.to_csv('result.csv', index = False) 2022. 6. 2.
사분위수 구하기 # 불필요한 컬럼 제거 drop 함수 이용 data.drop(columns=['CHAS','RAD']) # 각 컬럼별 IQR(Inter Quantile Range) 구하기 describe() 함수로 기초통계량을 구하여 변수에 저장 data_col12_desc = data_col12.describe() print(data_col12_desc) CRIM ZN INDUS NOX RM AGE \ count 506.000000 506.000000 506.000000 506.000000 491.000000 506.000000 mean 3.613524 11.363636 11.136779 0.554695 6.285102 68.574901 std 8.601545 23.322453 6.860353 0.115878 0.70.. 2022. 5. 31.
결측치 확인 1. 결측치 값을 평균값으로 대체 isnull() 함수 : 결측치 확인 . False : 결측치 아님, True : 결측치 isnull().sum() 함수 : 결측치 숫자 확인 copy() : 데이터를 복사 data_mean = data['RM'].copy() // 결측치가 있는 컬럼데이터만 복사 data_mean.head(3) rm_mean = data_mean.mean() print(rm_mean) mean() : 데이터의 평균을 구하는 함수, avg()함수가 아님 fillna() : 결측치를 채우는 함수 print(data_mean.fillna(rm_mean, inplace = False)) // 실제 데이터를 변경하지 않고 임시로 적용 print(data_mean.isnull().sum()) pr.. 2022. 5. 31.
반응형