반응형
통계학에서의 부트스트랩
브래들리 에프론(Bradley Efron)이 1979년에 제안한 방법으로, 표본에 대해 더 자세히 알기 위해 사용한다.
아이디어는 모집단의 성질에 대해 표본을 통해 추정할 수 있는 것처럼, 표본의 성질에 대해서도 재표본을 통해 추정할 수 있다는 것이다. 즉 주어진 표본(샘플)에 대해서, 그 샘플에서 또 다시 샘플(재표본)을 여러번(1,000~10,000번, 혹은 그 이상)추출하여 표본의 평균이나 분산 등이 어떤 분포를 가지는가를 알아낼 수 있다. 단, 원래의 모집단이 IID가정을 충족해야 한다는 제약이 있다
출처 : https://namu.wiki/w/Bootstrap
빅데이터 분석기법인 배깅(bagging)
주어진 데이터에 대해 여러개의 표본(bootstrap)으로 예측모형을 만든 후 예측모형을 결합하여 최종 예측미형 생성
브래들리 에프론(Bradley Efron)이 1979년에 제안한 방법으로, 표본에 대해 더 자세히 알기 위해 사용한다.
아이디어는 모집단의 성질에 대해 표본을 통해 추정할 수 있는 것처럼, 표본의 성질에 대해서도 재표본을 통해 추정할 수 있다는 것이다. 즉 주어진 표본(샘플)에 대해서, 그 샘플에서 또 다시 샘플(재표본)을 여러번(1,000~10,000번, 혹은 그 이상)추출하여 표본의 평균이나 분산 등이 어떤 분포를 가지는가를 알아낼 수 있다. 단, 원래의 모집단이 IID가정을 충족해야 한다는 제약이 있다
출처 : https://namu.wiki/w/Bootstrap
빅데이터 분석기법인 배깅(bagging)
주어진 데이터에 대해 여러개의 표본(bootstrap)으로 예측모형을 만든 후 예측모형을 결합하여 최종 예측미형 생성
반응형