[기초 통계학] 중심극한정리(Central limit theorem)
정의
다시 정리하자면, 모집단의 분포에는 상관 없이, 모집단이 특정한 평균과 표준편차를 따르는 어떤 분포를 따를 때, 그 모집단으로부터 추출한 표본평균들의 평균은 평균이 μ이고, σ를 샘플의 수로나눠준 정규분포를 따르게 된다.
아래 그림을 보면, 모집단이 평균이 μ이고 표준편차가 σ인 어떤 분포를 따랐을 때, 모집단으로부터 데이터 셋 k개를 뽑았다. 또한 각 데이터셋의 샘플 수는 n개이고 n>=30이라고 가정한다면, 이 데이터셋들의 표본 평균은 평균이 μ이고, 표준 편차는 $$ \frac{\sigma}{\sqrt{n}} $$인 정규분포를 따른다는 정리가 바로 중심극한정리이다.
표본평균을 빨간색으로 표시한 것은 사람들이 헷갈려 하기 때문이다. 절대로 표본의 분포가 정규분포를 따르는게 아니다. 표본 평균의 분포가 정규분포를 따른다는 점을 꼭 인지하자!
중심극한정리가 주는 의의
우리는 모집단에 대한 어떠한 정보도 알 수 없다. 하지만 중심극한정리의 가정 중 가장 좋은 가정이 있다면 모집단이 어떤 분포를 따르든 상관 없다는 점이다. 중심극한정리의 정의에 따르면 우리는 모집단으로부터 뽑은 표본들에 대한 표본평균의 분포가 정규분포를 따른 다는 것을 알 수 있게 됐고(표본의 수가 충분히 크다는 것을 가정), 이는 우리가 가지고 있는 표본들을 이용하여 모집단의 모수들에 대해서 추론할 수 있는 근거를 얻게 됨을 알 수 있다.
'공부 > 통계학' 카테고리의 다른 글
지수 분포 (Exponential distribution) (0) | 2022.05.08 |
---|---|
푸아송 분포 (Poisson distribution) (0) | 2022.05.01 |
[기초 통계학] 불편성(Unbiased) (0) | 2021.11.10 |
[기초 통계학] 표본평균과 표본 분산 (0) | 2021.11.09 |
[기초통계학] 확률변수의 독립성 (0) | 2021.11.07 |
댓글