공부/통계학

[기초통계학] 기댓값(Expected value)

Mosser 2021. 10. 28.

728x90

제가 처음 통계를 접했을 때, 기댓값과 평균이 대체 무슨차이가 있는지 궁금했었습니다. 같은 의미라고 하는 의견들도 많았고, 다르다는 의견도 많았습니다. 최근에 정리할 기회가 생겨서 둘이 어떤 차이가 있는지 말씀드리겠습니다.

평균은 다들 아시다시피 데이터의 모든 값을 더해서 개수로 나눠주면 산술평균을 구할 수 있습니다.

기댓값은 엄연히 말해서 확률변수에서 쓰이는 개념입니다.

예를 들어보죠.

우리가 주사위를 던졌을 때, 우리는 아래와 같은 확률분포표가 나올 거라는 걸 알고 있습니다.

위 확률분포표에서의 평균은 몇인가요? 다들 아시다시피 3.5입니다. 모르실 경우에는 이전 게시글인 확률분포에서의 평균 구하는 게시글을 참고하시기 바랍니다.

[기초 통계학] 이산 확률 분포에서의 기댓값

개요 일반 데이터에서 평균을 구할 수 있듯이, 이산확률분포에서도 기댓값으로 중심 지표를 얻을 수 있고, 분산 등을 구할 수 있습니다. 위와 같은 분포를 가지는 확률 분포 표를 해석해보

develsw.tistory.com

자, 그러면 우리가 주사위를 5번던져서 {1,3,5,2,1}이 나왔다고 합시다. 이때의 평균은 몇인가요?

네 2.4입니다.

그러면 여기에서 우리가 기대한 값은 3.5인데 주사위를 5번 던져서 나온 평균은 2.4입니다.

둘 사이에는 3.5-2.4=1.1의 차이가 있습니다.

그렇다면 우리가 주사위를 수백만번 던져서 그때 나온 값들의 평균을 구한다면 어떻게 될까요?

아마도 분명히 그 평균은 우리가 위 표에서 기대했던 값인 3.5로 가까워지게 될겁니다.

다시 정리하면,

평균은 우리가 가지고 있는 표본 데이터들을 가지고 구한 평균이 되고,

기댓값은 모집단에 대한 평균을 의미합니다. 즉, 모집단에서의 평균을 의미하는겁니다.

그럼 만약 우리의 샘플데이터가 모집단에 가까워지게 된다면, 이 데이터의 평균 역시 모집단의 기댓값에 수렴하게 될 것입니다.

그렇기 때문에, 아래와 같은 수식이 성립되는거죠.

E(X)=μ

확률 변수 X의 기댓값은 결국 모집단의 평균 μ와 같아지게 되는겁니다.

[기초통계학] 이항분포(Binomial distribution) (0)	2021.10.31
[기초 통계학] 베르누이 시행 (0)	2021.10.29
[기초 통계학] 확률변수에서의 분산 (0)	2021.10.27
[기초 통계학] 이산 확률 분포에서의 기댓값 (0)	2021.10.26
[기초 통계학] 확률 변수(Random variable) (0)	2021.10.25

댓글