공부/통계학

[기초 통계학] 분산(Variance)

Mosser 2021. 10. 15.
728x90
반응형

개요

데이터의 흩어짐 정도를 측정할 때, 편차의 절댓값이 아니라 편차를 제곱하는 방법도 있다.

위 편차 표에서 각 데이터를 제곱하여 부호를 없애보자.

편차의 제곱
데이터 A 36 36 1 1 4 9 16 25
데이터 B 4 1 0 0 0 0 1 4

분산

편차의 제곱의 평균값

 

위 그림에서, 분산이 크다면 파란색 영역처럼 넓게 데이터들이 분포해있음을 의미하고,

 

분산이 작다면 빨간색 영역처럼 데이터들이 평균에 가까이 분포되어있음을 의미합니다.

 

특징

1. 데이터가 평균에서 멀리 떨어진 곳까지 흩어져 있으면 분산은 커진다.

2. 데이터가 평균에 가까이 집중되어 있으면 분산은 작아진다.

3. 편차의 제곱으로 인하여 단위 또한 제곱이 되기 때문에 수치 해석이 어려워진다.

 

3번의 단점을 해결하기 위해서 위 그림에서 나온 SD(Standard deviation) 표준편차 개념이 나오게 됩니다.

반응형

댓글