공부/통계학

[기초통계학] 평균(Average)

Mosser 2021. 10. 13.
728x90
반응형

평균(Average)

데이터의 합계를 데이터 수로 나눈 것

 

 

특징

1. 수많은 데이터 중에서 대표적인 수치라고 생각할 수 있다.

2. 데이터들은 평균값 주변에 분포하고 있다.

3. 많이 나타나는 데이터는 평균값에 영향을 많이 준다.

4. 극단값의 영향을 많이 받는다.

 

만약, 데이터가 아래와 같다면 어떻게 될까?

 

1,1,1,3,1000

 

평균이 몇인가?

 

평균이 무려 201이다.

 

이처럼 평균은 극단값의 영향을 많이 받는 것을 알 수 있다.

 

그렇기 때문에 데이터에 대해서 전처리를 할 때에는 저런 1000이라는 극단값이 있다면, 이상치로 분류하여 데이터에서 제거하여 사용하는 경우가 대부분이다. 

 

데이터를 제거하고 싶지 않다면?

 

대표값으로 평균 말고 중앙값을 사용해보자.

 

반응형

'공부 > 통계학' 카테고리의 다른 글

[기초통계학] 평균 절대편차  (0) 2021.10.14
[기초통계학] 중앙값(Median)  (0) 2021.10.14
[기초 통계학] 상관과 산점도  (0) 2021.10.12
[기초 통계학] 박스 플랏이란?  (0) 2021.10.12
표본집단과 모집단  (0) 2021.09.30

댓글