새소식

수학/확률 및 통계

[기술 통계] 중심 경향치(Central Tendency)

  • -

중심 경향치(Central Tendency)는 데이터의 중심을 나타내는 값으로, 일반적으로 평균, 중앙값, 최빈값이 이에 해당한다.

 

  • 평균(Mean): 평균은 모든 데이터 값의 합을 데이터의 개수로 나눈 값이다. 기호로는 ${\mu}$ 또는 $\bar{x}$로 표현된다. 데이터의 전체적인 경향을 파악하는 데 가장 널리 사용되는 중심 경향성이다. 그러나 평균은 이상치(Outlier)에 민감하게 반응할 수 있어, 이상치가 있는 경우 다른 중심 경향치 지표를 고려해야 할 수 있다.

$\mu = \frac{\sum x}{n} \quad \text{또는} \quad \bar{x} = \frac{\sum x}{n}$

 

여기서 $\sum x$는 모든 데이터 값의 합이고, $n$은 데이터의 개수이다.

 

 

  • 중앙값(Median): 중앙값은 데이터를 크기 순으로 정렬했을 때 가운데 위치하는 값이다. 데이터의 개수가 홀수일 경우엔 가운데 값이 중앙값이고, 짝수일 경우엔 가운데 두 값의 평균이 중앙값이다. 중앙값은 이상치에 영향을 덜 받는 중심 경향치 지표로, 데이터의 분포가 왜곡되거나 이상치가 있는 경우 평균보다 더 의미있는 정보를 제공할 수 있다.

 

  • 최빈값(Mode): 최빈값은 데이터셋에서 가장 자주 등장하는 값이다. 최빈값은 범주형 데이터나 이산형 데이터에 사용되는 중심 경향성 지표로, 연속형 데이터에서는 적합하지 않을 수 있다. 데이터셋에서 고유한 최빈값이 없거나 여러 개의 최빈값이 있는 경우도 있다.

 

이러한 중심 경향치 지표들은 데이터의 전체적인 특성을 파악하고, 데이터의 분포와 경향을 설명하는 데 사용된다. 각 지표의 특성과 장단점을 고려하여, 분석하려는 데이터와 상황에 맞게 적절한 중심 경향치 지표를 선택해야 한다.

Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.