새소식

수학/확률 및 통계

[기술 통계] 형태(Shape)

  • -

기술통계에서 데이터의 모양(Shape)은 데이터 분포의 특성을 나타내는 중요한 요소다. 데이터의 모양은 주로 대칭성, 왜도, 첨도 등의 지표를 사용하여 설명된다.

 

  • 대칭성(Symmetry): 분포의 대칭성은 데이터가 평균을 중심으로 얼마나 대칭적으로 분포하고 있는지를 나타낸다. 대칭 분포에서는 평균, 중앙값, 최빈값이 모두 일치한다. 대표적인 대칭 분포로는 정규분포가 있다. 분포가 대칭이 아닌 경우 왜도를 통해 분포의 비대칭 정도를 측정할 수 있다.

 

 

 

  • 왜도(Skewness): 왜도는 분포의 비대칭 정도를 나타내는 지표로, 분포가 평균을 중심으로 어느 방향으로 치우쳐 있는지를 설명한다. 왜도가 0이면 분포가 대칭이다. 왜도가 양수인 경우(양의 왜도), 분포는 왼쪽으로 치우쳐져 있으며, 음수인 경우(음의 왜도) 오른쪽으로 치우쳐져 있다. 양의 왜도 같은 경우 평균보다 중앙값이 크며, 음의 왜도는 평균이 중앙값보다 크다.

 

 

 

  • 첨도(Kurtosis): 첨도는 분포의 뾰족함을 나타내는 지표로, 데이터가 평균 주변에 얼마나 집중되어 있는지를 설명합니다. 첨도가 높을수록 데이터가 평균 주변에 더 집중되어 있으며, 낮을수록 데이터가 평균 주변에서 더 퍼져 있다. 정규분포와 비교하여 첨도를 평가할 때, 첨도가 0이면 정규분포와 동일한 뾰족함을 가지며, 양수인 경우 정규분포보다 뾰족하고, 음수인 경우 정규분포보다 납작한 형태를 가집니다.

 

 

 

기술통계에서 데이터의 모양을 살펴보는 것은 데이터의 분포와 특성을 이해하고, 데이터가 어떤 특징을 가지고 있는지 파악하는 데 중요한 역할을 한다. 이를 통해 데이터의 이상치, 데이터 분포의 특성 등을 파악하고, 적절한 분석 기법을 선택할 수 있다. 또한, 데이터의 모양을 통해 어떤 가설 검정 방법이 적절한지 판단할 수 있으며, 데이터 전처리를 어떻게 진행해야 할지에 대한 인사이트를 얻을 수 있다.

예를 들어, 데이터의 모양이 정규분포와 유사하다면 많은 통계적 방법들이 사용 가능하다. 정규분포를 가정하는 매개변수 추정 방법이나 가설 검정 기법을 적용할 수 있다. 그러나 데이터의 모양이 정규분포와 크게 다를 경우, 비모수적 방법을 사용하여 데이터를 분석해야 할 수도 있다.

Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.