새소식

수학/확률 및 통계

분산(Variance)과 표준편차(Standard Deviation)

  • -

분산(Variance)은 확률 변수의 값이 평균(기댓값)으로부터 얼마나 흩어져 있는지를 나타내는 척도다. 즉, 분산은 데이터의 변동성을 측정하는 통계량이다. 이산 확률 변수와 연속 확률 변수에 대해 분산을 다음과 같이 계산할 수 있다.

 

이산 확률 변수의 분산

확률 변수 $X$가 이산적인 경우, 분산 $Var(X)$는 각 가능한 결과 $x_i$에 대한 확률 $P(x_i)$에 따라 가중치를 부여한 제곱 차의 합계로 계산된다.

 

$Var(X) = E((X - E(X))^2) = \sum_{i} (x_i - E(X))^2 P(x_i)$

 

 

연속 확률 변수의 분산

확률 변수 $X$가 연속적인 경우, 분산 $Var(X)$는 확률 밀도 함수 $f(x)$를 사용하여 가중치를 부여한 제곱 차의 적분으로 계산된다.

 

$Var(X) = E((X - E(X))^2) = \int_{-\infty}^{\infty} (x - E(X))^2 f(x) dx$

 

 

표준편차(Standard Deviation)분산의 양의 제곱근으로, 데이터의 변동성을 나타내는 척도다. 표준편차는 분산과 마찬가지로 이산 확률 변수와 연속 확률 변수에 대해 계산할 수 있으며, 원래의 데이터와 같은 단위로 표현된다.

 

$SD(X) = \sqrt{Var(X)}$

 

 

분산과 표준편차는 데이터의 변동성을 측정하는 중요한 통계량으로, 모델링, 위험 평가, 신뢰 구간 계산 등 다양한 분야에서 활용된다.

Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.