수학/확률 및 통계

분산(Variance)과 표준편차(Standard Deviation)

분산(Variance)은 확률 변수의 값이 평균(기댓값)으로부터 얼마나 흩어져 있는지를 나타내는 척도다. 즉, 분산은 데이터의 변동성을 측정하는 통계량이다. 이산 확률 변수와 연속 확률 변수에 대해 분산을 다음과 같이 계산할 수 있다.

이산 확률 변수의 분산

확률 변수 $X$가 이산적인 경우, 분산 $Var(X)$는 각 가능한 결과 $x_i$에 대한 확률 $P(x_i)$에 따라 가중치를 부여한 제곱 차의 합계로 계산된다.

$Var(X) = E((X - E(X))^2) = \sum_{i} (x_i - E(X))^2 P(x_i)$

연속 확률 변수의 분산

확률 변수 $X$가 연속적인 경우, 분산 $Var(X)$는 확률 밀도 함수 $f(x)$를 사용하여 가중치를 부여한 제곱 차의 적분으로 계산된다.

$Var(X) = E((X - E(X))^2) = \int_{-\infty}^{\infty} (x - E(X))^2 f(x) dx$

표준편차(Standard Deviation)는 분산의 양의 제곱근으로, 데이터의 변동성을 나타내는 척도다. 표준편차는 분산과 마찬가지로 이산 확률 변수와 연속 확률 변수에 대해 계산할 수 있으며, 원래의 데이터와 같은 단위로 표현된다.

$SD(X) = \sqrt{Var(X)}$

분산과 표준편차는 데이터의 변동성을 측정하는 중요한 통계량으로, 모델링, 위험 평가, 신뢰 구간 계산 등 다양한 분야에서 활용된다.

중심 극한 정리(Central Limit Theorem, CLT) (0)	2023.04.05
결합 확률(Joint Probability) (0)	2023.04.05
기댓값(Expectation) (0)	2023.04.05
베이즈 정리(Bayes' theorem) (0)	2023.04.05
조건부 확률(Conditional probability) (0)	2023.04.04

Contents

새소식