새소식

수학/확률 및 통계

연속 확률 분포(Continuous probability distribution)

  • -

연속 확률 분포(continuous probability distribution)연속 확률 변수의 값들이 나타날 확률을 설명하는 함수다.

 

PDF, Probability Density Function(확률밀도함수)

 

균일 분포(Uniform distribution)

구간 [a, b]에서 모든 값이 동일한 확률로 발생하는 확률변수의 분포

 

PDF

$f(x) = $\begin{cases}  \frac{1}{b-a}, & \text{for } a \le x \le b \\  0, & \text{otherwise}\end{cases}

 

정규 분포(Normal distribution)

평균이 $\mu$이고 표준편차가 $\sigma$인 연속 확률변수의 분포

 

PDF

$f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{ -\frac{(x-\mu)^2}{2\sigma^2} }$

 

지수 분포(Exponential distribution)

단위 시간 또는 공간에서 독립적으로 발생하는 사건 간의 시간이나 거리에 대한 확률변수의 분포

 

PDF

$f(x) = $\begin{cases}  \lambda e^{-\lambda x}, & \text{for } x \ge 0 \\  0, & \text{otherwise}\end{cases}

감마 분포(Gamma distribution)

일반화된 지수 분포로 모양(shape) 매개변수 $k$와 척도(scale) 매개변수 $\theta$를 가진 확률변수의 분포

 

PDF

$f(x) = $\begin{cases}  \frac{1}{\Gamma(k) \theta^k} x^{k-1} e^{-\frac{x}{\theta}}, & \text{for } x \ge 0 \\  0, & \text{otherwise}\end{cases}

 

베타 분포(Beta distribution)

0과 1 사이의 값들에 대한 확률변수의 분포로, 모양(shape) 매개변수 $\alpha$와 $\beta$를 가진다.

 

PDF

$f(x) = $\begin{cases}
  \frac{x^{\alpha - 1} (1-x)^{\beta - 1}}{B(\alpha, \beta)}, & \text{for } 0 \le x \le 1 \\
  0, & \text{otherwise}
\end{cases}

 

카이제곱 분포(Chi-squared distribution)

독립적인 표준 정규 분포를 따르는 확률 변수들의 제곱합에 대한 분포. 자유도(df)를 나타내는 매개변수 $k$를 가진다.

 

PDF

$f(x) = $\begin{cases}  \frac{1}{2^{k/2} \Gamma(k/2)} x^{(k/2)-1} e^{-\frac{x}{2}}, & \text{for } x \ge 0 \\  0, & \text{otherwise}\end{cases}

 

t 분포(Student's t-distribution)

정규 분포와 비슷한 모양을 갖지만, 양 끝의 꼬리 부분이 더 두껍고 긴 확률변수의 분포다. t 분포는 작은 표본 크기의 경우, 정규 분포를 가정한 분석에서 더 정확한 결과를 제공한다. 자유도(df)를 나타내는 매개변수 $\nu$를 가진다.

 

PDF

f(x) = $\frac{\Gamma(\frac{\nu+1}{2})}{\sqrt{\nu\pi} \Gamma(\frac{\nu}{2})} \left(1 + \frac{x^2}{\nu} \right)^{-\frac{\nu+1}{2}}$

 

F 분포(F-distribution)

두 개의 카이제곱 분포에 대한 비율에 대한 확률변수의 분포. 두 개의 자유도 매개변수 $d1$과 $d2$를 가진다.

 

PDF

f(x) = $\frac{\Gamma(\frac{d1+d2}{2})}{\Gamma(\frac{d1}{2}) \Gamma(\frac{d2}{2})} \frac{d1^{d1/2} d2^{d2/2} x^{(d1/2)-1}}{(d1x + d2)^{(d1+d2)/2}}$

 

 

 

이런 연속 확률 분포들은 다양한 상황과 문제를 모델링하는 데 사용된다. 예를 들어, 정규 분포는 자연, 사회 과학에서 다양한 현상을 설명하는 데 널리 사용되며, t 분포와 F 분포는 통계적 가설 검정에서 주요한 역할을 한다. 지수 분포와 감마 분포는 대기 시간이나 사건 간 시간과 같은 연속적인 시간이나 거리를 모델링하는 데 사용되며, 베타 분포는 확률값 자체에 대한 불확실성을 모델링하는 데 사용된다.

 

연속 확률 분포를 이해하고 활용하면 현실 세계의 다양한 문제를 효과적으로 해결할 수 있다. 연속 확률 분포는 각각의 확률밀도함수를 이용해 확률을 계산하며, 누적 분포 함수를 통해 구간 내 확률을 구할 수도 있다. 확률 분포에 따라 다양한 통계량이나 추정치를 계산할 수 있으며, 이를 바탕으로 데이터 분석 및 예측을 수행할 수 있다.

 

데이터 분석에서는 이러한 확률 분포들을 활용하여 데이터의 형태와 패턴을 파악하고, 불확실성을 추정하며, 가설 검정을 수행하고, 신뢰 구간을 구하는 등의 작업을 수행한다. 이를 통해 데이터를 바탕으로 의사 결정을 내릴 수 있으며, 새로운 이론을 발전시키거나 기존의 이론을 검증할 수도 있다.

 

Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.