연속 확률 분포(continuous probability distribution)는 연속 확률 변수의 값들이 나타날 확률을 설명하는 함수다.
PDF, Probability Density Function(확률밀도함수)
균일 분포(Uniform distribution)
구간 [a, b]에서 모든 값이 동일한 확률로 발생하는 확률변수의 분포
PDF
f(x)=
정규 분포(Normal distribution)
평균이 μ이고 표준편차가 σ인 연속 확률변수의 분포
PDF
f(x)=1√2πσ2e−(x−μ)22σ2
지수 분포(Exponential distribution)
단위 시간 또는 공간에서 독립적으로 발생하는 사건 간의 시간이나 거리에 대한 확률변수의 분포
PDF
f(x)=
감마 분포(Gamma distribution)
일반화된 지수 분포로 모양(shape) 매개변수 k와 척도(scale) 매개변수 θ를 가진 확률변수의 분포
PDF
f(x)=
베타 분포(Beta distribution)
0과 1 사이의 값들에 대한 확률변수의 분포로, 모양(shape) 매개변수 α와 β를 가진다.
PDF
f(x)=
카이제곱 분포(Chi-squared distribution)
독립적인 표준 정규 분포를 따르는 확률 변수들의 제곱합에 대한 분포. 자유도(df)를 나타내는 매개변수 k를 가진다.
PDF
f(x)=
t 분포(Student's t-distribution)
정규 분포와 비슷한 모양을 갖지만, 양 끝의 꼬리 부분이 더 두껍고 긴 확률변수의 분포다. t 분포는 작은 표본 크기의 경우, 정규 분포를 가정한 분석에서 더 정확한 결과를 제공한다. 자유도(df)를 나타내는 매개변수 ν를 가진다.
PDF
f(x) = Γ(ν+12)√νπΓ(ν2)(1+x2ν)−ν+12
F 분포(F-distribution)
두 개의 카이제곱 분포에 대한 비율에 대한 확률변수의 분포. 두 개의 자유도 매개변수 d1과 d2를 가진다.
PDF
f(x) = Γ(d1+d22)Γ(d12)Γ(d22)d1d1/2d2d2/2x(d1/2)−1(d1x+d2)(d1+d2)/2
이런 연속 확률 분포들은 다양한 상황과 문제를 모델링하는 데 사용된다. 예를 들어, 정규 분포는 자연, 사회 과학에서 다양한 현상을 설명하는 데 널리 사용되며, t 분포와 F 분포는 통계적 가설 검정에서 주요한 역할을 한다. 지수 분포와 감마 분포는 대기 시간이나 사건 간 시간과 같은 연속적인 시간이나 거리를 모델링하는 데 사용되며, 베타 분포는 확률값 자체에 대한 불확실성을 모델링하는 데 사용된다.
연속 확률 분포를 이해하고 활용하면 현실 세계의 다양한 문제를 효과적으로 해결할 수 있다. 연속 확률 분포는 각각의 확률밀도함수를 이용해 확률을 계산하며, 누적 분포 함수를 통해 구간 내 확률을 구할 수도 있다. 확률 분포에 따라 다양한 통계량이나 추정치를 계산할 수 있으며, 이를 바탕으로 데이터 분석 및 예측을 수행할 수 있다.
데이터 분석에서는 이러한 확률 분포들을 활용하여 데이터의 형태와 패턴을 파악하고, 불확실성을 추정하며, 가설 검정을 수행하고, 신뢰 구간을 구하는 등의 작업을 수행한다. 이를 통해 데이터를 바탕으로 의사 결정을 내릴 수 있으며, 새로운 이론을 발전시키거나 기존의 이론을 검증할 수도 있다.