KPSS(Kwiatkowski-Phillips-Schmidt-Shin) 검정은 시계열 데이터의 정상성을 검정하기 위한 통계적 방법 중 하나다. ADF(Augmented Dickey-Fuller) 검정이나 PP(Phillips-Perron) 검정과 달리 KPSS 검정은 시계열이 정상적이라고 가정한 상태에서 검정을 수행한다. 이로 인해 KPSS 검정은 ADF 및 PP 검정과 상호 보완적인 역할을 수행할 수 있다.
KPSS 검정은 시계열 데이터에 대한 다음의 회귀식을 사용한다.
$y_t = α + βt + ρ_1y_{t-1} + ... + ρ_py_{t-p} + ε_t$
여기서,
- $y_t$는 시계열 데이터
- $α$는 상수항, $βt$는 시간 추세
- $ρ_i$는 $AR(p)$ 모델의 계수
- $ε_t$는 오차항으로, iid(independent and identically distributed) 가정을 만족하는 백색잡음(white noise)
KPSS 검정의 귀무 가설(Null hypothesis, $H0$)은 시계열 데이터가 정상성을 가진다는 것이다. 대립 가설(Alternative hypothesis, $H1$)은 시계열 데이터가 정상성을 가지지 않는다는 것이다.
KPSS 검정 통계량은 다음과 같이 계산된다.
$KPSS 통계량 = (1/n^2) * ∑_{t=1}^n S_t^2 / σ̂^2$
여기서,
- $n$은 시계열 데이터의 길이
$S_t$는 누적 합계 오차(cumulative sum of errors)를 나타내며, $S_t = ∑_{i=1}^t ε_i$
- $σ̂^2$는 $ε_t$의 추정 분산
KPSS 통계량을 계산한 후, 해당 통계량이 임계값보다 크면 귀무 가설을 기각하고 시계열이 정상성을 가지지 않는다고 결론을 내릴 수 있다. 그렇지 않은 경우에는 시계열이 정상적이라고 볼 수 있다.
KPSS 검정은 ADF 및 PP 검정과 함께 시계열 데이터의 정상성을 확인하는 데 사용되며, 서로 보완적인 정보를 제공한다. 이를 통해 시계열 분석의 전제조건을 충족시키고, 데이터를 적절한 전처리를 거쳐 모델링 및 예측에 사용할 수 있다.