KPSS(Kwiatkowski-Phillips-Schmidt-Shin) 검정은 시계열 데이터의 정상성을 검정하기 위한 통계적 방법 중 하나다. ADF(Augmented Dickey-Fuller) 검정이나 PP(Phillips-Perron) 검정과 달리 KPSS 검정은 시계열이 정상적이라고 가정한 상태에서 검정을 수행한다. 이로 인해 KPSS 검정은 ADF 및 PP 검정과 상호 보완적인 역할을 수행할 수 있다.
KPSS 검정은 시계열 데이터에 대한 다음의 회귀식을 사용한다.
yt=α+βt+ρ1yt−1+...+ρpyt−p+εt
여기서,
- yt는 시계열 데이터
- α는 상수항, βt는 시간 추세
- ρi는 AR(p) 모델의 계수
- εt는 오차항으로, iid(independent and identically distributed) 가정을 만족하는 백색잡음(white noise)
KPSS 검정의 귀무 가설(Null hypothesis, H0)은 시계열 데이터가 정상성을 가진다는 것이다. 대립 가설(Alternative hypothesis, H1)은 시계열 데이터가 정상성을 가지지 않는다는 것이다.
KPSS 검정 통계량은 다음과 같이 계산된다.
KPSS통계량=(1/n2)∗∑nt=1S2t/σ̂2
여기서,
- n은 시계열 데이터의 길이
St는 누적 합계 오차(cumulative sum of errors)를 나타내며, St=∑ti=1εi
- σ̂2는 εt의 추정 분산
KPSS 통계량을 계산한 후, 해당 통계량이 임계값보다 크면 귀무 가설을 기각하고 시계열이 정상성을 가지지 않는다고 결론을 내릴 수 있다. 그렇지 않은 경우에는 시계열이 정상적이라고 볼 수 있다.
KPSS 검정은 ADF 및 PP 검정과 함께 시계열 데이터의 정상성을 확인하는 데 사용되며, 서로 보완적인 정보를 제공한다. 이를 통해 시계열 분석의 전제조건을 충족시키고, 데이터를 적절한 전처리를 거쳐 모델링 및 예측에 사용할 수 있다.