새소식

시계열 분석

SARIMA(Seasonal Autoregressive Integrated Moving Average) 모델

  • -

SARIMA(Seasonal Autoregressive Integrated Moving Average) 모델은 ARIMA 모델의 확장 버전으로, 계절성 패턴을 가진 시계열 데이터를 분석하고 예측하기 위한 통계적 방법이다. SARIMA 모델은 기본 ARIMA 모델에 계절성 요소를 추가하여 복잡한 계절성 패턴을 포착하고 설명할 수 있다.

SARIMA 모델은 다음과 같이 표현된다.

 

$SARIMA(p, d, q)(P, D, Q)m$

 

여기서 $p, d, q$는 각각 자기 회귀(AR) 차수, 차분 차수, 이동 평균(MA) 차수를 나타내며, 기본 ARIMA 모델과 동일한 의미다. $P, D, Q$는 각각 계절성 자기 회귀 차수, 계절성 차분 차수, 계절성 이동 평균 차수를 나타낸다. $m$은 계절성 주기를 나타내는 정수값으로, 예를 들어 월별 데이터의 경우 $m = 12$다.

 

SARIMA 모델 구축 및 분석 과정은 다음과 같다.

  1. 데이터 탐색: 시계열 데이터의 패턴, 추세, 계절성, 이상치 등을 확인한다.
  2. 데이터 전처리: 결측치 처리 및 이상치 제거를 수행한다.
  3. 정상화 여부 확인: 시계열 데이터가 정상 상태인지 확인하고, 비정상 상태라면 차분을 통해 정상화를 진행한다.
  4. ACF(Autocorrelation Function) 및 PACF(Partial Autocorrelation Function) 그래프를 분석하여 $p, q, P, Q$ 차수를 결정한다. 계절성 차분 차수 $D$는 데이터의 특성에 따라 결정된다.
  5. $SARIMA(p, d, q)(P, D, Q)m$ 모델을 구축하고 학습시킨다.
  6. 모델의 성능을 평가하고, 필요한 경우 파라미터를 조정하여 최적의 모델을 찾는다.
  7. 최적의 SARIMA 모델을 사용하여 미래 시점의 값을 예측한다.
  8. 예측값을 실제값과 비교하여 모델의 정확도를 평가하고, 필요한 경우 모델을 개선하거나 다른 시계열 분석 기법을 적용할 수 있다.

 

SARIMA 모델의 한계는 기본 ARIMA 모델과 유사하다. 주로 선형 가정과 고정된 구조의 한계를 가지며, 비선형 패턴을 처리하는 데 어려움이 있을 수 있다. 또한, SARIMA 모델은 정상성 가정을 요구하므로, 비정상 시계열 데이터는 차분을 통해 정상화해야 한다.

Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.