6.4.4.5. 박스-젠킨스 모델
November 25, 2016
박스-젠킨스 접근법 박스-젠킨스 ARMA 모델은 (이전에 살펴본 것처럼) AR과 MA 모델을 결합한 것이다. $$ \begin{align*} X_{t} =& \delta + \phi_{1} X_{t-1} + \phi_{2} X_{t-2} + \cdots + \phi_{p} X_{t-p} + \\ & A_{t} - \theta_{1} A_{t-1} - \theta_{2} A_{t-2} - \cdots - \theta_{q} A_{t - q} \end{align*} $$ 위의 식은 AR과 MA 모델에서 봤던 것과 크게 다르지 않다.
박스-젠킨스 모델에 대한 첨언 다음은 이 모델에 관한 몇 가지 사항들이다.
1. 박스-젠킨스 모델은 시계열이 정상적(stationary)이라고 가정한다. 박스와 젠킨스는 정상성(stationarity)을 얻기 위해 비-정상적인(non-stationary) 시계열을 빼는 작업을 한 번 이상하기를 권장한다. 그렇게 하면 ARIMA 모델이 된다. 여기에서 "I"는 "통합적인(integrated)"을 의미한다.
2. 몇몇 기법은 시계열의 각 점에서 시계열의 평균을 빼서 변환한다. 이 작업에서 평균이 0인 시계열이 나온다. 이 작업이 필요한지는 모델을 다루는 소프트웨어에 따라 다르다.
3. 계절적인 자동회귀와 계절적인 이동 평균 항을 넣어 박스-젠킨스 모델을 확장할 수 있다. 이렇게 해서 모델이 복잡해지더라도, 계절적인 자동회귀와 계절적인 이동 평균 항에 대한 기본적인 개념은 비-계절적인 자동회귀와 이동 평균 항과 비슷하다.
4. 가장 일반적인 박스-젠킨스 모델에는 차이를 구하는 계산, 자동회귀 항, 이동 평균 항, 계절적인 차이를 구하는 계산, 계절적인 자동회귀 항, 계절적인 이동 평균 항 등이 있다. 하지만 일반적으로 모델링을 할 때는 필요한 항만 추가해야 한다. 이러한 과정에 담긴 수학적인 내용이 좀 더 궁금하다면 Box, Jenkins and Reisel (1994), Chatfield (1996), Brockwell and Davis (2002)를 살펴보길 바란다.
박스-젠킨스 모델링 순서 다음은 박스-젠킨스 시계열 모델을 세울 때 중요한 3가지 과정이다.
1. 모델 판별
2. 모델 측정
3. 모델 검증
첨언 다음은 박스-젠킨스 모델에 관한 몇 가지 주의 사항이다.
1. 박스-젠킨스 모델은 자동회귀와 이동평균 둘 다 포함하고 있어서 상당히 유연하다.
2. 올드(Wold) 분해 정리(이 글에서 다루지 않는다)에 의하면, 정상 과정은 ARMA 모델로 근사할 수 있다. 근사식을 구하는 작업은 그리 간단하진 않다.
3. 챗필드Chatfield는 1996년에 추세와 계절적인 성분이 우세한 시계열을 분해하는 방법을 추천하였다.
4. 좋은 ARIMA 모델을 세우려면 회귀법 같이 보통 사용하는 통계 기법에 비해 일반적으로 많은 경험이 필요하다.
충분히 긴 시계열이 필요하다 보통 박스-젠킨스 모델을 효과적으로 맞추려면 적당히 긴 시계열이 필요하다. Chatfield는 1996년에 적어도 50개의 관측값이 필요하다고 하였고, 다른 사람들은 적어도 100개 이상이 필요하다고 하였다.