6.4.4.4. 단변량 시계열을 다루는 일반적인 방법

November 25, 2016

시계열을 모델링하는 여러가지 방법이 있다. 아래에서 가장 일반적인 몇 가지 방법들을 살펴보자.

추세, 계절적인, 나머지 분해 한 가지 방법은 시계열을 추세, 계절적인 부분, 나머지 성분으로 분해하는 것이다.

삼중 지수 평활법은 이 접근 방식의 한 예이다. 또 다른 예는 클리브랜드Cleveland가 1993년에 언급한 계절적인 loess라고 하는 방법인데, 지역적 가중치 최소 제곱법(locally weighted least squares)에 근거한다. 여기에서는 계절적인 loess방법은 다루지 않는다.

주파수 기반 방법 과학이나 공학에서 많이 사용하는 또 다른 방법은 시계열을 주파수 영역에서 분석하는 것이다. 이 방법은 빔 편광 사례 연구(beam deflection case study)에서 나타나는 사인 함수(sinusoidal) 형태 데이터를 모델링할 때 사용한다. 시계열의 주파수 분석할 때 분광 그래프를 주로 사용한다.

주파수 기반 방법의 자세한 내용은 블룸필드Bloomfield 1976, 젠킨스와 와츠Jenkins and Watts 1968, 그리고 챗필드 1996를 참고하라.

자동회귀(autoregressive, AR) 모델 단변량 시계열을 모델링할 때 흔히 자동회귀(AR) 모델을 사용한다. $$ X_{t} = \delta + \phi_{1} X_{t-1} + \phi_{2} X_{t-2} + \cdots + \phi_{p} X_{t-1} + A_{t} $$ 여기에서 \( X_{t} \)는 시계열, \( A_{t} \)는 백색 소음(white noise), $$ \delta = \left( 1 - \sum_{i=1}^{p} \phi_{i} \right) \mu \ , $$ \( \mu \)는 과정 평균을 의미한다.

자동회귀 모델은 단순히 시계열에서 하나 또는 그 이상의 이전 값에 대한 시계열의 현재 값의 선형 회귀이다. \(p\) 값을 AR 모델의 차수라고 한다.

표준 선형 최소 제곱 기법을 포함하여 다양한 기법으로 AR 모델을 분석할 수 있다. 그리고 직관적으로 이해할 수 있다.

이동 평균(Moving Average, MA) 모델 이동 평균은 단변량 시계열을 모델링하는 또 하나의 일반적인 접근법이다. $$ X_{t} = \mu + A_{t} - \theta_{1} A_{t-1} - \theta_{2} A_{t-2} - \cdots - \theta_{q} A_{t-q} $$ 여기에서 \( X_{t} \)는 시계열, \( \mu \)는 시계열의 평균, \( A_{t-i} \)는 백색 소음 항, \( \theta_{1} , \cdots, \theta_{q} \)는 모델의 매개변수이다. \(q\)값은 MA 모델의 차수라고 한다.

즉, 이동 평균 모델은 개념적으로 시계열에서 백색 소음이나 하나 또는 그 이상의 이전 값의 무작위적 충격에 대한 시계열에서 현재 값의 선형 회귀이다. 어떤 시점에서 무작위적 충격은 동일한 분포(보통 평균이 0이고 상수 척도인 정규 분포)에서 온다고 가정한다. 이 모델에서는 이러한 무작위적 충격이 시계열의 미래 값에 전파된다는 차이가 있다. 왜냐하면 오차 항이 관측할 수 없는 양이라, MA 추정을 맞추는 것은 AR 모델 경우보다 복잡하다. 선형 최소 제곱법 대신 비선형 맞춤(non-linear fitting) 과정을 반복해서 사용해야 한다. MA 모델은 AR 모델보다 직관적으로 해석하기 힘들다.

가끔 자기 상관 함수와 부분 자기 상관 함수가 MA 모델이 더 좋은 선택이라는 것이나 AR과 MA 항을 같은 모델에서 사용해야 한다는 것을 알려준다.

하지만, 모델 뒤의 오차 항은 독립적이어야 하고 단변량 과정의 표준적인 가정을 따라야 한다.

박스-젠킨스(Box-Jenkins) 접근법 박스(Box)와 젠킨스(Jenkins) 이동 평균과 자동회귀 접근법을 결합한 기법을 "시계열 분석: 예측과 제어(Time Series Analysis: Forecasting and Control)"라는 책을 통해 대중화하였다(Box, Jenkins, and Reinsel, 1994).

자동회귀와 이동 평균 접근법 둘 다 이미 알려져 있었더라도(Yule이 연구한 결과), 박스와 젠킨스는 두 가지 접근 방식을 결합하여 모델을 감별하고 측정하는 체계적인 방법론을 개발하였다. 이 점이 박스-젠킨스 모델의 강점이다. 다음에 이어지는 몇몇 절에서 이 모델을 자세하게 살펴보겠다.

원문 보기

6.4.4.4. 단변량 시계열을 다루는 일반적인 방법 - November 25, 2016 - Daniel Kim, PhD