Модель авторегресії — ковзного середнього

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

У статистичному аналізі часових рядів моделі авторегресії — ковзного середнього (АРКС, англ. autoregressive–moving-average models, ARMA) пропонують економний опис (слабко) стаціонарного стохастичного процесу в термінах двох многочленів, одного для авторегресії[en], а другого — для ковзного середнього[en]. Загальну модель АРКС було описано 1951 року в дисертації Пітера Уіттла[en] «Перевірка гіпотез в аналізі часових рядів» і популяризовано в книзі Джорджа Бокса[en] та Ґвилима Дженкінса[en] 1970 року.

Для заданого часового ряду даних Xt модель АРКС є інструментом для розуміння та, можливо, передбачування майбутніх значень цього ряду. Ця модель складається з двох частин: авторегресійної (АР), та ковзного середнього (КС). Частина АР передбачає регресування цієї змінної за її власними запізнюваними (тобто, минулими) значеннями. Частина КС передбачає моделювання члену похибки як лінійної комбінації членів похибки, що стаються в поточний момент та в різні моменти часу в минулому.

На цю модель зазвичай посилаються як на модель АРКС(p, q), де p — порядок авторегресійної частини, а q — порядок частини ковзного середнього (як визначено нижче).

Моделі АРКС може бути оцінювано за допомогою методу Бокса — Дженкінса[en].

Авторегресійна модель[ред. | ред. код]

Детальніші відомості з цієї теми Ви можете знайти в статті Авторегресійна модель[en].

Позначення АР(p) стосується авторегресійної моделі порядку p. Модель АР(p) записують як

де є параметрами, є сталою, а випадкова величина є білим шумом.

Щоби ця модель залишалася стаціонарною, для значень цих параметрів необхідні деякі обмеження. Наприклад, процеси в моделі АР(1) за |φ1| ≥ 1 стаціонарними не є.

Модель ковзного середнього[ред. | ред. код]

Детальніші відомості з цієї теми Ви можете знайти в статті Модель ковзного середнього[en].

Позначення КС(q) стосується моделі ковзного середнього порядку q:

де θ1, …, θq є параметрами моделі, μ є математичним сподіванням (що часто вважають рівним 0), а , , … є, знов-таки, членами похибки білого шуму.

Модель АРКС[ред. | ред. код]

Позначення АРКС(p, q) стосується моделі з p авторегресійними членами та q членами ковзного середнього. Ця модель містить моделі АР(p) та КС(q),

Загальну модель АРКС було описано 1951 року в дисертації Пітера Уіттла[en], який використовував математичний аналіз (ряд Лорана та аналіз Фур'є) та статистичне висновування.[1][2] Моделі АРКС було популяризовано книгою 1970 року Джорджа Бокса[en] та Дженкінса[en], які виклали ітераційний метод (Бокса — Дженкінса[en]) для їхнього вибирання та оцінювання. Цей метод був корисним для многочленів нижчих порядків (третього або нижчого ступеня).[3]

Зауваження про члени похибки[ред. | ред. код]

Члени похибки , як правило, вважають незалежними однаково розподіленими випадковими величинами (НОР), відбираними з нормального розподілу з нульовим середнім: ~ N(0, σ2), де σ2 є дисперсією. Ці припущення може бути послаблено, але це змінить властивості моделі. Зокрема, зміна припущення про НОР призведе до принципової відмінності.

Визначення в термінах оператора запізнювання[ред. | ред. код]

В деяких текстах ці моделі визначатимуть у термінах оператора запізнювання[en] L. В цих термінах модель АР(p) подають як

де представляє многочлен

Модель КС(q) подають як

де θ представляє многочлен

Нарешті, об'єднану модель АРКС(p, q) подають як

або, лаконічніше,

або

Альтернативний запис[ред. | ред. код]

Деякі автори, включно з Боксом[en], Дженкінсом[en] та Рейнзелем, використовують іншу угоду щодо коефіцієнтів авторегресії.[4] Це дозволяє всім многочленам, до яких входить оператор запізнювання, всюди мати подібний вигляд. Таким чином модель АРКС буде записано як

Більше того, якщо ми встановимо та , то отримаємо ще елегантніше формулювання:

Пристосовування моделей[ред. | ред. код]

Вибір р та q[ред. | ред. код]

Пошук відповідних значень p та q в моделі АРКС(p, q) може бути полегшено шляхом побудови частинних автокореляційних функцій[en] задля оцінки p, а також використання автокореляційних функцій задля оцінки q. Додаткову інформацію можливо підбирати, розглядаючи ті ж функції для залишків моделі, пристосованої початковим вибором p та q.

Броквел та Девіс для пошуку р та q радять застосовувати ІКАк.[5]

Оцінювання коефіцієнтів[ред. | ред. код]

Моделі АРКС після вибору р та q загалом не може бути пристосовувано за допомогою регресії найменших квадратів задля знаходження значень параметрів, які мінімізують член похибки. Загалом доброю практикою вважають знаходити найменші значення р та q, які забезпечують прийнятну пристосованість до даних. Для чистої моделі АР для забезпечення пристосованості можна використовувати рівняння Юла-Вокера[en].

Втілення в статистичних пакетах[ред. | ред. код]

  • В R функцію arima (зі стандартного пакунку stats) описано в ARIMA Modelling of Time Series. Пакунки розширення містять пов'язану та розширену функціональність, наприклад, пакунок tseries містить функцію arma, описану в «Fit ARMA Models to Time Series»; пакунок fracdiff містить fracdiff() для дробово інтегрованих АРКС-процесів тощо. Перегляд задач CRAN на Time Series містить посилання на більшість із них.
  • Mathematica має повну бібліотеку функцій часових рядів, включно з АРКС.[6]
  • MATLAB містить такі функції, як arma та ar для оцінювання моделей АР, АРК (авторегресійні екзогенні) та АРКСК. Для отримання додаткової інформації див. System Identification Toolbox та Econometrics Toolbox.
  • Модуль Python Statsmodels[en] містить багато моделей та функцій для аналізу часових рядів, включно з АРКС. Колишня частина scikit-learn[en], він тепер є автономним і добре поєднується з pandas. Докладніше див. тут.
  • PyFlux має втілення моделей АРКС на основі Python, включно з баєсовими моделями АРКС. Подробиці див. тут.
  • Чисельні бібліотеки IMSL — це бібліотеки функціональності чисельного аналізу, включно з процедурами АРКС та АРІКС, втіленими стандартними мовами програмування, такими як C, Java, C# .NET та Fortran.
  • gretl[en] також може оцінювати моделі АРКС, див. тут, де про це згадувано.
  • GNU Octave може оцінювати моделі АР за допомогою функцій з додаткового пакунку octave-forge.
  • Stata[en] містить функцію arima, яка може оцінювати моделі АРКС та АРІКС[en]. Докладніше див. тут.
  • SuanShu — це бібліотека Java чисельних методів, включно з комплексними статистичними пакунками, в яких одновимірні/багатовимірні моделі АРКС, АРІКС, АРКСК та ін. втілено за допомогою об'єктно-орієнтованого підходу. Ці втілення описано в «SuanShu, a Java numerical and statistical library».
  • SAS[en] має економетричний пакунок, ETS, який оцінює моделі АРІКС. Докладніше див. тут.

Застосування[ред. | ред. код]

АРКС є доречною, коли система є функцією як ряду не спостережуваних струсів (частина КС, або ковзне середнє), так і своєї власної поведінки. Наприклад, ціни акцій можуть струшуватися основною інформацією, а також демонструвати технічні прямування та ефекти повернення до середнього[en] через учасників ринку.

Узагальнення[ред. | ред. код]

Якщо не вказано інше, то залежність Xt від минулих значень та членів похибки εt вважається лінійною. Якщо ця залежність є нелінійною, то модель спеціально називають моделлю нелінійного ковзного середнього (НКС, англ. nonlinear moving average, NMA), нелінійної авторегресії (НАР, англ. nonlinear autoregressive, NAR) або нелінійної авторегресії — ковзного середнього (НАРКС, англ. nonlinear autoregressive–moving-average, NARMA).

Моделі авторегресії — ковзного середнього може бути узагальнювано й іншими способами. Див. також моделі авторегресії — умовної гетероскедастичності (АРУГ, англ. autoregressive conditional heteroskedasticity, ARCH) та моделі авторегресії — інтегрованого ковзного середнього[en] (АРІКС, англ. autoregressive integrated moving average, ARIMA). Якщо потрібно пристосовуватися до декількох часових рядів, то можна пристосовувати векторну ​​модель АРІКС (або ВАРІКС, англ. VARIMA). Якщо часовий ряд, про який йдеться, демонструє довгу пам'ять, то може бути доцільним дробове (англ. fractional) моделювання АРІКС (ДАРІКС, англ. FARIMA, інколи зване АРДІКС, англ. ARFIMA): див. авторегресію — дробово інтегроване ковзне середнє[en]. Якщо вважається, що дані містять сезонні ефекти, то їх можна моделювати моделлю САРІКС (сезонна АРІКС, англ. SARIMA), або періодичною (англ. periodic) моделлю АРКС.

Іншим узагальненням є багатомасштабна авторегресійна (БАР, англ. multiscale autoregressive, MAR) модель. Модель БАР індексовано вузлами дерева, тоді як стандартну авторегресійну модель (дискретного часу) індексовано цілими числами.

Зауважте, що модель АРКС є одновимірною моделлю. Розширеннями для багатовимірного випадку є векторна авторегресія (ВАР, англ. vector autoregression, VAR) та векторна авторегресія — ковзне середнє (ВАРКС, англ. Vector Autoregression Moving-Average, VARMA).

Модель авторегресії — ковзного середнього з екзогенними входами (модель АРКСК, ARMAX)[ред. | ред. код]

Позначення АРКСК(p, q, b) стосується моделі з p авторегресійними членами, q членами ковзного середнього та b членами екзогенних входів. Ця модель містить моделі АР(p) та КС(q), а також лінійну комбінацію останніх b членів відомих і зовнішніх часових рядів . Її задають як

де  — параметри екзогенного входу .

Було визначено деякі нелінійні варіанти моделей з екзогенними змінними: див., наприклад, нелінійну авторегресійну екзогенну модель.

Статистичні пакети втілюють модель АРКСК за допомогою «екзогенних», або «незалежних» змінних. При інтерпретуванні виходу цих пакетів слід бути обережними, оскільки оцінювані параметри зазвичай (наприклад, в R[7] та gretl) стосуються регресії

де до mt входять всі екзогенні (або незалежні) змінні:

Див. також[ред. | ред. код]


Примітки[ред. | ред. код]

  1. Hannan, Edward James (1970). Multiple time series. Wiley series in probability and mathematical statistics. New York: John Wiley and Sons.  (англ.)
  2. Whittle, P. (1951). Hypothesis Testing in Time Series Analysis. Almquist and Wicksell.  (англ.) Whittle, P. (1963). Prediction and Regulation. English Universities Press. ISBN 0-8166-1147-5.  (англ.)
    Перевидано як Whittle, P. (1983). Prediction and Regulation by Linear Least-Square Methods. University of Minnesota Press. ISBN 0-8166-1148-3.  (англ.)
  3. Hannan та Deistler, (1988, p. 227) : Hannan, E. J.; Deistler, Manfred (1988). Statistical theory of linear systems. Wiley series in probability and mathematical statistics. New York: John Wiley and Sons. 
  4. Box, George; Jenkins, Gwilym M.; Reinsel, Gregory C. (1994). Time Series Analysis: Forecasting and Control (вид. Third). Prentice-Hall. ISBN 0130607746.  (англ.)
  5. Brockwell, P. J.; Davis, R. A. (2009). Time Series: Theory and Methods (вид. 2nd). New York: Springer. с. 273. ISBN 9781441903198.  (англ.)
  6. Функції часових рядів в Mathematica Архівовано November 24, 2011, у en:Wayback Machine. (англ.)
  7. ARIMA Modelling of Time Series, документація R

Література[ред. | ред. код]

  • Mills, Terence C. (1990). Time Series Techniques for Economists. Cambridge University Press. ISBN 0521343399.  (англ.)
  • Percival, Donald B.; Walden, Andrew T. (1993). Spectral Analysis for Physical Applications. Cambridge University Press. ISBN 052135532X.  (англ.)
  • Francq, C.; Zakoïan, J.-M. (2005). Recent results for linear time series models with non independent innovations. У Duchesne, P.; Remillard, B. Statistical Modeling and Analysis for Complex Data Problems. Springer. с. 241–265. . (англ.)