Аналіз сингулярного спектру

Аналіз сингулярного спектру (англ. Singular spectrum analysis, SSA), також «Гусениця» — метод аналізу часових рядів, що базується на перетворенні одновимірного часового ряду на багатовимірний і подальший його сингулярний розклад. При правильному використанні метод дозволяє розділити часовий ряд на тренд, періодичні компоненти і випадковий шум.

Опис базового методу[ред. | ред. код]

У найбільш розповсюдженому варіанті алгоритму, вхідними даними є одномірний часовий ряд $F_{N}$ , де $N$ — довжина ряду. SSA складається з чотирьох етапів: 1. Перетворення одновимірних даних на багатовимірні, або вкладання (англ. embedding). Оберемо число $2\leq L<N$ , ширину вікна^[1]. Нехай $K=N-L+1$ . Побудуємо матрицю розміру $L\times K$ , наступним чином: перший стовпчик складають елементи ряду з $f_{1}$ по $f_{L}$ . Другий — $f_{2}$ по $f_{L+1}$ , і так до К-того стовпця, у який входять елементи від $f_{K}$ по $f_{N}$ ^[2].

\mathbf {X} ={\begin{bmatrix}f_{1}&f_{2}&f_{3}&\ldots &f_{K}\\f_{2}&f_{3}&f_{4}&\ldots &f_{K+1}\\f_{3}&f_{4}&f_{5}&\ldots &f_{K+2}\\\vdots &\vdots &\vdots &\ddots &\vdots \\f_{L}&f_{L+1}&f_{L+2}&\ldots &f_{N}\\\end{bmatrix}},

Матриця $\mathbf {X}$ називається траєкторною матрицею. Усі елементи, що лежать на діагоналях, паралельних побічній є рівними, тобто така матриця є ганкелевою.

2. Сингулярний розклад траєкторної матриці. Нехай $\mathbf {S} =\mathbf {X} \mathbf {X} ^{T}$ , матриця розмірності $L\times L$ . Тоді, позначимо власні числа матриці $\mathbf {S}$ як $\lambda _{1},\lambda _{2},...,\lambda _{L}$ , а власні вектори як $U_{1},U_{2},...,U_{L}$ . Якщо $d$ — це кількість ненульових власних чисел, то можна визначити $d$ факторних векторів

V_{i}={\frac {\mathbf {X} ^{T}U_{i}}{\sqrt {\lambda _{i}}}}

Тоді траєкторну матрицю можна представити у вигляді

\mathbf {X} =\mathbf {X} _{1}+\mathbf {X} _{2}+\ldots +\mathbf {X} _{d}=\sum _{i=1}^{d}{\sqrt {\lambda _{i}}}U_{i}V_{i}^{T}

Сукупність деякого власного числа $\lambda _{i}$ а також власного і факторного векторів що йому відповідають, називається власною трійкою (англ. eigentriple)^[3]

3. Групування. Усі власні трійки розбиваються на $m$ груп що не перетинаються, які позначаються як $I_{1},I_{2},...,I_{m}$ . Матриці що входять до кожної групи складаються: нехай $I$ це деяка група, в яку входять $p$ різних власних трійок, тоді

\mathbf {X} _{I}=\mathbf {X} _{i_{1}}+\mathbf {X} _{i_{2}}+...+\mathbf {X} _{i_{p}}

Групування є найбільш нетривіальною частиною метода. Критерієм правильності його виконання є те, що результуючи матриці, що отримуються сумацією всіх матриць всередині групи, є близькими до ганкелевих, тобто, значення на їх діагоналях, паралельних побіжним є рівними або хоча б близькими. Складові часового ряда, які можливо виділити таким чином, називаються розділимими^[4].

4. Усереднення, або ганкелізація. Оскільки рідко можливо створити справді ганкелеві матриці у попередньому етапі, у кожній з матриць $\mathbf {X} _{I}$ , всі значення, що лежать на діагоналях, паралельних побічній, усереднюються^[5]:

{\widetilde {x_{1,1}}}=x_{1,1}

;

{\widetilde {x_{1,2}}}={\widetilde {x_{2,1}}}={\frac {x_{1,2}+x_{2,1}}{2}}

;

{\widetilde {x_{1,3}}}={\widetilde {x_{2,2}}}={\widetilde {x_{3,1}}}={\frac {x_{1,3}+x_{2,2}+x_{3,1}}{3}}...

Отримана в результаті усереднення матриця буде ганкелевою, як і оригінальна траєкторна матриця $\mathbf {X}$ . Кожній з цих матриць можна поставити у відповідність деякий часовий ряд ${\widetilde {F_{N}^{(i)}}}$ (за тим самим принципом, як з часового ряду була отримана траєкторна матриця). Отримані $m$ часових рядів у сумі будуть давати оригінальний часовий ряд:

F_{N}={\widetilde {F_{N}^{(1)}}}+{\widetilde {F_{N}^{(2)}}}+...+{\widetilde {F_{N}^{(m)}}}

Компоненти, які є результатом роботи алгоритму можуть бути розподілені на три типи: тренд (нестаціонарна частина серії, монотонно зростаюча або спадаюча компонента, іноді з окремими піками — загалом, межа між трендом і періодичними компонентами з дуже довгим періодом є розмитою), періодичні компоненти (такі компоненти не обов'язково є гармонійними коливаннями, і можуть мати довільну форму, а іноді — амплітудну або частотну модуляцію, тобто, їх розмах або період може повільно збільшуватися або зменшуватися з часом, в останньому випадку такі компоненти називають квазіперіодичними), і шум (аперіодичні, хаотичні, швидкозмінні компоненти, що мають близьку до нуля коваріацію)^[6].

Перед використанням методу, для коректного порівняння різних компонент, дані зазвичай нормалізують^[en] — віднімають середнє значення і ділять на середньоквадратичне відхилення^[7].

Принцип роботи[ред. | ред. код]

Метод є ідейно близьким до методу головних компонент: у просторі траєкторних матриць він шукає ортогональний базис, за яким можна розкласти матрицю на незалежні компоненти. Сингулярний розклад дозволяє знайти такий базис, і крім того, має важливу особливість: серед всіх матриць рангу r (де r є меншим ніж ранг траєкторної матриці), матриця, що дорівнює сумі перших r матриць з сингулярного розкладу буде найближчою до оригінальної матриці (в сенсі, норма Фробеніуса різниць цих матриць буде найменшою)^[3].

Розділюваність компонент[ред. | ред. код]

Розділюваність (англ. separability) є дуже важливою концепцією для розуміння ефективності методу. Тільки якщо компоненти ряду є розділюваними, SSA зможе їх коректно виділити. Існує два різних типи розділюваності, слабка і сильна. Нехай є ряд $F_{N}$ що складається з двох компонент, $F_{N}^{(1)}$ і $F_{N}^{(2)}$ . Тоді ці компонентами називаються слабко розділюваними, якщо усі підряди довжини L першого ряду є ортогональними усім підрядам довжини L другого ряду, і те саме щодо підрядів довжини $K$ (тобто $N-L-1$ ). Або, що те саме, кожен з стовпців траєкторної матриці першого ряду є ортогональним кожному стовпцю другого ряду (і те саме щодо рядків траєкторних матриць).

Додатковою умовою сильної розділюваності є те, що множини власних значень матриць $\mathbf {S_{1}}$ і $\mathbf {S_{2}}$ не перетинаються.

Якщо усі власні значення траєкторної матриці є унікальними (тобто, не повторюються), то визначення сильної і слабкої розділюваності є однаковими^[8].

Існує необхідна, але не достатня умова розділюваності, яка називається w-ортогональність. Нехай $L^{*}=min(L,K),K^{*}=max(L,K)$ . Визначимо ваговий вектор^[9]

w_{i}={\begin{cases}i,&{\mbox{if }}1\leq i<L^{*}\\L^{*},&{\mbox{if }}L^{*}<i\leq K^{*}\\N-i,&{\mbox{if }}K^{*}<i\end{cases}}

Якщо представити $w$ як ряд, він буде мати трапецієвидну форму. Також, визначимо зважений добуток часових рядів як:

(F^{(1)},F^{(2)})_{w}=\sum _{i=1}^{N}w_{i}f_{i}^{(1)}f_{i}^{(2)}

Ряди $F^{(1)}$ і $F^{(2)}$ називаються w-ортогональними, якщо $(F^{(1)},F^{(2)})_{w}=0$ .

Хоча w-ортогональність не є достатньою умовою для роздільності, вона є необхідною — якщо два ряди не w-ортогональні, тоді вони і не розділювані. При цьому, ця умова є обчислювано простою, тому вона досить широко застосовується.

Два гармонічні періодичні ряди є розділюваними, якщо їх періоди у ціле число разів менші за розмірності траєкторної матриці: $T_{1}=L/m_{1}=K/p_{1};T_{2}=L/m_{2}=K/p_{2}$ .

Зазвичай повна розділюваність є недосяжною, тому на практиці від даних очікується наближена розділюваність. Існує кілька метрик, якими можливо її виміряти:

Максимальна кореляція. Ортогональність двох векторів можна розуміти як нульову кореляцію між їх компонентами. Тому максимальне абсолютне значення кореляції серед усіх пар підрядів довжини L i K (де один член пари взятий з першого ряду, а другий — з другого) є мірою неортогональності (чим ближча вона до нуля, тим краще).
Зважена кореляція (англ. w-correlation), яка є оцінкою близькості до w-ортогональності, і визначається як:

\rho _{12}^{(w)}={\frac {(F^{(1)},F^{(2)})_{w}}{(F^{(1)},F^{(1)})_{w}*(F^{(2)},F^{(2)})_{w}}}

Чим ближчий він до нуля, тим більш близькими до ортогональності є два ряди.

Вибір параметрів моделі[ред. | ред. код]

Загалом, базовий SSA має лише два параметри. Перший — числовий, довжина вікна. Другий — методологічний, спосіб групування.

Довжину вікна зазвичай обирають достатньо великою, оскільки вона має бути більшою, ніж можливі періоди коливання компонентів ряду, проте не більшою ніж $N/2$ . Нормальною практикою є $L>N/4$ ^[10]. Якщо ми очікуємо, що ряд містить компоненту деякого періоду, то є сенс взяти L кратним цьому періоду^[11].

Пошук методу групування є більш широкою задачею. Існує кілька емпіричних вказівок на те, як групувати компоненти:

На діаграмі власних значень, $(log(\lambda _{i}),i)$ компоненти що відносяться до шуму виглядають як довгий і плавно спадаючий хвіст. Такі компоненти зазвичай достатньо сильно w-корельовані між собою^[12].
Періодичним компонентам часто відповідають два близьких власних значення, або одне значення, якщо це пилкоподібна компонента (кожне наступне значення змінює знак відносно попереднього)
Найбільшим власним значенням відповідають найбільш значущі компоненти — зазвичай це тренд.

Примітки[ред. | ред. код]

↑ Golyandina,Nekrutkin,Zhigljavsky, 2001, с. 30.
↑ Golyandina,Nekrutkin,Zhigljavsky, 2001, с. 28.
↑ ^а ^б Golyandina,Nekrutkin,Zhigljavsky, 2001, с. 32.
↑ Golyandina,Nekrutkin,Zhigljavsky, 2001, с. 34.
↑ Golyandina,Nekrutkin,Zhigljavsky, 2001, с. 36.
↑ Golyandina,Nekrutkin,Zhigljavsky, 2001, с. 46.
↑ Elsner,Tsonis, 1996, с. 67.
↑ Golyandina,Nekrutkin,Zhigljavsky, 2001, с. 57.
↑ Golyandina,Nekrutkin,Zhigljavsky, 2001, с. 58.
↑ Elsner,Tsonis, 1996, с. 57.
↑ A Brief Introduction to Singular Spectrum Analysis
↑ Golyandina,Nekrutkin,Zhigljavsky, 2001, с. 79.

Література[ред. | ред. код]

N. Golyandina, V. Nekrutkin, and A. Zhigljavsky. Analysis of Time Series Structure: SSA and Related Techniques. — Boca Raton : CRC Press, 2001. — 260 с. — ISBN 1-58488-194-1.
James B. Elsner, Anastasios A. Tsonis. Singular Spectrum Analysis. A New Tool in Time Series Analysis. — New-York : Plenum Press, 1996. — 164 с. — ISBN 978-1-4419-3266-2.

[FOOTNOTEGolyandina,Nekrutkin,Zhigljavsky200130-1] Golyandina,Nekrutkin,Zhigljavsky, 2001, с. 30.

[FOOTNOTEGolyandina,Nekrutkin,Zhigljavsky200128-2] Golyandina,Nekrutkin,Zhigljavsky, 2001, с. 28.

[FOOTNOTEGolyandina,Nekrutkin,Zhigljavsky200132-3] а ^б Golyandina,Nekrutkin,Zhigljavsky, 2001, с. 32.

[FOOTNOTEGolyandina,Nekrutkin,Zhigljavsky200134-4] Golyandina,Nekrutkin,Zhigljavsky, 2001, с. 34.

[FOOTNOTEGolyandina,Nekrutkin,Zhigljavsky200136-5] Golyandina,Nekrutkin,Zhigljavsky, 2001, с. 36.

[FOOTNOTEGolyandina,Nekrutkin,Zhigljavsky200146-6] Golyandina,Nekrutkin,Zhigljavsky, 2001, с. 46.

[FOOTNOTEElsner,Tsonis199667-7] Elsner,Tsonis, 1996, с. 67.

[FOOTNOTEGolyandina,Nekrutkin,Zhigljavsky200157-8] Golyandina,Nekrutkin,Zhigljavsky, 2001, с. 57.

[FOOTNOTEGolyandina,Nekrutkin,Zhigljavsky200158-9] Golyandina,Nekrutkin,Zhigljavsky, 2001, с. 58.

[FOOTNOTEElsner,Tsonis199657-10] Elsner,Tsonis, 1996, с. 57.

[11] A Brief Introduction to Singular Spectrum Analysis

[FOOTNOTEGolyandina,Nekrutkin,Zhigljavsky200179-12] Golyandina,Nekrutkin,Zhigljavsky, 2001, с. 79.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]