Копула

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

У статистиці, копула або зв'язка використовується як загальний метод формулювання сукупного розподілу випадкових величин таким чином, що можна зобразити різні загальні типи залежності[1].

Основна ідея[ред.ред. код]

Нехай  X_1 і  X_2 — випадкові величини, функції розподілу імовірностей яких визначені на множинах  A та  B, відповідно. Позначимо і-у реалізацію j-ої випадкової величини як  x_j(i). Будемо називати функцію  C(X_1,X_2) зростаючою за кожною змінною  X_1 і  X_2 , якщо для неї виконується наступна умова:

C(x_1(2),x_2(2))+C(x_1(1),x_2(1))-C(x_1(2),x_2(1))-C(x_1(1),x_2(2)) \ge 0, коли x_j(1) \le x_j(2);

Визначимо підкопулу  C(X_1,X_2) як двовимірну функцію від двох змінних  X_1 і  X_2 , визначену на такій множині A \hbar B , що A\in[0;1] і B\in [0;1] , з областю значень [0;1] і задовольняючу наступним умовам:

  1. Обмеження знизу, тобто C(X_1,X_2)=0 , якщо \exists i:X_i=0 ;
  2. C(X_1,X_2)=X_i , якщо \forall \ne i: X_j=1 ;
  3. Зростання за кожною змінною;

Копула - це підкопула у разі, коли A=[0;1] і B=[0;1]. Саме на даному етапі можливо застосувати копули до моделювання спільних ймовірнісних розподілів, оскільки імовірність будь-якої випадкової величини також належить відрізку від нуля до одиниці.

Властивості зв'язок[ред.ред. код]

  1. Обмеженість: 0 \le C(x_1,...,x_k)\le 1;
  2. Для будь-якої зв'язки виконується нерівність (границя Фреше-Хефдинга, Frechet-Hoeffding): Max(0, x_1+x_2-1)\ge C(x_1,x_2) \ge Min(x_1,x_2)
  3. Упорядкованість (домінування): Зв'язка C_1 домінує над зв'язкою C_2, якщо \forall\  x_1,..., x_2 виконується C_1(x_1,...,x_k)\ge C_2(x_1,...,x_k);
  4. C(u,\;0)=C(0,\;v)=0,;
  5. C(u,\;1)=u;\quad C(1,\;v)=v.

Методи оцінки копул і виміру якості копула-моделей[ред.ред. код]

Параметричні (MLE, IFM)[ред.ред. код]

Цей клас методів припускає параметризацію як граничних розподілів, так і зв'язки. Якщо базовий підхід метод найбільшої правдоподібності (англ. Maximum Likelihood Estimation) передбачає максимізацію функції правдоподібності одночасно по граничних розподілах і по зв'язці, то метод "від маргіналів" (Inference for Margin - IFM) передбачає два етапи оцінки: спочатку - параметризація граничних розподілів, потім - копули.

Напівпараметричні (SP, CML)[ред.ред. код]

Напівпараметричні методи також припускають двоетапну оцінку копули. Але на першому етапі замість оцінки граничних розподілів використовується емпіричний розподіл. На другому ж етапі відбувається параметрична оцінка копули. У роботі [Kim G., Silvapulle M., Silvapulle P. (2007)] показано, що напівпараметричний метод (SP - semi-parametric) дає більш ефективні і стійкі оцінки ніж параметричні методи у випадках, коли тип оцінюваного розподілу не відомий і, як наслідок, виникає загроза їхньої невірної специфікації.

Непараметричні[ред.ред. код]

Серед непараметричних методів оцінки копул можна виділити підходи на основі оцінки емпіричної копули і ядерних оцінок. Перший підхід передбачає оцінку функції розподілу емпіричної копули, що відображає кількість випадків, коли реалізації випадкових величин одночасно потрапили в обрану групу розбиття нескінченного ймовірнісного простору (докладніше див. [Nelsen (2006), p. 219]).

Вимір якості оцінки копули[ред.ред. код]

Найбільш розповсюдженим критерієм вибору оптимальної копулиє критерій на основі значення функції максимальної правдоподібності - критерії Акаике (AI) і Шварца (BI). Другими за частототою застосування є тести Колмогорова-Смирнова й Андерсона-Дарлінга. Третім є метод оцінки дистанції до емпіричної копули.

Границі Фреше для копули[ред.ред. код]

Мінімальна копула - це нижня границя для всіх копул, тільки в двовимірному випадку відповідає строго негативної кореляції між випадковими величинами:

M(x,\;y)=\max(0,\;x+y-1).

Максимальна копула - це верхня границя для всіх копул, відповідає строго позитивної кореляції між випадковими величинами:

W(x,\;y)=\min(x,\;y).

Архімедові копули[ред.ред. код]

Одна часткова проста форма копули:

 H(x,\;y)=\Psi^{-1}(\Psi(F(x))+\Psi(G(y))),

де \psi називається функція-генератор. Такі копули називаються архімедяними. Кожна функція-генератор, що задовольняє приведеним нижче властивостям є основою для правильної копули:

\Psi(1)=0;\quad\lim_{x\to 0}\Psi(x)=\infty;\quad\Psi'(x)<0;\quad\Psi''(x)>0.

Копула-произведение, також називана незалежної копулой, - це копула, що не має залежностей між перемінними, її функція щільності завжди дорівнює одиниці.

\Psi(x)=-\ln(x);\quad H(x,\;y)=xy.

Копула Клейтона (Clayton):

\Psi(x)=x^\theta-1;\quad\theta\leqslant 0;\quad H(x,\;y)=(F(x)^\theta+G(y)^\theta-1)^{1/\theta}.

Для \theta=0 <!-iwas +1, can't be right! -i> у копуле Клейтона, випадкові величини статистично незалежні.

Підхід, заснований на функціях-генераторах, може бути розповсюджений для створення багатомірних копул за допомогою простого додавання перемінних.

Емпірична копула[ред.ред. код]

При аналізі даних з невідомим розподілом, можна побудувати "емпіричну копулу" шляхом підбору згортки таким чином, щоб граничні розподіли вийшли рівномірними. Математично це можна записати так:

C_n\left(\frac{i}{n}, \frac{j}{n}\right) = \frac{1}{n} \cdot Число пар (x,y) таких що x \leq x_{(i)} \text{ i } y \leq y_{(j)} \, , 1 \leq i \leq n , 1 \leq j \leq n

де x(і)і-ва порядкова статистика x.

Застосування[ред.ред. код]

Моделювання залежностей за допомогою копул широко використовується для оцінювання фінансових ризиків. Крім того, копули також застосовувалися до задач страхування життя як гнучкий інструмент, що дозволяє моделювати тривалість життя двох і більше осіб чи час до настання певної події.

Нещодавно копули були успішно використані для формування бази даних для аналізу надійності мостів[2] і для різноманітних багатовимірних симуляцій моделей в цивільному, механічному машинобудуванні, а також будівництва у відкритому морі.

Джерела[ред.ред. код]

  1. Nelsen, Roger B. (1999), An Introduction to Copulas, New York: Springer, ISBN 0387986235 .
  2. Onken, A; Grünewälder, S; Munk, MH; Obermayer, K (2009), Aertsen, Ad, ред., «Analyzing Short-Term Noise Dependencies of Spike-Counts in Macaque Prefrontal Cortex Using Copulas and the Flashlight Transformation», PLoS Computational Biology 5 (11): e1000577, doi:10.1371/journal.pcbi.1000577, PMID 19956759, PMC 2776173, http://www.ploscompbiol.org/article/info%3Adoi%2F10.1371%2Fjournal.pcbi.1000577