Копула

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

У статистиці, копула або зв'язка використовується як загальний метод формулювання сукупного розподілу випадкових величин таким чином, що можна зобразити різні загальні типи залежності[1].

Основна ідея[ред.ред. код]

Нехай і  — випадкові величини, функції розподілу імовірностей яких визначені на множинах та , відповідно. Позначимо і-у реалізацію j-ої випадкової величини як . Будемо називати функцію зростаючою за кожною змінною і , якщо для неї виконується наступна умова:

, коли ;

Визначимо підкопулу як двовимірну функцію від двох змінних і , визначену на такій множині , що і , з областю значень і задовольняючу наступним умовам:

  1. Обмеження знизу, тобто , якщо  ;
  2. , якщо  ;
  3. Зростання за кожною змінною;

Копула — це підкопула у разі, коли і . Саме на даному етапі можливо застосувати копули до моделювання спільних ймовірнісних розподілів, оскільки імовірність будь-якої випадкової величини також належить відрізку від нуля до одиниці.

Властивості зв'язок[ред.ред. код]

  1. Обмеженість: ;
  2. Для будь-якої зв'язки виконується нерівність (границя Фреше-Хефдинга, Frechet-Hoeffding):
  3. Упорядкованість (домінування): Зв'язка домінує над зв'язкою , якщо виконується ;
  4. ;

Методи оцінки копул і виміру якості копула-моделей[ред.ред. код]

Параметричні (MLE, IFM)[ред.ред. код]

Цей клас методів припускає параметризацію як граничних розподілів, так і зв'язки. Якщо базовий підхід метод найбільшої правдоподібності (англ. Maximum Likelihood Estimation) передбачає максимізацію функції правдоподібності одночасно по граничних розподілах і по зв'язці, то метод «від маргіналів» (Inference for Margin — IFM) передбачає два етапи оцінки: спочатку — параметризація граничних розподілів, потім — копули.

Напівпараметричні (SP, CML)[ред.ред. код]

Напівпараметричні методи також припускають двоетапну оцінку копули. Але на першому етапі замість оцінки граничних розподілів використовується емпіричний розподіл. На другому ж етапі відбувається параметрична оцінка копули. У роботі [Kim G., Silvapulle M., Silvapulle P. (2007)] показано, що напівпараметричний метод (SP — semi-parametric) дає більш ефективні і стійкі оцінки ніж параметричні методи у випадках, коли тип оцінюваного розподілу не відомий і, як наслідок, виникає загроза їхньої невірної специфікації.

Непараметричні[ред.ред. код]

Серед непараметричних методів оцінки копул можна виділити підходи на основі оцінки емпіричної копули і ядерних оцінок. Перший підхід передбачає оцінку функції розподілу емпіричної копули, що відображає кількість випадків, коли реалізації випадкових величин одночасно потрапили в обрану групу розбиття нескінченного ймовірнісного простору (докладніше див. [Nelsen (2006), p. 219]).

Вимір якості оцінки копули[ред.ред. код]

Найбільш розповсюдженим критерієм вибору оптимальної копулиє критерій на основі значення функції максимальної правдоподібності — критерії Акаике (AI) і Шварца (BI). Другими за частототою застосування є тести Колмогорова-Смирнова й Андерсона-Дарлінга. Третім є метод оцінки дистанції до емпіричної копули.

Границі Фреше для копули[ред.ред. код]

Мінімальна копула — це нижня границя для всіх копул, тільки в двовимірному випадку відповідає строго негативної кореляції між випадковими величинами:

Максимальна копула — це верхня границя для всіх копул, відповідає строго позитивної кореляції між випадковими величинами:

Архімедові копули[ред.ред. код]

Одна часткова проста форма копули:

де називається функція-генератор. Такі копули називаються архімедяними. Кожна функція-генератор, що задовольняє приведеним нижче властивостям є основою для правильної копули:

Копула-произведение, також називана незалежної копулой, — це копула, що не має залежностей між перемінними, її функція щільності завжди дорівнює одиниці.

Копула Клейтона (Clayton):

Для <!-iwas +1, can't be right! -i> у копуле Клейтона, випадкові величини статистично незалежні.

Підхід, заснований на функціях-генераторах, може бути розповсюджений для створення багатомірних копул за допомогою простого додавання перемінних.

Емпірична копула[ред.ред. код]

При аналізі даних з невідомим розподілом, можна побудувати «емпіричну копулу» шляхом підбору згортки таким чином, щоб граничні розподіли вийшли рівномірними. Математично це можна записати так:

Число пар таких що

де x(і) — і-ва порядкова статистика x.

Застосування[ред.ред. код]

Моделювання залежностей за допомогою копул широко використовується для оцінювання фінансових ризиків. Крім того, копули також застосовувалися до задач страхування життя як гнучкий інструмент, що дозволяє моделювати тривалість життя двох і більше осіб чи час до настання певної події.

Нещодавно копули були успішно використані для формування бази даних для аналізу надійності мостів[2] і для різноманітних багатовимірних симуляцій моделей в цивільному, механічному машинобудуванні, а також будівництва у відкритому морі.

Джерела[ред.ред. код]

  1. Nelsen, Roger B. (1999). An Introduction to Copulas. New York: Springer. ISBN 0387986235. .
  2. Onken, A; Grünewälder, S; Munk, MH; Obermayer, K (2009). Analyzing Short-Term Noise Dependencies of Spike-Counts in Macaque Prefrontal Cortex Using Copulas and the Flashlight Transformation. У Aertsen, Ad. PLoS Computational Biology 5 (11): e1000577. doi:10.1371/journal.pcbi.1000577. PMC 2776173. PMID 19956759.