Копула

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

У статистиці копула або зв'язка використовується як загальний метод формулювання сукупного розподілу випадкових величин таким чином, що можна зобразити різні загальні типи залежності[1].

Основна ідея[ред. | ред. код]

Нехай і  — випадкові величини, функції розподілу імовірностей яких визначені на множинах та відповідно. Позначимо і-ту реалізацію j-ї випадкової величини як . Називатимемо функцію зростаючою за кожною зі змінних і , якщо для неї виконується така умова:

, коли ;

Визначимо підкопулу як двовимірну функцію двох змінних і , визначену на такій множині , що і , з областю значень , що задовольняє таким умовам:

  1. Обмеження знизу, тобто , якщо
  2. , якщо
  3. Зростання за кожною зі змінних.

Копула — це підкопула у разі, коли і . Саме на даному етапі можливо застосувати копули до моделювання спільних ймовірнісних розподілів, оскільки імовірність будь-якої випадкової величини також належить відрізку від нуля до одиниці.

Властивості зв'язок[ред. | ред. код]

  1. Обмеженість: .
  2. Для будь-якої зв'язки виконується нерівність (границя Фреше-Хефдинга, Frechet-Hoeffding): .
  3. Упорядкованість (домінування): зв'язка домінує над зв'язкою , якщо виконується .

Методи оцінки копул і вимірювання якості копула-моделей[ред. | ред. код]

Параметричні (MLE, IFM)[ред. | ред. код]

Цей клас методів припускає параметризацію як граничних розподілів, так і зв'язки. Якщо базовий підхід — метод найбільшої правдоподібності (англ. Maximum Likelihood Estimation) передбачає максимізацію функції правдоподібності одночасно за граничними розподілами і за зв'язкою, то метод «від маргіналів» (Inference for Margin — IFM) передбачає два етапи оцінки: спочатку — параметризація граничних розподілів, потім — копули.

Напівпараметричні (SP, CML)[ред. | ред. код]

Напівпараметричні методи також припускають двоетапну оцінку копули. Але на першому етапі замість оцінки граничних розподілів використовується емпіричний розподіл. На другому ж етапі відбувається параметрична оцінка копули. У роботі [Kim G., Silvapulle M., Silvapulle P. (2007)] показано, що напівпараметричний метод (SP — semi-parametric) дає більш ефективні і стійкі оцінки ніж параметричні методи у випадках, коли тип оцінюваного розподілу не відомий і, як наслідок, виникає загроза їхньої неправильної специфікації.

Непараметричні[ред. | ред. код]

Серед непараметричних методів оцінки копул можна виділити підходи на основі оцінки емпіричної копули і ядерних оцінок. Перший підхід передбачає оцінку функції розподілу емпіричної копули, що відображає кількість випадків, коли реалізації випадкових величин одночасно потрапили в обрану групу розбиття нескінченного ймовірнісного простору (докладніше див. [Nelsen (2006), p. 219]).

Критерії якості оцінки копули[ред. | ред. код]

Найпоширенішим критерієм вибору оптимальної копули є критерій на основі значення функції максимальної правдоподібності — критерії Акаіке (AI) і Шварца (BI). Наступними за частотою застосування є тести Колмогорова-Смирнова й Андерсона-Дарлінга. Третім є метод оцінки дистанції до емпіричної копули.

Границі Фреше для копули[ред. | ред. код]

Мінімальна копула — це нижня границя для всіх копул, тільки в двовимірному випадку відповідає строго негативній кореляції між випадковими величинами:

Максимальна копула — це верхня границя для всіх копул, відповідає строго позитивній кореляції між випадковими величинами:

Архімедові копули[ред. | ред. код]

Одна часткова проста форма копули:

де називають функцією-генератором. Такі копули називаються архімедовими. Кожна функція-генератор, що задовольняє наведеним нижче властивостям є основою для правильної копули:

Копула-добуток, також називана незалежною копулою, — це копула, що не має залежностей між змінними, її функція щільності завжди дорівнює одиниці.

Копула Клейтона (Clayton):

Для у копулі Клейтона випадкові величини статистично незалежні.

Підхід, заснований на функціях-генераторах, може бути розповсюджений для створення багатовимірних копул за допомогою простого додавання змінних.

Емпірична копула[ред. | ред. код]

При аналізі даних із невідомим розподілом, можна побудувати «емпіричну копулу» шляхом підбору згортки таким чином, щоб граничні розподіли вийшли рівномірними. Математично це можна записати так:

Число пар таких що

де x(і) — і-та порядкова статистика x.

Застосування[ред. | ред. код]

Моделювання залежностей за допомогою копул широко використовується для оцінювання фінансових ризиків. Крім того, копули також застосовувалися до задач страхування життя як гнучкий інструмент, що дозволяє моделювати тривалість життя двох і більше осіб чи час до настання певної події.

Копули було успішно використано для формування бази даних для аналізу надійності мостів[2] і для різноманітних багатовимірних симуляцій моделей в цивільному, механічному машинобудуванні, а також будівництва у відкритому морі.

Джерела[ред. | ред. код]

  1. Nelsen, Roger B. (1999), An Introduction to Copulas, New York: Springer, ISBN 0387986235.
  2. Onken, A; Grünewälder, S; Munk, MH; Obermayer, K (2009), Aertsen, Ad (ред.), Analyzing Short-Term Noise Dependencies of Spike-Counts in Macaque Prefrontal Cortex Using Copulas and the Flashlight Transformation, PLoS Computational Biology, 5 (11): e1000577, doi:10.1371/journal.pcbi.1000577, PMC 2776173, PMID 19956759, архів оригіналу за 9 червня 2011, процитовано 15 березня 2011{{citation}}: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання)