Лоґіт-нормальний розподіл: відмінності між версіями

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
Вилучено вміст Додано вміст
Vovchyck (обговорення | внесок)
Створено шляхом перекладу сторінки «Logit-normal distribution»
(Немає відмінностей)

Версія за 07:40, 2 травня 2024

Logit-normal
Plot of the Logitnormal PDF
Функція розподілу ймовірностей
Plot of the Logitnormal PDF
Параметри σ2 > 0 — squared scale (real),
μR — location
Носій функції x ∈ (0, 1)
Розподіл імовірностей
Функція розподілу ймовірностей (cdf)
Середнє no analytical solution
Медіана
Мода no analytical solution
Дисперсія no analytical solution
Твірна функція моментів (mgf) no analytical solution

У теорії ймовірностей лоґіт-нормальний розподіл — це розподіл ймовірностей випадкової величини, лоґіт якого має нормальний розподіл. Якщо Y — випадкова величина з нормальним розподілом, а t — стандартна логістична функція, то X=t (Y) має лоґіт-нормальний розподіл; так само, якщо X має лоґіт-нормальний розподіл, то Y=logit (X)= log ( X /(1- X )) має нормальний розподіл. Він також відомий як лоґістичний нормальний розподіл[1], який часто відноситься до поліноміальної лоґіт-версії (наприклад див. [2][3]).

Змінну можна змоделювати як лоґіт-нормальною випадковою величиною, якщо це пропорція, яка обмежена нулем і одиницею, і де значення нуль і одиниця ніколи не зустрічаються.

Характеристика

Щільність ймовірності

Функція щільності ймовірності (PDF) лоґіт-нормального розподілу для 0 < x < 1:

де μ і σ є середнім і стандартним відхиленням лоґіту змінної (за визначенням, лоґіт змінної є нормально розподіленим).

Щільність, отримана шляхом зміни знака μ, є симетричною, оскільки вона дорівнює f(1-x;- μ, σ ), зсуваючи моду в інший бік 0,5 (середина інтервалу (0,1) ).

Графік логітнормальної щільности для різних комбінацій μ (граней) і σ (кольорів)

Моменти

Моменти лоґіт-нормального розподілу не мають аналітичного розв’язку. Моменти можна оцінити чисельним інтегруванням, однак числове інтегрування може бути непомірним, коли значення такі, що функція густини розбіжна до нескінченності в кінцевих точках нуль і один. Альтернативою є використання спостереження, що лоґіт-нормаль є перетворенням нормальної випадкової змінної. Це дозволяє нам наблизити -й момент через наступну квазіоцінку Монте-Карло

де стандартна логістична функція, і є оберненою кумулятивною функцією розподілу нормального розподілу із середнім і дисперсією [ <span title="and what is ''n''? (January 2021)">потрібне уточнення</span> ]

Мода або моди

Коли похідна густини дорівнює 0, то положення моди x задовольняє таке рівняння:

Для деяких значень параметрів існує два розвʼязки, тобто розподіл є бімодальним.

Багатовимірне узагальнення

Логістичний нормальний розподіл є узагальненням лоґіт-нормального розподілу у D-вимірні вектори ймовірностей шляхом логістичного перетворення багатовимірного нормального розподілу[1][4][5].

Щільність

Гуснина ймовірності:

де позначає вектор перших (D-1) компонентів і позначає симплекс D-вимірних векторів ймовірностей. Застосування адитивного логістичного перетворення для відображення багатовимірної нормальної випадкової змінної до симплексу дає:

Ґаусові функції густини та відповідні логістичні нормальні функції густини після логістичного перетворення.

Унікальне обернене відображення задається:

.

Це випадок вектора x, сума компонентів якого дорівнює одиниці. У випадку х із сигмоїдальними елементами, тобто коли

отримаємо

де логарифмування і ділення аргументів здійснюється поелементно. Це забезпечується тим, що матриця Якобі перетворення є діагональною з елементами .

Використання в статистичному аналізі

Логістичний нормальний розподіл є більш гнучкою альтернативою розподілу Діріхле, оскільки він може фіксувати кореляції між компонентами векторів ймовірностей. Він також має потенціал для спрощення статистичного аналізу композиційних даних, дозволяючи відповідати на запитання про логарифмічні співвідношення компонентів векторів даних. Часто цікавлять в практичних задачах досліджують співвідношення, а не абсолютні значення компонентів.

Симплекс ймовірностей є обмеженим простором, що робить стандартні методи, які зазвичай застосовуються до векторів у менш значущими. Ейтчісон описав проблему несправжніх відʼємних кореляцій при застосуванні таких методів безпосередньо до симплексних векторів[4]. Однак відображення композиційних даних в шляхом зворотного адитивного логістичного перетворення дає дійснозначні дані в . До цього представлення даних можна застосувати стандартні методи. Цей підхід виправдовує використання лоґіт-нормального розподілу, який, отже, можна розглядати як «Ґаусівський симплекс».

Зв'язок з розподілом Діріхле

Логіт-нормальне наближення розподілу Діріхле

Розподіл Діріхле та логіт-нормальний розподіл ніколи не є абсолютно рівними для будь-якого вибору параметрів. Однак Ейчісон описав метод апроксимації Діріхле з логістичною нормаллю, щоб їх розбіжність Кульбака–Лейблера (KL) була мінімімальна:

Мінімум набувається при:

Використовуючи моментні властивості розподілу Діріхле, розв’язок можна записати через дигамму і тригамма функції:

Це наближення особливо точне для великих . Фактично, можна показати, що для , маємо .

Див. також

  • Бета-розподіл і розподіл Кумарасвамі, інші двопараметричні розподіли на обмеженому інтервалі з подібними формами

Список літератури

  1. а б Aitchison, J.; Shen, S. M. (1980). Logistic-normal distributions: Some properties and uses. Biometrika. 67 (2): 261. doi:10.2307/2335470. ISSN 0006-3444. JSTOR 2335470. Помилка цитування: Некоректний тег <ref>; назва «AitchisonShen1980» визначена кілька разів з різним вмістом
  2. Peter Hoff, 2003. Link
  3. Log-normal and logistic-normal terminology - AI and Social Science – Brendan O'Connor. brenocon.com. Процитовано 18 April 2018.
  4. а б J. Atchison. "The Statistical Analysis of Compositional Data." Monographs on Statistics and Applied Probability, Chapman and Hall, 1986. Book
  5. Hinde, John (2011). Logistic Normal Distribution. У Lovric, Miodrag (ред.). International Encyclopedia of Statistical Sciences. Springer. с. 754—755. doi:10.1007/978-3-642-04898-2_342. ISBN 978-3-642-04897-5.

Подальше читання

зовнішні посилання