Апостеріорна ймовірність

Матеріал з Вікіпедії — вільної енциклопедії.
(Перенаправлено з Апостеріорний розподіл)
Перейти до навігації Перейти до пошуку

В баєсовій статистиці апостеріо́рна ймові́рність (англ. posterior probability) випадкової події або сумнівного твердження[прояснити] — це умовна ймовірність, присвоювана[прояснити] після врахування відповідного свідчення[en] або вихідних даних. Так само апостеріо́рний розпо́діл імові́рності (англ. posterior probability distribution) — це розподіл невідомої величини, яку розглядають як випадкову змінну, обумовлену свідченням, отриманим з експерименту або спостереження. «Апостеріорний» в даному контекст означає — після врахування відповідного свідчення, пов'язаного з певним досліджуваним випадком. Наприклад, існує («неапостеріорна») ймовірність того, що людина знайте скарб, копаючи у випадковому місці, та апостеріорна ймовірність знаходження закопаного скарбу, якщо людина копатиме в місці, де дзвенить її металодетектор.

Визначення[ред. | ред. код]

Апостеріорна ймовірність є ймовірністю параметрів за заданого свідчення : .

Вона протиставиться до функції правдоподібності, яка є ймовірністю цього свідчення за заданих параметрів: .

Вони пов'язані наступним чином:

Нехай у нас є апріорне переконання, що функція розподілу ймовірності це , і спостереження з правдоподібністю , тоді апостеріорна ймовірність визначається як

[1]

Апостеріорну ймовірність може бути записано в такому зручному для запам'ятовування вигляді:

.

Приклад[ред. | ред. код]

Нехай у школі 60% учнів — хлопці, і 40% — дівчата. Дівчата носять штани та спідниці в рівній кількості, хлопці всі носять штани. Спостерігач здалеку бачить учня (випадкового); все, що може бачити спостерігач, — це те, що учень в штанях. Яка ймовірність того, що цей учень — дівчина? Правильну відповідь може бути обчислено за допомогою теореми Баєса.

Подією є те, що учень, якого бачить спостерігач, є дівчиною, а подією є те учень, що цей учень носить штани. Для обчислення апостеріорної ймовірності , нам спочатку необхідно дізнатися:

  • , або ймовірність того, що цей учень є дівчиною незалежно від будь-якої іншої інформації. Оскільки спостерігач бачить випадкового учня, тобто всі учні мають однакову ймовірність бути побаченими, а частка дівчат серед них становить 40%, то ця ймовірність дорівнює 0.4.
  • , або ймовірність того, що цей учень не є дівчиною (тобто, хлопець), незалежно від будь-якої іншої інформації ( є доповнювальною подією до ). Це є 60%, або 0.6.
  • , або ймовірність того, що учень носить штани, якщо він є дівчиною. Оскільки вони однаково часто носять штани та спідниці, то це 0.5.
  • , або ймовірність то, що учень носить штани, якщо він є хлопцем. Це задано як 1.
  • , або ймовірність того, що (випадково вибраний) учень носить штани незалежно від будь-якої іншої інформації. Оскільки (згідно закону повної ймовірності), це становить .

Враховуючи всю цю інформацію, апостеріорна ймовірність того, що спостерігач бачить дівчину, за умови що учень, якого бачить спостерігач, носить штани, може бути обчислено підставленням цих значень до формули

Інтуїтивне пояснення цього результату полягає в тім, що з кожної сотні учнів (60 хлопців та 40 дівчат), оскільки ми спостерігаємо штани, цей учень є одним з 80, що їх носять (60 хлопців та 20 дівчат); оскільки 20/80 = 1/4 з них є дівчатами, то ймовірністю того, що учень в штанях є дівчиною, становить 1/4.

Обчислення[ред. | ред. код]

Апостеріорний розподіл імовірності однієї випадкової змінної при заданому значенні іншої може бути обчислено за теоремою Баєса шляхом множення апріорного розподілу ймовірності на функцію правдоподібності, а потім діленням на нормувальну сталу[en], а саме:

дає апостеріорну функцію густини ймовірності випадкової змінної з урахуванням даних , де

  • є апріорною густиною ;
  • є функцією правдоподібності як функції від ;
  • є нормувальною сталою, та
  • є апостеріорною густиною з урахуванням даних .

Імовірний інтервал[ред. | ред. код]

Апостеріорна ймовірність є умовною ймовірністю, обумовленою випадково спостережуваними даними. Відтак вона є випадковою змінною. Для випадкової змінної важливо підбивати величину її невизначеності. Одним зі способів досягнення цієї мети є надання ймовірного інтервалу апостеріорної ймовірності.

Класифікація[ред. | ред. код]

У класифікації апостеріорна ймовірність відображає невизначеність віднесення спостереження до певного класу, див. також ймовірності приналежності до класів. Хоча методи статистичної класифікації за визначенням і породжують апостеріорні ймовірності, фахівці з машинного навчання зазвичай подають значення приналежності, що не передбачають жодної ймовірнісної довірчості. Бажано перетворювати або перемасштабовувати значення приналежності у ймовірності приналежності до класів, оскільки вони є порівнюваними й на додачу легше застосовними для подальшої обробки.

Див. також[ред. | ред. код]

Примітки[ред. | ред. код]

  1. Christopher M. Bishop (2006). Pattern Recognition and Machine Learning. Springer. с. 21–24. ISBN 978-0-387-31073-2.  (англ.)

Література[ред. | ред. код]