Правило Баєса

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

У теорії ймовірностей та її застосуваннях пра́вило Ба́єса (англ. Bayes' rule) встановлює відповідність між шансами[en] події проти події до (апріорі) та після (апостеріорі) обумовлення іншою подією . Шанси до події є просто відношенням ймовірностей цих двох подій. Апріорні шанси є відношенням безумовних, або апріорних ймовірностей, а апостеріорні шанси є відношенням умовних, або апостеріорних ймовірностей за умови події . Це відношення виражається у термінах рівня правдоподібності, або коефіцієнту Баєса, . За визначенням, це є відношенням умовних ймовірностей події у випадку та у випадку відповідно. Це правило просто стверджує: апостеріорні шанси дорівнюють добуткові апріорних шансів на коефіцієнт Баєса.[1]:8

Коли цікавить довільно велика кількість подій , а не лише дві, це правило може бути перефразовано як апостеріорне є пропорційнім добуткові апріорного на правдоподібність, , де символ пропорційності означає, що ліва частина є пропорційною (тобто, дорівнює добуткові на сталу) до правої частини при зміні для фіксованої або заданої .[2][3] У такій формі воно йде ще від Лапласа[4] та Курно.[5][6]

Правило Баєса є рівноцінним способом формулювання теореми Баєса. Якщо нам відомі шанси за та проти , то ми знаємо ймовірність . На практиці в силу ряду причин йому може віддаватися перевага перед теоремою Баєса.

Правило Баєса широко використовується у статистиці, науці та інженерії, наприклад, у виборі моделі, ймовірнісних експертних системах на базі баєсових мереж, статистичних доказах[en] у судових процесах, фільтрах спаму електронної пошти тощо.[7][3] Як елементарний факт з числення ймовірностей, правило Баєса говорить нам, як пов'язані між собою безумовні та умовні ймовірності, чи то ми працюємо з частотницькою інтерпретацією ймовірності, чи то з баєсовою. При баєсовій інтерпретації воно часто застосовується у ситуації, коли та є конкурентними гіпотезами, а є деяким спостережуваним свідченням. Це правило показує, як чиєсь судження про те, чи є істинною чи , повинне уточнюватися при спостереженні свідчення .[1]

Правило[ред. | ред. код]

Одна подія[ред. | ред. код]

Для заданих подій , та правило Баєса стверджує, що умовні шанси за умови дорівнюють відособленим шансам , помноженим на коефіцієнт Баєса або рівень правдоподібності :

де

Тут шанси та умовні шанси, відомі також як апріорні та апостеріорні шанси, визначаються як

В особливому випадку, коли та , пишуть , та використовують аналогічні скорочення для коефіцієнту Баєса та умовних шансів. Шанси за визначенням є шансами за та проти . Відтак, правило Баєса може бути записано у скороченій формі

або іншими словами: апостеріорні шанси дорівнюють апріорним шансам , помноженим на рівень правдоподібності за умови інформації . Коротко, апостеріорні шанси дорівнюють апріорним шансам, помноженим на рівень правдоподібності.

Це правило часто застосовується, коли та є двома конкурентними гіпотезами стосовно причини деякої події . Апріорні шанси , іншими словами, шанси проти , виражають наші початкові переконання стосовно того, чи є істинним, чи ні. Подія представляє якесь свідчення, інформацію, дані або спостереження. Рівень правдоподібності є відношенням шансів спостереження відповідно до гіпотез та . Це правило каже нам, як мають уточнюватися наші апріорні переконання стосовно того, чи є істинним, чи ні, при отриманні інформації .

Багато подій[ред. | ред. код]

Якщо ми розглядаємо як довільну, а як незмінну, то ми можемо переписати теорему Баєса у вигляді , де символ пропорційності означає, що зі зміною при незмінній ліва частина дорівнює правій частині, помноженій на сталу.

Словами — апостеріорне пропорційне апріорному, помноженому на правдоподібність. Цю версію теореми Баєса було спочатку названо «Правилом Баєса» Антуаном-Огюстеном Курно у 1843 році.[5] Курно популяризував ранішу працю Лапласа 1774 року,[4] який незалежно відкрив правило Баєса. Працю Баєса було опубліковано посмертно у 1763 році, але вона залишалася більш-менш невідомою, поки Курно не привернув увагу до неї.[6]

Правилу Баєса може віддаватися перевага перед звичайним формулюванням теореми Баєса з цілого ряду причин. По-перше, воно є інтуїтивно простішим для розуміння. Інша причина полягає в тому, що в нормалізації ймовірностей іноді немає необхідності: іноді потрібно знати лише співвідношення ймовірностей. Нарешті, виконання нормалізації часто простіше здійснювати після спрощення добутку апріорного та правдоподібності шляхом вилучення будь-яких множників, що не залежать від , відтак нам не потрібно насправді обчислювати знаменник у звичайному формулюванні теореми Баєса

У баєсовій статистиці правило Баєса часто застосовується із так званою некоректною апріорною ймовірністю, наприклад, рівномірним розподілом ймовірності над усіма дійсними числами. В такому випадку апріорний розподіл не існує як міра ймовірності в межах звичайної теорії ймовірності, й теорема Баєса сама по собі є не доступною.

Послідовність подій[ред. | ред. код]

Правило Баєса може застосовуватися кілька разів. Кожного разу, як ми спостерігаємо нову подію, ми уточнюємо шанси між подіями, що нас цікавлять, скажімо, та , враховуючи цю нову інформацію. Для двох подій (повідомлень, свідчень) та

де

В особливому випадку двох взаємодоповнюваних подій та еквівалентним записом є

Виведення[ред. | ред. код]

Розгляньмо два примірники теореми Баєса:

Їхнє поєднання дає

Тепер за визначення

це означає

Аналогічне виведення застосовується для зумовлювання багатьма подіями, з використанням відповідного розширення теореми Баєса.

Приклади[ред. | ред. код]

Частотницький приклад[ред. | ред. код]

Розгляньмо приклад перевірки на вживання наркотиків зі статті про теорему Баєса.

Такі ж результати може бути отримано з використанням правила Баєса. Апріорні шанси того, що особа вживає наркотики, є 199 проти 1, оскільки та . Коефіцієнт Баєса у разі позитивного результату перевірки особи є на користь того, що особа вживає наркотики: це є відношення ймовірності позитивного результату для особи, що вживає наркотики, до позитивного результату особи, що їх не вживає. Апостеріорними шансами того, що особа вживає наркотики, відтак є , що є дуже близьким до . У круглих числах, лише один з трьох із тих, чия перевірка дала позитивний результат, насправді вживає наркотики.

Вибір моделі[ред. | ред. код]

Примітки[ред. | ред. код]

  1. а б Gelman, Andrew; Carlin, John B.; Stern, Hal S.; Dunson, David B.; Vehtari, Aki; Rubin, Donald B. (2013). Bayesian Data Analysis (вид. III). CRC Press. ISBN 978-1439840955. (англ.)
  2. Lee, Peter M. (2012). Bayesian Statistics: An Introduction (вид. IV). Wiley. ISBN 978-1-118-33257-3. (англ.)
  3. а б McGrayne, Sharon Bertsch (2012). The Theory That Would Not Die: How Bayes' Rule Cracked the Enigma Code, Hunted Down Russian Submarines, and Emerged Triumphant from Two Centuries of Controversy. Yale University Press. ISBN 978-0-300-18822-6. Архів оригіналу за 23 вересня 2015. Процитовано 23 квітня 2015. (англ.)
  4. а б Laplace Pierre-Simon. Memoir on the Probability of the Causes of Events // Statistical Science[en]. — 1774/1986. — Т. 1, вип. 3. — С. 364-378. — DOI:10.1214/ss/1177013621. (англ.)
  5. а б Антуан Курно (1843). Exposition de la théorie des chances et des probabilités. Librarie de L. Hachette. (фр.)
  6. а б Fienberg, Stephen E.[en]. In Search of the Magic Lasso: The Truth About the Polygraph // Statistical Science[en]. — 2005. — Т. 20, вип. 3. — С. 249-260. — DOI:10.1214/088342305000000223. (англ.)
  7. Rosenthal, Jeffrey S.[en] (2005). Struck by Lightning: The Curious World of Probabilities. HarperCollins. ISBN 978-0-00-200791-7. (англ.)

Література[ред. | ред. код]