Баєсова мережа

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

Баєсова мережа (або Баєсова мережа довіри) — це ймовірнісна модель, що являє собою множину змінних і їх ймовірнісних залежностей. Наприклад, баєсівська мережа може бути використана для обчислення ймовірності того, що хворий пацієнт за наявністю або відсутністю ряду симптомів, грунтуючись на даних про залежність між симптомами і хворобами.

Формально, байєсова мережа — це спрямований ациклічний граф, вершини якого являють змінні, а ребра кодують умовні залежності між змінними. Вершини можуть представляти змінні будь-яких типів, бути зваженими параметрами, прихованими змінними або гіпотезами. Існують ефективні методи, які використовуються для обчислень і навчання байєсівських мереж. Баєсівські мережі, які моделюють послідовності змінних, називають динамічними байєсовський мережами. Баєсівські мережі, в яких можуть бути присутніми як дискретні змінні, так і безперервні, називаються гібридними байєсовсовими мережами.

Визначення і принципи роботи[ред.ред. код]

Якщо ребро виходить з вершини A у вершину B, то A називають предком B, а B називають нащадком A. Множину вершин-предків вершиниXi позначимо як parents (Xi). Спільний розподіл значень у вершинах можна зручно розписати як результат локальних розподілів в кожному вузлі і його предків:

\mathrm P(X_1, \ldots, X_n) = \prod_{i=1}^n \mathrm P(X_i \mid \operatorname{parents}(X_i)).\,

Якщо у вершини Xi немає предків, то її локальний розподіл ймовірностей називають безумовним, інакше — умовним. Якщо значення у вузлі отримано в результаті досвіду, то вершину називають доказом.

Семантика залежностей[ред.ред. код]

Граф кодує залежності між змінними. Умовна незалежність представлена графічним властивістю d-розділеності.

Визначення d-розділеності [1] Шлях p\, називають d-поділеним (d-separated), або блокованим (blocked) множиною вершин Z\, тоді і тільки тоді, коли

  1. P\, містить ланцюг i\,m\,j\, або розгалуження i\,m\,j\, такі, що m\, належить Z\,, або
  2. P\, містить інвертоване розгалуження (коллайдер) i\,m\,j\,, таке, що m\, не належить Z\, і біля вершини m\, немає нащадків, які належать Z\,.

Нехай X,Y,Z\, — неперетинні підмножини вершин у аціклічному орієнтованому графі G\,. Множина вершин Z\, d-поділяє X\, та Y\, тоді і тільки тоді, коли Z\, блокує всі шляхи з будь-якої вершини, що належить X\, у будь-яку вершину, що належить Y\,, і позначають (<X \perp\!\!\!\perp Y|Z>)_G\,

Примітка: Під шляхом розуміється деяка послідовність ребер (будь-якого напрямку), що слідують одне за одним у графі.

Теорема про d-розділеності [1]. Для будь-яких трьох непересічних підмножин вершин  (X,Y,Z)\, у аціклічном орієнтованому графі G\, і для всіх імовірнісних розподілів P\, справедливо:

  1. Якщо(<X \perp\!\!\!\perp Y|Z>)_G\,, то (<X \perp\!\!\!\perp Y|Z>)_P\,, якщо G\, і P\, Марковськи-сумісні, і
  2. Якщо відношення умовної незалежності (<X \perp\!\!\!\perp Y|Z>)_P\, виконується для всіх імовірнісних розподілів, Марковскі-сумісних з G\,, то з цього випливає (<X \perp\!\!\!\perp Y|Z>)_G\,.

Іншими словами, якщо вершини d-розділені, то вони умовно незалежні; і якщо вершини умовно-незалежні у всіх імовірнісних розподілах, сумісних з графом G, то вони d-розділені.

Примітка: (<X \perp\!\!\!\perp Y|Z>)_P\, означає, що множини змінних X\, і Y\, умовно-незалежні при заданій множині Z\,

Докази — твердження виду «подія у вузлі x відбулося». Наприклад: «Комп'ютер не завантажується».

Приклад[ред.ред. код]

Проста байєсова мережа.

Припустимо, що може бути дві причини, за якими трава може стати мокрою (GRASS WET): спрацювала дощувальна установка, або пройшов дощ. Також припустимо, що дощ впливає на роботу дощувальної машини (під час дощу установка не включається). Тоді ситуація може бути змодельована проілюстрованою байєсівською мережею. Всі три змінні можуть приймати два можливих значення: T (правда — true) і F (брехня — false).

Спільна ймовірність функції:

\mathrm P(G,S,R)=\mathrm P(G|S,R)\mathrm P(S|R)\mathrm P(R)

де імена трьох змінних означають G = Трава мокра (Grass wet), S = Дощувальна установка (Sprinkler), і R = Дощ (Rain).

Модель може відповісти на такі питання як «Яка ймовірність того, що пройшов дощ, якщо трава мокра?» Використовуючи формулу умовної ймовірності і підсумовуючи змінні:


\mathrm P(\mathit{R}=T \mid \mathit{G}=T) 
=\frac{\mathrm P(\mathit{G}=T,\mathit{R}=T)}{\mathrm P(\mathit{G}=T)} 
=\frac{\sum_{\mathit{S} \in \{T, F\}}\mathrm P(\mathit{G}=T,\mathit{S},\mathit{R}=T)}{\sum_{\mathit{S}, \mathit{R} \in \{T, F\}} \mathrm P(\mathit{G}=T,\mathit{S},\mathit{R})}
 = \frac{(0.99 \times 0.01 \times 0.2 = 0.00198_{TTT}) + (0.8 \times 0.99 \times 0.2 = 0.1584_{TFT})}{0.00198_{TTT} + 0.288_{TTF} + 0.1584_{TFT} + 0_{TFF}} \approx 35.77 %.

Висновок[ред.ред. код]

У силу того, що Баєсова мережа — це повна модель для змінних та їх відношення, вона може бути використана для того, щоб давати відповіді на ймовірнісні запитання. Наприклад, мережу можна використовувати щоб отримати нове знання про стан підмножини змінних спостерігаючи за іншими змінними (змінні — докази). Це процес обчислення апостеріорного розподілу змінних за змінними доказами називають імовірнісним висновком. Це наслідок дає нам універсальну оцінку для додатків, де потрібно вибрати значення підмножини змінних, яке мінімізує функцію втрат, наприклад ймовірність помилкового рішення. Байєсова мережа може також вважатися механізмом для автоматичної побудови розширення Теореми Баєса для складніших завдань.

Програми[ред.ред. код]

Баєсові мережі використовуються для математичного моделювання в біоінформатиці (генетичних мережах, структури білків), медицині, класифікації документів, обробці зображень, обробці даних і системах прийняття рішень.

Див. також[ред.ред. код]

Додаткова інформація[ред.ред. код]

Бесплатні і Open-Source продукти[ред.ред. код]

Комерційні продукти[ред.ред. код]

Примітки[ред.ред. код]

  1. а б Judea Pearl. Causality: Models, Reasoning, and Inference. - 2-nd Edition. — Cambridge University Press, 2009. — 464 p.

Посилання[ред.ред. код]