Прихована марківська модель
Прихо́вана ма́рківська моде́ль (ПММ) — статистична модель, що імітує процес, схожого на марківський процес із невідомими параметрами. Завданням ПММ є визначення невідомих параметрів на основі спостережуваних. Отримані параметри може бути використано в подальшому аналізі, наприклад, для розпізнавання образів. ПММ може розглядатися як найпростіша Байєсова мережа довіри.
Перші нотатки про приховані марківські моделі опублікував Баум у 1960-х, і вже в 70-х їх вперше застосували для розпізнавання мови. З середини 1980-х ПММ застосовуються в аналізі біологічних послідовностей, зокрема ДНК. Основне застосування ПММ отримали в галузі розпізнавання мови, письма, рухів та біоінформатики. Крім того, ПММ застосовуються в криптоаналізі, машинному перекладі.
Зміст |
Приклад [ред.]
Уявімо двох друзів, які обговорюють щовечора по телефону, що вони робили вдень. Ваш друг може робити лише три речі: гуляти в парку, ходити за покупками або прибирати в кімнаті. Його вибір ґрунтується лише на погоді, яка була в момент прийняття рішення. Ви нічого не знаєте про погоду в тому регіоні, де живе ваш друг, але ви можете, ґрунтуючись на його рішеннях, спробувати вгадати, якою вона була.
Погоду можна зобразити у вигляді марківського ланцюга, вона має два стани: сонячно або дощ, але ви не можете самі побачити її, тому вона прихована від вас. Кожен день ваш друг обирає одне з трьох можливих рішень: прогулянка, покупки чи прибирання. Ви знаєте рішення вашого друга, тому це спостережуване значення. В цілому ми отримуємо ПММ.
Структура прихованої марківської моделі [ред.]
У звичайній марківській моделі стан видно спостерігачеві, тому ймовірності переходів - єдиний необхідний параметр. У прихованій марківській моделі ми можемо стежити лише за змінними, на які впливає цей стан. Кожен стан має ймовірнісний розподіл серед усіх можливих вихідних значень. Тому послідовність символів, згенерована ПММ, дає інформацію про послідовність станів.
Діаграма, подана нижче, показує загальну структуру ПММ. Овали - це змінні з випадковим значенням. Випадкова змінна
відповідає значенню прихованої змінної в момент часу
. Випадкова змінна
- це значення змінної, за якою ми спостерігаємо, в момент часу
. Стрілки на діаграмі символізують умовні залежності.
Із діаграми можна дізнатись, що значення прихованої змінної
(в момент часу
) залежить тільки від значення прихованої змінної
(в момент
). Це називається властивістю Маркова. Хоча в той же час значення змінної
, за якою ми спостерігаємо, залежить лише від значення прихованої змінної
(в момент часу
).
Ймовірність спостерігати послідовність
довжини
дорівнює:
тут сума пробігає по всіх можливих послідовностях прихованих вузлів
Метод підрахунку повним перебором значень
— дуже трудомісткий для багатьох реальних задач внаслідок того, що кількість можливих послідовностей прихованих вузлів дуже велика. Але застосування процедури вперед-назад [1] дозволяє істотно збільшити швидкість обчислень.
Загальний опис [ред.]
Основні приховані марківські моделі можна описати за допомогою таких змінних:
- кількість станів
- кількість спостережень
- параметр для спостереження за зв'язками між станами
- ймовірність переходу із стану
до стану 
-
-мірний вектор, що складається із 
- стан спостереження за час 
- результат спостереження за час 
- функція розподілу ймовірності спостережень, параметризованих по θ
Базові алгоритми [ред.]
Існують три основні задачі, пов'язані з ПММ:
- Алгоритм вперед-назад. Задано параметри моделі та послідовність, потрібно обчислити ймовірність появи заданої послідовності.
- Алгоритм Вітербі: Задано параметри моделі, необхідно визначити найпридатнішу послідовність прихованих вузлів, яка найточніше описує цю модель.
- Алгоритм Баума-Велша: Задано вхідну послідовність (послідовності) із дискретними значеннями, необхідно змоделювати відповідну ПММ на виході.
Посилання [ред.]
- Три основні задачі ПММ (рос.)
- Сергій Ніколенко. Лекції № 6 і № 7 (слайди), присвячені прихованим марківським моделям, із курсу «Теорія ймовірності»
Примітки [ред.]
- ↑ Rabiner, p. 262



- кількість станів
- кількість спостережень
- параметр для спостереження за зв'язками між станами
- ймовірність переходу із стану
до стану 
- 
- стан спостереження за час
- результат спостереження за час
- функція розподілу ймовірності спостережень, параметризованих по θ