Розрізнювальна модель

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

Розрі́знювальні моде́лі (англ. discriminative models), що також називають умо́вними моде́лями (англ. conditional models), є класом моделей, які застосовуються в машинному навчанні для моделювання залежності неспостережуваної змінної від спостережуваної змінної . В рамках імовірнісної схеми це здійснюється моделюванням умовного розподілу ймовірності , який може застосовуватися для передбачення з .

Розрізнювальні моделі, на противагу до породжувальних, не дозволяють породжувати приклади зі спільного розподілу та . Проте для таких задач як класифікація та регресія, що не потребують спільного розподілу, розрізнювальні моделі можуть демонструвати чудову продуктивність.[1][2][3] З іншого боку, породжувальні моделі є зазвичай гнучкішими за розрізнювальні у вираженні залежностей в складних задачах навчання. До того ж більшість розрізнювальних моделей за своєю природою є керованими, і їх неможливо легко розширити для некерованого навчання. Зрештою вибір між розрізнювальною та породжувальною моделлю диктують особливості конкретного застосування.

Визначення[ред. | ред. код]

На відміну від породжувального моделювання, яке вчить спільний розподіл , розрізнювальне моделювання навчається або прямому відображенню заданої не спостережуваної (цільової) змінної в клас міток в залежності від спостережуваних змінних (тренувальних прикладів). При практичному розпізнаванні об'єктів, , зазвичай, є вектором (наприклад, рядком пікселів або ознаками, отриманими з зображення тощо). З ймовірнісної точки зору, це досягається моделювання умовної ймовірності , що використовується для прогнозування по . Зауважимо, що є різниця між умовною моделлю та дискримінаційною моделлю, хоча найчастіше вони класифікуються як дискримінаційна модель.

Чиста розрізнювальна модель порівнянно з умовною моделлю[ред. | ред. код]

Умовна модель моделює умовний ймовірнісний розподіл, а розрізнювальна модель прагне оптимізувати відображення вхідних даних навколо найбільш подібних тренувальних даних[4].

Приклади[ред. | ред. код]

Приклади розрізнювальних моделей, що використовуються в машинному навчанні, включать: логістичну регресію, один із типів узагальненої лінійної регресії[en], що застосовується для передбачення двійкових або категорійних виходів (відомий також як максимально-ентропійні класифікатори[en]); метод опорних векторів, підсилювання (метаалгоритм), умовні випадкові поля, лінійну регресію, нейронні мережі тощо.

Див. також[ред. | ред. код]

Примітки[ред. | ред. код]

  1. P. Singla and P. Domingos. Discriminative training of Markov logic networks. In AAAI, 2005. (англ.)
  2. J. Lafferty, A. McCallum, and F. Pereira. Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data. In ICML, 2001. (англ.)
  3. A. Ng and M. I. Jordan. On Discriminative vs. Generative Classifiers: A Comparison of Logistic Regression and Naive Bayes. In NIPS, 2001 (англ.)
  4. Ballesteros, Miguel. Discriminative Models (PDF). Процитовано 28 жовтня 2018.[недоступне посилання з вересня 2019]