Вектор ознак

Матеріал з Вікіпедії — вільної енциклопедії.
(Перенаправлено з Вектор характеристик)
Перейти до: навігація, пошук
Запит «Простір ознак» перенаправляє сюди; про простори ознак в ядрових методах див. ядрові методи.

В розпізнаванні образів та машинному навчанні ве́ктор озна́к (англ. feature vector) — це n-вимірний вектор числових ознак, що представляють певний об'єкт. Багато алгоритмів у машинному навчанні вимагають чисельного представлення об'єктів, оскільки такі представлення полегшують обробку та статистичний аналіз. При представленні зображень значення ознак можуть відповідати пікселям зображення, при представленні текстів — можливо, частотам трапляння термінів. Вектори ознак еквівалентні векторам описових змінних, що використовуються в статистичних процедурах, таких як лінійна регресія. Вектори ознак часто об'єднують з ваговими коефіцієнтами за допомогою скалярного добутку з метою побудови функції лінійного передбачення[en], що застосовується для визначення оцінки для здійснення передбачення.

Векторний простір, пов'язаний із цими векторами, часто називають про́стором озна́к (англ. feature space). Задля зменшення розмірності простору ознак може застосовуватися ряд методик зниження розмірності[en].

Із вже наявних ознак можуть отримуватися ознаки вищого рівня, і додаватися до вектора ознак, наприклад, для дослідження хвороб є корисною ознака «Вік», і вона визначається як Вік = «Рік смерті» - «Рік народження». Цей процес називається побудо́вою озна́к (англ. feature construction).[1][2] Побудова ознак є застосуванням набору побудовних операторів до набору наявних ознак, що дає в результаті побудову нових ознак. Приклади таких побудовних операторів включають перевірку на умови рівності {=, ≠}, арифметичні оператори {+,−,×, /}, оператори над масивами {max(S), min(S), average(S)}, а також інші складніші оператори, наприклад, count(S,C),[3] що підраховує кількість ознак у векторі ознак S, які задовольняють певну умову C, або, наприклад, відстані до інших класів розпізнавання, узагальнених якимось приймальним пристроєм. Побудова ознак вже давно вважається потужним інструментом для покращення як точності, так і розуміння структури, зокрема, в задачах високих розмірностей.[4] Її застосування включають дослідження хвороб та розпізнавання емоцій[en] з мовлення.[5]

Див. також[ред.ред. код]

Примітки[ред.ред. код]

  1. Liu, H., Motoda H. (1998) Feature Selection for Knowledge Discovery and Data Mining., Kluwer Academic Publishers. Norwell, MA, USA. 1998. (англ.)
  2. Piramuthu, S., Sikora R. T. Iterative feature construction for improving inductive learning algorithms. In Journal of Expert Systems with Applications. Vol. 36 , Iss. 2 (March 2009), pp. 3401-3406, 2009 (англ.)
  3. Bloedorn, E., Michalski, R. Data-driven constructive induction: a methodology and its applications. IEEE Intelligent Systems, Special issue on Feature Transformation and Subset Selection, pp. 30-37, March/April, 1998 (англ.)
  4. Breiman, L. Friedman, T., Olshen, R., Stone, C. (1984) Classification and regression trees, Wadsworth (англ.)
  5. Sidorova, J., Badia T. Syntactic learning for ESEDA.1, tool for enhanced speech emotion detection and analysis. Internet Technology and Secured Transactions Conference 2009 (ICITST-2009), London, November 9–12. IEEE (англ.)


Сигма Це незавершена стаття з математики.
Ви можете допомогти проекту, виправивши або дописавши її.