Виділяння ознак

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

В машинному навчанні, розпізнаванні образів та в обробці зображень виділя́ння озна́к (англ. feature extraction) починається з первинного набору даних вимірювань, і будує похідні значення (ознаки), покликані бути інформативними та ненадлишковими, полегшувати наступні кроки навчання та узагальнення, і в деяких випадках вести до кращих тлумачень людьми. Виділяння ознак пов'язане зі зниженням розмірності.

Коли вхідні дані алгоритму є занадто великими, щоби їх можливо було обробити, і підозрюються на надлишковість (наприклад, одні й ті самі вимірювання як у метрах, так і в футах, або повторюваності в зображеннях, представлених пікселями), тоді їх може бути перетворено на скорочений набір ознак (що також називають вектором ознак). Цей процес називається виділянням ознак. Очікується, що виділені ознаки містять доречну інформацію з вхідних даних, так що бажане завдання може бути виконано із застосуванням цього скороченого представлення замість повних первинних даних.

Загальне[ред. | ред. код]

Виділяння ознак включає зниження кількості ресурсів, необхідних для опису великого набору даних. При виконанні аналізу складних даних одна з головних проблем випливає з кількості залучених змінних. Аналіз із великою кількістю змінних в загальному випадку вимагає великої кількості пам'яті та обчислювальних потужностей, або алгоритмів класифікації, що перенавчаються тренувальної вибірки, й погано узагальнюються на нові. Виділяння ознак є загальним терміном для позначення методів побудови таких поєднань змінних, щоби обходити ці проблеми, зберігаючи достатню точність опису даних.

Найкращі[джерело?] результати досягаються тоді, коли фахівець будує набір залежних від конкретного застосування ознак, процес, що називається проектуванням ознак. Але як би там не було, якщо такі фахові знання відсутні, допомогти можуть і загальні методики зниження розмірності. Вони включають:

Обробка зображень[ред. | ред. код]

Однією з дуже важливих областей застосування є обробка зображень, у якій застосовуються алгоритми для виявлення та виокремлення різних бажаних частин або фігур (ознак) оцифрованого зображення або потоку відео. Це особливо важливо в області оптичного розпізнавання символів.

Низькорівнева[ред. | ред. код]

Кривина[ред. | ред. код]

Рух зображення[ред. | ред. код]

На основі фігур[ред. | ред. код]

Гнучкі методи[ред. | ред. код]

  • Параметризовані фігури, що піддаються деформації
  • Активні контури (змії)

Виділяння ознак у програмному забезпеченні[ред. | ред. код]

Багато програмних пакетів аналізу даних[en] забезпечують виявляння ознак та зниження розмірності. Поширені середовища чисельного програмування, такі як MATLAB, SciLab, NumPy та мова програмування R, забезпечують деякі з простіших методик виявляння ознак (наприклад, метод головних компонент) через вбудовані команди. Специфічніші алгоритми часто доступні як загальнодоступні сценарії або додатки від третіх сторін.

Див. також[ред. | ред. код]

Примітки[ред. | ред. код]