Гаррісів афінний виявляч областей

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

У галузях комп'ютерного бачення та аналізу зображень[en] га́ррісів афі́нний виявля́ч областе́й (англ. Harris affine region detector) належить до категорії виявляння ознак. Виявляння ознак — це етап попередньої обробки деяких алгоритмів, які покладаються на встановлювання характерних, або особливих точок, щоби встановлювати відповідності між зображеннями, розпізнавати текстури, категоризувати об'єкти, або створювати панорами.

Огляд[ред. | ред. код]

Гаррісів афінний виявляч може встановлювати подібні області зображень, пов'язані через афінні перетворення, і з різним освітленням. Ці афінноінваріантні (англ. affine-invariant) виявлячі повинні бути здатними встановлювати схожі області в зображеннях, зроблених з різних точок огляду, пов'язаних простим геометричним перетворенням: масштабуванням, повертанням і зміщенням. Ці виявляні області називали як інваріантними, так і коваріантними. З одного боку, ці області виявляються інваріантно щодо перетворення зображення, але вони коваріантно змінюються з перетворенням зображення.[1] Не варто надто зациклюватися на цих двох угодах про іменування; важливо розуміти, що дизайн цих особливих точок робитиме їх сумісними між зображеннями, зробленими з кількох точок огляду. До інших афінноінваріантних виявлячів належать гессіанний афінний виявляч областей, максимально стабільні екстремумні області, виявляч опуклостей Кадіра — Брейді[en], області на основі контурів (англ. edge-based regions, EBR), та області на основі екстремумів яскравості (англ. intensity-extrema-based regions, IBR).

Миколайчик та Шмід (2002) вперше описали гаррісів афінний виявляч, яким його використовують сьогодні, у статті «Афінноінваріантний виявляч особливих точок».[2] До раніших праць у цьому напрямі належать застосування Ліндебергом і Гардінгом афінного пристосовування форми для обчислення афінноінваріантних описувачів зображень і зниження таким чином впливу перспективних деформацій зображень,[3] використання Баумбергом точок афіннопристосованих ознак для стереозіставляння з широкою базою (англ. wide baseline matching),[4] і перше використання Ліндебергом масштабоінваріантних точок ознак;[5][6][7] для огляду теоретичної підоснови. Гаррісів афінний виявляч покладається на поєднання кутових точок, виявляних за допомогою гаррісового виявляння кутів, багатомасштабного аналізу через гауссів простір масштабів, та афінного унормовування за допомогою ітеративного алгоритму афінного пристосовування форми. Рекурсивний та ітеративний алгоритм використовує ітеративний підхід до виявлення цих областей:

  1. Визначити початкові точки областей за допомогою масштабоінваріантного виявляча Гарріса — Лапласа.
  2. Для кожної початкової точки унормувати область, щоби вона була афінноінваріантною, за допомогою афінного пристосовування форми.
  3. Ітеративно оцінити цю афінну область: обрати належний масштаб інтегрування, масштаб диференціювання, та визначити просторові положення особливих точок.
  4. Уточнити цю афінну область, скориставшись цими масштабами та просторовими положеннями.
  5. Повторити крок 3, якщо критерію зупинки не досягнуто.

Опис алгоритму[ред. | ред. код]

Виявляч Гарріса — Лапласа (початкових точок областей)[ред. | ред. код]

Гаррісів афінний виявляч значною мірою покладається як на гаррісову міру, так і на гауссове масштабопросторове подання. Тому далі буде короткий огляд обох. Вичерпніші виведення дивіться у виявлянні кутів та гауссовому просторі масштабів, або їхніх відповідних працях.[6][8]

Гаррісова міра кута[ред. | ред. код]

Алгоритм Гарріса виявляння кутів покладається на центровий принцип: на куті яскравість зображення значно змінюватиметься в декількох напрямках. Це можливо сформулювати іншим чином, через дослідження змін яскравості внаслідок зміщення локального вікна. Навколо кутової точки при зміщенні цього вікна в довільному напрямку яскравість зображення змінюється сильно. Слідуючи цій інтуїції, та завдяки вправному розкладові, виявляч Гарріса використовує як основу для своїх рішень про кути матрицю другого моменту. (Повніше виведення див. у виявлянні кутів). Цю матрицю також називають матрицею автокореляції, вона має значення, тісно пов'язані з похідними яскравості зображення.

де та  — похідні (яскравості пікселів) у напрямах та відповідно в точці (, ); та  — параметри положення вагової функції w. Недіагональні елементи є добутком та , тоді як діагональні елементи є квадратами відповідних похідних. Вагова функція може бути рівномірною, але частіше ізотропна, кругова гауссова,

яка діє як усереднення в локальній області, водночас заважуючи сильніше значення поблизу центру.

Як виявилося, ця матриця описує форму автокореляційної міри через зміщення розташування вікна. Таким чином, якщо та  — власні значення , то ці значення забезпечують кількісний опис того, як автокореляційна міра змінюється в просторі: її головні кривини. Як зазначають Гарріс та Стівенс (1988), матриця з центром у кутових точках матиме два великі додатні власні значення. Замість виділяння цих власних значень такими методами як сингулярний розклад матриці, використовують гаррісову міру на основі сліду та визначника:

де  — стала. Кутові точки мають великі додатні власні значення, й відтак матимуть велику гаррісову міру. Таким чином, кутові точки визначають як локальні максимуми гаррісової міри, що перевищують заданий поріг.

де  — множина всіх кутових точок,  — гаррісова міра, обчислена в ,  — 8-сусідова множина з центром , а  — заданий поріг.

8-точковий окіл

Гауссів простір масштабів[ред. | ред. код]

Гауссове масштабопросторове подання зображення — це набір зображень, що є результатом згортання гауссового ядра різних розмірів із первинним зображенням. У загальному вигляді це подання можливо сформулювати так:

де  — ізотропне, кругове гауссове ядро, як визначено вище. Згортка з гауссовим ядром згладжує зображення за допомогою вікна розміром з це ядро. Більший масштаб, , відповідає гладшому отримуваному зображенню. Миколайчик та Шмід (2001) зазначають, що похідні та інші вимірювання мусить бути нормовано над масштабами.[9] Похідну порядку , , необхідно нормувати коефіцієнтом у такий спосіб:

Ці похідні, або будь-яку довільну міру, можливо пристосовувати до масштабопросторового подання шляхом рекурсивного обчислення цієї міри за допомогою набору масштабів, де -тий масштаб . Повніший опис див. у просторі масштабів.

Поєднання гаррісового виявляча над гауссовим простором масштабів[ред. | ред. код]

Виявляч Гарріса — Лапласа поєднує традиційний двовимірний гаррісів виявляч кутів з ідеєю гауссового масштабопросторового подання для створення масштабоінваріантного виявляча. Гаррісові кутові точки є гарними відправними точками, оскільки було показано, що вони, на додачу до визначання особливих точок зображення, мають добру інваріантність щодо обертання та освітлення.[10] Проте ці точки не інваріантні щодо масштабу, і тому матрицю другого моменту необхідно видозмінити, щоби відтворити властивість масштабоінваріантності. Позначмо через масштабопристосовану матрицю другого моменту, яку використовують у виявлячі Гарріса — Лапласа.

[11]

де  — гауссове ядро масштабу , а . Подібно до гауссового простору масштабів,  — гауссового згладжене зображення. Оператор позначує згортку. та  — похідні у відповідних напрямках, застосовані до згладженого зображення, та обчислені з використанням гауссового ядра з масштабом . З точки зору нашої системи гауссового простору масштабів, параметр визначає поточний масштаб, на якому виявляються гаррісові кутові точки.

Створений на основі цієї масштабопристосованої матриці другого моменту, виявляч Гарріса — Лапласа становить подвійний процес: застосування гаррісового виявляча кутів у кількох масштабах, та автоматичне обирання характерного масштабу (англ. characteristic scale).

Багатомасштабні гаррісові кутові точки[ред. | ред. код]

Цей алгоритм здійснює пошук над фіксованим числом наперед визначених масштабів. Набір масштабів задають наступним чином:

Миколайчик та Шмід (2004) використовують . Для кожного масштабу інтегрування , обраного з цього набору, відповідний масштаб диференціювання обирають як сталу пропорцію масштабу інтегрування: . Миколайчик та Шмід (2004) використовували .[11] Використовуючи ці масштаби, особливі точки виявляють за допомогою міри Гарріса на матриці . Кутовість (англ. cornerness), як і типову міру Гарріса, визначають як

Подібно до традиційного гаррісового виявляча, кутові точки — це ті локальні (у 8-точкових околах) максимуми кутовості, що перевищують заданий поріг.

Встановлювання характерного масштабу[ред. | ред. код]

Ітеративний алгоритм на основі Ліндеберга (1998) як просторово локалізує кутові точки, так й обирає характе́рний масшта́б (англ. characteristic scale).[6] Цей ітеративний пошук має три ключові кроки, виконувані для кожної з точок , які спершу було виявлено на масштабі багатомасштабним гаррісовим виявлячем ( вказує на -ту ітерацію):

  • Обрати масштаб , який максимізує лапласіан гауссіанів (ЛГ, англ. LoG) над попередньо визначеним діапазоном сусідніх масштабів. Сусідні масштаби, як правило, вибирають із діапазону, що перебуває в околі двох масштабів простору (англ. two scale-space). Тобто, якщо вихідні точки було виявлено з використанням коефіцієнта масштабування між послідовними масштабами, то окіл двох масштабів простору — це проміжок . Таким чином, розглядають гауссові масштаби . Вимірювання ЛГ визначають як
де та  — другі похідні у своїх відповідних напрямках.[12] Коефіцієнт (як обговорювалося вище в гауссовому просторі масштабів) використовують для унормовування ЛГ над масштабами, роблячи ці вимірювання порівнянними, відтак роблячи максимум доречним. Миколайчик та Шмід (2001) показують, що міра ЛГ у порівнянні з іншими мірами обирання масштабу досягає найвищого відсотка правильно виявлених кутових точок.[9] Масштаб, який максимізує міру ЛГ в околі двох масштабів простору, вважають характе́рним масшта́бом (англ. characteristic scale), , і використовують у наступних ітераціях. Якщо екстремуму або максимуму ЛГ не знайдено, цю точку викидають із подальших пошуків.
  • Використовуючи характерний масштаб, локалізувати точки в просторі. Інакше кажучи, обирають таким чином, щоби вона максимізувала гаррісову кутову міру (кутовість, англ. cornerness, як визначено вище) у локальному околі 8 × 8.
  • Критерій зупинки: і .

Якщо критерію зупинки не досягнуто, алгоритм повторюється з кроку 1, використовуючи ці нові точки та масштаб . Коли критерію зупинки досягнуто, знайдені точки являють собою ті, які максимізують ЛГ над масштабами (обирання масштабу) й максимізують гаррісову кутову міру в локальному околі (просторове обирання).

Афінноінваріантні точки[ред. | ред. код]

Математична теорія[ред. | ред. код]

Точки виявляча Гарріса — Лапласа масштабоінваріантні, й добре працюють для ізотропних областей, які розглядають під однаковим кутом огляду. Щоби вона була інваріантною до довільних афінних перетворень (та точок огляду), цю математичну структуру необхідно переглянути. Матрицю другого моменту для анізотропних областей визначають загальніше:

де та  — коваріаційні матриці, що визначають диференціювальні та інтегрувальні масштаби гауссового ядра. Хоча вона може виглядати значно відмінною від матриці другого моменту у виявлячі Гарріса — Лапласа; насправді вона ідентична. Попередня матриця була двовимірно ізотропною версією, в якій коваріаційні матриці та були одиничними матрицями 2 × 2, помноженими на коефіцієнти та відповідно. У новому формулюванні гауссові ядра можливо розглядати як багатовимірні гауссові розподіли, на відміну від однорідного гауссового ядра. Однорідне гауссове ядро можливо розглядати як ізотропну, кругову область. Подібно до цього, загальніше гауссове ядро визначає еліпсоїд. Фактично, власні вектори та власні значення коваріаційної матриці визначають кут повороту та розмір еліпсоїда. Таким чином, ми можемо легко побачити, що це подання дозволяє нам повністю визначити довільну еліптичну афінну область, над якою ми хочемо здійснювати інтегрування чи диференціювання.

Мета афінноінваріантного виявляча — встановлювати області зображень, пов'язані через афінні перетворення. Таким чином, ми розглядаємо точку та перетворену точку , де A — афінне перетворення. У випадку зображень, як , так і живуть у просторі . Матриці другого моменту пов'язано наступним чином:[3]

де та  — коваріаційні матриці для системи відліку . Якщо ми продовжимо це формулювання й забезпечимо виконання

де та  — скалярні коефіцієнти, буде можливо показати, що коваріаційні матриці для відповідної точки пов'язані подібним чином:

Завдяки вимозі до коваріаційних матриць задовольняти ці умови виникає кілька приємних властивостей. Одна з них полягає в тому, що квадратний корінь матриці другого моменту, , перетворюватиме первинну анізотропну область в ізотропні області, пов'язані просто через чисту матрицю повертання . Ці нові ізотропні області можливо розглядати як унормовану систему відліку. Наступні рівняння формулюють співвідношення між унормованими точками та :

Матрицю обертання можливо отримувати за допомогою градієнтних методів, таких як в описувачі SIFT. Як обговорювалося стосовно виявляча Гарріса, власні значення та власні вектори матриці другого моменту, , характеризують кривину та форму яскравостей пікселів. Тобто, власний вектор, пов'язаний із найбільшим власним значенням, вказує напрямок найбільшої зміни, а власний вектор, пов'язаний із найменшим власним значенням, визначає напрямок найменшої зміни. У двовимірному випадку власні вектори та власні значення визначають еліпс. Для ізотропної області область повинна мати круглу форму, а не еліптичну. Це той випадок, коли власні значення мають однакову величину. Таким чином, міра ізотропності навколо локальної області визначають наступним чином:

де позначують власні значення. Ця міра має діапазон . Значення відповідає ідеальній ізотропії.

Ітеративний алгоритм[ред. | ред. код]

Використовуючи цю математичну структуру, алгоритм гаррісового афінного виявляча ітеративно виявляє матрицю другого моменту, яка перетворює анізотропну область на унормовану, в якій міра ізотропності достатньо близька до одиниці. Алгоритм використовує цю матрицю пристосовування форми (англ. shape adaptation matrix), , щоби перетворювати зображення до унормованої системи відліку. В цьому внормованому просторі параметри особливих точок (просторове розташування, масштаб інтегрування та масштаб диференціювання) уточнюють за допомогою методів, подібних до виявляча Гарріса — Лапласа. Матриця другого моменту обчислюється в цій унормованій системі відліку, й на останній ітерації повинна мати міру ізотропності, близьку до одиниці. На кожній -тій ітерації кожна особлива область визначається декількома параметрами, які має встановлювати алгоритм: матрицею , положенням , масштабом інтегрування , та масштабом диференціювання . Оскільки цей виявляч обчислює матрицю другого моменту в перетвореній області, це перетворене положення зручно позначувати через , де .

  1. Виявляч встановлює простір пошуку в початковий стан точками, виявленими виявлячем Гарріса — Лапласа.
    одинична, а , та  — з виявляча Гарріса — Лапласа.
  2. Застосувати матрицю пристосовування форми з попередньої ітерації, , щоби породити унормовану систему відліку, . Для першої ітерації ви застосовуєте .
  3. Обрати масштаб інтегрування, , використовуючи метод, подібний до виявляча Гарріса — Лапласа. Цей масштаб обирають як такий, що максимізує лапласіан гауссіана (ЛГ). Простір пошуку масштабів лежить у межах двох масштабів простору масштабу попередньої ітерації.
    Важливо зазначити, що масштаб інтегрування в просторі нормований значно відрізняється від невнормованого простору. Тому важливо шукати масштаб інтегрування, а не використовувати масштаб у невнормованому просторі.
  4. Обрати масштаб диференціювання, . Щоби звузити простір пошуку та ступені вільності, покладають, що масштаб диференціювання пов'язано з масштабом інтегрування через сталий коефіцієнт: . Зі зрозумілих міркувань цей сталий коефіцієнт менший за одиницю. Миколайчик та Шмід (2001) зауважують, що занадто малий коефіцієнт робитиме згладжування (інтегрування) занадто значним у порівнянні з диференціюванням, а занадто великий коефіцієнт не дозволятиме інтегруванню усереднювати коваріаційну матрицю.[9] Зазвичай обирають . Масштаб, обраний з цієї множини, максимізуватиме ізотропну міру .
    де — матриця другого моменту, оцінена в унормованій системі відліку. Цей процес максимізування призводить до збігання власних значень до одного й того ж значення.
  5. Просторове локалізування: Обрати таку точку , що максимізує гаррісову міру кутовості (), в межах 8-точкового околу навколо попередньої точки .
    де — матриця другого моменту, визначена як вище. Вікно — це множина 8-найближчих сусідів точки з попередньої ітерації в нормованій системі відліку. Оскільки нашу просторову локалізацію було здійснено в -нормованій системі відліку, новообрану точку необхідно перетворити назад до первинної системи відліку. Цього досягають шляхом перетворення вектору зміщення, та додавання його до попередньої точки:
  6. Як зазначено вище, квадратний корінь матриці другого моменту визначає матрицю перетворення, яка породжує нормовану систему відліку. Відтак нам треба зберегти цю матрицю: . Матриця перетворення уточнюється: . Щоби забезпечити коректне дискретування зображення, і що ми розширюємо зображення в напрямку найменшої зміни (найменшого власного значення), ми фіксуємо максимальне власне значення: . Використовуючи цей метод уточнення, можливо легко побачити, що остаточна матриця набуває наступного вигляду:
  7. Якщо критерію зупинки не досягнуто, перейти до наступної ітерації на кроці 2. Оскільки цей алгоритм ітеративно шукає розв'язок для матриці нормування, яка перетворює анізотропну область на ізотропну, має сенс зупинитися, коли міра ізотропності, , стала достатньо близькою до свого максимального значення, 1. Достатньо близька означає наступну умову зупинки:
    Миколайчик та Шмід (2004) мали добрий успіх з .

Обчислення та втілення[ред. | ред. код]

Обчислювальну складність гаррісового афінного виявляча розбито на дві частини: початкове виявляння точок, та афінне унормовування областей. Алгоритм початкового виявляння точок, Гарріса — Лапласа, має складність , де  — число пікселів у зображенні. Алгоритм афінного унормовування області автоматично виявляє масштаб та оцінює матрицю пристосовування форми, . Цей процес має складність , де  — кількість початкових точок,  — розмір простору пошуку для автоматичного обирання масштабу, а  — число ітерацій, необхідних для обчислення матриці .[11]

Існують деякі методи зменшення складності цього алгоритму ціною точності. Одним із методів є усунення пошуку на кроці масштабу диференціювання. Замість обирати коефіцієнт з набору коефіцієнтів, прискорений алгоритм обирає масштаб, який буде сталим для всіх ітерацій та точок: . Хоч це скорочення простору пошуку й може зменшувати складність, ця зміна може серйозно впливати на збіжність матриці .

Аналіз[ред. | ред. код]

Збіжність[ред. | ред. код]

Можливо уявити, що цей алгоритм може встановлювати ідентичні особливі точки в різних масштабах. Оскільки гаррісів афінний алгоритм розглядає кожну початкову точку, задану виявлячем Гарріса — Лапласа, незалежно, розрізнення ідентичних точок немає. На практиці було показано, що всі ці точки зрештою збігатимуться до однієї й тієї ж особливої точки. Після завершення встановлювання всіх особливих точок алгоритм враховує дублікати шляхом порівнювання просторових координат (), масштабу інтегрування , міри ізотропності , та скосу.[11] Якщо ці параметри особливих точок схожі в межах заданого порогу, їх позначають як дублікати. Алгоритм відкидає всі ці дубльовані точки, за винятком особливої точки, найближчої до усереднення цих дублікатів. Зазвичай 30 % гаррісових афінних точок є достатньо відмінними та несхожими, щоб не бути відкинутими.[11]

Миколайчик та Шмід (2004) показали, що початкові точки часто (40 %) не збігаються. Цей алгоритм виявляє цю розбіжність, зупиняючи ітеративний алгоритм, якщо обернення міри ізотропності перевищує заданий поріг: . Миколайчик та Шмід (2004) використовують . Для тих, які дійсно збігалися, типове число необхідних ітерацій становило 10.[2]

Кількісна міра[ред. | ред. код]

Кількісний аналіз афінних виявлячів областей враховує як точність розташування точок, так і перекриття областей на двох зображеннях. Миколайчик та Шмід (2004) розширюють мі́ру повто́рюваності (англ. repeatability measure) Шмід зі співавт. (1998) як відношення точкових відповідностей до мінімуму виявлених точок двох зображень.[11][13]

де  — число відповідних точок у зображеннях та . та  — число виявлених точок у відповідних зображеннях. Оскільки кожне зображення подає тривимірний простір, може ставатися так, що одне зображення містить об'єкти, відсутні в другому зображенні, й відтак особливі точки яких не мають шансів мати відповідні. Щоби зробити міру повторюваності чинною, ці точки усувають, і мусять враховувати лише точки, що лежать на обох зображеннях; та враховують ці точки так, що . Для пари з двох зображень, пов'язаних через матрицю проєктивного перетворення[en] , кажуть, що дві точки та відповідні, якщо

Область перекриття двох еліптичних областей.
  1. Похибка в положеннях пікселів менша за 1,5 пікселі:
  2. По́хибка перекриття́ (англ. overlap error) цих двох афінних точок () мусить бути меншою за вказаний поріг (зазвичай 40 %).[1] Для афінних областей ця похибка перекриття така:

    де та  — встановлені еліптичні області, чиї точки задовольняють . По суті, ця міра бере відношення двох площ: площі перекриття (перетину), та загальної площі (об'єднання). Ідеальне перекриття матиме одиничне відношення, і матиме . Різні масштаби впливають на область перекриття, й відтак мусять враховуватися унормовуванням площ кожної з особливих областей. Області з похибкою перекриття до 50 % — придатні виявлячі для зіставляння їх із добрим описувачем.[1]

    Друга міра, оці́нка збі́гу (англ. matching score), оцінює здатність виявляча встановлювати відповідні точки між зображеннями практичніше. Для встановлювання відповідних точок Миколайчик та Шмід (2005) використовують описувач SIFT. На додачу до того, щоби бути найближчими точками в просторі SIFT, дві відповідні точки також мусять мати достатньо малу похибку перекриття (як визначено в мірі повторюваності). Оцінка збігу — це відношення числа зіставлених точок та мінімуму всіх виявлених точок у кожному зображенні:

    ,[1]
    де  — число зіставлених точок, а та  — числа виявлених областей у відповідних зображеннях.

Стійкість щодо афінних та інших перетворень[ред. | ред. код]

Миколайчик зі співавт. (2005) провели ретельний аналіз кількох афінних виявлячів областей рівня останніх досягнень: гаррісового афінного, гессіанного афінного виявлячів, МСЕО,[14] областей на основі екстремумів яскравості (англ. IBR) та на основі контурів (англ. EBR),[15] та опуклісного[en][16] виявляча.[1] У ході свого оцінювання Миколайчик зі співавт. аналізували як структуровані, так і текстуровані зображення. Двійкові файли цих виявлячів для Лінукс та їхні перевірні зображення доступні вільно на їхній вебсторінці. Далі йде короткий підсумок результатів Миколайчика зі співавт. (2005); кількісніший аналіз див у Порівнянні афінних виявлячів областей (англ.).

  • Зміна кута точки огляду: гаррісів афінний виявляч має достатню (середню) стійкість щодо цих типів змін. Він підтримує оцінку повторюваності понад 50 % до кута огляду понад 40 градусів. Цей виявляч схильний виявляти велике число повторюваних і відповідних областей навіть за великої зміни точки огляду.
  • Зміна масштабу: гаррісів афінний виявляч за змін масштабу лишається дуже стабільним. Незважаючи на те, що число точок значно зменшується за великих змін масштабу (понад 2,8), оцінки повторюваності (50—60 %) та збігу (25—30 %) лишаються дуже сталими, особливо для текстурованих зображень. Це узгоджується з високою продуктивністю ітеративного алгоритму автоматичного обирання масштабу.
  • Розмиті зображення: гаррісів афінний виявляч за розмивання зображення лишається дуже стабільним. Оскільки він не покладається на сегментування зображень чи межі областей, оцінки повторюваності та збігу лишаються сталими.
  • Артефакти JPEG: гаррісів афінний виявляч гіршає подібно до інших афінних виявлячів: оцінки повторюваності та збігу значно падають при стисненні понад 80 %.
  • Зміни освітленості: гаррісів афінний виявляч, як й інші афінні виявлячі, дуже стійкий щодо змін освітленості: оцінки повторюваності та збігу за зниження освітленості залишаються незмінними. Цього слід очікувати, оскільки ці виявлячі значною мірою покладаються на відносні яскравості (похідні), а не на абсолютні.

Загальні схильності[ред. | ред. код]

  • Точки гаррісових афінних областей, як правило, малі та численні. Як гаррісів афінний, так і гессіанний афінний виявлячі стабільно встановлюють вдвічі більше повторюваних точок, аніж інші афінні виявлячі: ~1000 областей для зображення 800x640.[1] Невеликі області рідше бувають затуленими, але мають менший шанс перекривати сусідні області.
  • Гаррісів афінний виявляч добре реагує на текстуровані сцени, в яких багато кутоподібних частин. Проте для деяких структурованих сцен, як-от будівель, дуже добре працює гессіанний афінний виявляч. Це доповнюють МСЕО, які працюють краще з добре структурованими (сегментованими) сценами.
  • Загалом гаррісів афінний виявляч працює дуже добре, але все ж відстає від МСЕО та гессіанного афінного у всіх випадках, крім розмитих зображень.
  • Гаррісів афінний та гессіанний афінний виявлячі менш точні, ніж інші: їхня оцінка повторюваності зростає зі збільшенням порогу перекриття.
  • Виявлені афінноінваріантні області все ще можуть відрізнятися своїм повертанням та освітленням. Будь-який описувач, що використовує ці області, повинен забезпечувати таку інваріантність при використанні цих областей для зіставлення або інших порівнянь.

Застосування[ред. | ред. код]

Програмні пакети[ред. | ред. код]

  • Affine Covariant Features: К. Миколайчик підтримує вебсторінку, яка містить двійкові файли для Linux гаррісового афінного виявляча, на додачу до інших виявлячів та описувачів. Також доступний код Matlab, який можливо використовувати для ілюстрації та обчислення повторюваності різних виявлячів. Код і зображення також доступні для дублювання результатів, отриманих у праці Миколайчика зі співавт. (2005).
  • lip-vireo — двійковий код для Linux, Windows та SunOS від дослідницької групи VIREO, див. більше на їхній домашній сторінці

Посилання[ред. | ред. код]

  • [1] — слайди презентації Миколайчика зі співавт. до їхньої праці 2005 року.
  • [2] — Лабораторія комп'ютерного бачення Корделії Шмід
  • [3] — код, перевірні зображення, бібліографія афінних коваріантних ознак, які ведуть Крістіан Миколайчик та Група візуальної геометрії з Групи робототехніки Оксфордського університету.
  • [4] — бібліографія виявлячів ознак (і плям), підтримувана Інститутом робототехніки та інтелектуальних систем Університету Південної Каліфорнії
  • [5] — Цифрове втілення лапласіана гауссіана

Див. також[ред. | ред. код]

Примітки[ред. | ред. код]

  1. а б в г д е K. Mikolajczyk, T. Tuytelaars, C. Schmid, A. Zisserman, J. Matas, F. Schaffalitzky, T. Kadir and L. Van Gool, A comparison of affine region detectors. In IJCV 65(1/2):43-72, 2005 (англ.)
  2. а б Mikolajcyk, K. and Schmid, C. 2002. An affine invariant interest point detector. In Proceedings of the 8th International Conference on Computer Vision, Vancouver, Canada. [Архівовано 2004-07-23 у Wayback Machine.] (англ.)
  3. а б T. Lindeberg and J. Garding (1997). "Shape-adapted smoothing in estimation of 3-{D} depth cues from affine distortions of local 2-{D} structure". Image and Vision Computing 15: pp 415—434. (англ.)
  4. A. Baumberg (2000). "Reliable feature matching across widely separated views". Proceedings of IEEE Conference on Computer Vision and Pattern Recognition: pages I:1774—1781. (англ.)
  5. Lindeberg, Tony, Scale-Space Theory in Computer Vision, Kluwer Academic Publishers, 1994, ISBN 0-7923-9418-6 (англ.)
  6. а б в T. Lindeberg (1998). "Feature detection with automatic scale selection". International Journal of Computer Vision 30 (2): pp 77—116. (англ.)
  7. Lindeberg, T. (2008). Scale-space. У Wah, Benjamin (ред.). Encyclopedia of Computer Science and Engineering. Т. IV. John Wiley and Sons. с. 2495—2504. doi:10.1002/9780470050118.ecse609. ISBN 978-0470050118. (англ.)
  8. C. Harris and M. Stephens (1988). "A combined corner and edge detector". Proceedings of the 4th Alvey Vision Conference: pages 147—151. [Архівовано 2007-09-16 у Wayback Machine.] (англ.)
  9. а б в K. Mikolajczyk and C. Schmid. Indexing based on scale invariant interest points. In Proceedings of the 8th International Conference on Computer Vision, Vancouver, Canada, pages 525-531, 2001. [Архівовано 2012-02-09 у Wayback Machine.] (англ.)
  10. Schmid, C., Mohr, R., and Bauckhage, C. 2000. Evaluation of interest point detectors. International Journal of Computer Vision, 37(2):151-172. (англ.)
  11. а б в г д е Mikolajczyk, K. and Schmid, C. 2004. Scale & affine invariant interest point detectors. International Journal on Computer Vision 60(1):63-86. (англ.)
  12. Spatial Filters: Laplacian/Laplacian of Gaussian [Архівовано 2007-11-20 у Wayback Machine.] (англ.)
  13. C. Schmid, R. Mohr, and C. Bauckhage. Comparing and evaluating interest points. In International Conference on Computer Vision, pp. 230-135, 1998. (англ.)
  14. J.Matas, O. Chum, M. Urban, and T. Pajdla, Robust wide baseline stereo from maximally stable extremal regions. In BMVC p. 384-393, 2002. (англ.)
  15. T. Tuytelaars and L. Van Gool, Matching widely separated views based on affine invariant regions. In IJCV 59(1):61-85, 2004. (англ.)
  16. T. Kadir, A. Zisserman, and M. Brady, An affine invariant salient region detector. In ECCV p. 404-416, 2004. (англ.)
  17. http://staff.science.uva.nl/~gevers/pub/overview.pdf (англ.)
  18. R. Datta, J. Li, and J. Z. Wang, “Content-based image retrieval - Approaches and trends of the new age,” In Proc. Int. Workshop on Multimedia Information Retrieval, pp. 253-262, 2005.IEEE Transactions on Multimedia, vol. 7, no. 1, pp. 127-142, 2005. [Архівовано 2007-09-28 у Wayback Machine.] (англ.)
  19. J. Sivic and A. Zisserman. Video google: A text retrieval approach to object matching in videos. In Proceedings of the International Conference on Computer Vision, Nice, France, 2003.[недоступне посилання] (англ.)
  20. J. Sivic and A. Zisserman. Video data mining using configurations of viewpoint invariant regions. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, Washington DC, USA, pp. 488-495, 2004.[недоступне посилання] (англ.)
  21. G. Dorko and C. Schmid. Selection of scale invariant neighborhoods for object class recognition. In Proceedings of International Conference on Computer Vision, Nice, France, pp. 634-640, 2003. (англ.)
  22. Beril Sirmacek and Cem Unsalan (January 2011). A probabilistic framework to detect buildings in aerial and satellite images (PDF). IEEE Transactions on Geoscience and Remote Sensing. 49 (1): 211—221. Bibcode:2011ITGRS..49..211S. doi:10.1109/TGRS.2010.2053713. S2CID 10637950. (англ.)