Узгодження множин точок: відмінності між версіями

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
[неперевірена версія][неперевірена версія]
Вилучено вміст Додано вміст
Створено шляхом перекладу сторінки «Point-set registration»
Рядок 1: Рядок 1:
== Узгодження на основі відповідностей ==
[[Файл:Cpd fish affine.gif|thumb|Узгодження множин точок є процесом узгодження двох множин точок. На малюнку, блакитна риба узгоджується з червоною.]]
Методи на основі відповідностей припускають, що можливі відповідності <math>m \leftrightarrow s_m</math> надаються задані для кожної точки <math>m \in \mathcal{M}</math> . Таким чином, отримуємо ситуацію, де обидві множини точок <math>\mathcal{M}</math> і <math>\mathcal{S}</math> мають <math>N</math> точок, а <math>m_i \leftrightarrow s_i,i=1,\dots,N</math> - це задані відповідності.
'''Узгодження множин точок''' ({{lang-en|point set registration}}, {{lang-en|point matching}}) у [[Теорія розпізнавання образів|теорії розпізнавання образів]] та [[Комп'ютерний зір|комп'ютерному зорі]] є процесом знаходження просторового [[Перетворення (математика)|перетворення]], яке узгоджує дві [[Хмара точок|множини точок]]. Метою знаходження такого перетворення є злиття декількох множин точок у глобально цілісну модель і відображення нового вимірювання на відомий набір даних для виявлення [[Ознака (комп'ютерне бачення)|ознак]] або оцінювання його {{Нп|Положення (комп'ютерний зір)|положення||Pose (computer vision)}}. Множина точок може бути вхідними даними з [[3D-сканер]]а або масивом, отриманим від [[далекомір]]а. Для використання в обробці зображень і [[Реєстрація зображень|реєстрації зображень]] на основі ознак, множина точок може бути множиною ознак, отриманою [[Виділяння ознак|виділянням ознак]] із зображення, наприклад, [[Виявлення кутів|виявленням кутів]]. Узгодження множин точок має широке застосування в [[Оптичне розпізнавання символів|оптичному розпізнаванні символів]],<ref name="tpsrpmchui">{{cite journal
|last1=Chui
|first1=Haili
|last2=Rangarajan
|first2=Anand
|title=A new point matching algorithm for non-rigid registration
|journal=Computer Vision and Image Understanding
|year=2003
|volume=89
|number=2
|pages=114–141
|doi=10.1016/S1077-3142(03)00009-2
}} {{ref-en}}</ref>
<ref name="lmfitzgibbon">{{cite journal
|last=Fitzgibbon
|first=Andrew W.
|title=Robust registration of 2D and 3D point sets
|journal=Image and Vision Computing
|year=2003
|volume=21
|issue=13
|pages=1145–1153
|doi=10.1016/j.imavis.2003.09.004
}} {{ref-en}}</ref> у [[Доповнена реальність|доповненій реальності]]<ref>{{Cite journal|last=Allan|first=Max|last2=Kapoor|first2=Ankur|last3=Mewes|first3=Philip|last4=Mountney|first4=Peter|date=2015-01-01|title=Non Rigid Registration of 3D Images to Laparoscopic Video for Image Guided Surgery|url=https://link.springer.com/chapter/10.1007/978-3-319-29965-5_11|journal=International Workshop on Computer-Assisted and Robotic Endoscopy|publisher=Springer International Publishing|pages=109–116}} {{ref-en}}</ref> та суміщенні даних [[Магнітно-резонансна томографія|магнітно-резонансної томографії]] зі знімками [[Комп'ютерна томографія|комп'ютерної томографії]].<ref name="mrcthill">{{cite journal
|last1=Hill
|first1=Derek LG
|last2=Hawkes
|first2=D. J.
|last3=Crossman
|first3=J. E.
|last4=Gleeson
|first4=M. J.
|last5=Cox
|first5=T. C. S.
|last6=Bracey
|first6=E. E. C. M. L.
|last7=Strong
|first7=A. J.
|last8=Graves
|first8=P.
|title=Registration of MR and CT images for skull base surgery using point-like anatomical features
|url=https://archive.org/details/sim_british-journal-of-radiology_1991-11_64_767/page/1030
|journal=British journal of radiology
|year=1991
|volume=64
|number=767
|pages=1030–1035
|doi=10.1259/0007-1285-64-767-1030
}} {{ref-en}}</ref><ref name="mrctstudholme">{{cite conference
|last1=Studholme
|first1=C.
|last2=Hill
|first2=D. L.
|last3=Hawkes
|first3=D. J.
|title=Automated 3D Registration of Truncated MR and CT Images of the Head
|conference=Proceedings of the Sixth British Machine Vision Conference
|year=1995
|pages=27–36
}} {{ref-en}}</ref>


=== Узгодження без викидів ===
== Формулювання ==
У найпростішому випадку можна припустити, що всі відповідності є правильними, тобто точки <math>m_i,s_i \in \mathbb{R}^3</math> генеруються таким чином:{{NumBlk|:|<math> s_i = lR m_i + t + \epsilon_i, i=1,\dots,N </math>|{{EquationRef|cb.1}}}}де <math>l > 0</math> є сталим [[Scale factor (computer science)|коефіцієнтом масштабування]] (у багатьох випадках <math>l=1</math>), <math>R \in \text{SO}(3)</math> є правильною 3D матрицею [[Обертання (математика)|обертання]] ( <math>\text{SO}(d)</math> є [[Ортогональна група|спеціальною ортогональною групою]] степеня <math>d</math> ), <math>t \in \mathbb{R}^3</math> є вектором [[Паралельне перенесення|паралельного перенесення]] та <math>\epsilon_i \in \mathbb{R}^3</math> моделює невідомий адитивний шум ( ''наприклад,'' [[Gaussian noise|шум Гауса]] ). Зокрема, якщо припустити, що шум <math>\epsilon_i</math> має нульове середнє значення та ізотропний гаусівський розподіл зі стандартним відхиленням стандартним відхиленням <math>\sigma_i</math>, ''тобто'' <math>\epsilon_i \sim \mathcal{N}(0,\sigma_i^2 I_3 )</math>, то оптимізація для отримання [[Метод максимальної правдоподібності|оцінки максимальної правдоподібності]] для невідомого масштабу, обертання та трансляції матиме наступний вигляд:{{NumBlk|:|<math> l^\star, R^\star, t^\star = \arg\min_{l>0, R \in \text{SO}(3), t \in \mathbb{R}^3} \sum_{i=1}^N \frac{1}{\sigma_i^2} \left\Vert s_i - lRm_i - t \right\Vert_2^2 </math>|{{EquationRef|cb.2}}}}Зауважимо, що коли коефіцієнт масштабування дорівнює 1, а вектор паралельного перенесення дорівнює нулю, тоді оптимізація відновлює формулювання [[Wahba's problem|проблеми Вахби]]. Незважаючи на [[Опукла оптимізація|неопуклість]] оптимізації ( {{EquationNote|cb.2}} ) через неопуклість множини <math>\text{SO}(3)</math> основоположна робота Бертольда К. П. Хорна показала, що ( {{EquationNote|cb.2}} ) фактично має розв'язок у вигляді замкнутої формули, шляхом розділення [[Коефіцієнт масштабу|оцінки масштабу]], [[Матриця повороту|повороту]] та [[Паралельне перенесення|паралельного перенесення]]. <ref name=":11">{{Cite journal|last=Horn|first=Berthold K. P.|date=1987-04-01|title=Closed-form solution of absolute orientation using unit quaternions|journal=JOSA A|language=EN|volume=4|issue=4|pages=629–642|bibcode=1987JOSAA...4..629H|doi=10.1364/JOSAA.4.000629|issn=1520-8532}}</ref> Подібні результати були виявлені Аруном ''та ін'' . <ref name=":12">{{Cite journal|last=Arun|first=K. S.|last2=Huang|first2=T. S.|last3=Blostein|first3=S. D.|date=September 1987|title=Least-Squares Fitting of Two 3-D Point Sets|journal=IEEE Transactions on Pattern Analysis and Machine Intelligence|volume=PAMI-9|issue=5|pages=698–700|doi=10.1109/TPAMI.1987.4767965|issn=1939-3539|pmid=21869429}}</ref> Крім того, щоб знайти унікальне перетворення <math>(l,R,t)</math>, для кожної множини точок потрібно як мінімум <math>N=3</math> неколінеарні точки.


Зовсім нещодавно Бріалес і Гонсалес-Хіменес розробили напіввизначену релаксацію, використовуючи [[Двоїстість (оптимізація)|двоїстість Лагранжа]], для випадку, коли множина моделей <math>\mathcal{M}</math> містить різні 3D-примітиви, такі як точки, лінії та площини (в тому випадку, коли модель <math>\mathcal{M}</math> є [[Полігональна сітка|3D-сіткою]]). <ref>{{Cite journal|last=Briales|first=Jesus|last2=Gonzalez-Jimenez|first2=Javier|date=July 2017|title=Convex Global 3D Registration with Lagrangian Duality|journal=2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)|pages=5612–5621|doi=10.1109/CVPR.2017.595|isbn=978-1-5386-0457-1|hdl-access=free}}</ref> Цікаво, що напіввизначена релаксація є емпірично жорсткою, ''тобто'' з розв’язку напіввизначеної релаксації можна отримати [[Екстремум|глобально оптимальний]] розв’язок.
Проблему можна узагальнити наступним чином:<ref name="gmmjian">{{cite journal
|last1=Jian
|first1=Bing
|last2=Vemuri
|first2=Baba C.
|title=Robust Point Set Registration Using Gaussian Mixture Models
|journal=IEEE Transactions on Pattern Analysis and Machine Intelligence
|year=2011
|volume=33
|number=8
|pages=1633–1645
|doi=10.1109/tpami.2010.223
|pmid=21173443
|s2cid=10923565
}}{{ref-en}}</ref>


=== Стійке узгодження ===
Нехай <math>\lbrace\mathcal{M},\mathcal{S}\rbrace</math>&nbsp;— це дві множини точок скінченого розміру у скінченновимірному дійсному векторному просторі <math>\mathbb{R}^d</math>, які містять <math>M</math> і <math>N</math> точок відповідно (''наприклад,'' <math>d=3</math> демонструє типовий випадок, коли <math>\mathcal{M}</math> і <math>\mathcal{S}</math> є множинами 3D-точок). Завдання полягає в тому, щоб знайти таке перетворення, яке буде застосовано до рухомої «моделі» множини точок <math>\mathcal{M}</math> так, щоб різниця (зазвичай визначається як [[евклідова відстань]]) між <math>\mathcal{M}</math> та статичною множиною об'єктів «сцени» <math>\mathcal{S}</math> була зведена до мінімуму. Іншими словами, потрібне відображення з <math>\mathbb{R}^d</math> на <math>\mathbb{R}^d</math>, яке дає найкраще вирівнювання між трансформованими «модельною» множиною та множиною «сцени». Відображення може складатися з {{Нп|Жорстке перетворення|жорсткого|en|Rigid transformation}} або нежорсткого перетворення. Модель перетворення можна записати як <math>T</math>, за допомогою якої перетворена та узгоджена множина точок моделі матиме вигляд:
Відомо, що формулювання методу [[Метод найменших квадратів|найменших квадратів]] ( {{EquationNote|cb.2}} ) може працювати з низькою ефективністю за наявності [[Викид (статистика)|викидів]] . Відповідність викидів – це пара вимірювань <math>s_i \leftrightarrow m_i</math> що відхиляється від [[Породжувальна модель|породжувальної моделі]] ( {{EquationNote|cb.1}} ). У цьому випадку можна розглянути іншу породжувальну модель так: {{NumBlk|:|<math> s_i = \begin{cases}
<div style="text-align:center;">
l R m_i + t + \epsilon_i & \text{if } i- \text{th pair is an inlier} \\
<math>T(\mathcal{M}).</math>
o_i & \text{if } i- \text{th pair is an outlier}
</div>
\end{cases} </math>|{{EquationRef|cb.3}}}}де якщо <math>i-</math> та пара <math>s_i \leftrightarrow m_i</math> входить до множини вхідних даних, то вона відповідає моделі без випадкових помилок ( {{EquationNote|cb.1}} ), ''тобто'' <math>s_i</math> отримується з <math>m_i</math> шляхом просторового перетворення і додавання невеликого шуму. Однак, якщо <math>i-</math> та пара <math>s_i \leftrightarrow m_i</math> є викидом, то вектор <math>s_i</math> може бути будь-яким довільним вектором <math>o_i</math>. Оскільки заздалегідь невідомо, які відповідності є викидами, стійке узгодження за породжувальною моделлю ( {{EquationNote|cb.3}} ) є назвичайно важливим для комп’ютерного зору та робототехніки, бо поточні методи зіставлення функцій мають тенденцію виводити сильно спотворені відповідності, де понад <math>95\%</math> відповідностей можуть бути викидами. <ref name=":0">{{Cite journal|last=Parra Bustos|first=Álvaro|last2=Chin|first2=Tat-Jun|date=December 2018|title=Guaranteed Outlier Removal for Point Cloud Registration with Correspondences|journal=IEEE Transactions on Pattern Analysis and Machine Intelligence|volume=40|issue=12|pages=2868–2882|arxiv=1711.10209|doi=10.1109/TPAMI.2017.2773482|issn=1939-3539|pmid=29990122}}</ref>
Таким чином, результатом алгоритму узгодження множин точок є ''оптимальне перетворення'' <math>T^\star</math> таке, що <math>\mathcal{M}</math> найкраще вирівнюється по <math>\mathcal{S}</math> відповідно до поняття функції відстані
<math>\operatorname{dist}(\cdot,\cdot)</math>:
<div style="text-align:center;">
<math> T^\star = \arg\min_{T \in \mathcal{T} } \text{dist}(T(\mathcal{M}),\mathcal{S}),</math></div>
де <math>T</math> використовується для позначення набору всіх можливих перетворень, які намагається знайти оптимізація. Найпоширенішим вибором функції для обчислення відстані є квадрат [[Евклідова відстань|евклідової відстані]] для кожної пари точок:
<div style="text-align:center;">
<math>\operatorname{dist}(T(\mathcal{M}), \mathcal{S}) = \sum_{m \in T(\mathcal{M})} \Vert m - s_m \Vert^2_2, \quad s_m = \arg\min_{s \in \mathcal{S} } \Vert s - m \Vert_2^2 ,</math>
</div>
де <math>\| \cdot \|_2</math> вказує на [[Норма (математика)|довжину вектора]], а <math>s_m</math>&nbsp;— на відповідну точку в множині <math>\mathcal{S}</math>, яка досягає найкоротшої відстані до даної точки <math>m</math> у множині <math>\mathcal{M}</math> після перетворення. Мінімізація такої функції у випадку {{Нп|Жорстке перетворення|жорсткого перетворення|en|Rigid transformation}} еквівалентна [[Метод найменших квадратів|методу найменших квадратів]].


Далі опишемо кілька поширених парадигм стійкого узгодження.
== Види алгоритмів ==


==== Максимальний консенсус ====
Якщо співвідношення (''тобто,'' <math>s_m \leftrightarrow m</math>) відомі до оптимізації, наприклад, за допомогою методів [[Ознака (комп'ютерне бачення)#Зіставлення|зіставлення ознак]], тоді оптимізація має на меті лише оцінити перетворення. Цей тип узгодження називається '''узгодженням на основі відповідностей (заочне узгодження)'''. З іншого боку, якщо відповідності невідомі, то оптимізації потрібно одночасно знайти відповідності та перетворення. Цей тип узгодження називається '''одночасним узгодженням положення та відповідності'''.
[[Консенсус (комп'ютерні науки)|Максимальний консенсус]] прагне знайти найбільшу множину відповідностей, яка узгоджуюється з [[Породжувальна модель|породжувальною моделлю]] ( {{EquationNote|cb.1}} ) для певного вибору просторового перетворення <math>(l,R,t)</math> . Формально, максимальний консенсус вирішує наступну оптимізацію:{{NumBlk|:|<math> \max_{l>0,R \in \text{SO}(3), t \in \mathbb{R}^3, \mathcal{I} } \vert \mathcal{I} \vert, \quad \text{subject to } \frac{1}{\sigma_i^2} \Vert s_i - lRm_i - t\Vert_2^2 \leq \xi, \forall i \in \mathcal{I} </math>|{{EquationRef|cb.4}}}}де <math>\vert \mathcal{I} \vert</math> позначає [[Потужність множини|потужність]] множини <math>\mathcal{I}</math>. Обмеження у формулі ({{EquationNote|cb.4}}) забезпечують те, що кожна пара вимірювань у множині відповідних точок <math>\mathcal{I}</math>, що задовольняють моделі без викидів, має менший [[Похибки та залишки|залишок]] , ніж заданий поріг <math>\xi</math>. На жаль, нещодавні дослідження показали, що глобальне розв'язання проблеми (cb.4) є [[NP-складна задача|NP-складною задачею]], і глобальні алгоритми, як правило, мають використовувати [[метод гілок і меж]], який має експоненційну складність у найгіршому випадку.<ref name=":1">{{Cite journal|last=Chin|first=Tat-Jun|last2=Suter|first2=David|date=2017-02-27|title=The Maximum Consensus Problem: Recent Algorithmic Advances|journal=Synthesis Lectures on Computer Vision|language=en-US|volume=7|issue=2|pages=1–194|doi=10.2200/s00757ed1v01y201702cov011|issn=2153-1056}}</ref><ref name=":2">{{Cite journal|last=Wen|first=Fei|last2=Ying|first2=Rendong|last3=Gong|first3=Zheng|last4=Liu|first4=Peilin|date=February 2020|title=Efficient Algorithms for Maximum Consensus Robust Fitting|journal=IEEE Transactions on Robotics|volume=36|issue=1|pages=92–106|doi=10.1109/TRO.2019.2943061|issn=1941-0468}}</ref><ref name=":3">{{Cite journal|last=Cai|first=Zhipeng|last2=Chin|first2=Tat-Jun|last3=Koltun|first3=Vladlen|date=2019|title=Consensus Maximization Tree Search Revisited|url=http://openaccess.thecvf.com/content_ICCV_2019/html/Cai_Consensus_Maximization_Tree_Search_Revisited_ICCV_2019_paper.html|journal=Proceedings of IEEE International Conference on Computer Vision (ICCV)|pages=1637–1645|arxiv=1908.02021|bibcode=2019arXiv190802021C}}</ref><ref>{{Cite journal|last=Bazin|first=Jean-Charles|last2=Seo|first2=Yongduek|last3=Pollefeys|first3=Marc|date=2013|editor-last=Lee|editor-first=Kyoung Mu|editor2-last=Matsushita|editor2-first=Yasuyuki|editor3-last=Rehg|editor3-first=James M.|editor4-last=Hu|editor4-first=Zhanyi|title=Globally Optimal Consensus Set Maximization through Rotation Search|journal=Computer Vision – ACCV 2012|series=Lecture Notes in Computer Science|language=en|location=Berlin, Heidelberg|publisher=Springer|volume=7725|pages=539–551|doi=10.1007/978-3-642-37444-9_42|isbn=978-3-642-37444-9}}</ref><ref>{{Cite journal|last=Hartley|first=Richard I.|last2=Kahl|first2=Fredrik|date=2009-04-01|title=Global Optimization through Rotation Space Search|journal=International Journal of Computer Vision|language=en|volume=82|issue=1|pages=64–79|doi=10.1007/s11263-008-0186-9|issn=1573-1405|hdl-access=free}}</ref>


Хоча розв'язання задачі максимального консенсусу є складним, існують ефективні евристики, які досить добре працюють на практиці. Однією з найпоширеніших евристикою є метод<ref>{{Cite journal|last1=Fischler|first1=Martin|last2=Bolles|first2=Robert|date=1981|title=Random sample consensus: a paradigm for model fitting with applications to image analysis and automated cartography|journal=Communications of the ACM|language=EN|volume=24|issue=6|pages=381–395|doi=10.1145/358669.358692|s2cid=972888}}</ref>. RANSAC - це ітеративний метод гіпотези та перевірки. На кожному кроці ітерації метод спочатку випадково вибирає 3 із загальної кількості <math>N</math> відповідності та обчислює гіпотезу <math>(l,R,t)</math> з використанням методу Горна<ref name=":11">{{Cite journal|last=Horn|first=Berthold K. P.|date=1987-04-01|title=Closed-form solution of absolute orientation using unit quaternions|journal=JOSA A|language=EN|volume=4|issue=4|pages=629–642|bibcode=1987JOSAA...4..629H|doi=10.1364/JOSAA.4.000629|issn=1520-8532}}</ref>, потім метод оцінює обмеження в ({{EquationNote|cb.4}}), щоб порахувати, скільки відповідностей фактично збігаються з такою гіпотезою (тобто обчислює залишкову величину<math>\Vert s_i - lRm_i - t \Vert_2^2 / \sigma_i^2</math> та порівнює її з порогом <math>\xi</math> для кожної пари вимірювань). Алгоритм завершується або після того, як він знайшов множину консенсусу з достатньою кількістю відповідностей, або після того, як було досягнуто загальної кількості допустимих ітерацій. RANSAC є високоефективний, оскільки основним обчисленням на кожній ітерації є розв'язання задачі за допомогою методу Горна. Однак RANSAC є недетермінованим та працює добре тільки в режимі низького відсотку викидів (наприклад, менше https://wikimedia.org/api/rest_v1/media/math/render/svg/21af75c495d846b26a303c0d86b135d0488591d0), оскільки його час роботи зростає експоненційно відносно відсотку викидів.<ref name=":0">{{Cite journal|last=Parra Bustos|first=Álvaro|last2=Chin|first2=Tat-Jun|date=December 2018|title=Guaranteed Outlier Removal for Point Cloud Registration with Correspondences|journal=IEEE Transactions on Pattern Analysis and Machine Intelligence|volume=40|issue=12|pages=2868–2882|arxiv=1711.10209|doi=10.1109/TPAMI.2017.2773482|issn=1939-3539|pmid=29990122}}</ref>
=== Жорстке узгодження ===
За допомогою жорсткого узгодження можна отримати {{Нп|Жорстке перетворення|жорстке перетворення|en|Rigid transformation}}, яке відображає одну множину точок нанесену на іншу. Жорстке перетворення визначається як перетворення, яке не змінює відстань між будь-якими двома точками. Зазвичай така трансформація складається з [[паралельне перенесення|паралельного перенесення]] та [[обертання]].<ref name="lmfitzgibbon" /> У рідкісних випадках множина точок також може бути дзеркальною. Найбільшого застосування жорстке узгодження множин точок набує у [[Робототехніка|робототехніці]] та [[комп'ютерний зір|комп'ютерному зорі]].


Для заповнення прогалини між швидким, але неточним методом RANSAC та точним, але вичерпним оптимізаційним методом гілок і меж, останні дослідження розробили детерміновані наближені методи вирішення максимізації консенсусу.<ref name=":1">{{Cite journal|last=Chin|first=Tat-Jun|last2=Suter|first2=David|date=2017-02-27|title=The Maximum Consensus Problem: Recent Algorithmic Advances|journal=Synthesis Lectures on Computer Vision|language=en-US|volume=7|issue=2|pages=1–194|doi=10.2200/s00757ed1v01y201702cov011|issn=2153-1056}}</ref><ref name=":2">{{Cite journal|last=Wen|first=Fei|last2=Ying|first2=Rendong|last3=Gong|first3=Zheng|last4=Liu|first4=Peilin|date=February 2020|title=Efficient Algorithms for Maximum Consensus Robust Fitting|journal=IEEE Transactions on Robotics|volume=36|issue=1|pages=92–106|doi=10.1109/TRO.2019.2943061|issn=1941-0468}}</ref><ref>{{Cite journal|last=Le|first=Huu Minh|last2=Chin|first2=Tat-Jun|last3=Eriksson|first3=Anders|last4=Do|first4=Thanh-Toan|last5=Suter|first5=David|date=2019|title=Deterministic Approximate Methods for Maximum Consensus Robust Fitting|journal=IEEE Transactions on Pattern Analysis and Machine Intelligence|volume=43|issue=3|pages=842–857|arxiv=1710.10003|doi=10.1109/TPAMI.2019.2939307|issn=1939-3539|pmid=31494545}}</ref><ref name=":3">{{Cite journal|last=Cai|first=Zhipeng|last2=Chin|first2=Tat-Jun|last3=Koltun|first3=Vladlen|date=2019|title=Consensus Maximization Tree Search Revisited|url=http://openaccess.thecvf.com/content_ICCV_2019/html/Cai_Consensus_Maximization_Tree_Search_Revisited_ICCV_2019_paper.html|journal=Proceedings of IEEE International Conference on Computer Vision (ICCV)|pages=1637–1645|arxiv=1908.02021|bibcode=2019arXiv190802021C}}</ref>
=== Нежорстке перетворення ===
За допомогою нежорсткого узгодження можна отримати нежорсткого (нелінійне) узгодження, яке відображає одну множину точок на іншу. Нежорсткі перетворення містять в собі [[Афінне перетворення|афінні перетворення]], такі як {{Нп|Масштабування (у геометрії)|масштабування|en|Scaling (geometry)}} та [[відображення зсуву]]. Однак, у контексті узгодження множини точок нежорстке зазвичай включає нелінійне перетворення. Якщо відомі [[Власні вектори та власні значення|власні вектори]] множини точок, нелінійне перетворення може бути параметризоване власними значеннями<ref name="cpdmyronenko2">{{cite journal
|last1=Myronenko
|first1=Andriy
|last2=Song
|first2=Xubo
|title=Point set registration: Coherent Point drift
|journal=IEEE Transactions on Pattern Analysis and Machine Intelligence
|volume=32
|number=2
|year=2010
|pages=2262–2275
|doi=10.1109/tpami.2010.46
|pmid=20975122
|arxiv=0905.2635
|s2cid=10809031
}}{{ref-en}}</ref>. Нелінійне перетворення також може бути параметризовано за допомогою {{Нп|Тонкі пластинчасті сплайни|тонких пластинних сплайнів|en|Thin plate spline}}<ref name="tpsrpmchui" /><ref name="cpdmyronenko2" />
=== Інші види ===
Деякі підходи до узгодження множин точок використовують алгоритми, які вирішують більш загальну задачу {{Нп|Зіставлення графів|зіставлення графів|en|Graph matching}}. Однак, обчислювальна складність таких методів, як правило, висока, і вони обмежені жорсткими узгодженнями.
[[Point Cloud Library|PCL (Point Cloud Library)]]&nbsp;— це фреймворк з відкритим вихідним кодом для n-вимірної множини точок і обробки 3D-геометрії, що містить кілька алгоритмів узгодження точок.<ref name=PCL-Tutorial>{{cite journal|last1=Holz|first1=Dirk|last2=Ichim |first2= Alexandru E.|last3=Tombari|first3=Federico| last4=Rusu|first4= Radu B.| last5= Behnke |first5=Sven|title= Registration with the Point Cloud Library: A Modular Framework for Aligning in 3-D | journal=IEEE Robotics Automation Magazine|date=2015|volume=22|issue=4|pages=110–124|doi= 10.1109/MRA.2015.2432331|s2cid=2621807|url= https://www.researchgate.net/publication/283198426 }}{{ref-en}}</ref>


==== Видалення викидів ====
== Див. також ==
Методи видалення [[Викид (статистика)|викидів]] спрямовані на попередню обробку набору сильно пошкоджених відповідностей перед оцінкою просторового перетворення. Метою видалення викидів є зменшення кількості викидів, при цьому зберігаючи внутрішні відповідності, щоб оптимізація через перетворення стала легшою та ефективнішою ( ''наприклад,'' RANSAC працює погано, коли відношення викидів вище <math>95\%</math> але працює досить добре, коли коефіцієнт викиду нижче <math>50\%</math> ).
* [[Зіставляння точкових ознак]]
* [[Тріангуляція множини точок]]


Парра Бустос ''та ін.'' запропонували метод під назвою Гарантоване Видалення Викидів (ГВВ), який використовує геометричні обмеження для скорочення відповідностей викидів, гарантуючи збереження внутрішніх відповідностей. <ref name=":0">{{Cite journal|last=Parra Bustos|first=Álvaro|last2=Chin|first2=Tat-Jun|date=December 2018|title=Guaranteed Outlier Removal for Point Cloud Registration with Correspondences|journal=IEEE Transactions on Pattern Analysis and Machine Intelligence|volume=40|issue=12|pages=2868–2882|arxiv=1711.10209|doi=10.1109/TPAMI.2017.2773482|issn=1939-3539|pmid=29990122}}</ref> Встановлено, що метод гарантованого видалення викидів здатний різко зменшити коефіцієнт викидів, що може значно підвищити ефективність максимізації консенсусу за допомогою RANSAC або методу гілок і меж. Янг і Карлоун запропонували побудувати попарні інваріантні вимірювання зсуву та обертання (TRIM) з вихідного набору вимірювань та вбудувати TRIM як ребра [[Теорія графів|графа]], вузлами якого є тривимірні точки. Оскільки внутрішні точки попарно узгоджені з точки зору масштабу, то вони повинні утворювати [[Задача про кліку|кліку]] в межах графа. Таким чином, використовуючи ефективні алгоритми для обчислення [[Задача про кліку|максимальної кліки]] на графі, можна знайти вхідні значення та ефективно виключити [[Викид (статистика)|викиди]]. <ref name=":4">{{Cite journal|last=Yang|first=Heng|last2=Carlone|first2=Luca|date=2019|title=A polynomial-time solution for robust registration with extreme outlier rates|journal=Robotics: Science and Systems|arxiv=1903.08588|doi=10.15607/RSS.2019.XV.003|isbn=978-0-9923747-5-4}}</ref> Метод видалення викидів на основі задачі про кліки також виявився досить корисним у проблемах узгодження множин точок у реальному світі. Подібні ідеї видалення викидів також були запропоновані Парра Бустосом ''та ін.'' .
== Примітки ==
{{reflist}}


== Посилання ==
==== М-оцінка ====
M-оцінка замінює [[метод найменших квадратів]] у ( {{EquationNote|cb.2}} ) стійкою функцією витрат, яка є менш чутливою до викидів. Формально М-оцінка прагне вирішити наступну проблему:{{NumBlk|:|<math> l^\star, R^\star, t^\star = \arg\min_{l>0, R \in \text{SO}(3), t \in \mathbb{R}^3} \sum_{i=1}^N \rho\left( \frac{1}{\sigma_i} \left\Vert s_i - lRm_i - t \right\Vert_2 \right) </math>|{{EquationRef|cb.5}}}}де <math>\rho(\cdot)</math> представляє вибір стійкої функції витрат. Варто звернути увагу, що вибір <math>\rho(x) = x^2</math> відновлює оцінку за методом найменших квадратів у ( {{EquationNote|cb.2}} ). Поширені стійкі функції витрат містять <math>\ell_1</math> - норми втрат, втрати Губера, <ref>{{Cite book
* [http://www.cise.ufl.edu/~anand/students/chui/research.html Reference implementation of thin plate spline robust point matching]
|title=Robust Statistics
* [http://www.cs.cmu.edu/~ytsin/KCReg/ Reference implementation of kernel correlation point set registration]
|last=Huber
* [http://sites.google.com/site/myronenko/research/cpd Reference implementation of coherent point drift]
|first=Peter J.
* [https://github.com/ethz-asl/libpointmatcher Reference implementation of ICP variants]
|last2=Ronchetti
|first2=Elvezio M.
|date=2009-01-29
|series=Wiley Series in Probability and Statistics
|publisher=John Wiley & Sons, Inc.
|location=Hoboken, NJ, USA
|language=en
|doi=10.1002/9780470434697
|isbn=978-0-470-43469-7
}}</ref> втрати Джемана-МакКлюра <ref name=":7">{{Cite journal|last=Zhou|first=Qian-Yi|last2=Park|first2=Jaesik|last3=Koltun|first3=Vladlen|date=2016|editor-last=Leibe|editor-first=Bastian|editor2-last=Matas|editor2-first=Jiri|editor3-last=Sebe|editor3-first=Nicu|editor4-last=Welling|editor4-first=Max|title=Fast Global Registration|journal=Computer Vision – ECCV 2016|series=Lecture Notes in Computer Science|language=en|location=Cham|publisher=Springer International Publishing|volume=9906|pages=766–782|doi=10.1007/978-3-319-46475-6_47|isbn=978-3-319-46475-6}}</ref> і втрати за методом найменших квадратів . <ref name=":6">{{Cite journal|last=Yang|first=Heng|last2=Carlone|first2=Luca|year=2019|title=A Quaternion-based Certifiably Optimal Solution to the Wahba Problem with Outliers|url=http://openaccess.thecvf.com/content_ICCV_2019/papers/Yang_A_Quaternion-Based_Certifiably_Optimal_Solution_to_the_Wahba_Problem_With_ICCV_2019_paper.pdf|journal=Proceedings of the IEEE International Conference on Computer Vision (ICCV)|pages=1665–1674|arxiv=1905.12536|bibcode=2019arXiv190512536Y}}</ref> <ref name=":4">{{Cite journal|last=Yang|first=Heng|last2=Carlone|first2=Luca|date=2019|title=A polynomial-time solution for robust registration with extreme outlier rates|journal=Robotics: Science and Systems|arxiv=1903.08588|doi=10.15607/RSS.2019.XV.003|isbn=978-0-9923747-5-4}}</ref> М-оцінка була однією з загальновживаних парадигм стійкої оцінки в робототехніці та комп’ютерному зорі. <ref>{{Cite journal|last=MacTavish|first=Kirk|last2=Barfoot|first2=Timothy D.|date=2015|title=At all Costs: A Comparison of Robust Cost Functions for Camera Correspondence Outliers|journal=2015 12th Conference on Computer and Robot Vision|pages=62–69|doi=10.1109/CRV.2015.52|isbn=978-1-4799-1986-4}}</ref> <ref>{{Cite journal|last=Bosse|first=Michael|last2=Agamennoni|first2=Gabriel|last3=Gilitschenski|first3=Igor|date=2016|title=Robust Estimation and Applications in Robotics|url=https://ieeexplore.ieee.org/document/8187472|journal=Foundations and Trends in Robotics|publisher=now|volume=4|issue=4|pages=225–269|doi=10.1561/2300000047}}</ref> Оскільки стійкі цільові функції зазвичай не є опуклими ( ''наприклад,'' обрізана відносна квадратична втрата в порівнянні з відносною квадратичною втратою), алгоритми для розв'язання задачі невипуклої оцінки М-шляхом, зазвичай ґрунтуються на [[Оптимізація (математика)|локальній оптимізації]], де спочатку відбувається початкове припущення, а потім застосовуються ітеративні виправлення перетворення, щоб продовжувати зменшувати значення об'єктивної функції. Локальна оптимізація, як правило, працює добре, коли початкове припущення близьке до глобального мінімуму, але вона також має схильність застрягати в локальних мінімумах, якщо якщо надано погану початкову ініціалізацію.


==== Градуйована неопуклість ====
Градуйована неопуклість ([[англ.]] ''Graduated non-convexity'') — це структура загального призначення для розв’язання задач невипуклої оптимізації без ініціалізації. Ця структура досягла успіху в додатках раннього зору та машинного навчання. <ref name=":8">{{Cite journal|last=Black|first=Michael J.|last2=Rangarajan|first2=Anand|date=1996-07-01|title=On the unification of line processes, outlier rejection, and robust statistics with applications in early vision|journal=International Journal of Computer Vision|language=en|volume=19|issue=1|pages=57–91|doi=10.1007/BF00131148|issn=1573-1405}}</ref> <ref name=":9">{{Cite book
|url=https://mitpress.mit.edu/books/visual-reconstruction
|title=Visual reconstruction
|last=Blake
|first=Andrew
|last2=Zisserman
|first2=Andrew
|year=1987
|publisher=The MIT Press
|isbn=9780262524063
}}</ref> Ключова ідея градуйованої неопуклості полягає в тому, щоб вирішити складну неопуклу проблему, починаючи з легкої опуклої задачі. Зокрема, для заданої стійкої функції витрат <math>\rho(\cdot)</math>, можна побудувати допоміжну функцію <math>\rho_{\mu}(\cdot)</math> з гіперпараметром <math>\mu</math>, налаштування якої може поступово збільшувати невипуклість допоміжної функції <math>\rho_{\mu}(\cdot)</math> поки вона не зійдеться до цільової функції <math>\rho(\cdot)</math> . <ref name=":9" /> <ref name=":10">{{Cite journal|last=Yang|first=Heng|last2=Antonante|first2=Pasquale|last3=Tzoumas|first3=Vasileios|last4=Carlone|first4=Luca|date=2020|title=Graduated Non-Convexity for Robust Spatial Perception: From Non-Minimal Solvers to Global Outlier Rejection|journal=IEEE Robotics and Automation Letters|volume=5|issue=2|pages=1127–1134|arxiv=1909.08605|doi=10.1109/LRA.2020.2965893|issn=2377-3774}}</ref> Отже, на кожному рівні гіперпараметра <math>\mu</math>, вирішується наступна оптимізація:{{NumBlk|:|<math> l_{\mu}^\star, R_{\mu}^\star, t_{\mu}^\star = \arg\min_{l>0, R \in \text{SO}(3), t \in \mathbb{R}^3} \sum_{i=1}^N \rho_{\mu}\left( \frac{1}{\sigma_i} \left\Vert s_i - l Rm_i - t \right\Vert_2 \right) </math>|{{EquationRef|cb.6}}}}Блек і Рангараджан довели, що для [[Цільова функція|цільової функції]] кожної оптимізації ( {{EquationNote|cb.6}} ) можна створити двоїстість на суму зважених найменших квадратів і так звану функцію процесу викиду на вагових коефіцієнтах, які визначають достовірність оптимізації в кожній парі вимірювань. <ref name=":8">{{Cite journal|last=Black|first=Michael J.|last2=Rangarajan|first2=Anand|date=1996-07-01|title=On the unification of line processes, outlier rejection, and robust statistics with applications in early vision|journal=International Journal of Computer Vision|language=en|volume=19|issue=1|pages=57–91|doi=10.1007/BF00131148|issn=1573-1405}}</ref> Використовуючи подвійність Блека-Рангараджана та градуйовану неопуклість, спеціально розроблену для функції Джемана-МакКлюра, Чжоу та ін. розробили швидкий глобальний алгоритм узгодження, який є стійким до приблизно 80% викидів у відповідностях. <ref name=":7">{{Cite journal|last=Zhou|first=Qian-Yi|last2=Park|first2=Jaesik|last3=Koltun|first3=Vladlen|date=2016|editor-last=Leibe|editor-first=Bastian|editor2-last=Matas|editor2-first=Jiri|editor3-last=Sebe|editor3-first=Nicu|editor4-last=Welling|editor4-first=Max|title=Fast Global Registration|journal=Computer Vision – ECCV 2016|series=Lecture Notes in Computer Science|language=en|location=Cham|publisher=Springer International Publishing|volume=9906|pages=766–782|doi=10.1007/978-3-319-46475-6_47|isbn=978-3-319-46475-6}}</ref> Нещодавно Янг на ін. показали, що спільне використання градуйованої неопуклості (призначеної для функції Гемана-МакКлура і усіченої функції найменших квадратів) та двоїстості Блека-Рангараджана може призвести до розв’язку загального призначення для стійких проблем узгодження, включаючи узгодження хмари точок та сітки. <ref name=":10">{{Cite journal|last=Yang|first=Heng|last2=Antonante|first2=Pasquale|last3=Tzoumas|first3=Vasileios|last4=Carlone|first4=Luca|date=2020|title=Graduated Non-Convexity for Robust Spatial Perception: From Non-Minimal Solvers to Global Outlier Rejection|journal=IEEE Robotics and Automation Letters|volume=5|issue=2|pages=1127–1134|arxiv=1909.08605|doi=10.1109/LRA.2020.2965893|issn=2377-3774}}</ref>


==== Сертифіковано стійке узгодження ====
{{Перекласти|en|Point set registration}}
Майже жоден із згаданих вище алгоритмів стійкого узгодження (за винятком алгоритму [[Метод гілок і меж|гілок і меж]], який у гіршому випадку працює в експоненційному часі) не має '''гарантій продуктивності''', а це означає, що ці алгоритми можуть повертати абсолютно неправильні оцінки без попередження. Тому ці алгоритми не є найдіними для критично важливих застосувань, таких як самокероване водіння.
{{комп'ютерна графіка-доробити}}


Зовсім недавно Янг та співавтори розробили перший алгоритм стійкого узгодження з гарантією надійності, під назвою ''«Оцінка за методом усічених найменших квадратів і напіввизначеної релаксації»'' ([[англ.]] ''Truncated least squares Estimation And SEmidefinite Relaxation''). Для угодження множини точок TEASER не тільки виводить оцінку перетворення, але й кількісно визначає оптимальність даної оцінки. TEASER використовує наступний оцінювач за методом усічених найменших квадратів:{{NumBlk|:|<math> l^\star, R^\star, t^\star = \arg\min_{l >0, R \in \text{SO}(3), t \in \mathbb{R}^3} \sum_{i=1}^N \min \left( \frac{1}{\sigma_i^2} \left\Vert s_i - l Rm_i - t \right\Vert_2^2, \bar{c}^2 \right) </math>|{{EquationRef|cb.7}}}}який отримується шляхом вибору усічених найменших квандратів (УНК) надійної функції витрат <math>\rho(x) = \min (x^2, \bar{c}^2)</math>, де <math>\bar{c}^2</math> є заздалегідь визначеною константою, яка визначає максимально дозволені залишки, які вважаються внутрішніми. Цільова функція УНК має таку властивість, яка визначає, що для внутрішніх відповідностей ( <math>\Vert s_i - l Rm_i - t \Vert_2^2 / \sigma_i^2 < \bar{c}^2</math> ), застосовується звичайний [[метод штрафів]] найменших квадратів; у той час як для відповідностей викидів ( <math>\Vert s_i - l Rm_i - t \Vert_2^2 / \sigma_i^2 > \bar{c}^2</math> ), цей штраф не застосовується, а викиди відхиляються. Якщо опьтмізація УНК ( {{EquationNote|cb.7}} ) розв'язується з глобальною оптимальністю, то вона еквівалентна методу Хорна лише для внутрішніх відповідностей.
[[Категорія:Комп'ютерний зір]]

Однак, розв’язання ( {{EquationNote|cb.7}} ) є досить складним через його комбінаторний характер. TEASER розв'язує ( {{EquationNote|cb.7}} ) наступним чином:

(i) Він створює інваріантні вимірювання таким чином, що оцінка масштабу, обертання та перетворення можуть бути відокремлені та розв’язана окремо. Ця стратегія, натхненна оригінальним методом Горна.

(ii) Та ж оцінка усічених найменших квадратів (далі - ''УНК)'' застосовується для кожної з трьох підзадач, де задача УНК масштабу може бути розв'язана за допомогою алгоритму, що називається адаптивним голосуванням. Задача обертання УНК можна послабити до напіввизначеної програми, де релаксація є точною на практиці, <ref name=":6">{{Cite journal|last=Yang|first=Heng|last2=Carlone|first2=Luca|year=2019|title=A Quaternion-based Certifiably Optimal Solution to the Wahba Problem with Outliers|url=http://openaccess.thecvf.com/content_ICCV_2019/papers/Yang_A_Quaternion-Based_Certifiably_Optimal_Solution_to_the_Wahba_Problem_With_ICCV_2019_paper.pdf|journal=Proceedings of the IEEE International Conference on Computer Vision (ICCV)|pages=1665–1674|arxiv=1905.12536|bibcode=2019arXiv190512536Y}}</ref> навіть із великою кількістю викидів. Задачу зсуву УНК можна вирішити використовуючи покомпонентне адаптивне голосування. Швидке впровадження, що використовує градуйовану неопуклість, є [https://github.com/MIT-SPARK/TEASER-plusplus код щ відкритим доступом тут] . На практиці оцінка за методом усічених квадратів і напіввизначенох релаксації може витримати більше ніж <math>99\%</math> викидів відповідності і виконуватись за мілісекунди.

На додаток до розробки оцінки за методом усічених квадратів і напіввизначенох релаксації, Янг та співавтори. також довели, що за деяких слабких умов на заданій множині точок, оцінка перетворення усічених квадратів і напіввизначенох релаксації має обмежені похибки в порівнянні із справжнім перетворенням. <ref name=":5">{{Cite arXiv}}</ref>
[[Категорія:Зіставляння із взірцем]]
[[Категорія:Зіставляння із взірцем]]
[[Категорія:Робототехніка]]
[[Категорія:Робототехніка]]
[[Категорія:Комп'ютерний зір]]

Версія за 14:48, 15 травня 2023

Узгодження на основі відповідностей

Методи на основі відповідностей припускають, що можливі відповідності надаються задані для кожної точки . Таким чином, отримуємо ситуацію, де обидві множини точок і мають точок, а - це задані відповідності.

Узгодження без викидів

У найпростішому випадку можна припустити, що всі відповідності є правильними, тобто точки генеруються таким чином:

 

 

 

 

(cb.1)

де є сталим коефіцієнтом масштабування (у багатьох випадках ), є правильною 3D матрицею обертання ( є спеціальною ортогональною групою степеня ), є вектором паралельного перенесення та моделює невідомий адитивний шум ( наприклад, шум Гауса ). Зокрема, якщо припустити, що шум має нульове середнє значення та ізотропний гаусівський розподіл зі стандартним відхиленням стандартним відхиленням , тобто , то оптимізація для отримання оцінки максимальної правдоподібності для невідомого масштабу, обертання та трансляції матиме наступний вигляд:

 

 

 

 

(cb.2)

Зауважимо, що коли коефіцієнт масштабування дорівнює 1, а вектор паралельного перенесення дорівнює нулю, тоді оптимізація відновлює формулювання проблеми Вахби. Незважаючи на неопуклість оптимізації ( cb.2 ) через неопуклість множини основоположна робота Бертольда К. П. Хорна показала, що ( cb.2 ) фактично має розв'язок у вигляді замкнутої формули, шляхом розділення оцінки масштабу, повороту та паралельного перенесення. [1] Подібні результати були виявлені Аруном та ін . [2] Крім того, щоб знайти унікальне перетворення , для кожної множини точок потрібно як мінімум неколінеарні точки.

Зовсім нещодавно Бріалес і Гонсалес-Хіменес розробили напіввизначену релаксацію, використовуючи двоїстість Лагранжа, для випадку, коли множина моделей містить різні 3D-примітиви, такі як точки, лінії та площини (в тому випадку, коли модель є 3D-сіткою). [3] Цікаво, що напіввизначена релаксація є емпірично жорсткою, тобто з розв’язку напіввизначеної релаксації можна отримати глобально оптимальний розв’язок.

Стійке узгодження

Відомо, що формулювання методу найменших квадратів ( cb.2 ) може працювати з низькою ефективністю за наявності викидів . Відповідність викидів – це пара вимірювань що відхиляється від породжувальної моделі ( cb.1 ). У цьому випадку можна розглянути іншу породжувальну модель так:

 

 

 

 

(cb.3)

де якщо та пара входить до множини вхідних даних, то вона відповідає моделі без випадкових помилок ( cb.1 ), тобто отримується з шляхом просторового перетворення і додавання невеликого шуму. Однак, якщо та пара є викидом, то вектор може бути будь-яким довільним вектором . Оскільки заздалегідь невідомо, які відповідності є викидами, стійке узгодження за породжувальною моделлю ( cb.3 ) є назвичайно важливим для комп’ютерного зору та робототехніки, бо поточні методи зіставлення функцій мають тенденцію виводити сильно спотворені відповідності, де понад відповідностей можуть бути викидами. [4]

Далі опишемо кілька поширених парадигм стійкого узгодження.

Максимальний консенсус

Максимальний консенсус прагне знайти найбільшу множину відповідностей, яка узгоджуюється з породжувальною моделлю ( cb.1 ) для певного вибору просторового перетворення . Формально, максимальний консенсус вирішує наступну оптимізацію:

 

 

 

 

(cb.4)

де позначає потужність множини . Обмеження у формулі (cb.4) забезпечують те, що кожна пара вимірювань у множині відповідних точок , що задовольняють моделі без викидів, має менший залишок , ніж заданий поріг . На жаль, нещодавні дослідження показали, що глобальне розв'язання проблеми (cb.4) є NP-складною задачею, і глобальні алгоритми, як правило, мають використовувати метод гілок і меж, який має експоненційну складність у найгіршому випадку.[5][6][7][8][9]

Хоча розв'язання задачі максимального консенсусу є складним, існують ефективні евристики, які досить добре працюють на практиці. Однією з найпоширеніших евристикою є метод[10]. RANSAC - це ітеративний метод гіпотези та перевірки. На кожному кроці ітерації метод спочатку випадково вибирає 3 із загальної кількості відповідності та обчислює гіпотезу з використанням методу Горна[1], потім метод оцінює обмеження в (cb.4), щоб порахувати, скільки відповідностей фактично збігаються з такою гіпотезою (тобто обчислює залишкову величину та порівнює її з порогом для кожної пари вимірювань). Алгоритм завершується або після того, як він знайшов множину консенсусу з достатньою кількістю відповідностей, або після того, як було досягнуто загальної кількості допустимих ітерацій. RANSAC є високоефективний, оскільки основним обчисленням на кожній ітерації є розв'язання задачі за допомогою методу Горна. Однак RANSAC є недетермінованим та працює добре тільки в режимі низького відсотку викидів (наприклад, менше https://wikimedia.org/api/rest_v1/media/math/render/svg/21af75c495d846b26a303c0d86b135d0488591d0), оскільки його час роботи зростає експоненційно відносно відсотку викидів.[4]

Для заповнення прогалини між швидким, але неточним методом RANSAC та точним, але вичерпним оптимізаційним методом гілок і меж, останні дослідження розробили детерміновані наближені методи вирішення максимізації консенсусу.[5][6][11][7]

Видалення викидів

Методи видалення викидів спрямовані на попередню обробку набору сильно пошкоджених відповідностей перед оцінкою просторового перетворення. Метою видалення викидів є зменшення кількості викидів, при цьому зберігаючи внутрішні відповідності, щоб оптимізація через перетворення стала легшою та ефективнішою ( наприклад, RANSAC працює погано, коли відношення викидів вище але працює досить добре, коли коефіцієнт викиду нижче ).

Парра Бустос та ін. запропонували метод під назвою Гарантоване Видалення Викидів (ГВВ), який використовує геометричні обмеження для скорочення відповідностей викидів, гарантуючи збереження внутрішніх відповідностей. [4] Встановлено, що метод гарантованого видалення викидів здатний різко зменшити коефіцієнт викидів, що може значно підвищити ефективність максимізації консенсусу за допомогою RANSAC або методу гілок і меж. Янг і Карлоун запропонували побудувати попарні інваріантні вимірювання зсуву та обертання (TRIM) з вихідного набору вимірювань та вбудувати TRIM як ребра графа, вузлами якого є тривимірні точки. Оскільки внутрішні точки попарно узгоджені з точки зору масштабу, то вони повинні утворювати кліку в межах графа. Таким чином, використовуючи ефективні алгоритми для обчислення максимальної кліки на графі, можна знайти вхідні значення та ефективно виключити викиди. [12] Метод видалення викидів на основі задачі про кліки також виявився досить корисним у проблемах узгодження множин точок у реальному світі. Подібні ідеї видалення викидів також були запропоновані Парра Бустосом та ін. .

М-оцінка

M-оцінка замінює метод найменших квадратів у ( cb.2 ) стійкою функцією витрат, яка є менш чутливою до викидів. Формально М-оцінка прагне вирішити наступну проблему:

 

 

 

 

(cb.5)

де представляє вибір стійкої функції витрат. Варто звернути увагу, що вибір відновлює оцінку за методом найменших квадратів у ( cb.2 ). Поширені стійкі функції витрат містять - норми втрат, втрати Губера, [13] втрати Джемана-МакКлюра [14] і втрати за методом найменших квадратів . [15] [12] М-оцінка була однією з загальновживаних парадигм стійкої оцінки в робототехніці та комп’ютерному зорі. [16] [17] Оскільки стійкі цільові функції зазвичай не є опуклими ( наприклад, обрізана відносна квадратична втрата в порівнянні з відносною квадратичною втратою), алгоритми для розв'язання задачі невипуклої оцінки М-шляхом, зазвичай ґрунтуються на локальній оптимізації, де спочатку відбувається початкове припущення, а потім застосовуються ітеративні виправлення перетворення, щоб продовжувати зменшувати значення об'єктивної функції. Локальна оптимізація, як правило, працює добре, коли початкове припущення близьке до глобального мінімуму, але вона також має схильність застрягати в локальних мінімумах, якщо якщо надано погану початкову ініціалізацію.

Градуйована неопуклість

Градуйована неопуклість (англ. Graduated non-convexity) — це структура загального призначення для розв’язання задач невипуклої оптимізації без ініціалізації. Ця структура досягла успіху в додатках раннього зору та машинного навчання. [18] [19] Ключова ідея градуйованої неопуклості полягає в тому, щоб вирішити складну неопуклу проблему, починаючи з легкої опуклої задачі. Зокрема, для заданої стійкої функції витрат , можна побудувати допоміжну функцію з гіперпараметром , налаштування якої може поступово збільшувати невипуклість допоміжної функції поки вона не зійдеться до цільової функції . [19] [20] Отже, на кожному рівні гіперпараметра , вирішується наступна оптимізація:

 

 

 

 

(cb.6)

Блек і Рангараджан довели, що для цільової функції кожної оптимізації ( cb.6 ) можна створити двоїстість на суму зважених найменших квадратів і так звану функцію процесу викиду на вагових коефіцієнтах, які визначають достовірність оптимізації в кожній парі вимірювань. [18] Використовуючи подвійність Блека-Рангараджана та градуйовану неопуклість, спеціально розроблену для функції Джемана-МакКлюра, Чжоу та ін. розробили швидкий глобальний алгоритм узгодження, який є стійким до приблизно 80% викидів у відповідностях. [14] Нещодавно Янг на ін. показали, що спільне використання градуйованої неопуклості (призначеної для функції Гемана-МакКлура і усіченої функції найменших квадратів) та двоїстості Блека-Рангараджана може призвести до розв’язку загального призначення для стійких проблем узгодження, включаючи узгодження хмари точок та сітки. [20]

Сертифіковано стійке узгодження

Майже жоден із згаданих вище алгоритмів стійкого узгодження (за винятком алгоритму гілок і меж, який у гіршому випадку працює в експоненційному часі) не має гарантій продуктивності, а це означає, що ці алгоритми можуть повертати абсолютно неправильні оцінки без попередження. Тому ці алгоритми не є найдіними для критично важливих застосувань, таких як самокероване водіння.

Зовсім недавно Янг та співавтори розробили перший алгоритм стійкого узгодження з гарантією надійності, під назвою «Оцінка за методом усічених найменших квадратів і напіввизначеної релаксації» (англ. Truncated least squares Estimation And SEmidefinite Relaxation). Для угодження множини точок TEASER не тільки виводить оцінку перетворення, але й кількісно визначає оптимальність даної оцінки. TEASER використовує наступний оцінювач за методом усічених найменших квадратів:

 

 

 

 

(cb.7)

який отримується шляхом вибору усічених найменших квандратів (УНК) надійної функції витрат , де є заздалегідь визначеною константою, яка визначає максимально дозволені залишки, які вважаються внутрішніми. Цільова функція УНК має таку властивість, яка визначає, що для внутрішніх відповідностей ( ), застосовується звичайний метод штрафів найменших квадратів; у той час як для відповідностей викидів ( ), цей штраф не застосовується, а викиди відхиляються. Якщо опьтмізація УНК ( cb.7 ) розв'язується з глобальною оптимальністю, то вона еквівалентна методу Хорна лише для внутрішніх відповідностей.

Однак, розв’язання ( cb.7 ) є досить складним через його комбінаторний характер. TEASER розв'язує ( cb.7 ) наступним чином:

(i) Він створює інваріантні вимірювання таким чином, що оцінка масштабу, обертання та перетворення можуть бути відокремлені та розв’язана окремо. Ця стратегія, натхненна оригінальним методом Горна.

(ii) Та ж оцінка усічених найменших квадратів (далі - УНК) застосовується для кожної з трьох підзадач, де задача УНК масштабу може бути розв'язана за допомогою алгоритму, що називається адаптивним голосуванням. Задача обертання УНК можна послабити до напіввизначеної програми, де релаксація є точною на практиці, [15] навіть із великою кількістю викидів. Задачу зсуву УНК можна вирішити використовуючи покомпонентне адаптивне голосування. Швидке впровадження, що використовує градуйовану неопуклість, є код щ відкритим доступом тут . На практиці оцінка за методом усічених квадратів і напіввизначенох релаксації може витримати більше ніж викидів відповідності і виконуватись за мілісекунди.

На додаток до розробки оцінки за методом усічених квадратів і напіввизначенох релаксації, Янг та співавтори. також довели, що за деяких слабких умов на заданій множині точок, оцінка перетворення усічених квадратів і напіввизначенох релаксації має обмежені похибки в порівнянні із справжнім перетворенням. [21]

  1. а б Horn, Berthold K. P. (1 квітня 1987). Closed-form solution of absolute orientation using unit quaternions. JOSA A (EN) . 4 (4): 629—642. Bibcode:1987JOSAA...4..629H. doi:10.1364/JOSAA.4.000629. ISSN 1520-8532.
  2. Arun, K. S.; Huang, T. S.; Blostein, S. D. (September 1987). Least-Squares Fitting of Two 3-D Point Sets. IEEE Transactions on Pattern Analysis and Machine Intelligence. PAMI-9 (5): 698—700. doi:10.1109/TPAMI.1987.4767965. ISSN 1939-3539. PMID 21869429.
  3. Briales, Jesus; Gonzalez-Jimenez, Javier (July 2017). Convex Global 3D Registration with Lagrangian Duality. 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR): 5612—5621. doi:10.1109/CVPR.2017.595. ISBN 978-1-5386-0457-1. {{cite journal}}: |hdl-access= вимагає |hdl= (довідка)
  4. а б в Parra Bustos, Álvaro; Chin, Tat-Jun (December 2018). Guaranteed Outlier Removal for Point Cloud Registration with Correspondences. IEEE Transactions on Pattern Analysis and Machine Intelligence. 40 (12): 2868—2882. arXiv:1711.10209. doi:10.1109/TPAMI.2017.2773482. ISSN 1939-3539. PMID 29990122.
  5. а б Chin, Tat-Jun; Suter, David (27 лютого 2017). The Maximum Consensus Problem: Recent Algorithmic Advances. Synthesis Lectures on Computer Vision (амер.). 7 (2): 1—194. doi:10.2200/s00757ed1v01y201702cov011. ISSN 2153-1056.
  6. а б Wen, Fei; Ying, Rendong; Gong, Zheng; Liu, Peilin (February 2020). Efficient Algorithms for Maximum Consensus Robust Fitting. IEEE Transactions on Robotics. 36 (1): 92—106. doi:10.1109/TRO.2019.2943061. ISSN 1941-0468.
  7. а б Cai, Zhipeng; Chin, Tat-Jun; Koltun, Vladlen (2019). Consensus Maximization Tree Search Revisited. Proceedings of IEEE International Conference on Computer Vision (ICCV): 1637—1645. arXiv:1908.02021. Bibcode:2019arXiv190802021C.
  8. Bazin, Jean-Charles; Seo, Yongduek; Pollefeys, Marc (2013). Lee, Kyoung Mu; Matsushita, Yasuyuki; Rehg, James M.; Hu, Zhanyi (ред.). Globally Optimal Consensus Set Maximization through Rotation Search. Computer Vision – ACCV 2012. Lecture Notes in Computer Science (англ.). Berlin, Heidelberg: Springer. 7725: 539—551. doi:10.1007/978-3-642-37444-9_42. ISBN 978-3-642-37444-9.
  9. Hartley, Richard I.; Kahl, Fredrik (1 квітня 2009). Global Optimization through Rotation Space Search. International Journal of Computer Vision (англ.). 82 (1): 64—79. doi:10.1007/s11263-008-0186-9. ISSN 1573-1405. {{cite journal}}: |hdl-access= вимагає |hdl= (довідка)
  10. Fischler, Martin; Bolles, Robert (1981). Random sample consensus: a paradigm for model fitting with applications to image analysis and automated cartography. Communications of the ACM (EN) . 24 (6): 381—395. doi:10.1145/358669.358692. S2CID 972888.
  11. Le, Huu Minh; Chin, Tat-Jun; Eriksson, Anders; Do, Thanh-Toan; Suter, David (2019). Deterministic Approximate Methods for Maximum Consensus Robust Fitting. IEEE Transactions on Pattern Analysis and Machine Intelligence. 43 (3): 842—857. arXiv:1710.10003. doi:10.1109/TPAMI.2019.2939307. ISSN 1939-3539. PMID 31494545.
  12. а б Yang, Heng; Carlone, Luca (2019). A polynomial-time solution for robust registration with extreme outlier rates. Robotics: Science and Systems. arXiv:1903.08588. doi:10.15607/RSS.2019.XV.003. ISBN 978-0-9923747-5-4.
  13. Huber, Peter J.; Ronchetti, Elvezio M. (29 січня 2009). Robust Statistics. Wiley Series in Probability and Statistics (англ.). Hoboken, NJ, USA: John Wiley & Sons, Inc. doi:10.1002/9780470434697. ISBN 978-0-470-43469-7.
  14. а б Zhou, Qian-Yi; Park, Jaesik; Koltun, Vladlen (2016). Leibe, Bastian; Matas, Jiri; Sebe, Nicu; Welling, Max (ред.). Fast Global Registration. Computer Vision – ECCV 2016. Lecture Notes in Computer Science (англ.). Cham: Springer International Publishing. 9906: 766—782. doi:10.1007/978-3-319-46475-6_47. ISBN 978-3-319-46475-6.
  15. а б Yang, Heng; Carlone, Luca (2019). A Quaternion-based Certifiably Optimal Solution to the Wahba Problem with Outliers (PDF). Proceedings of the IEEE International Conference on Computer Vision (ICCV): 1665—1674. arXiv:1905.12536. Bibcode:2019arXiv190512536Y.
  16. MacTavish, Kirk; Barfoot, Timothy D. (2015). At all Costs: A Comparison of Robust Cost Functions for Camera Correspondence Outliers. 2015 12th Conference on Computer and Robot Vision: 62—69. doi:10.1109/CRV.2015.52. ISBN 978-1-4799-1986-4.
  17. Bosse, Michael; Agamennoni, Gabriel; Gilitschenski, Igor (2016). Robust Estimation and Applications in Robotics. Foundations and Trends in Robotics. now. 4 (4): 225—269. doi:10.1561/2300000047.
  18. а б Black, Michael J.; Rangarajan, Anand (1 липня 1996). On the unification of line processes, outlier rejection, and robust statistics with applications in early vision. International Journal of Computer Vision (англ.). 19 (1): 57—91. doi:10.1007/BF00131148. ISSN 1573-1405.
  19. а б Blake, Andrew; Zisserman, Andrew (1987). Visual reconstruction. The MIT Press. ISBN 9780262524063.
  20. а б Yang, Heng; Antonante, Pasquale; Tzoumas, Vasileios; Carlone, Luca (2020). Graduated Non-Convexity for Robust Spatial Perception: From Non-Minimal Solvers to Global Outlier Rejection. IEEE Robotics and Automation Letters. 5 (2): 1127—1134. arXiv:1909.08605. doi:10.1109/LRA.2020.2965893. ISSN 2377-3774.
  21. Заповніть пропущені параметри: назву і/або авторів. arXiv:[1].