Істотна матриця

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

У комп'ютерному зорі істотною матрицею є a матриця що пов'язує відповідні точки на стереозображеннях, припускаючи, що камери задовольняють моделі камери обскури.

Функція[ред. | ред. код]

Більш конкретно, якщо і є однорідними нормалізованими координатами зображення на зображеннях 1 та 2 відповідно, тоді

якщо і відповідають одній і тій же 3D точці на сцені.

Вищезазначене співвідношення, яке визначає істотну матрицю, було опубліковане у 1981 р. Х. Крістофером Лонге-Хіггінсом. У книзіі Лонгє-Хіггінса наводиться алгоритм оцінки з набору відповідних нормалізованих координат зображення, а також алгоритм визначення відносного положення та орієнтації двох камер за відомою . Нарешті, показано, як за допомогою істотної матриці можна визначити 3D-координати точок зображення.

Використання[ред. | ред. код]

Істотну матрицю можна розглядати як попередник фундаментальної матриці . Обидві матриці можна використовувати для встановлення звʼязку між відповідними точками зображень, але істотну матрицю можна використовувати лише щодо каліброваних камер, оскільки внутрішні параметри камери повинні бути відомі для досягнення нормалізації. Однак, якщо камери відкалібровані, істотна матриця може бути корисною для визначення як відносного положення, так і орієнтації між камерами та положення 3D відповідних точок зображення.

Виведення та визначення[ред. | ред. код]

Виведення згідно роботі Лонгет-Гіггінса.

Дві нормалізовані камери проектують 3D-світ на свої відповідні площини зображення. Позначимо 3D координати точки Р у системах координат кожної камери як і . Оскільки камери нормалізовані, відповідні координати зображення

 і 

Тоді однорідні координати можна записати як

 і 

або більш компактно

 і 

де і є однорідними 2D координатами зображення, а і тривимірні координати в двох різних системах координат.

Ще однією властивістю нормалізованих камер є те, що їх відповідні системи координат пов'язані за допомогою зсуву та обертання. Це означає, що два набори тривимірних координат пов'язані як

де є матрицею повороту і є тривимірним вектором зсуву.

Тоді істотна матриця визначається як:

де є матричним записом векторного добутку з .

Щоб продемонструвати, що це визначення істотної матриці описує звʼязок відповідних координат зображення помножимо зліва та зправа на 3D-координати точки P у двох різних системах координат:

  1. Використано наведене вище співвідношення між і та визначення через і .
  2. оскільки матриця обертання є ортогональною матрицею.
  3. Властивість матричного запису векторного добутку .

Нарешті, можна припустити, що обидва і > 0, інакше їх не видно в обох камерах. Це дає

що є звʼязком між відповідними точками зображення, який визначає істотна матриця.

Властивості[ред. | ред. код]

Результатом множення істотної матриці на ненульовий скаляр, є істотна матриця, яка визначає точно такий же звʼязок, як і . Це означає що можна розглядати як елемент проективного простору, тобто дві такі матриці вважаються еквівалентними, якщо одна є ненульовим скалярним множенням іншої. Це є важливою властивістю, якщо визначається за даними зображень. Однак можна також визначити як

де , і тоді задає чітко визначене масштабування. На практиці реалізації алгоритмів можуть використовувати обидві форми.

Звʼязок також може бути виражений як

і

Тут останнє рівняння є обмеженням матриці, яке можна розглядати як 9 обмежень, по одному для кожного елемента матриці. Ці обмеження часто використовуються для визначення суттєвої матриці з п'яти відповідних пар точок.

Істотна матриця має п’ять-шість ступенів вільності, залежно від того, розглядається вона як проективний елемент чи ні. Матриця обертання і вектор зсуву мають три ступені вільності кожен а загалом їх шість. Якщо суттєву матрицю розглядати як проективний елемент потрібно відняти один ступінь свободи, пов'язану зі скалярним множенням, залишаючи в цілому п'ять ступенів свободи.

Оцінка[ред. | ред. код]

Враховуючи набір відповідних точок зображення, можна оцінити істотну матрицю, яка задовольняє визначальному епіполярному обмеженню для всіх точок набору. Однак, якщо точки зображення зашумлені, що є типовим випадком у будь-якій практичній ситуації, неможливо знайти істотну матрицю, яка б точно задовольняла всім обмеження.

Залежно від того, як враховується похибка, пов'язана з кожним обмеженням, можна визначити або оцінити істотну матрицю, яка оптимально задовольняє всім обмеженням для даного набору відповідних точок зображення. Найпростіший підхід полягає в постановці загальної задачі найменших квадратів, широко відомої як восьмиточковий алгоритм .

Визначення повороту та зсуву з істотної матриці[ред. | ред. код]

Враховуючи, що істотна матриця була визначена для пари стереокамер - наприклад, за допомогою методу оцінки наведеного вище - ця матриця може бути використана для визначення повороту та зсув між системами координат цих двох камер. У цьому частинному випадку розглядається як проективний елемент, та не визначає масштаб.

Знаходження першого роз'язку[ред. | ред. код]

Наведений нижче спосіб знаходження матриці повороту та вектора зсуву засновано на виконанні сингулярного розкладу т. Також можливо визначити та без використання сингулярного розкладу.

Сингулярний розклад дає

де та отрогональні матриці та є діагональною матрицею з елементами

Діагональні елементи є сингулярними значеннями які, згідно до властивостей істотної матриці повинні містити два однакових і одне нульове значення. Позначимо

  для неї  

і зробимо наступний анзац

Оскільки може не повністю задовольняти всім обмеженням при роботі з реальними даними, може допомогти альтернатива

  де  

Пошук усіх розв'язків[ред. | ред. код]

Знайдений можливий розв'язок для та для матриці не є єдиним, він може виятивися навіть недійсним із урахуванням реального розташування камер.

Для існує два протилежних напрямки для , и два різних обертання (яким відповідає та , що сумісні із даною істотною матрицею. Всього це дає чотири розв'язки для зсуву та повороту між системами координат двох камер. Однак на праткиці три розв'язки завжди відповідають тривимірній точці, що знаходиться позаду хоча б однієї з камер і тому не може бути видима. Тільки один з чотирьох розв'язків відповідає точкам, що знаходятся попереду обох камер і лише цей розв'язок є вірним.

Знаходження 3D-точок з відповідних точок зображення[ред. | ред. код]

Існує багато методів обчислень за відповідними нормованими координатами зображення і , якщо істотна матриця відома і були визначені відповідні перетворення обертання та паралельного переносу камери.

Дивитися також[ред. | ред. код]

Інструменти[ред. | ред. код]

Перелік джерел[ред. | ред. код]

  • David Nistér (June 2004). An efficient solution to the five-point relative pose problem. IEEE Transactions on Pattern Analysis and Machine Intelligence. 26 (6): 756—777. doi:10.1109/TPAMI.2004.17. PMID 18579936.
  • H. Stewénius and C. Engels and D. Nistér (June 2006). Recent Developments on Direct Relative Orientation. ISPRS Journal of Photogrammetry and Remote Sensing. 60 (4): 284—294. Bibcode:2006JPRS...60..284S. CiteSeerX 10.1.1.61.9329. doi:10.1016/j.isprsjprs.2006.03.005.
  • H. Christopher Longuet-Higgins (September 1981). A computer algorithm for reconstructing a scene from two projections. Nature. 293 (5828): 133—135. Bibcode:1981Natur.293..133L. doi:10.1038/293133a0.
  • Richard Hartley and Andrew Zisserman (2003). Multiple View Geometry in computer vision. Cambridge University Press. ISBN 978-0-521-54051-3.
  • Yi Ma; Stefano Soatto; Jana Košecká; S. Shankar Sastry (2004). An Invitation to 3-D Vision. Springer. ISBN 978-0-387-00893-6.
  • Gang Xu and Zhengyou Zhang (1996). Epipolar geometry in Stereo, Motion and Object Recognition. Kluwer Academic Publishers. ISBN 978-0-7923-4199-4.