Оптичний потік: відмінності між версіями

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
[неперевірена версія][перевірена версія]
Вилучено вміст Додано вміст
+машинний переклад, +перекласти, +перекладаю
замінено перекладом «Optical flow»
Мітка: Посилання на сторінки неоднозначності
Рядок 1: Рядок 1:
[[Файл:Opticfloweg uk.png|thumb|right|400px|Оптичний потік, який сприймається спостерігачем, що обертається (в даному прикладі мухою).
{{Машинний переклад|дата=листопад 2021}}
Напрямок та величина оптичного потоку в кожній позиції подано стрілками відповідного напрямку і довжини.]]
{{Перекласти|en|Optical flow|дата=листопад 2021}}
{{Перекладаю}}


'''Опти́чний поті́к''' ({{lang-en|optical flow, optic flow}})&nbsp;— це схема видимого [[Рух (механіка)|руху]] об'єктів, поверхонь і граней у зоровій сцені, спричинюваного {{нп|Відносний рух|відносним рухом||Relative motion}} спостерігача та сцени.<ref>{{Cite book |url={{google books|plainurl=yes|id=CSgOAAAAQAAJ|pg=PA77|text=optical flow}} |title=Thinking in Perspective: Critical Essays in the Study of Thought Processes |last1=Burton |first1=Andrew |last2=Radford |first2=John |publisher=Routledge |year=1978 |isbn=978-0-416-85840-2}} {{ref-en}}</ref><ref>{{Cite book |url={{google books|plainurl=yes|id=-I_Hazgqx8QC|pg=PA414|text=optical flow}} |title=Electronic Spatial Sensing for the Blind: Contributions from Perception |last1=Warren |first1=David H. |last2=Strelow |first2=Edward R. |publisher=Springer |year=1985 |isbn=978-90-247-2689-9}} {{ref-en}}</ref> Оптичний потік також можливо визначити як розподіл видимих швидкостей руху візерунку яскравості в зображенні.<ref>{{Cite journal |last1=Horn |first1=Berthold K.P. |last2=Schunck |first2=Brian G. |date=August 1981 |title=Determining optical flow |url=http://image.diku.dk/imagecanon/material/HornSchunckOptical_Flow.pdf |journal=Artificial Intelligence |language=en |volume=17 |issue=1–3 |pages=185–203 |doi=10.1016/0004-3702(81)90024-2|hdl=1721.1/6337 }} {{ref-en}}</ref> Поняття оптичного потоку було запроваджено американським психологом {{нп|Джеймс Дж. Ґібсон|Джеймсом Дж. Ґібсоном||James J. Gibson}} у 1940-х роках для опису зорових стимулів, що виникають у тварин, які рухаються світом.<ref>{{Cite book |title=The Perception of the Visual World |last=Gibson |first=J.J. |publisher=Houghton Mifflin |year=1950}} {{ref-en}}</ref> Джеймс Ґібсон наголосив на важливості оптичного потоку для {{нп|Можливості|сприймання можливостей||Affordance}}, здатності розрізнювати можливості для дій у середовищі. Послідовники Ґібсона та його [[Екологічна психологія|екологічного підходу до психології]] згодом показати роль стимулу оптичного потоку для сприймання руху спостерігачем у світі; сприймання форми, відстані й руху об'єктів у світі; та контролю пересування.<ref>{{Cite journal |last1=Royden |first1=C. S. |last2=Moore |first2=K. D. |year=2012 |title=Use of speed cues in the detection of moving objects by moving observers |journal=Vision Research |volume=59 |pages=17–24 |doi=10.1016/j.visres.2012.02.006|pmid=22406544 |s2cid=52847487 }} {{ref-en}}</ref>
[[Файл:Opticfloweg.png|thumb|right|400px|Оптичний потік, який сприймається спостерігачем, що обертається (в даному прикладі мухою).
Напрямок та величина оптичного потоку в кожній позиції представлено стрілками відповідного напрямку і довжини.]]


Термін «оптичний потік» також використовують робототехніки, охоплюючи споріднені методики з обробки зображень та керування навігацією, включно з [[Виявляння руху|виявлянням руху]], [[Сегментування зображень|сегментуванням об'єктів]], інформацією про час до контакту, обчисленнями фокусу розширення, освітленістю, кодуванням [[Компенсація руху|компенсації руху]], та вимірюванням стереодиспаритету.<ref name="Kelson R. T. Aires, Andre M. Santana, Adelardo A. D. Medeiros 2008">{{Cite book |url=http://www.dca.ufrn.br/~adelardo/artigos/SAC08.pdf |title=Optical Flow Using Color Information |last1=Aires |first1=Kelson R. T. |last2=Santana |first2=Andre M. |last3=Medeiros |first3=Adelardo A. D. |publisher=ACM New York, NY, USA |year=2008 |isbn=978-1-59593-753-7}} {{ref-en}}</ref><ref name="S. S. Beauchemin , J. L. Barron 1995">{{Cite journal |url=http://portal.acm.org/ft_gateway.cfm?id=212141&type=pdf&coll=GUIDE&dl=GUIDE&CFID=72158298&CFTOKEN=85078203 |title=The computation of optical flow |last1=Beauchemin |first1=S. S. |last2=Barron |first2=J. L. |journal=ACM Computing Surveys |publisher=ACM New York, USA |year=1995|volume=27 |issue=3 |pages=433–466 |doi=10.1145/212094.212141 |s2cid=1334552 }} {{ref-en}}</ref>
'''Оптичний потік'''&nbsp;— це представлення видимого сліду [[Рух (механіка)|руху]] об'єктів, поверхонь, і граней візуальної сцени, що спостерігається під час відносного руху між спостерігачем
(наприклад, [[human eye|око людини]] або [[камера]]) і сцени.<ref>{{cite book | title = Thinking in Perspective: Critical Essays in the Study of Thought Processes | author = Andrew Burton and John Radford | publisher = Routledge | year = 1978 | isbn = 0-416-85840-6 | url = http://books.google.com/?id=CSgOAAAAQAAJ&pg=PA77&dq=%22optical+flow%22+%22optic+flow%22+date:0-1985 }}</ref><ref>{{cite book | title = Electronic Spatial Sensing for the Blind: Contributions from Perception | author = David H. Warren and Edward R. Strelow | publisher = Springer | year = 1985 | isbn = 90-247-2689-1 | url = http://books.google.com/?id=-I_Hazgqx8QC&pg=PA414&dq=%22optical+flow%22+%22optic+flow%22+date:0-1985 }}</ref>


== Оцінювання ==
Поняття оптичного потоку була запропоноване американським психологом [[Джеймс Гібсон|Джеймсом Дж. Гібсоном]] у 1940-х роках для опису візуального стимулу (сигналу), що виникає у тварин, які рухаються у просторі відносно довколишнього середовища.<ref>{{cite book | title = The Perception of the Visual World | author = Gibson, J.J.| publisher = Houghton Mifflin | year = 1950 }}</ref>


Послідовності впорядкованих зображень уможливлюють оцінювання руху або як миттєвих швидкостей зображення, або як дискретних зміщень зображень.<ref name="S. S. Beauchemin , J. L. Barron 1995" /> Фліт та Вейсс пропонують навчальний посібник з оптичного потоку на основі градієнта.<ref>{{Cite book |title=Handbook of Mathematical Models in Computer Vision |last1=Fleet |first1=David J. |last2=Weiss |first2=Yair |publisher=Springer |year=2006 |isbn=978-0-387-26371-7 |editor-last=Paragios |editor-first=Nikos |pages=237–257 |chapter=Optical Flow Estimation |editor-last2=Chen |editor-first2=Yunmei |editor-last3=Faugeras |editor-first3=Olivier D. |chapter-url=http://www.cs.toronto.edu/~fleet/research/Papers/flowChapter05.pdf}} {{ref-en}}</ref> Джон Л. Баррон, Девід Дж. Фліт та Стівен Бошемен пропонують аналіз продуктивності низки методик оптичного потоку, з наголосом на точності та густоті вимірювань.<ref>{{Cite journal |last1=Barron |first1=John L. |last2=Fleet |first2=David J. |last3=Beauchemin |first3=Steven |name-list-style=amp |year=1994 |title=Performance of optical flow techniques |url=http://www.cs.toronto.edu/~fleet/research/Papers/ijcv-94.pdf |journal=International Journal of Computer Vision |volume=12 |pages=43–77 |citeseerx=10.1.1.173.481 |doi=10.1007/bf01420984|s2cid=1290100 }} {{ref-en}}</ref>
Джеймс Гібсон підкреслював важливість оптичного потоку для [[Можливості|можливості сприйняття]], здатність розрізняти обмеження і можливості для дій в навколишньому оточенні. Послідовники робіт Гібсона і його [[Екологічна психологія|екологічного підходу до психології]] згодом змогли показати роль стимулу оптичного потоку для сприйняття руху спостерігача відносно довколишнього світу; сприйняття форми, дистанції і руху навколишніх об'єктів; і контроль пересування.<ref>Royden, C. S., & Moore, K. D. (2012). Use of speed cues in the detection of moving objects by moving observers. Vision research, 59, 17–24. doi:10.1016/j.visres.2012.02.006</ref>


Методи оптичного потоку намагаються обчислювати рух між двома кадрами, що було знято в моменти часу <math>t</math> та <math>t+\Delta t</math>, в положенні кожного [[Воксель|вокселя]]. Ці методи називають диференціальними, оскільки вони ґрунтуються на локальних наближеннях сигналу зображення [[Ряд Тейлора|рядами Тейлора]], тобто, вони використовують частинні похідні за просторовими та часовими координатами.
Нещодавно оптичного потоку термін був кооптовані робототехніки включити відповідні прийоми з обробки зображень та контролю навігаційного, такі як виявлення руху, об'єктів сегментації, час-контактну інформацію, фокус розрахунків розширення, яскравості, з компенсацією руху кодування, і стерео невідповідність вимірювань.


Для випадку вимірності 2D+''t'' (випадки 3D та ''n''-D є подібними) воксель у положенні <math>(x,y,t)</math> з інтенсивністю <math>I(x,y,t)</math> буде переміщено між цими двома кадрами на <math>\Delta x</math>, <math>\Delta y</math> та <math>\Delta t</math>, й може бути задано наступне ''обмеження сталості яскравості'' ({{lang-en|brightness constancy constraint}}):
З недавнього часу термін оптичного потоку був [[Кооптація|кооптований]] [[роботицист]]ами, щоб включити до цього поняття відповідні прийоми з обробки зображень та навігаційного контролю, такого як детект руху, сегментація об'єктів, інформація про час до зіткнення (контакту), розрахунок фокусу розширення (focus of expansion), яскравість, кодування з компенсацією руху, і вимірювання стерео диспаратності.<ref name="Kelson R. T. Aires, Andre M. Santana, Adelardo A. D. Medeiros 2008">{{cite book | title = Optical Flow Using Color Information | author = Kelson R. T. Aires, Andre M. Santana, Adelardo A. D. Medeiros | publisher = ACM New York, NY, USA | year = 2008 | isbn = 978-1-59593-753-7 | url = http://www.dca.ufrn.br/~adelardo/artigos/SAC08.pdf }}</ref><ref name="S. S. Beauchemin , J. L. Barron 1995"> {{cite book| title = The computation of optical flow | author = S. S. Beauchemin , J. L. Barron | publisher = ACM New York, USA | year = 1995 | url = http://portal.acm.org/ft_gateway.cfm?id=212141&type=pdf&coll=GUIDE&dl=GUIDE&CFID=72158298&CFTOKEN=85078203}}</ref>


: <math>I(x,y,t) = I(x+\Delta x, y + \Delta y, t + \Delta t)</math>
== Розрахунок ==


Якщо виходити з того, що переміщення є невеликим, це обмеження зображення в <math>I(x,y,t)</math> може бути розгорнуло за допомогою [[Ряд Тейлора|ряду Тейлора]] в
Послідовність з впорядкованих зображень дозволяє оцінити рух, або у вигляді миттєвих швидкостей зображення, або у вигляді дискретних величин зміщення зображення.<ref name="S. S. Beauchemin , J. L. Barron 1995"/> Є матеріали у вигляді уроку по методу оптичного потоку на основі градієнтів.<ref>{{cite book | chapter = Optical Flow Estimation | author = David J. Fleet and Yair Weiss | title = Handbook of Mathematical Models in Computer Vision | editor = Paragios et al. | publisher = Springer | year = 2006 | isbn = 0-387-26371-3 | url = http://www.cs.toronto.edu/~fleet/research/Papers/flowChapter05.pdf}}</ref> Також дослідники проводили аналіз порівняння різних технік оптичного потоку, що аналізують точність і частоту вимірювань.<ref>{{cite journal | journal = International Journal of Computer Vision | title = Performance of optical flow techniques | author = John L. Barron, David J. Fleet, and Steven Beauchemin | publisher = Springer | year = 1994 | url = http://www.cs.toronto.edu/~fleet/research/Papers/ijcv-94.pdf}}</ref>


: <math>I(x+\Delta x,y+\Delta y,t+\Delta t) = I(x,y,t) + \frac{\partial I}{\partial x}\Delta x+\frac{\partial I}{\partial y}\Delta y+\frac{\partial I}{\partial t}\Delta t+</math>{{нп|члени вищих порядків|||Higher-order terms}}
Методи розрахунку оптичного руху намагаються оцінити рух між двома кадрами зображення, які відносяться до моментів часу ''t'' і <math>t+\Delta t</math> в кожній позиції [[Воксель|вокселя]]. Такі методи називаються диференційними, оскільки вони основані на локальних оцінках [[Ряд Тейлора|ряду Тейлора]] для сигналу зображення; тобто вони використовують часткові похідні по просторовим і часовим координатам.


При відкиданні членів вищих порядків (що здійснює лінеаризацію) з цього випливає, що
Для випадку розмірності 2D+''t'' (так само і для 3D або ''n''-D випадків) розташування вокселя <math>(x,y,t)</math> з інтенсивністю <math>I(x,y,t)</math>, який буде рухатись на <math>\Delta x</math>, <math>\Delta y</math> і <math>\Delta t</math> між двома кадрами зображення, і з наступним обмеженням ''сталості яскравості'' (brightness constancy constraint) можна записати:


: <math>I(x,y,t) = I(x+\Delta x, y + \Delta y, t + \Delta t)</math>

Вважаючи, що рух був не значним, розраховуючи наближення зображення в <math>I(x,y,t)</math> за допомогою [[Ряд Тейлора|рядів Тейлора]] можна отримати:
: <math>I(x+\Delta x,y+\Delta y,t+\Delta t) = I(x,y,t) + \frac{\partial I}{\partial x}\Delta x+\frac{\partial I}{\partial y}\Delta y+\frac{\partial I}{\partial t}\Delta t+</math>[[Теорія збурень|… (члени вищого порядку)]]
З цих рівнянь випливає, що:
: <math>\frac{\partial I}{\partial x}\Delta x+\frac{\partial I}{\partial y}\Delta y+\frac{\partial I}{\partial t}\Delta t = 0</math>
: <math>\frac{\partial I}{\partial x}\Delta x+\frac{\partial I}{\partial y}\Delta y+\frac{\partial I}{\partial t}\Delta t = 0</math>

або
або, при діленні на <math>\Delta t</math>,

: <math>\frac{\partial I}{\partial x}\frac{\Delta x}{\Delta t}+\frac{\partial I}{\partial y}\frac{\Delta y}{\Delta t}+\frac{\partial I}{\partial t}\frac{\Delta t}{\Delta t} = 0</math>
: <math>\frac{\partial I}{\partial x}\frac{\Delta x}{\Delta t}+\frac{\partial I}{\partial y}\frac{\Delta y}{\Delta t}+\frac{\partial I}{\partial t}\frac{\Delta t}{\Delta t} = 0</math>

в результаті чого
що в результаті дає

: <math>\frac{\partial I}{\partial x}V_x+\frac{\partial I}{\partial y}V_y+\frac{\partial I}{\partial t} = 0</math>
: <math>\frac{\partial I}{\partial x}V_x+\frac{\partial I}{\partial y}V_y+\frac{\partial I}{\partial t} = 0</math>
де <math>V_x,V_y</math> це компоненти <math>x</math> і <math>y</math> швидкості або оптичного потоку
<math>I(x,y,t)</math> і <math>\tfrac{\partial I}{\partial x}</math>, <math>\tfrac{\partial I}{\partial y}</math> і
<math>\tfrac{\partial I}{\partial t}</math> є похідними для зображення в <math>(x,y,t)</math>
у відповідних напрямках. <math>I_x</math>,<math> I_y</math> і <math> I_t</math> далі можуть бути записані для похідних.


де <math>V_x,V_y</math> є складовими <math>x</math> та <math>y</math> швидкості або оптичного потоку <math>I(x,y,t)</math>, а <math>\tfrac{\partial I}{\partial x}</math>, <math>\tfrac{\partial I}{\partial y}</math> та <math>\tfrac{\partial I}{\partial t}</math> є похідними зображення в <math>(x,y,t)</math> у відповідних напрямках. Далі ці похідні може бути позначено через <math>I_x</math>,<math> I_y</math> та <math> I_t</math>.
Таким чином:

Отже:

: <math>I_xV_x+I_yV_y=-I_t</math>
: <math>I_xV_x+I_yV_y=-I_t</math>

або
або

: <math>\nabla I^T\cdot\vec{V} = -I_t</math>
: <math>\nabla I\cdot\vec{V} = -I_t</math>
Це рівняння з двома невідомими, як таке не може бути вирішене.

Це відомо як ''[[Сприйняття руху#Проблема апертури|проблема апертури (діафрагми)]]'' алгоритму оптичного потоку. Для розрахунку оптичного потоку необхідне інший набір рівнянь, що задаються деякими додатковими умовами. Всі методи розрахунку оптичного потоку вводять додаткові умови для оцінки фактичного потоку.
Це&nbsp;— рівняння з двома невідомими, й саме по собі розв'язаним бути не може. Це відоме як ''{{нп|проблема вікна|||Aperture problem}}'' ({{lang-en|aperture problem}}) в алгоритмах оптичного потоку. Щоби знайти оптичний потік, потрібен інший набір рівнянь, заданий деяким додатковим обмеженням. Для оцінювання фактичного потоку всі алгоритми оптичного потоку запроваджують додаткові умови.

=== Методи визначення ===

* [[Фазова кореляція]]&nbsp;— обернення унормованого {{нп|Взаємний спектр потужності|взаємного спектру потужності||Cross-power spectrum}}
* Блокові методи&nbsp;— мінімізування суми квадратів різниць, або {{нп|Сума модулів різниць|суми модулів різниць||Sum of absolute differences}}, або максимізування унормованої {{нп|Взаємна кореляція|взаємної кореляції||Cross-correlation}}
* Диференціальні методи оцінювання оптичного потоку, що ґрунтуються на частинних похідних сигналу зображення та/або шуканого поля потоку та частинних похідних вищого порядку, такі як:
** [[Метод Лукаса — Канаде]]&nbsp;— стосовно клаптиків зображення та афінної моделі для поля потоку<ref name="Zhang2018">{{Cite journal |last1=Zhang |first1=G. |last2=Chanson |first2=H. |author-link2=Юбер Шансон |year=2018 |title=Application of Local Optical Flow Methods to High-Velocity Free-surface Flows: Validation and Application to Stepped Chutes |url=http://staff.civil.uq.edu.au/h.chanson/reprints/Zhang_Chanson_etfs_2018.pdf |journal=Experimental Thermal and Fluid Science |volume=90 |pages=186–199 |doi=10.1016/j.expthermflusci.2017.09.010}} {{ref-en}}</ref>
** {{нп|Метод Горна — Шунка|||Horn–Schunck method}}&nbsp;— оптимізування функціоналу на основі залишків від обмеження сталості яскравості, та певного члена регуляризації, що виражає очікувану плавність поля потоку<ref name="Zhang2018" />
** {{нпні|Метод Бакстона — Бакстона|||Buxton–Buxton method}}&nbsp;— ґрунтується на моделі руху контурів у послідовностях зображень<ref>{{Cite book |url=https://books.google.com/books?id=NiQXkMbx-lUC&q=optical-flow+Buxton-and-Buxton&pg=PA107 |title=Visual Cognition |last=Glyn W. Humphreys and {{нп|Вікі Брюс|Vicki Bruce||Vicki Bruce}} |publisher=Psychology Press |year=1989 |isbn=978-0-86377-124-8}} {{ref-en}}</ref>
** {{нпні|Метод Блека — Джепсона|||Black–Jepson method}}&nbsp;— грубий оптичний потік через кореляцію<ref name="S. S. Beauchemin , J. L. Barron 1995" />
** Загальні [[варіаційні методи]]&nbsp;— низка видозмін/розширень Горна&nbsp;— Шунка, що використовують інші члени даних, та інші члени гладкості.
* Дискретні методи оптимізації&nbsp;— простір пошуку дискретизується, й узгодження зображення відтак обробляється через призначування міток на кожному пікселі таким чином, що відповідне деформування мінімізує відстань між первинним та цільовим зображеннями.<ref>{{Cite book |url=http://vision.mas.ecp.fr/pub/mian08.pdf |title=Dense Image Registration through MRFs and Efficient Linear Programming |last1=B. Glocker |last2=N. Komodakis |last3=G. Tziritas |last4=N. Navab |last5=N. Paragios |publisher=Medical Image Analysis Journal |year=2008}} {{ref-en}}</ref> Оптимальний розв'язок часто добувають через алгоритми {{нп|Теорема про максимальний потік, мінімальний розріз|теореми про максимальний потік, мінімальний розріз||Max-flow min-cut theorem}}, лінійне програмування, або методи {{нп|поширення переконання|||Belief propagation}}.

Багато з них, на додачу до поточних алгоритмів на рівні останніх досягнень, оцінюють на наборі даних ''Middlebury Benchmark Dataset''.<ref>{{Cite journal |last1=Baker |first1=Simon |last2=Scharstein |first2=Daniel |last3=Lewis |first3=J. P. |last4=Roth |first4=Stefan |last5=Black |first5=Michael J. |last6=Szeliski |first6=Richard |date=March 2011 |title=A Database and Evaluation Methodology for Optical Flow |journal=International Journal of Computer Vision |language=en |volume=92 |issue=1 |pages=1–31 |doi=10.1007/s11263-010-0390-2 |s2cid=316800 |issn=0920-5691}} {{ref-en}}</ref><ref>{{Cite web |url=http://vision.middlebury.edu/flow/ |title=Optical Flow |last1=Baker |first1=Simon |last2=Scharstein |first2=Daniel |website=vision.middlebury.edu |access-date=2019-10-18 |last3=Lewis |first3=J. P. |last4=Roth |first4=Stefan |last5=Black |first5=Michael J. |last6=Szeliski |first6=Richard}} {{ref-en}}</ref> Іншими популярними наборами даних є ''[[KITTI]]'' та ''[[Sintel]]''.

== Використання ==

Головними аспектами дослідження оптичного потоку стали [[оцінювання руху]] та [[стискання відео]]. Хоча поле оптичного потоку на перший погляд і схоже на щільне поле руху, отримуване за допомогою методик оцінювання руху, оптичний потік є дослідженням не лише визначення самого поля оптичного потоку, але також і його використання в оцінюванні тривимірної природи та структури сцени, як і тривимірного руху об'єктів та спостерігача відносно сцени, де здебільшого використовують якобіан зображення.<ref>{{cite web|last=Corke|first=Peter|authorlink=Пітер Корк|title=The Image Jacobian|url=https://robotacademy.net.au/lesson/the-image-jacobian/|website=QUT Robot Academy|date=8 May 2017}} {{ref-en}}</ref>

Дослідники в галузі робототехніки використовували оптичний потік в багатьох областях, таких як {{нп|Виявляння об'єктів|виявляння||Object detection}} та відстежування об'єктів, виділяння основного плану зображення, виявляння руху, навігація роботів та [[візуальна одометрія]].<ref name="Kelson R. T. Aires, Andre M. Santana, Adelardo A. D. Medeiros 2008" /> Інформацію оптичного потоку визнавали корисною для керування мініатюрними літальними апаратами.<ref>{{Cite journal |last1=Barrows |first1=G. L. |last2=Chahl |first2=J. S. |last3=Srinivasan |first3=M. V. |date=2003 |title=Biologically inspired visual sensing and flight control |journal=Aeronautical Journal |volume=107 |issue=1069 |pages=159–268 |doi=10.1017/S0001924000011891 |doi-broken-date=31 October 2021 |via=Cambridge University Press | url = https://www.cambridge.org/core/journals/aeronautical-journal/article/biologically-inspired-visual-sensing-and-flight-control/0B3884D11BB0A54C2A196BF57162C153}} {{ref-en}}</ref>

До застосувань оптичного потоку належить задача висновування не лише руху спостерігача та об'єктів у сцені, але також і [[Структура|структури]] об'єктів та середовища. Оскільки усвідомлення руху та породжування ментальних мап структури нашого середовища є критичними складовими тваринного (та людського) [[Зір|зору]], перетворення цієї вродженої здібності на комп'ютерну здатність є так само вирішальним й у галузі [[Машинний зір|зору машинного]].<ref>{{Cite book |url={{google books|plainurl=yes|id=c97huisjZYYC|pg=PA133|text=optic+flow}} |title=Advances in Computer Vision |last=Brown |first=Christopher M. |publisher=Lawrence Erlbaum Associates |year=1987 |isbn=978-0-89859-648-9}} {{ref-en}}</ref>

[[Файл:Optical flow example v2.png|thumb|right|Вектор оптичного потоку руху об'єкта в послідовності відео.]]

Розгляньмо п'ятикадровий кліп руху м'яча з лівої нижньої частини поля зору до правої верхньої. Методики оцінювання руху можуть визначити, що на двовимірній площині м'яч рухається вгору та праворуч, й вектори, що описують цей рух, можливо виділити з цієї послідовності кадрів. Для цілей стискання відео (наприклад, ''[[MPEG]]''), послідовність тепер описано настільки добре, наскільки потрібно. Проте в галузі машинного зору питання про те, чи це м'яч рухається праворуч, чи спостерігач рухається ліворуч, є непізнанною, але критичною інформацією. Навіть якби в цих п'яти кадрах було присутнє статичне візерункове тло, ми не змогли би з упевненістю стверджувати, що м'яч рухався праворуч, оскільки цей візерунок міг мати нескінченну відстань від спостерігача.


== Давач оптичного потоку ==
== Давач оптичного потоку ==
{{Не плутати2|{{нп|Оптичний вимірювач потоку|оптичним вимірювачем потоку||Optical flowmeter}}}}


Давач оптичного потоку&nbsp;— це {{нп|Розумний зоровий давач|зоровий давач||Smart vision sensor}}, здатний вимірювати оптичний потік або візуальний рух, та видавати вимірювання, що ґрунтуються на оптичному потоці. Існують різноманітні конфігурації давачів оптичного потоку. Однією з конфігурацій є чип давача зображення, з'єднаний з процесором, запрограмованим виконувати алгоритм оптичного потоку. Інша конфігурація використовує зоровий чип, що є інтегрованою схемою, яка має як [[давач зображення]], так і процесор, на одному й тому ж кристалі, що уможливлює компактне втілення.<ref>{{Cite book |title=Vision Chips |last=Moini |first=Alireza |date=2000 |publisher=Springer US |isbn=9781461552673 |location=Boston, MA |oclc=851803922}} {{ref-en}}</ref><ref>{{Cite book |title=Analog VLSI and neural systems |last=Mead |first=Carver |date=1989 |publisher=Addison-Wesley |isbn=0201059924 |location=Reading, Mass. |oclc=17954003 |url-access=registration |url=https://archive.org/details/analogvlsineural00mead }} {{ref-en}}</ref> Таким прикладом є звичайний давач [[Оптична миша|оптичної миші]]. У деяких випадках схему обробки може бути втілено із застосуванням схем з аналоговим або змішаними сигналами для уможливлення швидкого обчислювання оптичного потоку з мінімальним споживанням струму.
Сенсор оптичного потоку це датчик зору здатний вимірювати оптичний потік або візуальний рух і видавати результат вимірювання на основі оптичного потоку. Існує багато різних конфігурацій таких сенсорів.

Це може бути датчик зображення з'єднаний з процесором, на якому виконується запрограмований алгоритм оптичного потоку. Інша конфігурація використовує зоровий чип, що виконаний у вигляді інтегральної схеми, що містить і датчик зображення і процесор в одному кристалі, у вигляді компактного пристрою.<ref>Vision Chips, by Alireza Moini, Kluwer Academic Publishers, 2000</ref><ref>Analog VLSI and Neural Systems, by Carver Mead, 1989</ref> Прикладом цього є звичайний датчик оптичної миші, що використовується в [[Оптична миша|оптичних мишах]]. В деяких випадках використовуються можуть використовуються обчислювальні схеми з використанням аналогових схем із змішаними сигналами, для швидких розрахунків оптичного потоку при мінімальному споживанні струму.
Однією з областей сучасних досліджень є застосування методик {{нп|Нейроморфна інженерія|нейроморфної інженерії||Neuromorphic engineering}} для втілення схем, що реагують на оптичний потік, і відтак можуть бути доречними для використання в давачі оптичного потоку.<ref>{{Cite book |title=Analog VLSI circuits for the perception of visual motion |last=Stocker |first=Alan A. |date=2006 |publisher=John Wiley & Sons |isbn=0470034882 |location=Chichester, England |oclc=71521689}} {{ref-en}}</ref> Такі схеми можуть черпати натхнення з біологічних нейронних схем, що реагують на оптичний потік подібним чином.

Одною із сфер сучасних досліджень є використання техніки [[Нейроморфна інженерія|нейроморфної інженерії]] для реалізації схем, які сприймають оптичний потік, і таким чином можуть бути використані як оптичний датчик.<ref>Analog VLSI Circuits for the Perception of Visual Motion, by Alan Stocker, Wiley and Sons, 2006</ref> Такі схеми черпають ідеї з біологічних нейронних мереж, і за схожим принципом сприймають оптичний потік.
Давачі оптичного потоку широко використовують у комп'ютерних [[Оптична миша|оптичних мишах]] як головну давачеву складову для вимірювання руху миші поверхнею.

Давачі оптичного потоку використовують також і в [[Робототехніка|робототехніці]], переважно де є потреба у вимірюванні візуального руху або відносного руху робота та інших об'єктів поблизу робота. Однією з областей поточних досліджень також є використання давачів оптичного потоку в [[Безпілотний літальний апарат|безпілотних літальних апаратах (БПЛА)]] задля забезпечення стабільності та уникання перешкод.<ref>{{Cite book |title=Flying insects and robots |date=2009 |publisher=Springer |isbn=9783540893936 |editor-last=Floreano |editor-first=Dario |location=Heidelberg |oclc=495477442 |editor-last2=Zufferey |editor-first2=Jean-Christophe |editor-last3=Srinivasan |editor-first3=Mandyam V. |editor-last4=Ellington |editor-first4=Charlie}} {{ref-en}}</ref>

== Див. також ==
* {{нп|Осяжний оптичний лад|||Ambient optic array}}
* [[Оптична миша]]
* [[Дальнісне зображення]]
* [[Зоровий процесор]]
* [[Рівняння неперервності]]


== Примітки ==
== Примітки ==
{{reflist}}
{{reflist|2}}

== Посилання ==
{{commonscat}}
* [http://users.fmrib.ox.ac.uk/~steve/review/review/node1.html#SECTION00010000000000000000 Finding Optic Flow] {{ref-en}}
* Стаття [http://www.fxguide.com/featured/art_of_optical_flow/ Art of Optical Flow] на ''fxguide.com'' (з використанням оптичного потоку у візуальних ефектах) {{ref-en}}
* [http://of-eval.sourceforge.net/ Optical flow evaluation and ground truth sequences.] {{ref-en}}
* [http://vision.middlebury.edu/flow/ Middlebury Optical flow evaluation and ground truth sequences.] {{ref-en}}
* [http://www.mrf-registration.net/ mrf-registration.net]&nbsp;— оцінювання оптичного потоку за допомогою [[Марковське випадкове поле|МВП]] {{ref-en}}
* [https://web.archive.org/web/20091014150930/http://www.onera.fr/dtim-en/gpu-for-image/folkigpu.php The French Aerospace Lab:] втілення оптичного потоку на основі Лукаса&nbsp;— Канаде на [[ГП]] {{ref-en}}
* [https://web.archive.org/web/20111102071946/http://www.cuvilib.com/features/motion-estimation/ Втілення на CUDA] від ''CUVI'' (''CUDA Vision & Imaging Library'') {{ref-en}}
* [http://www.ipol.im/pub/art/2013/20/ Horn and Schunck Optical Flow:] інтерактивне демо та первинний код методу Горна та Шунка
* [http://www.ipol.im/pub/art/2013/26/ TV-L1 Optical Flow:] інтерактивне демо та первинний код методу Зака та ін.
* [http://www.ipol.im/pub/art/2013/21/ Robust Optical Flow:] інтерактивне демо та первинний код методу Брокса та ін.


[[Категорія:Рух у комп'ютернім зорі]]
[[Категорія:Рух у комп'ютернім зорі]]

Версія за 14:55, 3 листопада 2021

Оптичний потік, який сприймається спостерігачем, що обертається (в даному прикладі мухою). Напрямок та величина оптичного потоку в кожній позиції подано стрілками відповідного напрямку і довжини.

Опти́чний поті́к (англ. optical flow, optic flow) — це схема видимого руху об'єктів, поверхонь і граней у зоровій сцені, спричинюваного відносним рухом[en] спостерігача та сцени.[1][2] Оптичний потік також можливо визначити як розподіл видимих швидкостей руху візерунку яскравості в зображенні.[3] Поняття оптичного потоку було запроваджено американським психологом Джеймсом Дж. Ґібсоном[en] у 1940-х роках для опису зорових стимулів, що виникають у тварин, які рухаються світом.[4] Джеймс Ґібсон наголосив на важливості оптичного потоку для сприймання можливостей, здатності розрізнювати можливості для дій у середовищі. Послідовники Ґібсона та його екологічного підходу до психології згодом показати роль стимулу оптичного потоку для сприймання руху спостерігачем у світі; сприймання форми, відстані й руху об'єктів у світі; та контролю пересування.[5]

Термін «оптичний потік» також використовують робототехніки, охоплюючи споріднені методики з обробки зображень та керування навігацією, включно з виявлянням руху, сегментуванням об'єктів, інформацією про час до контакту, обчисленнями фокусу розширення, освітленістю, кодуванням компенсації руху, та вимірюванням стереодиспаритету.[6][7]

Оцінювання

Послідовності впорядкованих зображень уможливлюють оцінювання руху або як миттєвих швидкостей зображення, або як дискретних зміщень зображень.[7] Фліт та Вейсс пропонують навчальний посібник з оптичного потоку на основі градієнта.[8] Джон Л. Баррон, Девід Дж. Фліт та Стівен Бошемен пропонують аналіз продуктивності низки методик оптичного потоку, з наголосом на точності та густоті вимірювань.[9]

Методи оптичного потоку намагаються обчислювати рух між двома кадрами, що було знято в моменти часу та , в положенні кожного вокселя. Ці методи називають диференціальними, оскільки вони ґрунтуються на локальних наближеннях сигналу зображення рядами Тейлора, тобто, вони використовують частинні похідні за просторовими та часовими координатами.

Для випадку вимірності 2D+t (випадки 3D та n-D є подібними) воксель у положенні з інтенсивністю буде переміщено між цими двома кадрами на , та , й може бути задано наступне обмеження сталості яскравості (англ. brightness constancy constraint):

Якщо виходити з того, що переміщення є невеликим, це обмеження зображення в може бути розгорнуло за допомогою ряду Тейлора в

члени вищих порядків[en]

При відкиданні членів вищих порядків (що здійснює лінеаризацію) з цього випливає, що

або, при діленні на ,

що в результаті дає

де є складовими та швидкості або оптичного потоку , а , та є похідними зображення в у відповідних напрямках. Далі ці похідні може бути позначено через , та .

Отже:

або

Це — рівняння з двома невідомими, й саме по собі розв'язаним бути не може. Це відоме як проблема вікна[en] (англ. aperture problem) в алгоритмах оптичного потоку. Щоби знайти оптичний потік, потрібен інший набір рівнянь, заданий деяким додатковим обмеженням. Для оцінювання фактичного потоку всі алгоритми оптичного потоку запроваджують додаткові умови.

Методи визначення

Багато з них, на додачу до поточних алгоритмів на рівні останніх досягнень, оцінюють на наборі даних Middlebury Benchmark Dataset.[13][14] Іншими популярними наборами даних є KITTI та Sintel.

Використання

Головними аспектами дослідження оптичного потоку стали оцінювання руху та стискання відео. Хоча поле оптичного потоку на перший погляд і схоже на щільне поле руху, отримуване за допомогою методик оцінювання руху, оптичний потік є дослідженням не лише визначення самого поля оптичного потоку, але також і його використання в оцінюванні тривимірної природи та структури сцени, як і тривимірного руху об'єктів та спостерігача відносно сцени, де здебільшого використовують якобіан зображення.[15]

Дослідники в галузі робототехніки використовували оптичний потік в багатьох областях, таких як виявляння та відстежування об'єктів, виділяння основного плану зображення, виявляння руху, навігація роботів та візуальна одометрія.[6] Інформацію оптичного потоку визнавали корисною для керування мініатюрними літальними апаратами.[16]

До застосувань оптичного потоку належить задача висновування не лише руху спостерігача та об'єктів у сцені, але також і структури об'єктів та середовища. Оскільки усвідомлення руху та породжування ментальних мап структури нашого середовища є критичними складовими тваринного (та людського) зору, перетворення цієї вродженої здібності на комп'ютерну здатність є так само вирішальним й у галузі зору машинного.[17]

Вектор оптичного потоку руху об'єкта в послідовності відео.

Розгляньмо п'ятикадровий кліп руху м'яча з лівої нижньої частини поля зору до правої верхньої. Методики оцінювання руху можуть визначити, що на двовимірній площині м'яч рухається вгору та праворуч, й вектори, що описують цей рух, можливо виділити з цієї послідовності кадрів. Для цілей стискання відео (наприклад, MPEG), послідовність тепер описано настільки добре, наскільки потрібно. Проте в галузі машинного зору питання про те, чи це м'яч рухається праворуч, чи спостерігач рухається ліворуч, є непізнанною, але критичною інформацією. Навіть якби в цих п'яти кадрах було присутнє статичне візерункове тло, ми не змогли би з упевненістю стверджувати, що м'яч рухався праворуч, оскільки цей візерунок міг мати нескінченну відстань від спостерігача.

Давач оптичного потоку

Давач оптичного потоку — це зоровий давач[en], здатний вимірювати оптичний потік або візуальний рух, та видавати вимірювання, що ґрунтуються на оптичному потоці. Існують різноманітні конфігурації давачів оптичного потоку. Однією з конфігурацій є чип давача зображення, з'єднаний з процесором, запрограмованим виконувати алгоритм оптичного потоку. Інша конфігурація використовує зоровий чип, що є інтегрованою схемою, яка має як давач зображення, так і процесор, на одному й тому ж кристалі, що уможливлює компактне втілення.[18][19] Таким прикладом є звичайний давач оптичної миші. У деяких випадках схему обробки може бути втілено із застосуванням схем з аналоговим або змішаними сигналами для уможливлення швидкого обчислювання оптичного потоку з мінімальним споживанням струму.

Однією з областей сучасних досліджень є застосування методик нейроморфної інженерії для втілення схем, що реагують на оптичний потік, і відтак можуть бути доречними для використання в давачі оптичного потоку.[20] Такі схеми можуть черпати натхнення з біологічних нейронних схем, що реагують на оптичний потік подібним чином.

Давачі оптичного потоку широко використовують у комп'ютерних оптичних мишах як головну давачеву складову для вимірювання руху миші поверхнею.

Давачі оптичного потоку використовують також і в робототехніці, переважно де є потреба у вимірюванні візуального руху або відносного руху робота та інших об'єктів поблизу робота. Однією з областей поточних досліджень також є використання давачів оптичного потоку в безпілотних літальних апаратах (БПЛА) задля забезпечення стабільності та уникання перешкод.[21]

Див. також

Примітки

  1. Burton, Andrew; Radford, John (1978). Thinking in Perspective: Critical Essays in the Study of Thought Processes. Routledge. ISBN 978-0-416-85840-2. (англ.)
  2. Warren, David H.; Strelow, Edward R. (1985). Electronic Spatial Sensing for the Blind: Contributions from Perception. Springer. ISBN 978-90-247-2689-9. (англ.)
  3. Horn, Berthold K.P.; Schunck, Brian G. (August 1981). Determining optical flow (PDF). Artificial Intelligence (англ.). 17 (1–3): 185—203. doi:10.1016/0004-3702(81)90024-2. hdl:1721.1/6337. (англ.)
  4. Gibson, J.J. (1950). The Perception of the Visual World. Houghton Mifflin. (англ.)
  5. Royden, C. S.; Moore, K. D. (2012). Use of speed cues in the detection of moving objects by moving observers. Vision Research. 59: 17—24. doi:10.1016/j.visres.2012.02.006. PMID 22406544. S2CID 52847487. (англ.)
  6. а б Aires, Kelson R. T.; Santana, Andre M.; Medeiros, Adelardo A. D. (2008). Optical Flow Using Color Information (PDF). ACM New York, NY, USA. ISBN 978-1-59593-753-7. (англ.)
  7. а б в Beauchemin, S. S.; Barron, J. L. (1995). The computation of optical flow. ACM Computing Surveys. ACM New York, USA. 27 (3): 433—466. doi:10.1145/212094.212141. S2CID 1334552. (англ.)
  8. Fleet, David J.; Weiss, Yair (2006). Optical Flow Estimation (PDF). У Paragios, Nikos; Chen, Yunmei; Faugeras, Olivier D. (ред.). Handbook of Mathematical Models in Computer Vision. Springer. с. 237—257. ISBN 978-0-387-26371-7. (англ.)
  9. Barron, John L.; Fleet, David J. & Beauchemin, Steven (1994). Performance of optical flow techniques (PDF). International Journal of Computer Vision. 12: 43—77. CiteSeerX 10.1.1.173.481. doi:10.1007/bf01420984. S2CID 1290100. (англ.)
  10. а б Zhang, G.; Chanson, H. (2018). Application of Local Optical Flow Methods to High-Velocity Free-surface Flows: Validation and Application to Stepped Chutes (PDF). Experimental Thermal and Fluid Science. 90: 186—199. doi:10.1016/j.expthermflusci.2017.09.010. (англ.)
  11. Glyn W. Humphreys and Vicki Bruce[en] (1989). Visual Cognition. Psychology Press. ISBN 978-0-86377-124-8. (англ.)
  12. B. Glocker; N. Komodakis; G. Tziritas; N. Navab; N. Paragios (2008). Dense Image Registration through MRFs and Efficient Linear Programming (PDF). Medical Image Analysis Journal. (англ.)
  13. Baker, Simon; Scharstein, Daniel; Lewis, J. P.; Roth, Stefan; Black, Michael J.; Szeliski, Richard (March 2011). A Database and Evaluation Methodology for Optical Flow. International Journal of Computer Vision (англ.). 92 (1): 1—31. doi:10.1007/s11263-010-0390-2. ISSN 0920-5691. S2CID 316800. (англ.)
  14. Baker, Simon; Scharstein, Daniel; Lewis, J. P.; Roth, Stefan; Black, Michael J.; Szeliski, Richard. Optical Flow. vision.middlebury.edu. Процитовано 18 жовтня 2019. (англ.)
  15. Corke, Peter (8 May 2017). The Image Jacobian. QUT Robot Academy. (англ.)
  16. Barrows, G. L.; Chahl, J. S.; Srinivasan, M. V. (2003). Biologically inspired visual sensing and flight control. Aeronautical Journal. 107 (1069): 159—268. doi:10.1017/S0001924000011891 (неактивний 31 October 2021) — через Cambridge University Press.{{cite journal}}: Обслуговування CS1: Сторінки із неактивним DOI станом на жовтень 2021 (посилання) (англ.)
  17. Brown, Christopher M. (1987). Advances in Computer Vision. Lawrence Erlbaum Associates. ISBN 978-0-89859-648-9. (англ.)
  18. Moini, Alireza (2000). Vision Chips. Boston, MA: Springer US. ISBN 9781461552673. OCLC 851803922. (англ.)
  19. Mead, Carver (1989). Analog VLSI and neural systems. Reading, Mass.: Addison-Wesley. ISBN 0201059924. OCLC 17954003. (англ.)
  20. Stocker, Alan A. (2006). Analog VLSI circuits for the perception of visual motion. Chichester, England: John Wiley & Sons. ISBN 0470034882. OCLC 71521689. (англ.)
  21. Floreano, Dario; Zufferey, Jean-Christophe; Srinivasan, Mandyam V.; Ellington, Charlie, ред. (2009). Flying insects and robots. Heidelberg: Springer. ISBN 9783540893936. OCLC 495477442. (англ.)

Посилання