Сприйняття глибини

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

Глибина сприйняття є візуальною здатністю сприймати світ у трьох вимірах (3D) та відчувати відстань до об'єкту. Відчуття глибини — відповідний термін для тварин, бо тварини можуть відчути відстань до об'єкта (через їх здатність рухатися точно, на однаковій відстані від іншого рухомого тіла), то ж невідомо, чи «сприймають» вони рух у тому ж суб'єктивному вигляді, що і люди.[1]

Сприйняття глибини виникає з різноманітних сигналів із глибини простору. Вони, зазвичай, поділяються на бінокулярні сигнали, які засновані на отриманні сенсорної інформації в трьох вимірах з обох очей і монокулярні сигнали, які можуть бути представлені лише в двох вимірах та спостерігатися лише одним оком.[2][3] Бінокулярні сигнали відносяться до стереоочей зближення і поступаються глибиною від бінокулярного зору через експлуатацію паралакса. Монокулярні сигнали включають такі розміри: віддаленість від об'єкта, менші кути огляду, ніж при бінокулярному зорі, малі об'єкти і паралакс руху.[4]

Монокулярні сигнали[ред.ред. код]

Монокулярні сигнали надають інформацію про глибину при перегляді сцени одним оком.

Зміна відстані за допомогою паралаксу.
Оптичний паралакс.

Коли спостерігач рухається, очевидно, що відносний рух декількох стаціонарних об'єктів на фоні каже про їх відносну відстань.

Рух паралакса
Як відомо, інформація про напрямок та швидкість руху є паралаксом руху, отже вона може забезпечити абсолютну інформацію про глибину.[5] Цей ефект добре видно при русі в автомобілі. Коли речі знаходяться неподалік, то вони швидко пролітають, в той час, як далекі об'єкти з'являються порівняно повільно. Деякі тварини, які не мають бінокулярного зору через природу їх очей, мають малі поля огляду, тому паралакс руху виражений більш явно, ніж у людини (наприклад, деякі види птахів різко рухають своїми головами, щоб домогтися паралаксу руху; білки також рухаються в ортогональних лініях до об'єкту, який їх зацікавив, для того, щоб зробити теж саме).
Глибина від руху
Коли об'єкт рухається в напрямку до спостерігача, проекція об'єкта на сітківку ока розширюється за деякий період часу; це призводить до сприйняття руху об'єкта по лінії. Інша назва цього явища «глибина від оптичного розширення».[6] Динамічна зміна дає стимул спостерігачеві не лише побачити як рухається об'єкт, але й сприйняти відстань до рухомого об'єкту. Таким чином, в цьому контексті, зміна відстані служить сигналом розміру.[7] A пов'язана з цим явищем здатність зорової системи до обчислення часу виходу на зв'язок з об'єктом, що наближається; отже здатність оптичного розширення буде корисна в ситуаціях, починаючи від водіння автомобіля, закінчуючи грою в бейсбол. Проте, розрахунок часу виходу на зв'язок, строго кажучи, сприйняття швидкості, а не глибини.
Кінетичний ефект глибини
Якщо стаціонарно жорсткий малюнок (наприклад, дротяний куб) поміщається поперед точкового джерела світла так, що його тінь падає на напівпрозорий екран, то спостерігач на іншій стороні екрану бачитиме двовимірну структуру ліній. Але, якщо куб обертається, зорова система буде витягувати інформацію, необхідну для сприйняття в третьому вимірі з рухів ліній, і куб буде видно. Це є прикладом кінетичного ефекту глибини.[8] Ефект має місце, коли обертальний об'єкт є твердим (а не контурою фігурою), за умови, що за прогнозами тінь складається з ліній, які мають певні кути або кінцеві точки, і що ці лінії змінюються в довжину та орієнтацію при обертанні.[9]
Перспектива
Властивість паралельних ліній сходитися на достатньо великій відстані (на нескінченності), дозволяє нам реконструювати відносну відстань двох частин об'єкта, або ландшафтні особливості. Прикладом може бути пряма дорога, дивлячись на яку, помічаємо, що дорога звужується по її ходу протяжіння в нескінченність.
Відносний розмір
Якщо два об'єкти, як відомо, однакового розміру, (наприклад, два дерева), але їх абсолютна величина невідома, відносні сигнали розміру можуть надавати інформацію про відносні глибини двох об'єктів. Якщо один стягує більший кут зору на сітківці ока, ніж інший, то об'єкт, який стягує більший кут зору знаходиться ближче до спостерігача.
Знайомий розмір
Оскільки кут огляду об'єкта, що проектуються на сітківку зменшується з відстанню, то ця інформація може бути об'єднана з попереднім знанням про об'єкт, тому розмір визначає абсолютну глибину об'єкта. Наприклад, люди, зазвичай, знайомі з розміром середнього автомобіля. Ці попередні знання можуть бути об'єднані з інформацією про кут, який він стягує на сітківці ока, що визначає абсолютну глибину автомобіля в даній сцені.
Абсолютний розмір
Навіть, якщо фактичний розмір об'єкта невідомий і існує тільки один видимий об'єкт, то менший об'єкт здається далі, ніж великий об'єкт, який стоїть в тому ж місці.[10]
Повітряна перспектива
Через розсіювання світла в атмосфері, об'єкти, які знаходяться на великій відстані мають більш низьку яскравість контрасту та низьку насиченість кольору. У зв'язку з цим, образи здаються туманними на великій відстані, а далі вони перетворюються в точки. У комп'ютерній графіці, це часто називають «відстань туману». Передній план має високу контрастність, а фон має низьку контрастність. Об'єкти, що відрізняються лише контрасністю, нa тлі здаються на різних глибинах.[11] Колір віддалених об'єктів також зміщується в бік синьої частини спектра (наприклад, далекі гори). Деякі художники, особливо Сезанн, використовують «теплі» пігменти (червоний, жовтий та помаранчевий), щоб донести особливості до глядача, і «холодні» кольори (синій, фіолетовий та синьо-зелений), щоб вказати, що частина кривих знаходиться далеко від картинної площини.
Розміщення
Це навколоруховий сигнал для сприйняття глибини. Коли ми намагаємося зосередитися на далекому об'єкті, циліарний м'яз розтягує кришталик ока, що робить його тоншим, і саме це змінює фокусну відстань ока. Кінестетичні відчуття скорочення і розслаблення циліарного м'яза (інтраокулярних м'язів) відправляються в зорову кору головного мозку, де це відчуття використовується для інтерпретації відстань/глибина. Розміщення ефективне лише для відстаней менше 2 метрів.
Оклюзія
Оклюзії (також згадуються як інтерпозиції) відбуваються, коли будь-яка поверхня, яка знаходиться поблизу, перекривається поверехнею, яка знаходиться десь далi.[12] Якщо об'єкт частково блокує вид іншого об'єкта, люди сприймають його як ближчий. Тим більше, ця інформація дозволяє спостерігачеві лише створити «рейтинг» відносної близькості. Монокулярні оклюзії складаються з текстури та геометрії об'єкта. Монокулярні оклюзії здатні зменшити затримку сприйняття глибини, як в натуральних та штучних подразниках.[13][14]
Криволінійні перспективи
На зовнішніх екстремальних полях зору, паралельні лінії викривляються, як у фотографії, зробленої через об'єктив «риб'ячого ока». Цей ефект значно підвищує почуття присутності глядача в реальному, тривимірному просторі. (Класична перспектива не має можливості використання для цього так званого «спотворення», хоча насправді «спотворення» строго дотримується законів оптики і забезпечує абсолютно дійсну візуальну інформацію, так само, як класична перспектива робить це для частини поля зору, що знаходиться в межах його рамок).
Текстурний градієнт
На об'єктах, які знаходяться близько можна чітко побачити дрібні деталі, в той час як такі ж самі деталі не видно на дальніх відстанях. Це називається текстурою градієнта малого об'єкта. Наприклад, на довгій гравійній дорозі можна буде добре роздивитися форми, розмір та колір гравію, який лежить поруч із спостерігачем. Вдалечині, текстура дороги може не бути чітко диференційована.
Освітлення та затінення 
Світло падає на об'єкт та відбивається від його поверхні, а тіні, які кинуті об'єктами, забезпечують ефективний сигнал для мозку, для визначення форми об'єктів і їх положення в просторі.[15]
Розмиття розфокусировки
Розмиття розфокусування зображення дуже широко використовується в фото і відео для створення враження глибини. Це може діяти як монокулярний сигнал навіть тоді, коли всі інші сигнали не будуть видалені. Це може внести свій вклад у сприйняття глибини в природних зображеннях сітківки ока, оскільки глибина фокуса людського ока обмежена. Крім того, існує кілька алгоритмів оцінки на основі глибини розфокусування та розмивання.[16] Деякі стрибки павуків, як відомо, використовують зображення розфокусировки на глибині судді.[17]
Висота
Коли об'єкт видно відносно до горизонту, ми схильні сприймати об'єкти, які ближче до горизонту як далі від нас, і об'єкти, які розташовані далі від горизонту, як ближче до нас.[18]

Бінокулярний сигнал[ред.ред. код]

Найпростіша стереограма з двох ракурсів. При правильному розташуванні кожне око бачить свій ракурс.

Бінокулярний сигнал надає інформацію про глибину при перегляді сцени обома очима.

Стереоскопічна, або сітчаткова бінокулярна невідповідність або бінокулярний паралакс
Тварини які мають очі, що розміщені фронтально, також використовують інформацію, отриману від іншої проекції об'єктів на сітківку ока і по двом проекціям судять глибину. При використанні двох зображень однієї і тієї ж сцени, отриманих під різними кутами, можна тріангулювати відстань до об'єкта з високим ступенем точності. У кожного виду очей трохи відрізняється кут видимого об'єкта з боку лівого та правого ока. Це відбувається через горизонтальний розділовий паралакс очей. Якщо об'єкт знаходиться далеко, невідповідність цього образу, падаючого на дві сітківки буде невеликим. Якщо об'єкт знаходиться близько чи поруч, розрив буде більшим. Тому люди думають, що вони сприймають глибину при перегляді автостереограм[en], 3-D фільмів і стереоскопічних фотографій.
Зйомка тривимірного зображення за допомогою кодуючого растру.
Конвергенція
Це бінокулярний окоруховий сигнал для сприйняття глибини/відстані. Це називається стереоскопічне зосередження двох очних яблук на один об'єкт. При цьому вони сходяться і відбувається конвергенція в м'язах очного яблука. З монокулярним проходженням сигналу, кінестетичні відчуття від цих м'язів очного яблука також допомагають в сприйнятті глибини/відстані. Кут сходження менше, коли око фіксується на об'єкти, які знаходяться далеко. Конвергенція ефективна на відстанях, які є меншими за 10 метрів.
Стереоскопічна тінь
Медина Пуерта показав, що зображення на сітківці ока не мають невідповідності паралаксу, але з різними тінями зливаються стереоскопічно, додаючи сприйняття глибини до сцени, яка на даний момент відображається. Він назвав це явище «бінокулярна тінь». Тіні є важливими для стереоскопічного сигналу, а як наслідок і для сприйняття глибини.[19]

З цих різних сигналів, лише конвергенція та знайомий розмір забезпечують абсолютну інформацію про відстань. Всі інші сигнали є відносними (тобто, вони можуть бути використані лише для вказівки, на об'єкти, які знаходяться ближче по відношенню до інших). Стереоскопічний сигнал є відносним, бо більша або менша розбіжність для довколишніх об'єктів може означати, що ці об'єкти відрізняються більш-менш по суті у відносній глибини або об'єкт, що досліджується, знаходиться ближче або далеко (чим далі сцена, тим менше невідповідність на сітчатках ока вказує на ту чи іншу різницю глибини.)

Роль у виживанні живих організмів[ред.ред. код]

Більшість відкритих рівнин заселені рослиноїдними тваринами (особливо копитними), у них відсутній бінокулярний зір, оскільки в них очі знаходяться з обох боків голови, забезпечуючи огляд, майже 360°. Вид на горизонт дозволяє їм помітити наближення хижаків практично з будь-якого напрямку. Тим не менше, більшість хижаків мають обидва ока у фронтальному положенні, дозволяючи бінокулярне сприйняття глибини та допомагаючи їм оцінювати відстань, коли вони накинуться або зпікірують на свою жертву. Тварини, які витрачають багато часу лазять на деревах використовують бінокулярний зір для того, щоб точно оцінювати відстань, коли стрімко рухаються з гілки на гілку.

Метт Картмілл — фізичний антрополог в Бостонському університеті, піддав критиці цю теорію, посилаючись на інші деревні породи, які відчувають нестачу бінокулярного зору, наприклад білки та деякі види птахів. Замість цього, він пропонує «Візуальну хижацьку гіпотезу», яка стверджує, що родові примати були комахоїдними хижаками, що нагадують долгопядів, з урахуванням того ж тиску відбору фронтального бачення, як інших хижих видів. Він також використовує цю гіпотезу для пояснення спеціалізації у приматів рук, як він передбачає, стали пристосовані для захоплення здобичі, як хижаки використовують кігті.

У мистецтві[ред.ред. код]

Фотографії захоплення перспективи є двовимірними зображеннями, які часто ілюструють ілюзію глибини. (Це відрізняється від картини тим, що в картині використовують фізичну матерію фарби, щоб створити реальну присутність опуклих форм і просторової глибини.) Стереоскоп і View-Master[en], а також 3D-фільми, використовують бінокулярний зір, змушуючи глядача бачити два зображення створених з різних позицій (точок зору). Чарльз Вітстон був першим, хто обговорив сприйняття глибини буття сигналом бінокулярної невідповідності. Він винайшов стереоскоп, який є інструментом з двох окулярів, і який відображає дві фотографії одного і того ж місця, прийнятого порівняно під різними кутами. Коли це спостерігається, окремо кожним оком, пари зображень індукують чітке відчуття глибини.[20]

Навчені художники добре знають про різні методи, які зазначають просторову глибину (колір затінення, відстань протитуманні, перспективних і відносно розміру), і користуються ними, щоб зробити свої твори «реальними». Глядач відчуває, що можна було б досягти і захопити ніс в портреті Рембрандта або яблуко у Сезанна.

Кубізм був заснований на ідеї включення декількох точок зору в розписаний образ, неначе для імітації візуального досвіду фізично в присутності суб'єкта, і бачення його з різних точок зору. У «Високому кубізмі» експерименти Брака і Пікассо цікаві, але ще більш дивними є в візуальному плані. Трохи пізніше картини їх послідовників, таких як вид Роберта Делоне на Ейфелеву вежу, або Манхеттенські міські пейзажі Джона Маріна[ru], запозичували вибухову незграбність кубізму та перебільшували традиційну ілюзію тривимірного простору. Через сто років після пригоди в стилі кубізму, вердикт історії мистецтва в тому, що найтонше і успішне використання декількох точок зору можна знайти в піонерському кінці роботи Сезанна, який як очікувалося, і надихнув перших кубістів. Пейзажі та натюрморти Сезанна запропонували власне високорозвинене сприйняття глибини художника. Водночас, як і інші постімпресіоністи, Сезанн дізнався від японського мистецтва значимість плоских (двовимірних) прямокутників самої картини; Хокусай і Хіросіге ігнорують, або навіть повертають назад лінійну перспективу і тим самим нагадують глядачеві те, що картина може бути тільки «істинною». І саме тоді він визнав істину своєї власної плоскої поверхні. На відміну від Європи «академічна» картина була присвячена Великій Брехні.

Захворювання і сприйняття глибини[ред.ред. код]

Очні захворювання, такі як амбліопія, гіпоплазія зорового нерва, і косоокість може знизити сприйняття глибини.

Оскільки (за визначенням), бінокулярне сприйняття глибини вимагає два функціонуючі ока, то тільки з одним функціонуючим оком ми вже не маємо бінокулярного сприйняття глибини.

Література[ред.ред. код]

  1. Howard, Ian (2012). Perceiving in Depth. New York: Oxford University Press. ISBN 978-0-199-76414-3. 
  2. Sternberg, R. K. (2012).
  3. Goldstein E.B. (2014)Sensation and perception (9th ed.). Pacific Grove CA: Wadsworth.
  4. Burton HE (1945). The optics of Euclid. Journal of the Optical Society of America 35 (5). с. 357–372. doi:10.1364/JOSA.35.000357. 
  5. Ferris SH (1972). Motion parallax and absolute distance. Journal of experimental psychology 95 (2). с. 258–263. 
  6. Swanston, M.C.; Gogel, W.C. (1986). Perceived size and motion in depth from optical expansion. Perception & Psychophysics 39 (5). с. 309–326. doi:10.3758/BF03202998. 
  7. Ittelson, W.H. (Apr 1951). Size as a cue to distance: Radial motion. American Journal of Psycholoyg 64 (2). с. 188–202. doi:10.2307/1418666. JSTOR 1418666. 
  8. Wallach, H.; O'Connell, D.N. (1953). The kinetic depth effect. Journal of Experimental Psychology 45 (4). с. 205–217. doi:10.1037/h0056880. PMID 13052853. 
  9. Kaufman, Lloyd (1974). Sight and Mind. New York: Oxford University Press. с. 139–141. 
  10. Sousa, R., Brenner, E., & Smeets, J. B. J. (2011). Judging an unfamiliar object's distance from its retinal image size. Journal of Vision, 11(9), 10, 1-6. Sousa, R., Smeets, J. B. J., & Brenner, E. (2012). Does size matter? Perception, 41(12), 1532-1534.
  11. O'Shea RP, Blackburn SG, Ono H (1994). Contrast as a depth cue. Vision Research 34 (12). с. 1595–1604. doi:10.1016/0042-6989(94)90116-3. PMID 7941367. 
  12. Johnston, Alan. Depth Perception. UCL Division of Psychology and Language Sciences. Процитовано 22 September 2013. 
  13. Gillam B, Borsting E (1988). The role of monocular regions in stereoscopic displays. Perception 17 (5). с. 603–608. doi:10.1068/p170603. PMID 3249668. 
  14. Schacter, Daniel L.; Gilbert, Daniel T.; Wegner, Daniel M. (2011). Sensation and Perception. Psychology (вид. 2nd). New York: Worth, Inc. с. 136–137. 
  15. Lipton, L. (1982). Foundations of the Stereoscopic Cinema - A Study in Depth. New York: Van Nostrand Reinhold. с. 56. 
  16. Mather G (22 February 1996). Image Blur as a Pictorial Depth Cue. Proceedings: Biological Sciences 263 (1367). с. 169–172. Bibcode:1996RSPSB.263..169M. doi:10.1098/rspb.1996.0027. 
  17. Takashi Nagata; Koyanagi, M; Tsukamoto, H; Saeki, S; Isono, K; Shichida, Y; Tokunaga, F; Kinoshita, M; Arikawa, K та ін. (27 January 2012). Depth Perception from image defocus in a jumping spider. Science 335 (6067). с. 469–471. Bibcode:2012Sci...335..469N. doi:10.1126/science.1211667. PMID 22282813. 
  18. Carlson, Neil R.; Miller Jr., Harold L.; Heth, Donald S.; Donahoe, John W.; Martin, G. Neil (2010). Psychology: The Science of Behavior (вид. 7th). Pearson. с. 187. ISBN 978-0-205-76223-1. 
  19. Medina Puerta A (1989). The power of shadows: shadow stereopsis. J. Opt. Soc. Am. A 6 (2). с. 309–311. Bibcode:1989JOSAA...6..309M. doi:10.1364/JOSAA.6.000309. PMID 2926527. 
  20. Schacter, Daniel L. (2011). Psychology (вид. 2nd). New York: Worth, In. с. 151. 

Бібліографія[ред.ред. код]

  • Howard, Ian P.; Rogers, Brian J. (2012). Perceiving in Depth. New York: Oxford University Press.  In three volumes
  • Palmer, S. E. (1999). Vision science: Photons to phenomenology. Cambridge, MA: Bradford Books/MIT Press. 
  • Pinker, Steven (1997). The Mind's Eye. How the Mind Works. с. 211–233. ISBN 0-393-31848-6. 
  • Sternberg RJ, Sternberg K, Sternberg K (2011). Cognitive Psychology (вид. 6th). Wadsworth Pub Co. 
  • Purves D, Lotto B (2003). Why We See What We Do: An Empirical Theory of Vision. Sunderland, MA: Sinauer Associates. 
  • Steinman, Scott B.; Steinman, Barbara A.; Garzia, Ralph Philip (2000). Foundations of Binocular Vision: A Clinical Perspective. New York: McGraw-Hill Medical. ISBN 0-8385-2670-5.