Таблиця сумарних площ

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
Використання таблиці сумарних площ (2.) магічного квадрата шостого порядку (1.) для підсумовування підпрямокутника його значень; кожна кольорова пляма висвітлює суму всередині прямокутника її кольору.

Табли́ця сума́рних пло́щ (англ. summed-area table) — це структура даних та алгоритм для швидкого й ефективного породжування суми значень у прямокутній підмножині ґратки. В галузі обробки зображень вона також відома як інтегра́льне зобра́ження (англ. integral image). Її було запроваджено в комп'ютерній графіці 1984 року Френком Кроу[en] для використання з MIP-текстуруванням. У комп'ютернім баченні її популяризував Льюїс,[1] а потім вона отримала назву «інтегрального зображення» та широке використання в системі Віоли — Джонса виявляння об'єктів 2001 року. Історично цей принцип дуже добре відомий у дослідженні багатовимірних функцій розподілу ймовірності, а саме в обчисленні двовимірних (або N-вимірних) імовірностей (площ під розподілом імовірності) з відповідних кумулятивних функцій розподілу.[2]

Алгоритм[ред. | ред. код]

Як підказує назва, значення в будь-якій точці (xy) таблиці сумарних площ — це сума всіх пікселів вище та ліворуч від (xy), включно:[3][4]

де це значення пікселя в (x, y).

Таблицю сумарних площ можливо ефективно обчислювати за один прохід зображенням, оскільки значення в ній в (xy) це просто[5]

(Зверніть увагу, що цю сумарну матрицю обчислюють з верхнього лівого кута)
Опис обчислення суми в структурі даних/алгоритмі таблиці сумарних площ

Щойно таблицю сумарних площ було обчислено, для обчислення суми яскравостей будь-якої прямокутної області потрібно рівно чотири посилання на масив незалежно від розміру області. Тобто, за позначень на рисунку праворуч, маючи A=(x0, y0), B=(x1, y0), C=(x0, y1) та D=(x1, y1), сума i(x, y) у прямокутнику, охопленому A, B, C та D, дорівнює:

Розширення[ред. | ред. код]

Цей метод природно розширюється на неперервні області.[2]

Цей метод також можливо розширити на зображення високої вимірності.[6] Якщо кути прямокутника — з в , то суму значень зображення, які містяться в цьому прямокутнику, обчислюють за формулою

де  — інтегральне зображенням в , а  — вимірність зображення. Запис відповідає у наведеному вище прикладі , , , та . У нейровізуалізації, наприклад, зображення мають вимірність або , при використанні вокселів або вокселів із часовою міткою.

Цей метод було розширено до інтегрального зображення високого порядку, як у праці Фана зі співавт.,[7] які запропонували два, три або чотири інтегральні зображення для швидкого та ефективного обчислювання стандартного відхилення (дисперсії), коефіцієнту асиметрії та коефіцієнта ексцесу локального блоку зображення. Це описано докладно нижче:

Для обчислювання дисперсії та стандартного відхилення блоку нам потрібні два інтегральні зображення:

Дисперсію визначають як

Нехай та позначують суми блоку з та відповідно. Обчислювати та інтегральними зображеннями швидко. Тепер ми перетворюємо рівняння дисперсії так:

Де , а .

Подібно до оцінювання середнього значення () та дисперсії (), для яких потрібні інтегральні зображення першого та другого степеня зображення відповідно (тобто ), маніпуляції, подібні до згаданих вище, можливо виконати з третім і четвертим степенями зображень (тобто ) для отримання коефіцієнтів асиметрії та ексцесу.[7] Але одна важлива деталь втілення, яку слід мати на увазі для вищевказаних методів, як зазначили Ф. Шафаіт зі співавт.,[8] полягає в переповненні цілих чисел, що виникає для інтегральних зображень вищого порядку у випадку використання 32-розрядних цілих чисел.

Див. також[ред. | ред. код]

Примітки[ред. | ред. код]

  1. Lewis, J.P. (1995). Fast template matching. Proc. Vision Interface. с. 120—123. (англ.)
  2. а б Finkelstein, Amir; neeratsharma (2010). Double Integrals By Summing Values Of Cumulative Distribution Function. Wolfram Demonstration Project. (англ.)
  3. Crow, Franklin (1984). Summed-area tables for texture mapping. SIGGRAPH '84: Proceedings of the 11th annual conference on Computer graphics and interactive techniques. с. 207—212. (англ.)
  4. Viola, Paul; Jones, Michael (2002). Robust Real-time Object Detection (PDF). International Journal of Computer Vision. (англ.)
  5. BADGERATI (3 вересня 2010). Computer Vision – The Integral Image. computersciencesource.wordpress.com. Процитовано 13 лютого 2017. (англ.)
  6. Tapia, Ernesto (January 2011). A note on the computation of high-dimensional integral images. Pattern Recognition Letters. 32 (2): 197—201. doi:10.1016/j.patrec.2010.10.007. (англ.)
  7. а б Phan, Thien; Sohoni, Sohum; Larson, Eric C.; Chandler, Damon M. (22 квітня 2012). Performance-analysis-based acceleration of image quality assessment (PDF). с. 81—84. CiteSeerX 10.1.1.666.4791. doi:10.1109/SSIAI.2012.6202458. ISBN 978-1-4673-1830-3. Архів оригіналу (PDF) за 24 травня 2014. Процитовано 1 січня 2023. {{cite book}}: Проігноровано |journal= (довідка) (англ.)
  8. Shafait, Faisal; Keysers, Daniel; M. Breuel, Thomas (January 2008). Efficient implementation of local adaptive thresholding techniques using integral images (PDF). Electronic Imaging. Document Recognition and Retrieval XV. 6815: 681510–681510–6. CiteSeerX 10.1.1.109.2748. doi:10.1117/12.767755. Архів оригіналу (PDF) за 15 грудня 2014. Процитовано 1 січня 2023. (англ.)

Посилання[ред. | ред. код]

Відео лекцій