Tesseract

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук
Tesseract
TesseractLogo.png
Tesseract-3.03.png
Розробник(и) Hewlett-Packard, Google
Стабільний випуск 3.02 (28 жовтня 2012 )
Версії 3.04 і 3.05.00[1]
Репозиторій github.com/tesseract-ocr/tesseract
Написано на C C++
Операційна система Windows, Linux, Mac OS X
Тип OCR
Ліцензія Apache 2.0
Веб-сайт tesseract-ocr.googlecode.com

CMNS: Tesseract на Вікісховищі

Tesseract — вільна програма для розпізнавання текстів, розроблялася Hewlett-Packard з 1985 до 1994 року, а в наступне десятиріччя залишалася практично без змін. Не так давно Google купив[Джерело?] її та відкрив джерельні тексти під ліцензією Apache 2.0 у 2006 році.[2] для продовження розробки. У цей час програма вже працює з UTF-8, розпізнає багато мов, серед яких і українська.

Застосування[ред.ред. код]

Tesseract був використаний, зокрема, Міжнародним консорціумом журналістів-розслідувачів для дослідження інформації у так званих «панамських документах»[3].

Примітки[ред.ред. код]

  1. https://api.github.com/repos/tesseract-ocr/tesseract/releases
  2. Vincent, Luc (August 2006). Announcing Tesseract OCR. Архів оригіналу за 2012-03-18. Процитовано 2008-06-26. 
  3. Mar Cabra, Erin Kissane (11 квітня 2016). The People and Tech Behind the Panama Papers. opennews.org. An OpenNews project. Процитовано 18 квітня 2016. 

Див. також[ред.ред. код]

Посилання[ред.ред. код]