CuneiForm

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук
CuneiForm
CuneiForm OCR.pngCuneiForm 12
Автор(и) Cognitive Technologies
Розробник(и) Cognitive Technologies
Стабільний випуск 12 (12 грудня 2007)
Нестабільний випуск джерельні коди (2 квітня 2008)
Операційна система Windows, Linux[1]
Українська інтерфейс — ні, ОРС — так
Тип ОРС
Ліцензія вільна (Відкрите програмне забезпечення з березня 2008), Ліцензія BSD
Сайт www.cuneiform.ru, www.openocr.org

CuneiForm — інструмент оптичного розпізнавання символів, розроблений російською компанією Cognitive Technologies. Програма перетворює файли зображень, отримані зі сканера або іншим шляхом на текст. Після декількох років без розвитку, 12 грудня 2007 року анонсовано відкриття джерельних текстів програми, яке відбулося 2 квітня 2008 року [2].

Можливості[ред.ред. код]

CuneiForm — шрифтонезалежна (OmniFont) система. Алгоритми, закладені в CuneiForm, виходять з правил написання букв, з їх топології, і не вимагають завдання яких-небудь еталонів, або навчання. Розпізнаються будь-які друкарські шрифти — книги, газети, журнали, роздруківки з лазерних і матричних принтерів, тексти з друкарських машинок, і т.п. Не розпізнається рукописний текст і декоративні шрифти (готичний, стилізований під рукописний). У CuneiForm існують спеціальні налаштування для розпізнавання текстів з матричного принтера і факсів 200x100 DPI.

CuneiForm зберігає форматування тексту і роспізнає складні таблиці будь-якої структури.

Програма розпізнає текст на англійській, болгарській, голландській, данській, естонській, іспанській, італійській, латвійській, литовській, німецькій, польській, португальській, російській, румунській, сербській, словенській, турецькій, угорській, українській, французькій, хорватській, чеській, шведській мовах та російсько-англійський двомовний текст.

CuneiForm може зберегти розпізнаний текст у форматах RTF, HTML, або текстовому. Також можливо передати текст до текстового процесора Word або електронної таблиці Excel.

Історія[ред.ред. код]

Колись лідер програмного забезпечення з розпізнавання символів у Росії, CuneiForm змагався з популярною нині програмою ABBYY FineReader.

Майбутнє[ред.ред. код]

Cognitive Technologies розпочали програму «Розпізнавання має бути на кожному комп'ютері», щоб зробити розпізнавання доступним для всіх споживачів. Перший крок програми — випуск CuneiForm як вільно поширюваного ПЗ. Наступним кроком стане запуск вільної on-line служби розпізнавання на сайті www.cuneiform.ru до кінця січня 2008 року.

2 квітня 2008 року компанія Cognitive Technologies оголосила про відкриття джерельного коду програми[2]. В даний час, розробники вибрали для проекту ліцензію BSD[3].

У квітні 2009 випущена перша версія Cuneiform-Qt — графічного інтерфейсу до Cuneiform на основі бібліотеки Qt4.

У червні 2009 випущена перша публічна версія YAGF — графічної оболонки до Cuneiform на основі бібліотеки Qt4.

Див. також[ред.ред. код]

Посилання[ред.ред. код]

Виноски[ред.ред. код]

  1. Jussy Pakkanen портував джерельний код Cuneiform під Linux. Поточний статус --- альфа.
  2. а б Cognitive Technologies відкрила код OCR Cuneiform
  3. Ліцензія