Автоматизований переклад

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

Автоматизований переклад (АП, англ. Computer-Aided Translation (CAT)) — переклад текстів на комп'ютері з використанням комп'ютерних технологій. Від машинного перекладу (МП) він відрізняється тим, що весь процес перекладу здійснюється людиною, комп'ютер лише допомагає їй створити готовий текст або за менший час, або з кращою якістю.

Ідея АП з'явилася з моменту появи комп'ютерів: перекладачі завжди виступали проти стандартної в ті роки концепції МП, на яку було спрямовано більшість досліджень в області комп'ютерної лінгвістики, але підтримували використання комп'ютерів для допомоги перекладачам. У 1960-і роки Європейське об'єднання вугілля та сталі (попередник сучасного Євросоюзу) почало створювати термінологічні бази даних під загальною назвою Eurodicautom[1]. У Радянському Союзі для створення баз такого роду був створений ВІНІТІ.

У сучасній формі ідея АП була розвинена у статті Мартіна Кея 1980 року [2], який висунув наступну тезу: «by taking over what is mechanical and routine, it (computer) frees human beings for what is essentially human» (комп'ютер бере на себе рутинні операції і звільняє людину для операцій, що вимагають людського мислення).

В даний час найпоширенішими способами використання комп'ютерів при письмовому перекладі є робота із словниками та глосаріями, окремими термінологічними базами, пам'яттю перекладів (англ. Translation Memory, TM), що містить приклади раніше перекладених текстів, а також використання так званих корпусів, великих колекцій текстів однією або декількома мовами, що дає стислий опис того, як слова і вирази реально використовуються в мові в цілому або в конкретній наочній області.

Для локалізації програмного забезпечення часто застосовуються спеціалізовані засоби, наприклад Passolo, які дозволяють перекладати меню та повідомлення у програмних ресурсах і безпосередньо у скомпільованих програмах, а також тестувати коректність локалізації. Для перекладу аудіовізуальних матеріалів (головним чином фільмів) також використовуються спеціалізовані засоби, наприклад, Swift, які об'єднують в собі деякі аспекти пам'яті перекладів, але додатково забезпечують можливість появи субтитрів за часом, їх форматування на екрані, відповідності відеостандартам і т. п

При синхронному перекладі використання засобів автоматизованого перекладу за необхідністю обмежено. Одним з прикладів є використання словників, що завантажуються на КПК. Іншим прикладом може служити напівавтоматичне витягання списків термінів при підготовці до синхронного перекладу у вузькій наочній області[3].

У вузьких наочних областях за великої кількості початкових текстів і сталої термінології перекладачі можуть використовувати і машинний переклад, який може забезпечити гарну якість перекладу термінології та стійких виразів у вузькій області. Перекладач у цьому випадку здійснює пост-редагування отриманого тексту. Більше половини текстів всередині Єврокомісії (головним чином юридичні тести та поточна кореспонденція) перекладаються з використанням МП.

Приклади систем автоматизованого перекладу на ринку програмного забезпечення — SDL Trados, Transit, Deja Vu, Wordfast, AIT.

Загальний огляд[ред.ред. код]

Автоматизований переклад це широке поняття, що охоплює різні засоби та інструменти. Вони можуть включати:

  • Програми для перевірки правопису, що вбудовуються у текстові редактори або окремі програми;
  • Програми для перевірки розділових знаків, що також можуть бути вбудованими у текстові редактори або додаткові програми;
  • Програми для управління термінологією, що дозволяють перекладачам управляти своєю власною термінологічною базою в електронній формі. Це може бути створена у текстовому редакторі звичайна таблиця, електронна таблиця, а також база даних, що збудована у програмі FileMaker Pro. Для більш трудомістких (та більш дорогих) рішень існує спеціальне програмне забезпечення на кшталт LogiTerm, MultiTerm, Termex та інше;
  • Словники на компакт-дисках, одномовні або багатомовні;
  • Термінологічні бази даних, що зберігаються на компакт-дисках або підключаються через мережу Інтернет, наприклад The Open Terminology Forum або TERMIUM;
  • Програми для повнотекстового пошуку (або індексатори), що дозволяють користувачу робити запити у раніше перекладених текстах або різних довідкових документах. У перекладацькому середовищі найбільш відомі такі індексатори як Naturel, ISYS Search Software, and dtSearch;
  • Програми конкордансу, що дозволяють знаходити приклади слів або висловів у поширеному контексті в одномовному, двомовному та багатомовному корпусах, як то бітекст або пам'ять перекладів;
  • Бітекст, що не є дуже новим винаходом, являє собою наслідок злиття первинного тексту та його перекладу, що може бути пізніше проаналізованим програмами для повнотекстового пошуку або конкордансу;
  • Програмне забезпечення для управління проектами, що дозволяє мовознавцям структурувати складні перекладацькі проекти, доручати різні завдання різним співробітникам, а потім наглядати за процесом їх виконання;
  • Менеджери пам'яті перекладів (ТММ), що складаються з бази даних сегментів тексту на первинній мові та їх перекладів на одну та більше цільових мов;
  • Майже повністю автоматичні системи, що нагадують машинний переклад, але дозволяють користувачу вносити поправки у сумнівних випадках. Іноді такі програми називають машинним перекладом за участю людини.

Джерела[ред.ред. код]

  1. http://ec.europa.eu/eurodicautom/Controller
  2. Martin Kay (1980), The Proper Place of Men and Machines in Language Translation. Research report CSL-80-11, Xerox Palo Alto Research Center, Palo Alto, CA. Передруковано у 1997 році в Machine Translation 12: 3–23, 1997.(PDF)
  3. Claudio Fantinuoli, Specialized Corpora from the Web and Term Extraction for Simultaneous Interpreters. // Baroni, Bernardini (ред.), WaCky! Working Papers on the Web as Corpus, С. 173-190, Wackybook

Див. також[ред.ред. код]

Посилання[ред.ред. код]