Автоматизований переклад

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

Автоматизований переклад (АП, англ. Computer-Aided Translation (CAT)) — переклад текстів на комп'ютері з використанням комп'ютерних технологій. Від машинного перекладу (МП) він відрізняється тим, що весь процес перекладу здійснюється людиною, комп'ютер лише допомагає їй створити готовий текст або за менший час, або з кращою якістю.

Загальний огляд[ред.ред. код]

Ідея АП з'явилася з моменту появи комп'ютерів: перекладачі завжди виступали проти стандартної в ті роки концепції МП, на яку було спрямовано більшість досліджень в області комп'ютерної лінгвістики, але підтримували використання комп'ютерів для допомоги перекладачам. У 1960-і роки Європейське об'єднання вугілля та сталі (попередник сучасного Євросоюзу) почало створювати термінологічні бази даних під загальною назвою Eurodicautom[1]. У Радянському Союзі для створення баз такого роду був створений ВІНІТІ.

У сучасній формі ідея АП була розвинена у статті Мартіна Кея 1980 року [2], який висунув таку тезу:

Комп'ютер бере на себе рутинні операції і звільняє людину для операцій, що вимагають людського мислення
(By taking over what is mechanical and routine, it (computer) frees human beings for what is essentially human.

Наразі найпоширенішими способами використання комп'ютерів під час письмового перекладу є робота зі словниками й глосаріями, окремими термінологічними базами, пам'яттю перекладів (англ. Translation Memory, TM), що містить приклади раніше перекладених текстів, а також використання так званих корпусівв—еликих колекцій текстів однією або делькома мовами, що дає стислий опис того, як слова і вирази реально використовуються в мові в цілому або в конкретній наочній області.

Для локалізації програмного забезпечення часто застосовуються спеціалізовані засоби, наприклад SDL Passolo, які дають змогу перекладати меню та повідомлення у програмних ресурсах і безпосередньо у скомпільованих програмах, а також тестувати коректність локалізації. Для перекладу аудіовізуальних матеріалів (здебільшого фільмів) також використовуються спеціалізовані засоби, наприклад, Swift, які об'єднують в собі деякі аспекти пам'яті перекладів, але додатково забезпечують можливість появи субтитрів за часом, їх форматування на екрані, відповідності відеостандартам тощо.

У синхронному перекладі використання засобів автоматизованого перекладу за необхідністю обмежено. Одним із прикладів є використання словників, що завантажуються на КПК. Іншим прикладом може служити напівавтоматичне витягання списків термінів під час підготовки до синхронного перекладу у вузькій наочній області[3].

У вузьких наочних областях за великої кількості початкових текстів і сталої термінології перекладачі можуть використовувати і машинний переклад, який здатен забезпечити гарну якість перекладу термінології та стійких виразів у вузькій області. Перекладач у цьому випадку здійснює так зване постредагування отриманого тексту. Більше половини текстів всередині Єврокомісії (головним чином юридичні тести та поточна кореспонденція) перекладаються з використанням МП.

Приклади систем автоматизованого перекладу на ринку програмного забезпечення — SDL Trados, Transit, Deja Vu, Wordfast, Wordfast Anywhere, OmegaT.

Програми, використовувані під час автоматизованого перекладу[ред.ред. код]

Автоматизований переклад — це широке поняття, що охоплює різні засоби й інструменти. Вони можуть включати:

  • Програми для перевірки правопису, вбудовані в текстові редактори або як окремі програми.
  • Програми для перевірки розділових знаків, які теж можуть бути вбудованими у текстові редактори, або додаткові програми;
  • Програми для керування термінологією, які дають перекладачам змогу керувати своєю власною термінологічною базою в електронній формі. Це може бути створена в текстовому редакторі звичайна таблиця, електронна таблиця, а також база даних, збудована у програмі на кшталт FileMaker Pro. Для більш трудомістких (та більш дорогих) рішень існує спеціальне програмне забезпечення на кшталт LogiTerm, MultiTerm, Termex та інше.
  • Електронні словники, одномовні або багатомовні.
  • Термінологічні бази даних, що зберігаються в електронному вигляді або підключаються через мережу Інтернет, наприклад The Open Terminology Forum або TERMIUM.
  • Програми для повнотекстового пошуку («індексатори»), які дають користувачу змогу робити запити у раніше перекладених текстах або різних довідкових документах. У перекладацькому середовищі найбільш відомі такі індексатори як Naturel, ISYS Search Software, and dtSearch.
  • Програми конкордансу, які дають змогу шукати приклади слів або висловів у поширеному контексті в одномовному, двомовному та багатомовному корпусах, як то бітекст або пам'ять перекладів.
  • Бітекст, що не є дуже новим винаходом, являє собою наслідок злиття первинного тексту та його перекладу, що може бути пізніше проаналізованим програмами для повнотекстового пошуку або конкордансу.
  • Програмне забезпечення для управління проектами, що дозволяє мовознавцям структурувати складні перекладацькі проекти, доручати різні завдання різним співробітникам, а потім наглядати за процесом їх виконання.
  • Менеджери пам'яті перекладів (ТММ), що складаються з бази даних сегментів тексту на первинній мові та їх перекладів на одну та більше цільових мов.
  • Майже повністю автоматичні системи, що нагадують машинний переклад, але дають користувачеві змогу вносити поправки в сумнівних випадках. Іноді такі програми називають машинним перекладом за участю людини.

Джерела[ред.ред. код]

  1. http://ec.europa.eu/eurodicautom/Controller
  2. Martin Kay (1980), The Proper Place of Men and Machines in Language Translation. Research report CSL-80-11, Xerox Palo Alto Research Center, Palo Alto, CA. Передруковано у 1997 році в Machine Translation 12: 3–23, 1997.(PDF)
  3. Claudio Fantinuoli, Specialized Corpora from the Web and Term Extraction for Simultaneous Interpreters. // Baroni, Bernardini (ред.), WaCky! Working Papers on the Web as Corpus, С. 173-190, Wackybook

Див. також[ред.ред. код]

Посилання[ред.ред. код]