Пост-редагування

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

Постредагування (або пост-редагування) — це процес правки машинного перекладу, що має на меті високу якість тексту на виході. Людина, яка редагує машинний переклад називається постредактором. Постредагування тісно пов'язано з концепцією попереднього редагування тексту оригіналу. У процесі перекладу тексту за допомогою машинного перекладу найкращі результати можна отримати лише шляхом попереднього редагування оригіналу тексту, наприклад, застосувавши принципи контролю мови автора — а потім вже редагування помилок машинного перекладу. Воно відрізняється від редагування та вдосконалення тексту, написаного людиною (процесу, який часто називають переглядом у галузі перекладу). Після цього відредагований текст може бути переглянутий з метою забезпечення адекватності перекладу та виправлення простих помилок.  

Постредагування передбачає виправлення вихідного результату машинного перекладу, аби забезпечити той рівень якості, що був заздалегідь узгоджений між клієнтом та редактором. Поверхневе постредагування спрямоване на те, щоб зробити текст просто зрозумілим; повне постредагування вдосконалює ще відповідність стилістики перекладу до тексту оригіналу. З можливостями машинного перекладу повне постредагування стає альтернативою ручному, або ж традиційному перекладу. Практично всі засоби комп'ютерного перекладу (CAT) тепер підтримують постредагування текстів машинного перекладу.

Постредагування та машинний переклад[ред. | ред. код]

Машинний переклад почав використовуватися не тільки в наукових центрах, а й в своєму фактичному призначенні в кінці сімдесятих років у деяких великих установах, таких як Європейська Комісія та Панамериканська організація охорони здоров'я, а потім, пізніше, в деяких корпораціях, таких як Caterpillar та General Motors. Перші дослідження про постредагування з'явилися у вісімдесятих роках, пов'язані з його практичним застосуванням. Для розробки відповідних основ та підготовки, члени Асоціації машинного перекладу в Америці (AMTA) та Європейської асоціації машинного перекладу (EAMT) створили в 1999 році спеціальну групу з вивчення процесу постредагування.

Після дев'яностих років, досягнення в галузі комп'ютерних та інтернет технологій значно прискорили розвиток машинного перекладу, що дозволило використувувати його через веб-браузер, у тому числі як безкоштовний та корисний додаток в основних пошукових системах (Google Translate, Bing Translator, Yahoo!, Babel Fish). Визнання того факту широким загалом, що результати машинного перекладу не є досконалими супроводжувалося більшим визнанням постредагуванням. Оскільки попит на локалізацію товарів і послуг зростає такими темпами, які неможливо було задовольнити ручним перекладом, навіть без допомоги пам'яті перекладу та іншими технологіями управління перекладами, такі галузі, як Товариство користувачів автоматизації перекладу (TAUS), очікують, що машинний переклад та постредагування відіграватиме значно більшу роль протягом наступних кількох років.

Використання машинного перекладу іноді передбачає попереднє редагування.

Поверхневе та повне постредагування[ред. | ред. код]

Дослідження у вісімдесятих роках ввело відмінності, які в контексті Служби перекладу Європейської Комісії вперше були визначені як загальне та швидке або повне та творче постредагування. Поверхневе та повне постредагування назараз є тим формулюванням, яке найчастіше використовується сьогодні.

Поверхневе постредагування передбачає мінімальне втручання з боку редактора, і таке редагування потребується лише для того, аби допомогти читачу зрозуміти текст; очікується, що клієнт використовуватиме його лише для внутрішніх цілей, або ж часто в таких ситуаціях, коли текст необхідний терміново або за короткий проміжок часу.

Повне редагування передбачає більш високий рівень редагування з метою досягнення ступеня якості, який має бути узгоджений між клієнтом та постредактором; очікується, що результатом буде той текст, який не тільки зрозумілий, але також стилістично відповідає тексту оригіналу, тому його можна поширювати та використовувати для цільової аудиторії, тобто як для внутрішніх, так і для зовнішніх цілей.

Як результат постредагування машинного перекладу, він не повинен відрізнятися від ручного перекладу. Однак, все ж таки перекладачу потрібно менше зусиль задля опрацювання та перекладу оригінального тексту, ніж постредактору задля роботи з машинним перекладом. Хоча враховуючи досягнення машинного перекладу — цей факт може змінитися. Для роботи з деякими мовними парами і деякими завданнями, враховуючи можливості комп'ютеру, деякі клієнти вже надають перевагу праці з перекладачами постредакторами, замість перекладу з нуля, вважаючи, що вони отримають аналогічну якість за меншу ціну.

Класифікація поверхневого / повного редагування була розроблена в дев'яностих роках, коли машинний переклад все ще містився на компакт-диску, та не могла задовольнити запити машинного перекладу при редагуванні. Для деяких мовних пар та деяких завдань, особливо якщо джерело було попередньо відредаговане, машинний переклад може бути достатньо хорошим для загальних цілей, не вимагаючи попереднього втручання людини.

Ефективність постредагування[ред. | ред. код]

Постредагування застосовується, коли результат машинного перекладу є недостатньої якості, а традиційний переклад не потрібен. Зазвичай постредагування радять використовувати, коли воно може принаймні подвоїти якість ручного перекладу, а у випадку поверхневого постредагування — навіть у чотири рази.

Однак ефективність постредагування важко передбачити. Різні висновки приводять як в наукові, так і в промислові дослідження, стверджуючи, що постредагування, як правило, швидше, ніж переклад з нуля, незалежно від мовних пар чи досвіду перекладачів. Однак єдиного рішення щодо цього немає, оскільки точно не відомо скільки часу можна заощадити за допомогою постредагування на практиці (якщо взагалі можна). Хоча робочі звіти про економію часу становлять близько 40 %, деякі академічні дослідження говорять про те, що економія часу в реальних умовах праці, швидше за все, становить від 0 до 20 %. Професіонали також повідомили про заперечливе підвищення продуктивності, коли на виправлення потрібно більше часу, ніж на переклад з нуля.

Постредагування та лінгвістичні послуги[ред. | ред. код]

Приблизно вже тридцять років існує машинний переклад, а постредагування все ще є на стадії «зародження професії». Права та обов'язки постредактора все ще не зарегламентовані. Постредагування має щось спільне з перекладом та редагуванням, але всюди лише частково. Більшість вважає, що ідеальним редактором буде той перекладач, який прагне навчитись певних необхідним навичок, але є такі, хто вважає, що простіше навчити людину, що лише знає мови, без обізнаності у перекладознавстві. Не багато відомо ні про те, хто фактично є постредакторами, чи є вони, як правило, професійними перекладачами, чи працюють вони в основному як штатні працівники, або як фрілансери, та на яких умовах. Багато професійних перекладачів не підтримують постредагування, серед інших причин тому, що вони, як правило, оплачуються за меншими тарифами, ніж звичайні переклади, причому Міжнародна асоціація професійних письмових та усних перекладачів (IAPTI) особливо наголошує на цьому увагу.

Якість машинного перекладу після постредагування вище, а тому вимагає менших зусиль постредактора, особливо коли машинний переклад забезпечується нейронним, вертикальним або індивідуальним механізмом машинного перекладу. Підвищення якості перекладу може бути оцінено лише згодом, лінгвістам потрібен час для виправлення машинного перекладу в тому самому середовищі перекладу, як XTM Cloud, що є системою управління перекладом та автоматизованим перекладом, де час постредагування та оцінка мовної якості є результатом опублікованих текстів, які вже згодом можна порівняти.

Немає чітких даних про те, наскільки поширене постредагування в перекладацькій галузі. Нещодавно проведене опитування показало, що 50 % тих, хто пропонує мовні послуги використовують постредагування, але 85 % має менше ніж 10 % їх пропускної спроможності. Memsource, онлайн-додаток перекладу, стверджує, що понад 50 відсотків перекладів на його платформі між англійською, іспанською та французькою та іншими мовами зроблено за допомогою пам'яті перекладу з машинним перекладом. Постредагування також здійснюється через портали для краудсорсингу перекладів, такі як Unbabel, які до листопада 2014 року стверджували, що відредагували понад 11 млн слів.

Оцінки результативності та обсягу, в будь-якому випадку, є динамічним процесом, тому значною мірою розвиток постредагування текстів зумовлено тим фактом, що чим швидше та ґрунтовніше буде вдосконалюватися сфера постредагування, тим вищою буде якість машинного перекладу.

Див. також[ред. | ред. код]

Джерела[ред. | ред. код]

  1. Авторське редагування
  2. Корунець І. В. Теорія і практика перекладу (аспекти перекладу) / І. В. Корунець. — Вінниця, 2003. — 448 с.
  3. Машинна лінгвістика рідною мовою http://journlib.univ.kiev.ua/index.php?act=article&article=1456
  4. Особливості використання машинного перекладу в умовах професійної підготовки майбутніх перекладачів
  5. Green, Spence, Jeffrey Heer, and Christopher D. Manning (2013). «The Efficacy of Human Post-Editing for Language Translation» (PDF). ACM Human Factors in Computing Systems.
  6. Marcello Federico, Alessandro Cattelan, and Marco Trombetti (2012). «Measuring user productivity in machine translation enhanced computer assisted translation» (PDF).
  7. Plitt, Mirko and Francois Masselot (2010). «A Productivity Test of Statistical Machine Translation Post-Editing in A Typical Localisation Context» (PDF). Prague Bulletin of Mathematical Linguistics. 93: 7–16.