Машинний переклад

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до: навігація, пошук

Машинний переклад (МП):

  • переклад текстів (письмових та усних) з однієї природної мови на іншу за допомогою комп'ютера;
  • напрямок наукових досліджень, пов'язаний з побудовою перекладацьких систем.

На базовому рівні, робота комп'ютерних програм для перекладу полягає у заміні слів чи словосполучень з однієї мови на слова чи словосполучення з іншої. Однак тоді виникає проблема, що така заміна не може забезпечити якісний переклад тексту, адже потрібне визначення та розпізнання слів та цілих фраз з мови оригіналу. Це спонукає активну наукову діяльність у галузі комп'ютерної лінгвістики. Наразі, для вирішення неоднозначностей при перекладі, використовуються багатомовні онтологічні ресурси, такі як WordNet та UWN.

Автоматизований переклад[ред.ред. код]

Замість «машинний» іноді вживається слово автоматичний, що не впливає на сенс. Проте термін автоматизований переклад має зовсім інше значення  — в такому випадку програма просто допомагає людині перекладати тексти.

Автоматизований переклад передбачає такі форми взаємодії:

  • Частково автоматизований переклад: наприклад, використання перекладачем-людиною комп'ютерних словників.
  • Системи з поділом праці: комп'ютер навчений перекладати тільки фрази жорстко заданої структури (але робить це так, що виправляти за ним не потрібно), а все, що не вклалося в схему, віддає людині.

В англомовній термінології також розрізняються терміни англ. machine translation, MT (повністю автоматичний переклад) і англ. machine-aided або англ. machine-assisted translation (MAT) (автоматизований); якщо ж треба позначити й те, й інше, пишуть M(A)T.

Існують два принципово різних підходи до побудови алгоритмів машинного перекладу: заснований на правилах (rule-based) і статистичний, або заснований на статистиці (statistical-based). Перший підхід є традиційним і використовується більшістю розробників систем машинного перекладу (ПРОМТ в Росії, SYSTRAN у Франції, Linguatec у Німеччині тощо) [1] До другого типу належить популярний сервіс Перекладач компанії Google[2], а також новий сервіс від ABBYY [3]

Статистичний машинний переклад[ред.ред. код]

Статистичний машинний переклад — це різновид машинного перекладу тексту, заснований на порівнянні великих обсягів мовних пар. Мовні пари — тексти, що містять речення на одній мові і відповідні речення на інші, можуть бути як варіантами написання двох речень людиною — носієм двох мов, так і набором речень та їх перекладів, виконаних людиною. Таким чином статистичний машинний переклад має властивістю «самонавчання». Чим більше в розпорядженні програми є мовних пар і чим точніше вони відповідають один одному, тим краще результат статистичного машинного перекладу.

Під поняттям «статистичного машинного перекладу» мається на увазі загальний підхід до вирішення проблеми перекладу, який заснований на пошуку найімовірнішого перекладу речення з використанням даних, отриманих з двомовної сукупності текстів. Як приклад двомовної сукупності текстів можна назвати парламентські звіти, які являють собою протоколи дебатів в парламенті. Двомовні парламентські звіти видаються в Канаді, Гонконгу та інших країнах; офіційні документи Європейського економічного співтовариства видаються 11 мовами; а Організація Об'єднаних Націй публікує документи на декількох мовах. Як виявилося, ці матеріали є безцінними ресурсами для статистичного машинного перекладу.

Примітки[ред.ред. код]

Див. також[ред.ред. код]


Мовознавство Це незавершена стаття з мовознавства.
Ви можете допомогти проекту, виправивши або дописавши її.