Нейронний машинний переклад Google

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

Нейронний машинний переклад Google (GNMT) — це система нейронного машинного перекладу (NMT), розроблена компанією Google і представлена в листопаді 2016 року, яка використовує штучну нейронну мережу для підвищення швидкості і якості перекладу в Google Перекладачі[1][2][3].

GNMT підвищує якість перекладу, застосовуючи метод машинного перекладу що базується на прикладах (EBMT), у якому система «навчається на мільйонах прикладів». Архітектура системного навчання GNMT була вперше випробувана на більш ніж ста мовах, що підтримуються Google Перекладачем. Завдяки потужній внутрішній структурі система з часом вчиться створювати якісніші й природніші переклади. GNMT здатна перекладати речення в цілому, а не частинами. GNMT здатна виконувати інтерлінгвальний машинний переклад, кодуючи семантику речення замість того, щоб запам'ятовувати переклади окремих фраз[4].

Історія[ред. | ред. код]

Проєкт Google Brain був створений у 2011 році в «секретній дослідницькій лабораторії Google X» Джеффом Діном, співробітником Google, Грегом Коррадо, дослідником із Google, та Ендрю Ином, професором комп'ютерних наук Стенфордського університету[5][6][7]. Робота Ина лягла в основу одного з найбільших технологічних проривів у Google і Стенфорді[8].

У вересні 2016 року дослідницька група Google оголосила про розробку системи перекладу GNMT, і до листопада Google Перекладач почав використовувати нейронний машинний переклад (NMT) замість колишніх статистичних методів (SMT)[9][10][11], які використовувалися з жовтня 2007 року всередині власної закритої SMT-системи[12][13].

Система NMT всередині Google Перекладача використовує велику штучну нейронну мережу, придатну для глибокого навчання[1][2][3]. Вивчаючи мільйони прикладів, GNMT покращує якість перекладу, використовуючи ширший контекст для виведення найякіснішого перекладу. Потім результат перебудовується й пристосовується для відповідності граматиці людської мови.

GNMT не створила свою внутрішню універсальну мову, а скоріше прагнула знайти спільне між багатьма мовами, що має бути цікаво більше для психологів і лінгвістів, ніж для фахівців у галузі інформатики[14]. Новий механізм перекладу був включений в обидві сторони для дев'яти мов: англійської, іспанської, китайської, корейської, німецької, португальської, турецької, французької та японської у 2016 році[1]. У березні 2017 року були додані ще три мови: в'єтнамська, російська та хінді[15]. У тому ж місяці за допомогою спільноти Google Перекладача була додана підтримка арабської мови та івриту[16]. Далі наприкінці квітня 2017 року було додано підтримку дев'яти індійських мов, а саме: бенгалі, гуджараті, каннада, малаялам, маратхі, пенджабі, тамільської, телугу та гінді[17].

Мови, що підтримуються GNMT[ред. | ред. код]

Нижче наведено список мовних пар, у яких для перекладу використовується модель нейронного машинного перекладу Google (NMT). Станом на липень 2017 року для всіх мов підтримується тільки переклад на англійську мову і назад[18]:

Мовна пара Коди мов
1 Африкаанс ↔ Англійська afen
2 Арабська ↔ Англійська aren
3 Болгарська ↔ Англійська bgen
4 Китайська (спрощена) ↔ Англійська zh-CNen
5 Китайська (традиційна) ↔ Англійська zh-TWen
6 Хорватська ↔ Англійська hren
7 Чеська ↔ Англійська csen
8 Данська ↔ Англійська daen
9 Голландська ↔ Англійська nlen
10 Французька ↔ Англійська fren
11 Німецька ↔ Англійська deen
12 Грецька ↔ Англійська elen
13 Іврит ↔ Англійська iwen
14 Хінді ↔ Англійська hien
15 Ісландська ↔ Англійська isen
16 Індонезійська ↔ Англійська iden
17 Італійська ↔ Англійська iten
18 Японська ↔ Англійська jaen
19 Корейська ↔ Англійська koen
20 Норвезька ↔ Англійська noen
21 Польська ↔ Англійська plen
22 Португальська ↔ Англійська pten
23 Румунська ↔ Англійська roen
24 Російська ↔ Англійська ruen
25 Словацька ↔ Англійська sken
26 Іспанська ↔ Англійська esen
27 Шведська ↔ Англійська sven
28 Тайська ↔ Англійська then
29 Турецька ↔ Англійська tren
30 В'єтнамська ↔ Англійська vien

Прямий переклад[ред. | ред. код]

Стверджується, що система GNMT краще попереднього варіанту Google Перекладача тим, що вона може виконувати «прямий переклад», тобто перекладати з однієї мови на іншу безпосередньо (наприклад, з японської на корейську). Раніше Google Перекладач спочатку перекладав з початкової мови на англійську, а потім з англійської на кінцеву мову замість прямого перекладу з однієї мови на іншу[4].

Див. також[ред. | ред. код]

Примітки[ред. | ред. код]

  1. а б в Barak Turovsky (15 листопада 2016), Found in translation: More accurate, fluent sentences in Google Translate, Google Blog, процитовано 11 січня 2017
  2. а б Mike Schuster, Melvin Johnson, and Nikhil Thorat (22 листопада 2016), Zero-Shot Translation with Google’s Multilingual Neural Machine Translation System, Google Research Blog, процитовано 11 січня 2017
  3. а б Gil Fewster (5 січня 2017), The mind-blowing AI announcement from Google that you probably missed, freeCodeCamp, архів оригіналу за 31 травня 2017, процитовано 11 січня 2017
  4. а б Boitet, Christian; Blanchon, Hervé; Seligman, Mark; Bellynck, Valérie (2010). MT on and for the Web (PDF). Архів оригіналу (PDF) за 29 березня 2017. Процитовано 1 грудня 2016.
  5. Jeff Dean and Andrew Ng (26 червня 2012). Using large-scale brain simulations for machine learning and A.I. Official Google Blog. Процитовано 26 січня 2015.
  6. Google's Large Scale Deep Neural Networks Project. Процитовано 25 жовтня 2015.
  7. Markoff, John (25 червня 2012). How Many Computers to Identify a Cat? 16,000. New York Times. Процитовано 11 лютого 2014.
  8. Robert D. Hof (14 серпня 2014). A Chinese Internet Giant Starts to Dream: Baidu is a fixture of online life in China, but it wants to become a global power. Can one of the world’s leading artificial intelligence researchers help it challenge Silicon Valley’s biggest companies?. Technology Review. Процитовано 11 січня 2017.
  9. Katyanna Quach (17 листопада 2016), Google's neural network learns to translate languages it hasn't been trained on: First time machine translation has used true transfer learning, процитовано 11 січня 2017
  10. Lewis-Kraus, Gideon (14 грудня 2016). The Great A.I. Awakening. The New York Times. Процитовано 11 січня 2017.
  11. Le, Quoc; Schuster, Mike (27 вересня 2016). A Neural Network for Machine Translation, at Production Scale. Google Research Blog. Google. Процитовано 1 грудня 2016.
  12. Google Switches to its Own Translation System, October 22, 2007
  13. Barry Schwartz (23 жовтня 2007). Google Translate Drops SYSTRAN for Home-Brewed Translation. Search Engine Land.
  14. Chris McDonald (7 січня 2017), Commenting on Gil Fewster's January 5th article in the Atlantic, процитовано 11 січня 2017
  15. Turovsky, Barak. Higher quality neural translations for a bunch more languages. The Keyword Google Blog. Google. Процитовано 6 березня 2017.
  16. Novet, Jordan (30 березня 2017). Google now provides AI-powered translations for Arabic and Hebrew. VentureBeat.
  17. Turovsky, Barak (25 квітня 2017). Making the internet more inclusive in India. The Keyword.
  18. Translation API Language Support. Google Cloud Platform. 4 травня 2017.

Посилання[ред. | ред. код]