Нейронний машинний переклад Google

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

Нейронний машинний переклад Google (GNMT) — це система нейронного машинного перекладу (NMT), розроблена компанією Google і представлена в листопаді 2016 року, яка використовує штучну нейронну мережу для підвищення швидкості і якості перекладу в Google Перекладачі.[1][2][3]

GNMT підвищує якість перекладу, застосовуючи метод машинного перекладу що базуеться на прикладах (EBMT), в якому система "навчається на мільйонах прикладів". Архітектура системного навчання GNMT була вперше випробувана на більш, ніж ста мовах, що підтримуються Google Перекладачем. Завдяки потужній внутрішній структурі, система з часом вчиться створювати більш якісні і природні переклади. GNMT здатна перекладати речення в цілому, а не частинами. GNMT здатна виконувати інтерлінгвальний машинний переклад, кодуючи семантику речення замість того, щоб запам'ятовувати переклади окремих фраз.[4]

Історія[ред. | ред. код]

Проект Google Brain був створений в 2011 році в “секретній дослідницькій лабораторії Google X” Джеффом Діном, співробітником Google, Грегом Коррадо, дослідником з Google, та Ендрю Ином, професором комп'ютерних наук Стенфордського університету.[5][6][7] Робота Ина лягла в основу одного з найбільших технологічних проривів в Google і Стенфорді.[8]

У вересні 2016 року дослідницька група Google оголосила про розробку системи перекладу GNMT, і до листопада Google Перекладач почав використовувати нейронний машинний переклад (NMT) замість колишніх статистичних методів (SMT)[9][10][11], які використовувалися з жовтня 2007 року всередині власної закритої SMT системи.[12][13]

Система NMT всередині Google Перекладача використовує велику штучну нейронну мережу, придатну для глибинного навчання.[1][2][3] Вивчаючи мільйони прикладів, GNMT покращує якість перекладу, використовуючи більш широкий контекст для виведення найбільш якісного перекладу. Потім результат перебудовується і пристосовується для відповідності граматиці людської мови. GNMT не створила свою внутрішню універсальну мову, а скоріше прагнула знайти спільне між багатьма мовами, що має бути цікаво більше для психологів і лінгвістів, ніж для фахівців в галузі інформатики.[14] Новий механізм перекладу був включений в обидві сторони для дев'яти мов: англійської, французької, німецької, іспанської, португальської, китайської, японської, корейської та турецького в 2016 році.[1] У березні 2017 року були додані ще три мови: російська, хінді і в'єтнамська.[15] У тому ж місяці за допомогою спільноти Google Перекладача була додана підтримка івриту та арабської мови.[16] Далі в кінці квітня 2017 року було додано підтримку дев'яти індійських мов, а саме: хінді, бенгалі, маратхі, гуджараті, пенджабі, тамільської, телугу, малаялам і каннада.[17]

Мови, що підтримуються GNMT[ред. | ред. код]

Нижче наведено список мовних пар, в яких для перекладу використовується модель нейронного машинного перекладу Google (NMT). Станом на липень 2017 року для всіх мов підтримується тільки переклад на англійську мову і назад:[18]

Мовна пара Коди мов
1 Африкаанс <-> Англійська af <-> en
2 Арабська <-> Англійська ar <-> en
3 Болгарська <-> Англійська bg <-> en
4 Китайська (спрощена) <-> Англійська zh-CN <-> en
5 Китайська (традиційна) <-> Англійська zh-TW <-> en
6 Хорватська <-> Англійська hr <-> en
7 Чеська <-> Англійська cs <-> en
8 Данська <-> Англійська da <-> en
9 Голландська <-> Англійська nl <-> en
10 Французька <-> Англійська fr <-> en
11 Німецька <-> Англійська de <-> en
12 Грецька <-> Англійська el <-> en
13 Іврит <-> Англійська iw <-> en
14 Хінді <-> Англійська hi <-> en
15 Ісландська <-> Англійська is <-> en
16 Індонезійська <-> Англійська id <-> en
17 Італійська <-> Англійська it <-> en
18 Японська <-> Англійська ja <-> en
19 Корейська <-> Англійська ko <-> en
20 Норвезька <-> Англійська no <-> en
21 Польська <-> Англійська pl <-> en
22 Португальська <-> Англійська pt <-> en
23 Румунська <-> Англійська ro <-> en
24 Російська <-> Англійська ru <-> en
25 Словацька <-> Англійська sk <-> en
26 Іспанська <-> Англійська es <-> en
27 Шведська <-> Англійська sv <-> en
28 Тайська <-> Англійська th <-> en
29 Турецька <-> Англійська tr <-> en
30 В'єтнамська <-> Англійська vi <-> en

Прямий переклад[ред. | ред. код]

Стверджується, що система GNMT краще попереднього варіанту Google Перекладача тим, що вона може виконувати "прямий переклад", тобто перекладати з однієї мови на іншу безпосередньо (наприклад, з японської на корейську). Раніше Google Перекладач спочатку перекладав з початкової мови на англійську, а потім з англійської на кінцеву мову замість прямого перекладу з однієї мови на іншу.[4]

Див. також[ред. | ред. код]

Посилання[ред. | ред. код]

  1. а б в Barak Turovsky (November 15, 2016). Found in translation: More accurate, fluent sentences in Google Translate. Google Blog. Процитовано January 11, 2017. 
  2. а б Mike Schuster, Melvin Johnson, and Nikhil Thorat (November 22, 2016). Zero-Shot Translation with Google’s Multilingual Neural Machine Translation System. Google Research Blog. Процитовано January 11, 2017. 
  3. а б Gil Fewster (January 5, 2017). The mind-blowing AI announcement from Google that you probably missed. freeCodeCamp. Процитовано January 11, 2017. 
  4. а б Boitet, Christian; Blanchon, Hervé; Seligman, Mark; Bellynck, Valérie (2010). MT on and for the Web (PDF). Процитовано December 1, 2016. 
  5. Jeff Dean and Andrew Ng (26 June 2012). Using large-scale brain simulations for machine learning and A.I.. Official Google Blog. Процитовано 26 January 2015. 
  6. Google's Large Scale Deep Neural Networks Project. Процитовано 25 October 2015. 
  7. Markoff, John (June 25, 2012). How Many Computers to Identify a Cat? 16,000. New York Times. Процитовано February 11, 2014. 
  8. Robert D. Hof (August 14, 2014). A Chinese Internet Giant Starts to Dream: Baidu is a fixture of online life in China, but it wants to become a global power. Can one of the world’s leading artificial intelligence researchers help it challenge Silicon Valley’s biggest companies?. Technology Review. Процитовано January 11, 2017. 
  9. Katyanna Quach (November 17, 2016). Google's neural network learns to translate languages it hasn't been trained on: First time machine translation has used true transfer learning. Процитовано January 11, 2017. 
  10. Lewis-Kraus, Gideon (December 14, 2016). The Great A.I. Awakening. The New York Times. Процитовано January 11, 2017. 
  11. Le, Quoc; Schuster, Mike (September 27, 2016). A Neural Network for Machine Translation, at Production Scale. Google Research Blog. Google. Процитовано December 1, 2016. 
  12. Google Switches to its Own Translation System, October 22, 2007
  13. Barry Schwartz (October 23, 2007). Google Translate Drops SYSTRAN for Home-Brewed Translation. Search Engine Land. 
  14. Chris McDonald (January 7, 2017). Commenting on Gil Fewster's January 5th article in the Atlantic. Процитовано January 11, 2017. 
  15. Turovsky, Barak. Higher quality neural translations for a bunch more languages. The Keyword Google Blog. Google. Процитовано 6 March 2017. 
  16. Novet, Jordan (30 March 2017). Google now provides AI-powered translations for Arabic and Hebrew. VentureBeat. 
  17. Turovsky, Barak (April 25, 2017). Making the internet more inclusive in India. The Keyword. 
  18. Translation API Language Support. Google Cloud Platform. May 4, 2017. 

Зовнішні посилання[ред. | ред. код]