Українські TTS

Матеріал з Вікіпедії — вільної енциклопедії.
(Перенаправлено з TTS Ukrainian)
Перейти до навігації Перейти до пошуку

Українськомовний TTS (також відомий як українськомовний текст-у-мовлення / українськомовний ТУМ, англ. Ukrainian text-to-speech / Ukrainian TTS) — text-to-speech система, що спроможна наживо виконувати конвертування україномовного друкованого тексту в україномовне аудіо.

Історія українськомовних TTS[ред. | ред. код]

Напівпрофесійні українськомовні TTS[ред. | ред. код]

До середини 2016 року, існувало 4 напівпрофесійні TTS системи з підтримкою української мови: 1) Розмовлялка (2 голоси: чоловічий Анатоль/Стьопа та жіночий Руся); 2) CyberMova/VymovaPlus/VymovaPro (4 голоси: жіночий Наталя та чоловічі Опанас, Дмитро, та Слава); 3) UkrVox (1 голос: чоловічий Ігор Мурашко); та 4) RHVoice (чоловічий Анатоль та жіночий Наталя: після 2021 року також чоловічий Володимир та жіножий Маріанна).

Українськомовні голоси TTS Анатоль (англ. Anatol) та Наталя (англ. Natalia) у системі TTS RHVoice російської програмістки Ольґи Яковлєвої з'явилися у лютому 2016 року завдяки зусиллю спеціалістів Соціально-реабілітаційного центру незрячих Харкова, які для створення чоловічого голосу Анатоль змогли залучити відомого радіоведучого, голоса харківського метро та диктора харківського суспільного радіо UA:Українське радіо Анатолія Подорожко.[1][2][3] Згодом у 2021 році для RHVoice створили ще два українські голоси: Володимир (англ. Volodymyr), озвучений радіоведучим Володимиром Бєгловим, та Маріанна (англ. Marianna), озвучений Маріанною Фірткою, радіоведучою «Львівська Хвиля».[4][5][6]

Професійні українськомовні TTS[ред. | ред. код]

Google WaveNet TTS[ред. | ред. код]

У 2016—2019 роках з'явилася перша професійна система української мови на базі Google WaveNet Text-to-Speech: спочатку у 2016 Google додала україномовний WaveNet жіночий голос лише до вебверсії Google Translate, 5 квітня 2017 Google також оновила свій офіційний застосунок Google Text-to-Speech для Android до версії 3.11.12, додавши підтримку україномовного WaveNet жіночого голосу,[7] а 21 лютого 2019 року Google також додала україномовний WaveNet жіночий голос до вебверсії Google Cloud Text-to-Speech.[8][9][10]

Nuance Vocalizer TTS та Microsoft Azure Neural TTS[ред. | ред. код]

У вересні 2018 року, разом з оновленням для Nuance Vocalizer TTS для Android до версії 3.1.7, з'явилася друга професійна система української мови Text-to-Speech під назвою Lesya розроблена компанією Cerence/Nuance; цей український TTS голос Леся англ. Lesya) став доступний у таких продуктах як Nuance Vocalizer TTS (Windows/Android),[11] Nuance Mix,[12][13] Цей новий український голос Lesya також доступний у TTS продуктах незалежних перепостачальників, як от Code Factory,[14] NextUp,[15][16] KobaVision/KobaSpeech[17] тощо. Згодом саме рушій Cerence/Nuance з українськомовним голосом Lesya став доступний у iPhone телефонах Apple: спочатку у квітні 2022 року разом з оновленням iOS 16 українськомовний голос TTS Lesya став доступний у застосунках Voice Over та Live Text,[18][19][20][21] а пізніше у вересні 2023 року також і у застосунках Translate та Live Speech.[22]

Згодом у квітні 2021 році Microsoft придбав Nuance;[23] й одночасно з цим у березні 2021 року підтрику української мови додали до Нейронної TTS хмаринно-серверного сервісу Microsoft Azure (англ. Miscrosoft Azure Neural TTS) долучивши чоловічий голос Остап (англ. Ostap) та жіночий голос Поліна (англ. Polina).[24][25][26]

Ukrainian TTS використавши ESPnet[ред. | ред. код]

У жовтні 2021 року група українських розробників зі спільноти UA Speech Recognition and Synthesis під головуванням Юрія Паніва (псевдо robinhad) створили у GitHub репозиторій Ukrainian TTS використавши технологію ESPnet; cпочатку розробники додали лише один голос, однак згодом перелік розширили й станом на 2023 рік перелік доступних українськомовних голосів зріс до п'яти: чоловічі Mykyta, Dmytro та Олекса а також жіночі Lada та Tetyana.[27] Усі голоси можна використовувати безкоштовно на сайті розробників brehunets.com; окрім того напрацювання цього проєкту використано при створенні українськомовних голосів для Balacoon TTS та Neon AI / Coqui AI TTS.[28][29]

Ukrainian TTS від fliki.ai[ред. | ред. код]

У серпні 2023 року сервіс fliki.ai додав підтримку української мови у своїх продуктах, й на додачу до TTS рушіїв від Microsoft та Google також створили 30 власних високоякісних ультра-реалістичних нейронних українськомовних жіночих та чоловічих голосів (всього 32 українськомовні TTS голоси).[30][31]

Огляд україномовних TTS[ред. | ред. код]

Технічні дані україномовних TTS[ред. | ред. код]

Далі наведено перелік та порівняння найпоширеніших україномовних синтезаторів мовлення (українські TTS / Ukrainian TTS).

Назва Розробник(и) Дата першого релізу ОС Остання стабільна версія Ліцензія
№ 1 UkrVox Ігор Мурашко[32] Ярослав Козак (Львів) 1994 MS DOS/MS Windows 4.2 (січень 2011) Безкоштовна
№ 2 КіберМова Vymova Plus/Pro Panas,[33][34] Natalka[35] КіберМова (Тетяна Людовик, Микола Сажок, Валентина Робейко; Київ) 2003 MS Windows 1.0 (березень 2016) Платна[36]
№ 3 Розмовлялька[37][38] Анатолій Чорний (Харків) 2004 MS Windows 1.2 (липень 2007) Безкоштовна
№ 4 RHVoice Анатоль,[39] Наталя, [40][41][42] Володимир,[43], Маріанна[44] Ольґа Яковлєва (Чебоксари, Росія) 2016 Linux/MS Windows/Google Android 1.0 (лютий 2016) Безкоштовна
№ 5 Google WaveNet TTS Ukrainian Google Inc. (Маунтін-В'ю, КА, США) 2017 Web/Google Android 1.0 (квітень 2017)[45] Платна
№ 6 Cerence/Nuance TTS Ukrainian Lesya[46][47] Cerence/Nuance (Берлінгтон, МА, США) 2018 MS Windows/Google Android 1.0 (вересень 2018) Платна
№ 7 Microsoft Azure Neural TTS Ukrainian[48][49] Microsoft (Сіетл, ВА, США) 2021 Web/MS Windows/Google Android/Apple MacOS/IOS 1.0 (березень 2021) Платна
№ 8 Ukrainian TTS використавши ESPnet[50] Юрій Панів (псевдо robinhad; Львів, Україна) 2021 Web/MS Windows/Google Android/Apple MacOS/IOS 6.0 (грудень 2023) Безкоштовна
№ 9 fliki.ai TTS Ukrainian[51] fliki.ai (Бенгалуру, Індія) 2023 Web/MS Windows/Google Android/Apple MacOS/IOS 1.0 (серпень 2023) Платна

Приклад звучання україномовних TTS[ред. | ред. код]

Приклади вимови різними українськими TTS уривку вірша Ліни Костенко Ще назва є, а річки вже немає:

Назва Демо Мови Доступні голоси ППІ розпізнавання мовлення Підтримувані операційні системи Символ наголосу
№ 1 UkrVox Ігор Мурашко (Ігор Мурашко): українська[52] 1 (голос Ігоря Мурашко) Microsoft Speech API 5 (SAPI 5) Windows ^ (перед наголошеною голосною)
№ 2 Кібермова Vymova Plus/Pro Panas/Natalka (Опанас):
(Наталка)
:
українська[52] 3 чоловічих (Опанас, Дмитро, Слава), 1 жіночий (Наталка) Microsoft Speech API 5 (SAPI 5) Windows + (після наголошеної голосної)
№ 3 Розмовлялька Анатоль/Руся (Анатоль):
(Руся):
українська 2 (1 чоловічий: Анатоль/Стьопа[53], 1 жіночий: Руся) власницький ППІ Windows ' (після наголошеної голосної)
№ 4 RHVoice Анатоль/Наталя (Анатоль)[39]:
(Наталя):
українська 2 (1 чоловічий: Анатоль[39], 1 жіночий: Наталя) Microsoft Speech API 5 (SAPI 5) Windows/Linux/Android н/д
№ 5 Google WaveNet TTS Ukrainian (Google WaveNet TTS Ukrainian): українська 1 (1 жіночий: Google WaveNet TTS Ukrainian) власницький ППІ (WaveNet) Web, Android н/д
№ 6 Cerence/Nuance TTS Ukrainian Lesya (Cerence/Nuance Lesya): українська 1 (1 жіночий: Cerence/Nuance TTS Ukrainian Voice Lesya) Microsoft Speech API 5 (SAPI 5) Windows/Android н/д
№ 7 Microsoft Azure Neural TTS Ukrainian (Microsoft Azure Neural TTS Polina): TBA
(Microsoft Azure Neural TTS Ostap): TBA
українська 1 (1 чоловічий: Остап, 1 жіночий: Поліна) власницький ППІ (Azure Neural TTS) Windows/Android/MacOS та iOS н/д
№ 8 Ukrainian TTS використавши ESPnet (ukrainian-tts Oleksa): TBA
(ukrainian-tts Tetyana): TBA
українська 5 (3 чоловічих: Oleksa, Mykyta, Dmytro; 2 жіночих: Lada, Tetyana) відкритий ППІ (ESPnet2-TTS) Windows/Android/MacOS та iOS н/д
№ 9 fliki.ai TTS Ukrainian (fliki.ai-tts Pavlo): TBA
(fliki.ai-tts Kateryna): TBA
українська 32 чоловічих та жіночих голосів (включає Google та Microsoft TTS голоси) власницький ППІ (невідомо) Windows/Android/MacOS та iOS н/д

Існує декілька програм-читачів екрана, що використовують Text-To-Speech (TTS) для читання тексту вголос у Windows та Android і які можна використовувати для читання тексту одним з наявних україномовних TTS. Зокрема такі програми як Voice,[54] Wordtalk,[55] Balabolka[56], Dspeech[57], Infovox4[58] тощо можна налаштувати аби вони читали текст українською з використанням вашого бажаного україномовного TTS двигуна.

Примітки[ред. | ред. код]

  1. Звернення до українських IT-компаній і до міністерств інформаційної та соціальної політики — Zazid.net, 22 січня 2017
  2. natalia-ukr // RHVoice. — GitHub, 2016. — Переглянуто 8 листопада 2021. (англ.)
  3. anatol-ukr // RHVoice. — GitHub, 2016. — Переглянуто 8 листопада 2021. (англ.)
  4. RHVoice: Ukrainian voices  // rhvoice.org. 2021. (англ.)
  5. marianna-ukr // RHVoice. — GitHub, 2021. — Переглянуто 8 листопада 2021. (англ.)
  6. volodymyr-ukr // RHVoice. — GitHub, 2021. — Переглянуто 8 листопада 2021. (англ.)
  7. Google Text-to-speech 3.11.12 improves voices and adds support for Ukrainian, Czech, Bangla, Khmer, more. androidpolice.com, 2017/04/11 (англ.)
  8. Google Cloud Text-to-Speech: Supported voices and languages. cloud.google.com, 2020 (англ.)
  9. Google Cloud Text-to-Speech adds 31 WaveNet voices, 7 languages and dialects. venturebeat.com, 2019/02/21 (англ.)
  10. Listing out voices. cran.r-project.org, 2020 (англ.)
  11. Cod Factory Vocalizer TTS Voice [Архівовано 18 вересня 2016 у Wayback Machine.]. play.google.com, 2018 (англ.)
  12. Nuance Mix: Languages and TTS Voices. docs.mix.nuance.com. 2021 (англ.)
  13. Cerence TTS Factsheet. cerence.com. 2021 (англ.)
  14. Code Factory: Speech synthesis [Архівовано 15 лютого 2020 у Wayback Machine.]. codefactoryglobal.com. 2018 (англ.)
  15. NextUp: Cerence TTS Voices. nextup.com. 2021 (англ.)
  16. Nuance TTS: Lesya (Ukrainian), sample. nextup.com. 2018 (англ.)
  17. KobaSpeech 4 With Vocalizer Lesya — Ukrainian. kobaspeech.com. 2018 (англ.)
  18. Функції Live Text та Voice Over від Apple підтримуватимуть українську мову // forbes.ua, 7 червня 2022
  19. Apple додав українську мову в Live Text та Voice Over // ms.detector.media, 8 червня 2022
  20. Apple додає новий-старий Український голос у войсовер! // Facebook сторінка "Навчально-інформаційний комп'ютерний центр УТОС", 7 червня 2022
  21. Відомості про оновлення iOS 16 // support.apple.com/uk-ua/, 2022
  22. Компанія Apple додала українську мову в застосунок для перекладів // ms.detector.media, 26 вересня 2023
  23. Microsoft купив компанію з розпізнавання мовлення майже за $20 млрд // lb.ua, 13 квітня 2021
  24. Language and voice support for the Speech service // Azure AI Services, 2023 (англ.)
  25. What's new in Azure AI Speech?, March 2021 release // Azure AI Services, 15 веересня 2023 (англ.)
  26. Eleven more languages are generally available for Azure Neural Text-to-Speech // AI - Azure AI services Blog, techcommunity.microsoft.com, 31 березня 2021 (англ.)
  27. https://github.com/robinhad/ukrainian-tts/releases
  28. Neon AI Support for the Ukrainian Language // neon.ai, 2023 (англ.)
  29. Українська мова в Balacoon // balacoon.com, 8 липня 2023
  30. fliki.ai: What's New? // fliki.ai, 2023 (англ.)
  31. fliki.ai: Best Ukrainian AI Voices. Generate high quality text-to-speech using natural Ukrainian AI voices // fliki.ai, 2023 (англ.)
  32. [1]
  33. [2]
  34. [3]
  35. [4]
  36. VymovaPlus ($29,95)
    VymovaPro ($37,45)
    Natalka Стандартна ($14.95)
    Natalka Сімейна ($29.95)
    Natalka Для класу ($99.95)
    Natalka Для сайту ($199.95)
  37. [5]
  38. [6]
  39. а б в Оригінальний голос: Анатолій Подорожко — диктор харківського суспільного радіо UA:Українське радіо та «голос харківського метро»
  40. [7]
  41. [8]
  42. [9]
  43. Оригінальний голос: Володимир Бєглов
  44. Оригінальний голос: Маріанна Фіртка
  45. доступна у додатку Google TTS починаючи з версії 3.11.12
  46. [10]
  47. https://www.nuance.com/omni-channel-customer-engagement/voice-and-ivr/text-to-speech.html
  48. [11]
  49. https://speech.microsoft.com/portal/voicegallery
  50. [12]
  51. [13]
  52. а б Також може читати текст англійською мовою, але з українським акцентом
  53. Анатоль та Стьопа мають однакові голоси
  54. Архівована копія. Архів оригіналу за 16 лютого 2020. Процитовано 16 лютого 2020.{{cite web}}: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title (посилання)
  55. Архівована копія. Архів оригіналу за 8 лютого 2020. Процитовано 15 лютого 2020.{{cite web}}: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title (посилання)
  56. Архівована копія. Архів оригіналу за 5 вересня 2017. Процитовано 4 вересня 2017.{{cite web}}: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title (посилання)
  57. Архівована копія. Архів оригіналу за 31 липня 2015. Процитовано 26 липня 2015.{{cite web}}: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title (посилання)
  58. Архівована копія. Архів оригіналу за 10 серпня 2015. Процитовано 26 липня 2015.{{cite web}}: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title (посилання)

Посилання[ред. | ред. код]