Lyra (кодек)

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку

Lyra — аудіо-кодек з втратами, розроблений Google для стиснення голосу на дуже низьких швидкостях передачі. На відміну від інших форматів аудіо, він використовує алгоритм, заснований на машинному навчанні, для виконання стиснення.

Особливості[ред. | ред. код]

Аудіо-кодек Lyra створений для передачі голосу в реальному часі за умов значно обмеженої пропускної здатності, наприклад через повільне або ненадійне з'єднання.[1] Він здатний працювати лише з фіксованими швидкостями передачі, а саме 3.2, 6 та 9 кбіт/с. Кодек Lyra призначений для забезпечення вищої якості звуку, ніж ті, що використовують традиційні алгоритми передачі сигналу на аналогічних швидкостях передачі.[2][3] Натомість стиснення досягається за допомогою алгоритму, що заснований на машинному навчанні, який кодує вхідні дані з виділенням ознак, а потім реконструює їх за допомогою генеративної моделі.[1] Модель, що використовується, навчена на тисячах годин записів голосу понад 70 мовами.[2] Через те, що генеративні моделі складніші за обчисленнями за традиційні кодеки, для отримання прийнятної продуктивності використовується спрощена модель, що паралельно обробляє різні діапазони частот.[4] Lyra потребує затримку у 20 мс через власний розмір кадру.[3] Приклад реалізації Google доступний для Android та Linux.[4]

Якість звучання[ред. | ред. код]

Початкова версія кодеку Lyra показувала значно кращі результати, ніж традиційні кодеки на аналогічних швидкостях передачі.[1][4][5] Google стверджує, що кодек відтворює природне звучання мови, а також, що Lyra на швидкості у 3 кбіт/с перевершує Opus на 8 кбіт/с.[2] Цахі Левент-Леві пише, що аудіо-кодек Satin, розроблений на базі штучного інтелекту Microsoft, перевершує його на вищих бітрейтах.[5]

Підтримка[ред. | ред. код]

Реалізації[ред. | ред. код]

Реалізація Google доступна на GitHub за ліцензією Apache.[1][6] Вона написана на мові програмування C++ та оптимізована для 64-бітної архітектури ARM, але також працює і на x86, на Android та Linux.

Застосунки[ред. | ред. код]

Google Duo використовує кодек Lyra для передачі звуку під час відеодзвінків, коли пропускна здатність мережі обмежена.[1][5]

Примітки[ред. | ред. код]

  1. а б в г д Buckley, Ian (8 квітня 2021). Google Makes Its Lyra Low Bitrate Speech Codec Public. MakeUseOf (амер.). Процитовано 21 липня 2022.
  2. а б в Lyra: A New Very Low-Bitrate Codec for Speech Compression. Google AI Blog (англ.). Процитовано 21 липня 2022.
  3. а б Lyra V2 - a better, faster, and more versatile speech codec. Google Open Source Blog. Процитовано 26 квітня 2023.
  4. а б в Google Duo uses a new codec for better call quality over poor connections. XDA (амер.). 9 квітня 2021. Процитовано 21 липня 2022.
  5. а б в Levent-Levi, Tsahi (19 квітня 2021). Lyra, Satin and the future of voice codecs in WebRTC. BlogGeek.me (амер.). Процитовано 21 липня 2022.
  6. Google (2021). Lyra: A Very Low-Bitrate Codec for Speech Compression. GitHub. Процитовано 21 липня 2022.