Підписуйтеся на наш телеграм канал!
Meta створила штучний інтелект, здатний зменшувати аудіофайли без втрати якості звуку
Корпорація Meta створила EnCodec — нейронну мережу, навчену стискати аудіофайли до мінімальних обсягів. Дослідники Meta запевняють, що досягли найкращих результатів гіперстиснення аудіо, яка взагалі можлива на цей час.
«Уявіть, що ви слухаєте аудіоповідомлення друга у зоні з низьким доступом до Інтернету, і воно не зупиняється та не збивається. Наше дослідження показує, як ми можемо використовувати штучний інтелект, щоби досягти цього», — зазначають дослідники Meta у своєму блозі.
Classic codecs such as MP3, Opus & EVS rely on handcrafted ways to efficiently code & decode files — we’re probably reaching the limits of what they can give us.
So using AI, we created Encodec, a #neuralnetwork trained end-to-end to reconstruct the input signal.
2/5 pic.twitter.com/lOLHCgmno8
— Meta AI (@MetaAI) October 25, 2022
Інженери створили логіку системи та навчили її стискати аудіофайл до потрібного розміру. Потім цей файл можна декодувати за допомогою нейронної мережі. Таким чином виходить досягти приблизно 10-кратного рівня стиснення (у порівнянні з MP3) без втрати якості.
Дослідники корпорації випустили наукову статтю, в якій висвітлюються всі технічні деталі та описується архітектура EnCodec. У документі також підкреслюється, що EnCodec можна вдосконалити й таким чином зменшити файл ще на 40% без втрати якості. Щоб допомогти розробникам і технологічним ентузіастам краще зрозуміти EnCodec, Meta також опубліковала код та дала доступ до нього всім охочим.
Нагадаємо, що Meta також розробила систему штучного інтелекту для перекладу хоккієнської мови, яка не має власного письма. Система поки проходить стадію розробки, оскільки алгоритм на цей час здатен перекладати лише одне речення за один раз. Однак у корпорації запевняють, що технологія зможе застосовуватися і до інших схожих між собою мов.