Xiaomi відкрила доступ до моделі клонування голосу для 646 мов

Технології

8:40 am, 10 Травня, 2026

Xiaomi випустила OmniVoice — модель штучного інтелекту для клонування голосу, яка підтримує 646 мов, зокрема найрідкісніші, для яких майже не існує навчальних даних. Розробка повністю відкрита для всіх охочих.

Для коректної вимови складних слів модель використовує великі мовні моделі — за принципом, схожим на ChatGPT. В основі навчання — 50 відкритих наборів голосових даних загальним обсягом 580 тисяч годин аудіозаписів різними мовами світу.

Одна з ключових можливостей OmniVoice — клонування голосу з будь-якого зразка. Достатньо записати, як говорить людина, і модель відтворить цей голос іншою мовою. Це відкриває широкі можливості для локалізації контенту та озвучення.

Окрім клонування, інструмент дозволяє описати бажаний голос текстом — наприклад, «чоловік середнього віку з низьким голосом» — і отримати синтезований результат. Також підтримується додавання емоційних відтінків: сміху, зітхань або шепоту.

Серед додаткових функцій — виправлення неправильної вимови та очищення фонових шумів у записах. Це робить OmniVoice корисним інструментом не лише для генерації, а й для редагування аудіо.

Код моделі, навчальні дані та готові ваги розміщені у відкритому доступі на GitHub і Hugging Face. Там само доступна демоверсія, яку можна протестувати без жодного встановлення.

BTC

$80,428.20

0.37%

ETH

$2,328.48

0.49%

BNB

$648.24

-0.61%

XRP

$1.42

-0.74%

SOL

$93.42

-0.14%

Всі курси

Xiaomi відкрила доступ до моделі клонування голосу для 646 мов

Схожі записи