Підписуйтеся на наш телеграм канал!
OpenAI створила штучний інтелект, що здатний генерувати справжній голос людини
OpenAI представила широкому загалу перші результати роботи над унікальною розробкою — штучним інтелектом Voice Engine. Технологія здатна генерувати природну мову, ідентичну оригінальному голосу диктора, використовуючи всього лише текст і 15-секундний аудіозапис.
Розробка Voice Engine почалася наприкінці 2022 року. Модель уже знаходить застосування в API перетворення тексту на мову, а також у функціях ChatGPT Voice і Read Aloud. Водночас OpenAI здійснює обережний підхід до ширшого поширення технології з огляду на потенціал неправомірного використання синтетичних голосів.
Серед ранніх застосувань Voice Engine виділяють:
- допомога у читанні для неписьменних і дітей з використанням природних і емоційних голосів;
- переклад контенту (відео та подкасти) для розширення глобальної аудиторії;
- покращення надання базових послуг у віддалених районах;
- підтримка людей із захворюваннями, що впливають на мову, через терапевтичні та освітні застосунки;
- відновлення голосу у пацієнтів, які страждають від раптових або дегенеративних станів мовлення.
OpenAI наголошує на серйозності ризиків, пов’язаних із генерацією мови, що ідеально імітує голоси людей, особливо в контексті виборів. У відповідь на ризики компанія розробила заходи безпеки, включно з водяними знаками для відстеження походження аудіо, створеного Voice Engine, і активним моніторингом використання технології. Партнери, які тестують Voice Engine, погодилися з політикою використання, що забороняє імітацію іншої особи або організації без згоди.