Підписуйтеся на наш телеграм канал!
Штучний інтелект ChatGPT навчиться приймати голосові повідомлення і відповідати голосом
Технологічний стартап OpenAI розширює варіанти взаємодії з ChatGPT. Нова версія чат-бота тепер приймає як підказки не лише текст, але й зображення та голосові команди. Для користувачів преміум-підписки нові можливості стануть доступні у найближчі два тижні, іншим користувачам доведеться зачекати.
В OpenAI заявили: завдяки покращеній базовій технології чат-боа, якість відповідей ChatGPT стане значно вищою. Як це працюватиме: користувач натискає кнопку і промовляє запитання, ChatGPT перетворює його на текст і передає у велику мовну модель, отримує відповідь, перетворює її назад на мовлення і дає фідбек вголос.
Нові можливості ChatGPT спираються на велику мовну модель Whisper, яка виконує значну частину роботи з перетворення мови в текст і назад. За твердженням OpenAI, нова модель може генерувати «людський голос із тексту і зразка мови тривалістю у кілька секунд». Наразі доступно п’ять варіантів голосу для ChatGPT, але OpenAI вбачає у цій моделі набагато більший потенціал.