Підписуйтеся на наш телеграм канал!
Google розробила штучний інтелект, який генерує музику за текстовими описами
Система Google MusicLM навчалася на наборі даних із 280 000 годин музики і може створювати особливо складні композиції (наприклад, для таких текстових запитів, як «чарівна джазова пісня з незабутнім соло на саксофоні і соло співака» або «берлінське техно 90-х із низьким басом і сильними ударними»).
Своїм глибоким навчанням MusicLM, власне, і вирізняється з-поміж інших систем ШІ для генерування пісень — Riffusion, Dance Diffusion, AudioML від Google та Jukebox від OpenAI. Всі вони дещо обмежені технічними можливостями та меншою кількістю використаних для навчання даних.
MusicLM також можна керувати за допомогою комбінації зображення і тексту або генерувати аудіо з певним типом інструмента в певному жанрі. Можна вибрати навіть рівень досвіду «музиканта», також система здатна створювати музику, натхненну місцями, епохами або вимогами в контексті чогось (наприклад, мотиваційна музика для тренувань).
Але MusicLM поки що знаходиться в альфа-режимі - деякі зразки мають спотворену суть та якість, що є побічним ефектом процесу навчання. І хоча технічно MusicLM може генерувати людський вокал, звучить це не надто реалістично.
Водночас Google не поспішає випускати цей інструмент для широкого загалу враховуючи етичні проблеми, з якими він може зіткнутися. MusicLM, як і інші системи, використовувала в навчанні захищений авторським правом матеріал, а під час експерименту виявилося, що близько 1% результатів було безпосередньо відтворено з пісень, на яких тренувалася система.