Suno AI — ИИ для генерации музыки

Не так давно вышла третья версия suno.ai и это, мне кажется, отличный повод написать про то что это такое, что может и почему это интересно.

Начнем с того, что это алгоритм машинного обучения для end-to-end генерации музыки. В теории, для того чтобы что-то сгенерировать человек вообще не нужен.

Алгоритм сам напишет текст, озвучит его и наложит музыку. И результат даже в таком формате поражает. Очевидно, что уже не так уж просто отличить сгенерированную музыку от записей настоящих концертов.

Но в такой музыке не будет души, правда ведь?) Поэтому человек все же может принимать участие в написании музыки на разных уровнях. Он может ограничиться приблизительным описанием или полностью написать текст, задать стиль, прописать где будет куплет, а где крутое гитарное соло.

Скептически настроенные люди могли бы сказать, что это все не музыка, что это все просто пародия на уже существующие песни. И в целом они будут не далеки от истины, ведь так работает машинное обучение: мы учим модель генерировать что-то как можно более похожее на то, что уже существует. Но это вовсе не значит, что модель не создает ничего нового! Аналогичным образом работают и ChatGPT и Stable Diffusion. ChatGPT отвечает на ваши новые вопросы своими новыми ответами, а Stable Diffusion генерирует новые картинки по вашим новым запросам. Также и здесь.

Но не стоит полагать, что вся "новизна" будет заключаться исключительно в запросах. Модели машинного обучения имеют свойство обобщаться, то есть именно "понимать" что от них хотят, а значит вполне могут и создавать что-то новое посредством стохастических процессов внутри них.

Еще один аргумент в пользу того, что модель может писать интересную и необычную музыку — сам процесс генерации. По всей видимости, генерация музыки идет поверх уже написанного текста. То есть фактически музыка подстраивается под текст, и если текст будет иметь какую-то интересную и необычную поэтическую структуру то и музыка будет по крайней мере необычной. То есть экспрессивность музыки наследуется от экспрессивности текста, а текстовые модели сейчас показывают очень разнообразные и интересные результаты!

Я прикрепляю к посту пару треков, которые получились у меня. Мне они нравятся

#IT@cirno_nb #Science #AI

Suno AI — <a wiki-id=ИИ для генерации музыки " src="https://sun9-4.userapi.com/impg/3Z1bv7xDAav6cVjDG3YgGNYT_URXk5xx8_BQRQ/XrA2awaA5S0.jpg?size=510x721&quality=95&sign=547131b41fad1520ea611fb2e0df86f9&c_uniq_tag=VxyWVGQWV7qjyGjLa0jOk-eZ1KYHCc0ptLB4d54J8GU&type=album">
Мы в VK: https://vk.com/cirno_nb