Искусственный интеллект меняет всю индустрию искусства, даже научился писать музыку по текстовому запросу. ИИ-системы анализируют мировую классику, классифицируют треки и на этой базе создает что-то свое. Много вопросов в обществе на тему, оригинальные ли это треки, нарушают или нет авторское право. Одно ясно точно: нейросеть открывает новые возможности для музыкантов, продюсеров и просто любителей. 

Рассмотрим самые интересные ИИ-сервисы для генерации музыки, их особенности и принцип работы.

Suno

  • Где попробовать: suno.com
  • Сложность: 🎵

Самая популярная нейросеть для написания песен и музыки. Генерирует мелодии на основе текстового запроса, поддерживает множество языков и даже создает обложки для треков. Можно детально настроить структуру песни, прописав в промте куплеты, припевы, инструментальные части. При хорошей настройке ИИ сможет написать полноценный трек на 2 минуты.

Новые пользователи получают 50 бесплатных токенов на сутки. Этого хватает на 10 песен: 5 запросов с двумя вариантами трека в каждом. Разработчики часто дарят дополнительные токены по разным поводам, в честь выпуска обновления или компенсации за ошибки.

Udio

  • Где попробовать: udio.com
  • Сложность: 🎵🎵🎵

Мощный ИИ для создания музыкальных композиций, работает с текстовыми запросами. На момент подготовки текста нейросеть доступна в beta-режиме. Песни создаются из написанных в промте слов. Бесплатно пользователи получают 10 кредитов ежедневно и 100 дополнительных кредитов ежемесячно. Один кредит позволяет генерировать два варианта трека, аналогично Suno.

Пользователь может расписать подробные стихи или же дать запрос в духе: «Песня о том, как стать богатым ничего не делая». Нейронка сама придумает название трека, текст и мотив. В нашем примере все четко — «Разбитые мечты».

При тесте показалось, что с абстрактными запросами Suno справляется лучше, текст точнее передает смысл и чувства, лучше подбирает тембр и стиль. Но если хочется тонкой настройки музыкального аккомпанемента на готовые слова, то Udio справится лучше. 

В платных пакетах за $10 можно писать треки до 2 минут, лимит в месяц повышен до 1200, приоритетная очередь, генерация обложки. За $30 все из прошлого плана, но лимиты больше.

Riffusion

  • Где попробовать: riffusion.com
  • Сложность: 🎵

Подойдет для создания коротких 12-секундных музыкальных композиций. Чтобы создать песню, нужно ввести короткий текстовый запрос. Например, указать жанр, стиль, женский или мужской вокал. Если этого не прописать, то ИИ самостоятельно выберет установки. 

Особенность сервиса в том, что можно разделить готовую композицию на отдельные аудиодорожки: вокал, ударные, бас и другие инструменты. Riffusion выдаст 3 трека, их можно скачать в форматах mp3 или mp4 с обложкой.

Mubert

  • Где попробовать: mubert.com
  • Сложность: 🎵🎵

Пишет фоновую музыку, подойдет для видеоконтента, например, в разговорные ролики на фон, чтобы не прилетел страйк за авторское право. Еще можно написать вступление к подкасту. Писать промт надо на английском, можно задать продолжительность, выбрать тип генерации: трек, луп, микс и джингл.

После регистрации бесплатно дают энергию на создание 25 треков в месяц длительностью до 25 минут. Для скачивания надо указать канал, где планируется использовать музыку.

Soundful

  • Где попробовать: my.soundful.com
  • Сложность: 🎵🎵

Простой в использовании ИИ для создания музыки. После регистрации появится короткая анкета из 2 вопросов: кто вы по специальности, какие жанры интересуют. После выдадут шаблоны с жанрами и поджанрами. Надо выбрать что-то одно, подкрутить настройки скорости, тональности, дать имя треку и система сгенерирует мелодию.

Не самая гибкая нейросеть, но если не хочется заморачиваться, система Soundful с шаблонами отлично подойдет. Бесплатный тариф ограничен созданием и скачиванием 10 треков в месяц для личного использования. Платная подписка за $10 в месяц снимает эти ограничения.

Avia.AI

  • Где попробовать: creators.aiva.ai
  • Сложность: 🎵🎵🎵

В системе есть библиотека с жанрами, стилями и созданным пользователями контентом. На основе этого нейросеть обучается и пишет треки в выбранной юзером тональности. Отличается от других ИИ встроенным редактором треков. На нем можно локально настроить звучание инструментов, темп, эффекты. 

Бесплатно дают сгенерировать и скачать 3 трека длительностью до 3 минут. За 49 евро месячный лимит повышается до 200 треков и бонусом передают авторские права, чтобы использовать музыку в коммерческих целях, например, в рекламе, фильмах, видеоиграх.

Stable Audio 2

  • Где попробовать: stableaudio.com
  • Сложность: 🎵🎵

Специализируется на создании инструментальных треков без вокала. Работает с текстовыми запросами, можно загрузить референс или выбрать готовый пресет по жанру. При обучении Stable Audio 2 использовали лицензированные данные, это значит, что все генерации легальные, их можно использовать в коммерческих целях. В бесплатной версии можно генерировать до 10 композиций в месяц.

Endel

  • Где попробовать: endel.io
  • Сложность: 🎵

Стартап, который в реальном времени генерирует звуки, чтобы помочь сосредоточиться на выполнении каких-то задач или музыку для сна. Endel больше про релаксацию и медитацию, а не написание треков с нуля в нейросети. Бесплатно можно пользоваться 7 дней, после за 280 рублей в месяц или 3490 в год. 

Алгоритм Endel учитывает различные факторы: время суток, погоду, сердечный ритм пользователя. На основе этих данных система генерирует персонализированный звуковой фон.

So-vits-svc

So-vits-svc — мощный инструмент от китайцев для работы с вокалом. Главная особенность — способность реалистично имитировать голоса известных исполнителей, но система не создает музыку с нуля.

В работе инструмент очень сложный, требует навыков обращения с кодом, знание английского и много заготовок. В числе которых: оригинальная а капелла, инструментальная дорожка и образец голоса выбранного исполнителя. В So-vits-svc можно генерить каверы из серии «Джигурда спел песенку про школу», но надо помнить, что использовать чужие голоса — неэтично. 

MusicLM

Google сделали систему генерации музыки MusicLM на основе текстовых описаний. Она способна создавать треки как по коротким запросам, вроде «поп-рок», так и по развернутым описаниям «песня о том, как сосед общаге съел последнюю котлету, мне было очень грустно, тяжелый рок, мужской вокал».

Несмотря на впечатляющие возможности, MusicLM пока недоступна для широкой публики. Google опасается проблем с авторскими правами, так как система обучалась на существующих музыкальных произведениях. Однако компания открыла доступ к базе данных для разработчиков, желающих создать собственные музыкальные ИИ.

Заглавное фото: CQ.ru с помощью DALL-E