11.04.2024 - 18:58 / habr.com

Stability AI представила обновление модели Stable Audio 2.0

Stability AI рассказала в блоге о релизе модели машинного обучения Stable Audio 2.0. После обновления нейросеть может генерировать музыкальные композиции длительностью до трёх минут в стерео и с частотой дискретизации 44,1 кГц.

Кроме того, пользователи могут загружать свои треки и изменять их с помощью промптов. Нововведения в Stable Audio: На выходе получаются треки с когерентной музыкальной структурой длительностью до трёх минут.

Это значит, что каждая композиция включает в себя вступление, основную тему, завершение и переходы между частями произведения.Нейросеть генерирует аудио с частотой дискретизации 44,1 кГц.Применяется эффект стерео для разделения частей композиции на правый и левый каналы.Кроме базовой функции генерации из текста в аудио появился новый режим.

музыка искусственный интеллект нейросети машинное обучение daniilshat

Читать на habr.com

Все новости от habr.com

Об этом же в других СМИ

Разработчики выпустили бенчмарк для языковых моделей, в котором нейросетям надо играть в Street Fighter III habr.com / 3 недели назад

Модель GPT-4 Turbo стала доступна пользователям ChatGPT Plus habr.com / 3 недели назад

xAI представила Grok-1.5V — свою первую мультимодальную модель, которая теперь обрабатывает и изображения gagadget.com / 3 недели назад

Сайт imag.one - агрегатор новостей из открытых источников. Источник указан в начале и в конце анонса. Вы можете пожаловаться на новость, если находите её недостоверной.

Сейчас читают