Stability AI выпустила семейство моделей Stable Audio 3 для генерации инструментальной музыки и звуковых эффектов. По данным компании, релиз включает открытые веса для малой и средней версий моделей.
Малая версия работает на процессоре MacBook Pro M4. Средняя версия требует потребительских видеокарт с 8 ГБ видеопамяти. Обе модели генерируют стереозвук с частотой дискретизации 44,1 кГц, используя трёхэтапный конвейер обучения: flow matching, дистилляция с разогревом и состязательное постобучение.
По результатам тестирования на бенчмарке BBC Sound Effects при длительности 5 секунд средняя версия Stable Audio 3 показала метрику FAD 0,369. Компания заявляет, что этот результат ниже, чем у всех оценённых в исследовании открытых базовых моделей.
Модели предназначены для создания звуковых эффектов и музыкальных композиций. Открытая доступность весов позволяет разработчикам интегрировать технологию в собственные приложения.
Источник: Marktechpost
Реклама: 🔥 Хочешь получить Telegram Premium и стать гуру Polymarket? Кликай сюда!