Stability AI оптимизировал свою модель генерации звука для работы на чипах Arm

Asal · 03.03.2025

ИИ-стартап Stability AI объединился с чипмейкером Arm, чтобы вывести Stability Audio Open, модель ИИ, способную генерировать звук, включая звуковые эффекты, на мобильные устройства на чипах Arm.

Хотя ряд приложений с искусственным интеллектом, таких как Suno и Udio, могут генерировать звук, большинство из них опираются на облачную обработку, что означает, что их нельзя использовать в автономном режиме. Более того, некоторые модели генерации аудио были обучены на контенте, защищенном авторским правом, что создает риск для интеллектуальной собственности. Stability утверждает, что обучающий набор Stable Audio Open полностью состоит из аудиозаписей и песен, не защищенных авторским правом.

Stable Audio Open, работающая на чипах Arm, которая будет продемонстрирована на конференции Mobile World Congress в Барселоне на этой неделе, может генерировать звук на основе текстового описания, например, «Нежные океанские волны на закате». Компания Stability утверждает, что совместно с Arm оптимизировала и «очистила» Stable Audio Open, ускорив время генерации в 30 раз.

Генерация одного 11-секундного аудиосэмпла занимает около 8 секунд на процессоре Armv9.
Для ясности, оптимизированная модель Stable Audio Open недоступна для скачивания - по крайней мере, пока. Но в своем заявлении генеральный директор Stability Прем Аккараджу намекнул, что в будущем Stability будет работать над тем, чтобы ее модели, включая Stable Audio Open, появились в потребительских приложениях и устройствах.

«По мере того как все больше профессиональных творческих работников и предприятий используют генеративный искусственный интеллект для создания своих производственных конвейеров, важно, чтобы наши модели и рабочие процессы были доступны повсюду, чтобы строители могли создавать, а творцы - творить», - сказал Аккараджу. «Мы рады сотрудничать с Arm именно по этой причине».

Stability заявляет, что сотрудничает с Arm для дальнейшей оптимизации Stable Audio Open.

Компания Stability, стоящая за популярной моделью генерации изображений Stable Diffusion, в прошлом году привлекла новые средства, поскольку инвесторы, включая Эрика Шмидта и основателя Napster Шона Паркера, пытались повернуть бизнес в нужное русло. Эмад Мостаке, соучредитель и бывший генеральный директор Stability, по сообщениям, неправильно управлял Stability, что привело к финансовому краху, увольнению сотрудников, срыву партнерства с Canva и росту беспокойства инвесторов по поводу перспектив компании.

За последние несколько месяцев Stability наняла нового генерального директора, назначила в совет директоров режиссера «Титаника» Джеймса Кэмерона и выпустила несколько новых моделей генерации изображений.

Оригинал

Уникальность

Stability AI оптимизировал свою модель генерации звука для работы на чипах Arm

Похожие темы