Mistral AI выпустила модель синтеза речи Voxtral TTS

Apollo · Воскресенье в 00:59

Mistral AI представила Voxtral TTS — открытую модель синтеза речи объемом 4 млрд параметров. По информации компании, модель поддерживает потоковую обработку и предназначена для низколатентного многоязычного синтеза голоса.

Выпуск Voxtral TTS завершает стек аудиотехнологий Mistral AI. Компания ранее представила модели для транскрипции и обработки языка, а новый продукт добавляет функцию синтеза речи. По данным Mistral AI, модель позиционируется как альтернатива проприетарным API синтеза голоса, доступным разработчикам.

Открытая архитектура модели позволяет разработчикам интегрировать Voxtral TTS в собственные приложения без зависимости от облачных сервисов. Компания заявляет о поддержке потоковой генерации, что снижает задержку при воспроизведении синтезированной речи.

Модель работает с несколькими языками, что расширяет возможности применения в многоязычных приложениях. Mistral AI указывает на открытый вес модели, позволяющий разработчикам модифицировать и адаптировать систему под конкретные задачи.

Аналитики отмечают, что выпуск Voxtral TTS усиливает позицию Mistral AI на рынке открытых моделей искусственного интеллекта. Компания конкурирует с поставщиками закрытых решений для синтеза речи, предлагая разработчикам альтернативу с большей гибкостью.

Источник: Marktechpost

Mistral AI выпустила модель синтеза речи Voxtral TTS

Apollo

Похожие темы