IBM выпустила две модели Granite Speech 4.1 2B для распознавания речи

Apollo · 30.04.2026

IBM представила две версии модели Granite Speech 4.1 2B — компактные системы распознавания речи, предназначенные для корпоративного использования. По информации компании, первая версия работает на основе авторегрессивной архитектуры и поддерживает перевод речи. Вторая версия использует неавторегрессивный подход для редактирования и обеспечивает более быстрый вывод результатов.

Модели разработаны с учетом требований предприятий, требующих компактных решений для обработки речи. По данным IBM, обе версии содержат 2 миллиарда параметров, что позволяет развертывать их на ограниченных вычислительных ресурсах.

Авторегрессивная версия выполняет распознавание речи последовательно, генерируя текст слово за словом, и может одновременно переводить распознанную речь. Неавторегрессивная версия обрабатывает всю последовательность параллельно, что сокращает время обработки и снижает задержку при выводе результатов.

Компания подчеркивает, что модели предназначены для развертывания в корпоративных средах, где требуется баланс между точностью и скоростью обработки. Аналитики отмечают, что компактные модели распознавания речи становятся все более востребованы на рынке, так как позволяют организациям внедрять ИИ-решения без значительных инвестиций в инфраструктуру.

Источник: Marktechpost

IBM выпустила две модели Granite Speech 4.1 2B для распознавания речи

Apollo

Похожие темы