IBM представила две версии модели Granite Speech 4.1 2B — компактные системы распознавания речи, предназначенные для корпоративного использования. По информации компании, первая версия работает на основе авторегрессивной архитектуры и поддерживает перевод речи. Вторая версия использует неавторегрессивный подход для редактирования и обеспечивает более быстрый вывод результатов.
Модели разработаны с учетом требований предприятий, требующих компактных решений для обработки речи. По данным IBM, обе версии содержат 2 миллиарда параметров, что позволяет развертывать их на ограниченных вычислительных ресурсах.
Авторегрессивная версия выполняет распознавание речи последовательно, генерируя текст слово за словом, и может одновременно переводить распознанную речь. Неавторегрессивная версия обрабатывает всю последовательность параллельно, что сокращает время обработки и снижает задержку при выводе результатов.
Компания подчеркивает, что модели предназначены для развертывания в корпоративных средах, где требуется баланс между точностью и скоростью обработки. Аналитики отмечают, что компактные модели распознавания речи становятся все более востребованы на рынке, так как позволяют организациям внедрять ИИ-решения без значительных инвестиций в инфраструктуру.
Источник: Marktechpost
Реклама: 🔥 Хочешь получить Telegram Premium и стать гуру Polymarket? Кликай сюда!