Cohere выпустила открытую модель Command A+ на основе архитектуры Sparse Mixture-of-Experts объемом 218 миллиардов параметров. По данным компании, новая модель объединяет функциональность четырех предыдущих вариантов Command A в единую систему.
Модель работает на двух видеокартах H100 при квантизации W4A4, что снижает требования к вычислительным ресурсам. Command A+ поддерживает 48 языков и является первой мультимодальной моделью рассуждений в линейке Cohere, способной обрабатывать текст и изображения.
По информации компании, модель предназначена для построения агентных рабочих процессов, где системы принимают самостоятельные решения на основе входных данных. Архитектура Sparse MoE позволяет активировать только необходимые части модели, повышая эффективность обработки.
Компания подчеркивает, что открытый исходный код модели позволяет разработчикам адаптировать систему под собственные задачи. Аналитики отмечают, что снижение требований к оборудованию расширяет доступность больших языковых моделей для организаций с ограниченными вычислительными мощностями.
Источник: Marktechpost
Реклама: 🔥 Хочешь получить Telegram Premium и стать гуру Polymarket? Кликай сюда!