MiniMax выпустила языковую модель M3 с архитектурой MiniMax Sparse Attention. По данным компании, новая модель поддерживает контекстное окно объемом 1 млн токенов, что позволяет обрабатывать значительно большие объемы текста за один запрос.
Модель M3 получила встроенную поддержку мультимодальности. Система может работать с изображениями, видео и выполнять операции компьютерного зрения, включая управление интерфейсом устройства. По информации компании, это позволяет использовать модель для автоматизации задач, требующих взаимодействия с графическим интерфейсом.
Архитектура MiniMax Sparse Attention, по заявлению разработчиков, обеспечивает эффективную обработку больших контекстов при сохранении производительности. Компания позиционирует решение как инструмент для разработки агентных систем, способных выполнять сложные многошаговые задачи.
Расширенный контекст позволяет модели анализировать длинные документы, исторические данные и сложные сценарии без разделения входных данных на части. Аналитики отмечают, что поддержка видео и компьютерного зрения расширяет применение модели за пределы текстовых задач.
Модель M3 позиционируется как решение для разработчиков, работающих с автоматизацией, анализом данных и созданием интеллектуальных агентов. Компания не уточнила детали доступности и условия использования модели.
Источник: Marktechpost
Модель M3 получила встроенную поддержку мультимодальности. Система может работать с изображениями, видео и выполнять операции компьютерного зрения, включая управление интерфейсом устройства. По информации компании, это позволяет использовать модель для автоматизации задач, требующих взаимодействия с графическим интерфейсом.
Архитектура MiniMax Sparse Attention, по заявлению разработчиков, обеспечивает эффективную обработку больших контекстов при сохранении производительности. Компания позиционирует решение как инструмент для разработки агентных систем, способных выполнять сложные многошаговые задачи.
Расширенный контекст позволяет модели анализировать длинные документы, исторические данные и сложные сценарии без разделения входных данных на части. Аналитики отмечают, что поддержка видео и компьютерного зрения расширяет применение модели за пределы текстовых задач.
Модель M3 позиционируется как решение для разработчиков, работающих с автоматизацией, анализом данных и созданием интеллектуальных агентов. Компания не уточнила детали доступности и условия использования модели.
Источник: Marktechpost
Реклама: 🔥 Хочешь получить Telegram Premium и стать гуру Polymarket? Кликай сюда!