StepFun выпустила языковую модель Step 3.7 Flash архитектуры MoE объемом 198 миллиардов параметров. По данным компании, модель поддерживает обработку изображений, имеет контекстное окно в 256 тысяч токенов и включает режим Advisor Mode для работы с агентами кодирования и поисковыми системами.
Модель предназначена для выполнения задач, требующих анализа визуальной информации и обработки больших объемов текста. Архитектура MoE (Mixture of Experts) позволяет активировать только часть параметров при обработке каждого запроса, что снижает вычислительные затраты.
Режим Advisor Mode, согласно информации компании, обеспечивает взаимодействие с автоматизированными системами и поисковыми приложениями. Расширенное контекстное окно в 256 тысяч токенов позволяет обрабатывать длинные документы и сложные сценарии без потери информации.
Компания позиционирует Step 3.7 Flash как решение для разработчиков, работающих с мультимодальными задачами. Модель может использоваться в системах автоматизации кода и интеграции с поисковыми платформами.
Визуальные возможности встроены в архитектуру модели, что позволяет обрабатывать изображения без дополнительных компонентов. Компания не раскрыла детали обучения и тестирования производительности на стандартных бенчмарках.
Источник: Marktechpost
Реклама: 🔥 Хочешь получить Telegram Premium и стать гуру Polymarket? Кликай сюда!