Французская лаборатория искусственного интеллекта Mistral вступает в игру по созданию моделей искусственного интеллекта, способных к рассуждению.
Во вторник утром Mistral анонсировала Magistral, свою первую семью моделей, способных к рассуждению. Как и другие модели, способные к рассуждению, — например, o3 от OpenAI и Gemini 2.5 Pro от Google — Magistral решает задачи шаг за шагом, что повышает согласованность и надежность в таких областях, как математика и физика.
Magistral доступна в двух вариантах: Magistral Small и Magistral Medium. Magistral Small имеет размер 24 миллиарда параметров и доступен для скачивания с платформы разработчиков ИИ Hugging Face по разрешительной лицензии Apache 2.0. (Параметры — это внутренние компоненты модели, которые определяют ее поведение.) Magistral Medium, более мощная модель, доступна в предварительной версии на платформе чат-бота Mistral Le Chat и API компании, а также в облаках сторонних партнеров.
«Magistral подходит для широкого спектра корпоративных сценариев использования, от структурированных вычислений и программной логики до деревьев решений и систем на основе правил», — пишет Mistral в своем блоге. «Модели точно настроены для многоступенчатой логики, улучшая интерпретируемость и обеспечивая отслеживаемый процесс мышления на языке пользователя».
Основанная в 2023 году, Mistral — это передовая модельная лаборатория, создающая ряд сервисов на базе искусственного интеллекта, включая вышеупомянутый Le Chat и мобильные приложения. Она поддерживается венчурными инвесторами, такими как General Catalyst, и на сегодняшний день привлекла более 1,1 миллиарда евро (примерно 1,24 миллиарда долларов).
Несмотря на свои внушительные ресурсы, Mistral отстает от других ведущих лабораторий искусственного интеллекта в некоторых областях, таких как разработка моделей рассуждений. Судя по собственным тестам Mistral, Magistral также не выглядит особенно конкурентоспособным продуктом.
В тестах GPQA Diamond и AIME, которые оценивают физические, математические и научные навыки модели, Magistral Medium уступает Gemini 2.5 Pro и Claude Opus 4 от Anthropic. Magistral Medium также не превосходит Gemini 2.5 Pro в популярном тесте программирования LiveCodeBench.
Возможно, именно поэтому Mistral рекламирует другие сильные стороны Magistral в своем блоге. Magistral предоставляет ответы в 10 раз быстрее, чем конкуренты в Le Chat, утверждает Mistral, и поддерживает широкий спектр языков, включая итальянский, арабский, русский и упрощенный китайский.
«Опираясь на наши флагманские модели, Magistral предназначен для исследований, стратегического планирования, оптимизации операционной деятельности и принятия решений на основе данных», — пишет компания в своем посте, «будь то оценка рисков и моделирование с учетом множества факторов или расчет оптимальных сроков доставки с учетом ограничений».
Выпуск Magistral последовал за дебютом клиента Mistral Code, предназначенного для «кодирования настроения». Несколько недель до этого Mistral запустила несколько моделей, ориентированных на кодирование, и представила Le Chat Enterprise, корпоративный чат-бот, который предлагает такие инструменты, как конструктор AI-агентов, и интегрирует модели Mistral со сторонними сервисами, такими как Gmail и SharePoint.
Оригинал
Уникальность