• Добро пожаловать на инвестиционный форум!

    Во всем многообразии инвестиций трудно разобраться. MMGP станет вашим надежным помощником и путеводителем в мире инвестиций. Только самые последние тренды, передовые технологии и новые возможности. 400 тысяч пользователей уже выбрали нас. Самые актуальные новости, проверенные стратегии и способы заработка. Сюда люди приходят поделиться своим опытом, найти и обсудить новые перспективы. 16 миллионов сообщений, оставленных нашими пользователями, содержат их бесценный опыт и знания. Присоединяйтесь и вы!

    Впрочем, для начала надо зарегистрироваться!
  • 🐑 Моисей водил бесплатно. А мы платим, хотя тоже планируем работать 40 лет! Принимай участие в партнеской программе MMGP
  • 📝 Знаешь буквы и умеешь их компоновать? Платим. Дорого. Бессрочная акция от MMGP: "ОПЛАТА ЗА СООБЩЕНИЯ"
  • 💰 В данном разделе действует акция с оплатой за новые публикации
  • 📌 Внимание! Перед публикацией новостей ознакомьтесь с правилами новостных разделов

Deep Cogito выходит из тени с гибридными моделями ИИ

Deep.jpg

Новая компания Deep Cogito вышла из невидимости с семейством общедоступных моделей ИИ, которые можно переключать между режимами «рассуждения» и «не рассуждения».

Модели рассуждений, такие как OpenAI's o1, показали большие перспективы в таких областях, как математика и физика, благодаря своей способности эффективно проверять факты, прорабатывая сложные проблемы шаг за шагом. Однако за такие рассуждения приходится платить: за большие вычисления и задержки. Поэтому такие лаборатории, как Anthropic, разрабатывают «гибридные» архитектуры моделей, которые сочетают компоненты рассуждений со стандартными элементами, не связанными с рассуждениями.

Гибридные модели могут быстро отвечать на простые вопросы, тратя дополнительное время на рассмотрение более сложных запросов.
Все модели Deep Cogito, называемые Cogito 1, являются гибридными. Cogito утверждает, что они превосходят лучшие открытые модели того же размера, включая модели от Meta и китайского ИИ-стартапа DeepSeek.

«Каждая модель может отвечать напрямую или самостоятельно размышлять перед ответом (как рассуждающие модели)», - поясняет компания в своем блоге. «Все были разработаны небольшой командой примерно за 75 дней».

Модели Cogito 1 имеют от 3 миллиардов параметров до 70 миллиардов параметров, и Cogito утверждает, что в ближайшие недели и месяцы к ним присоединятся модели с количеством параметров до 671 миллиарда. Параметры примерно соответствуют навыкам модели в решении задач, при этом большее количество параметров обычно лучше.

Cogito 1 не был разработан с нуля. Deep Cogito создала свои собственные модели на основе открытых моделей Llama от Meta и Qwen от Alibaba. По словам компании, она применила новые подходы к обучению, чтобы повысить производительность базовых моделей и обеспечить возможность переключения рассуждений.

Согласно результатам внутреннего бенчмарка Cogito, самая крупная модель Cogito 1, Cogito 70B, с рассуждениями превосходит модель рассуждений R1 от DeepSeek по нескольким математическим и языковым оценкам. Cogito 70B с отключенными рассуждениями также превосходит недавно выпущенную модель Llama 4 Scout компании Meta в LiveBench, тесте ИИ общего назначения.

Каждая модель Cogito 1 доступна для загрузки или использования через API на облачных провайдерах Fireworks AI и Together AI.
«В настоящее время мы все еще находимся на ранних стадиях нашего масштабирования, используя лишь часть вычислений, обычно предназначенных для традиционного пост/продолжительного обучения больших языковых моделей», - пишет Cogito в своем блоге. «Двигаясь вперед, мы изучаем дополнительные подходы к посттренинговому обучению для самосовершенствования».

Согласно документам, поданным в администрацию штата Калифорния, компания Deep Cogito, расположенная в Сан-Франциско, была основана в июне 2024 года. На странице компании в LinkedIn указаны два соучредителя - Дришан Арора и Дхрув Малхотра. Малхотра ранее был менеджером по продуктам в лаборатории Google AI DeepMind, где он работал над технологией генеративного поиска. Арора был старшим инженером-программистом в Google.

Deep Cogito, в число спонсоров которой входит South Park Commons, по данным PitchBook, ставит перед собой амбициозную цель - создать «общий сверхинтеллект». Основатели компании понимают под этим словосочетанием ИИ, способный выполнять задачи лучше, чем большинство людей, и «открывать совершенно новые возможности, которые мы еще не можем себе представить».

Оригинал

Уникальность
 

Похожие темы

Сверху Снизу