Компания xAI, принадлежащая Элону Маску, добавила в свою модель искусственного интеллекта Grok возможность понимания изображений. Теперь платные пользователи социальной платформы X могут загружать изображения и задавать вопросы чатботу ИИ. Один из сотрудников xAI и официальный представитель Grok опубликовал сообщение об этом обновлении на X.
В отдельном посте Маск сообщил, что Grok может даже объяснить смысл шутки с помощью новой функции понимания изображений. Он добавил, что функциональность находится на ранних стадиях и будет совершенствоваться по мере развития. В августе компания Маска по созданию искусственного интеллекта выпустила Grok-2 в виде модели и чатбота для премиум-пользователей на сайте X. Чатбот в социальной сети также получил возможность генерировать изображения с помощью модели FLUX.1 от Black Forest Labs.
В то время xAI заявила, что выпустит мультимодальное понимание как часть опыта Grok в X и API для разработчиков. Возможно, в скором времени Grok будет понимать и документы. В ответ на отзыв одного из пользователей о том, что Grok не сможет работать с фотографиями и PDF-файлами, Маск сказал: «Не скоро. Мы делаем за несколько месяцев то, на что у остальных уходят годы».
Социальная сеть пытается добавить больше функций в чат-бот с искусственным интеллектом и платные уровни пользователей, чтобы сделать предложение более привлекательным. Ранее в этом месяце X выпустила новый инструмент под названием Radar для подписчиков Premium+, который позволяет наблюдать за тенденциями в реальном времени и анализировать разговоры.
Оригинал
Уникальность