Компания OpenAI анонсировала нового ИИ-«агента», призванного помочь людям проводить глубокие и сложные исследования с помощью ChatGPT, платформы для чатботов на базе ИИ.
Соответственно, он называется «глубокие исследования».
В блоге OpenAI, опубликованном в воскресенье, говорится, что эта новая возможность предназначена для «людей, которые занимаются интенсивной научной работой в таких областях, как финансы, наука, политика и инженерия, и нуждаются в тщательных, точных и надежных исследованиях». Кроме того, компания добавила, что она может быть полезна для тех, кто совершает «покупки, которые обычно требуют тщательного исследования, например, автомобили, бытовая техника и мебель».
По сути, глубокое исследование ChatGPT предназначено для тех случаев, когда вам не просто нужен быстрый ответ или резюме, а необходимо тщательно изучить информацию с нескольких веб-сайтов и других источников.
OpenAI заявила, что уже сегодня глубокое исследование доступно пользователям ChatGPT Pro, ограниченным 100 запросами в месяц, затем появится поддержка пользователей Plus и Team, а затем и Enterprise. (По словам компании, OpenAI планирует запустить Plus примерно через месяц, а лимиты запросов для платных пользователей должны быть «значительно выше» в ближайшее время). Это геотаргетированный запуск; OpenAI не сообщила о сроках выпуска для клиентов ChatGPT в Великобритании, Швейцарии и Европейской экономической зоне.
Чтобы воспользоваться глубоким исследованием ChatGPT, достаточно выбрать «глубокое исследование» в композиторе, а затем ввести запрос с возможностью прикрепления файлов или электронных таблиц. (Пока это только веб-приложение, интеграция с мобильными и настольными приложениями появится позже в этом месяце). Глубокое исследование может занять от 5 до 30 минут, и вы получите уведомление о завершении поиска.
В настоящее время результаты глубокого исследования ChatGPT представлены только в текстовом виде. Но OpenAI заявила, что в скором времени намерена добавить встроенные изображения, визуализацию данных и другие «аналитические» результаты. Также в «дорожной карте» есть возможность подключения «более специализированных источников данных», включая «подписные» и внутренние ресурсы, добавили в OpenAI.
Главный вопрос заключается в том, насколько точным будет глубокое исследование ChatGPT? Ведь искусственный интеллект несовершенен. Он склонен к галлюцинациям и другим видам ошибок, которые могут быть особенно опасны в сценарии «глубокого исследования». Возможно, именно поэтому OpenAI заявила, что каждый результат глубоких исследований ChatGPT будет «полностью задокументирован, с четкими цитатами и кратким изложением мыслей, что облегчит поиск и проверку информации».
Пока неясно, будут ли эти меры достаточными для борьбы с ошибками ИИ. Функция веб-поиска от OpenAI на базе ИИ в ChatGPT, ChatGPT Search, нередко допускает ляпы и дает неправильные ответы на вопросы. Тестирование, проведенное TechCrunch, показало, что по некоторым запросам ChatGPT Search выдает менее полезные результаты, чем Google Search.
Чтобы повысить точность глубокого исследования, OpenAI использует специальную версию недавно анонсированной модели ИИ o3 «reasoning», которая была обучена с помощью обучения с усилением на «реальных задачах, требующих использования браузера и инструментов Python». Обучение с подкреплением, по сути, «учит» модель методом проб и ошибок достигать определенной цели. По мере приближения к цели модель получает виртуальное «вознаграждение», которое, в идеале, позволяет ей лучше справляться с задачей в дальнейшем.
В компании заявили, что данная версия модели OpenAI o3 «оптимизирована для просмотра веб-страниц и анализа данных», добавив, что «она использует логику для поиска, интерпретации и анализа огромных объемов текста, изображений и PDF-файлов в Интернете, при необходимости реагируя на информацию, которую она встречает [...] Модель также может просматривать загруженные пользователем файлы, строить и итерировать графики с помощью инструмента python, вставлять в свои ответы сгенерированные графики и изображения с сайтов, а также цитировать определенные предложения или отрывки из своих источников».
Компания заявила, что протестировала глубокие исследования ChatGPT с помощью «Последнего экзамена человечества» - теста, включающего более 3 000 вопросов экспертного уровня в различных научных областях. Модель o3, используемая в глубоких исследованиях, достигла точности 26,6 %, что может показаться провальной оценкой, но Humanity's Last Exam был разработан как более жесткий, чем другие эталоны, чтобы опережать развитие моделей. По данным OpenAI, модель глубокого исследования o3 значительно опередила Gemini Thinking (6,2 %), Grok-2 (3,8 %) и собственную модель OpenAI GPT-4o (3,3 %).
Тем не менее, OpenAI отмечает, что глубокие исследования ChatGPT имеют свои ограничения, иногда допуская ошибки и неверные выводы. По словам компании, глубокое исследование может с трудом отличать авторитетную информацию от слухов и часто не может сообщить, когда не уверено в чем-то, а также может допускать ошибки форматирования в отчетах и цитатах.
Для тех, кто беспокоится о влиянии генеративного ИИ на студентов или на всех, кто пытается найти информацию в Интернете, такой тип глубокого, хорошо цитируемого результата, вероятно, звучит более привлекательно, чем обманчиво простое резюме чатбота без ссылок. Но посмотрим, будет ли большинство пользователей действительно подвергать результаты реальному анализу и перепроверке.
Оригинал
Уникальность