Google DeepMind представила AlphaEvolve — систему на основе большой языковой модели, которая самостоятельно переписывает алгоритмы для многоагентного обучения с подкреплением в играх с неполной информацией.
Традиционно разработка алгоритмов для таких сценариев, как покер, где игроки действуют последовательно и не видят информацию друг друга, требовала ручной итерации. Исследователи вручную определяли схемы взвешивания, правила дисконтирования и решатели равновесия методом проб и ошибок.
По данным Google DeepMind, AlphaEvolve использует эволюционный подход, позволяя языковой модели генерировать и модифицировать код алгоритмов. В ходе тестирования система превзошла результаты, полученные экспертами-исследователями при разработке алгоритмов вручную.
Система работает как кодирующий агент, который итеративно улучшает алгоритмы на основе обратной связи от тестирования. Компания отмечает, что подход позволяет ускорить процесс разработки и открывает новые возможности для оптимизации.
Исследование демонстрирует применение больших языковых моделей для автоматизации научных задач в области машинного обучения. Аналитики указывают на потенциал подобных систем для ускорения разработки алгоритмов в других областях.
Источник: Marktechpost
Реклама: 🔥 Хочешь получить Telegram Premium и стать гуру Polymarket? Кликай сюда!