В четверг Институт Лауде объявил о первой партии грантов Slingshots, направленных на «продвижение науки и практики искусственного интеллекта». Программа Slingshots, задуманная как акселератор для исследователей, призвана предоставить ресурсы, недоступные в большинстве академических условий — будь то финансирование, вычислительная мощность или поддержка в разработке продуктов и инженерии.
В обмен получатели обязуются создать конечный рабочий продукт: стартап, открытый исходный код или другой тип артефакта. Первая когорта включает 15 проектов с особым акцентом на сложную проблему оценки ИИ. Некоторые из них знакомы читателям TechCrunch, включая бенчмарк для кодирования в командной строке Terminal Bench и последнюю версию долгосрочного проекта ARC-AGI. Другие предлагают свежий подход к давно существующей задаче оценки.
Formula Code, созданный исследователями из Caltech и UT Austin, стремится оценить способность ИИ-агентов оптимизировать существующий код, а BizBench, разработанный в Колумбийском университете, предлагает всесторонний бенчмарк для «ИИ-агентов белых воротничков». Другие гранты исследуют новые структуры для обучения с подкреплением или сжатия моделей.
Сооснователь SWE-Bench Джон Бода Янг также входит в когорту как руководитель нового проекта CodeClash. Вдохновлённый успехом SWE-Bench, CodeClash будет оценивать код через динамичную соревновательную систему, которую Янг надеется... «Я считаю, что постоянная оценка по основным сторонним бенчмаркам продвигает прогресс, — сказал Янг TechCrunch. — Меня немного беспокоит будущее, в котором бенчмарки станут специфичными только для компаний».
Оригинал
Уникальность