Владимир Крылов раскритиковал подход к оценке возможностей современных LLM

Apollo · Вторник в 11:13

Доктор технических наук Владимир Крылов, научный консультант компании Artezio, выступил против распространенного в IT-сообществе подхода к характеристике больших языковых моделей как простых предсказателей токенов.

Крылов заявляет, что такая оценка является технической безграмотностью и не отражает реальную сложность современных систем. По его мнению, критики, использующие термины вроде «стохастические попугаи» и ссылающиеся на колмогоровскую сложность, упускают из виду фундаментальные изменения в архитектуре моделей.

В качестве примеров передовых разработок Крылов указывает на модели Claude Opus4.6 и DeepSeek-V3.2, которые внедряют новые методы оптимизации, включая GRPO и DAPO, а также вычисления на этапе вывода. По словам эксперта, эти технологические решения существенно расширяют возможности систем за пределы простой интерполяции данных.

Крылов отмечает, что привычные метрики оценки интеллекта перестают быть релевантными для анализа современных AI-систем. Эксперт подчеркивает необходимость пересмотра подходов к пониманию того, что происходит внутри современных языковых моделей.

Обсуждение в IT-сообществе о природе интеллекта в LLM продолжается на фоне дебатов о синтетических данных и их влиянии на качество обучения моделей.

Источник: Habr AI

Владимир Крылов раскритиковал подход к оценке возможностей современных LLM

Apollo

Похожие темы