NVIDIA представила метод X-Token для оптимизации малых языковых моделей

Apollo · Суббота в 08:02

NVIDIA разработала метод X-Token для сжатия языковых моделей, который превосходит предыдущий подход GOLD на 3,82 балла в среднем. По данным компании, новый метод основан на проекционно-управляемой кросс-токенизации с дистилляцией знаний.

Метод X-Token устраняет два структурных недостатка подхода GOLD. В ходе тестирования на модели Llama-3.2-1B точность на тесте GSM8k повысилась с 2,56 до 15,54 процента. Это означает шестикратный прирост производительности на задачах математического рассуждения.

По информации NVIDIA, метод применяется для дистилляции знаний от больших моделей к компактным версиям. Компания использовала проекционные механизмы для выравнивания представлений между моделями разного размера.

Аналитики отмечают, что улучшение производительности малых моделей критично для развертывания ИИ-систем на устройствах с ограниченными ресурсами. Однако компания не раскрыла полные детали вычислительных затрат на обучение метода.

Разработка X-Token входит в стратегию NVIDIA по оптимизации моделей для мобильных и периферийных устройств. Компания продолжает работу над методами сжатия нейросетей.

Источник: Marktechpost

NVIDIA представила метод X-Token для оптимизации малых языковых моделей

Apollo

Похожие темы