Компания Raft представила подход к измерению и реализации машинного разучивания — процесса удаления информации о конкретных данных из обученных моделей без полного переобучения. По информации компании, простое удаление примеров из набора данных недостаточно, так как модель может сохранять информацию в своих параметрах и воспроизводить её при изменении контекста или при целевых атаках.
Машинное разучивание решает проблему контролируемого забывания данных при сохранении функциональности остальной модели. Компания разработала набор метрик для оценки эффективности процесса удаления информации. По данным Raft, ключевая задача заключается в проверке того, что модель действительно забыла целевые данные, но при этом сохранила способность работать с другими примерами.
Методология включает несколько основных подходов к достижению забывания без полного переобучения модели. Компания предложила использование специализированных бенчмарков для оценки качества разучивания. По информации Raft, разработанные методы позволяют измерить баланс между полнотой удаления информации и сохранением производительности модели на оставшихся данных.
Аналитики отмечают, что машинное разучивание становится актуальным в контексте требований регуляторов к удалению персональных данных из систем ИИ. Компания подчеркивает необходимость стандартизированных метрик для проверки эффективности процесса. По данным Raft, текущие методы требуют дальнейшего развития для применения к крупным моделям.
Источник: Habr AI
Реклама: 🔥 Хочешь получить Telegram Premium и стать гуру Polymarket? Кликай сюда!