OpenAI 22 апреля 2026 года представила открытую модель Privacy Filter для поиска и маскирования персональной информации в текстовых данных. По информации компании, модель предназначена для локального запуска без передачи данных на внешние серверы и поддерживает расширенный контекст с детальной таксономией чувствительных сущностей.
Модель использует специализированную архитектуру для выявления и скрытия различных типов персональных данных. Компания заявляет о возможности обработки текстов на нескольких языках, включая английский.
По результатам тестирования на русскоязычных данных модель демонстрирует высокую точность при обработке американских имен и географических названий. Однако при работе с русскими именами и топонимами результаты оказались менее надежными. Тестирование включало проверку на примерах типа русских фамилий и названий населенных пунктов.
Аналитики отмечают, что мультиязычный режим модели требует дополнительной валидации на локальных данных перед использованием в производстве. Компания позиционирует Privacy Filter как инструмент для организаций, обрабатывающих чувствительные данные, но подчеркивает необходимость предварительного тестирования на специфичных для конкретного рынка текстах.
Источник: Habr AI
Реклама: 🔥 Хочешь получить Telegram Premium и стать гуру Polymarket? Кликай сюда!