Выступая в понедельник на конференции SXSW в Остине, генеральный директор Bluesky Джей Грабер заявил, что социальная сеть работает над созданием системы согласия пользователей на использование их данных для генеративного ИИ.
Публичный характер социальной сети Bluesky уже позволил другим людям обучать свои системы искусственного интеллекта на контенте пользователей, как это было обнаружено в прошлом году, когда 404 Media обнаружила набор данных, созданный из 1 миллиона постов Bluesky, размещенных на Hugging Face.
Конкурент Bluesky, компания X, тем временем передает посты пользователей родственной компании xAI для обучения своего чат-бота ИИ Grok. Прошлой осенью компания изменила свою политику конфиденциальности, чтобы разрешить третьим сторонам обучать свой ИИ на сообщениях пользователей X. Этот шаг, последовавший за выборами в США, которые повысили статус владельца X Элона Маска в администрации Трампа, способствовал очередному оттоку пользователей из X в Bluesky.
В результате всего за два года работы децентрализованной альтернативы X с открытым исходным кодом Bluesky число пользователей превысило 32 миллиона человек.
Однако спрос на данные для обучения ИИ означает, что новая социальная сеть должна задуматься о своей политике в области ИИ, хотя она и не планирует обучать свои собственные системы ИИ на сообщениях пользователей.
Выступая на SXSW, Грабер пояснил, что компания совместно с партнерами разрабатывает рамки согласия пользователей на то, как они хотят, чтобы их данные использовались - или не использовались - для генеративного ИИ.
«Мы действительно верим в выбор пользователей», - сказал Грабер, отметив, что пользователи смогут указать, как они хотят использовать контент Bluesky.
«Это может быть что-то похожее на то, как веб-сайты указывают, хотят ли они, чтобы поисковые системы их соскабливали, или нет», - продолжила она.
«Поисковые системы все равно могут скрести веб-сайты, независимо от того, есть у вас такая возможность или нет, потому что веб-сайты открыты в публичном интернете. Но в целом этот файл robots.txt уважается многими поисковыми системами», - сказала она. «Поэтому нужно, чтобы что-то было широко принято, чтобы пользователи, компании и регулирующие органы пошли на это. Но я думаю, что здесь это может сработать».
Предложение, которое в настоящее время находится на GitHub, предполагает получение согласия пользователя на уровне учетной записи или даже на уровне поста, а затем обращение к другим компаниям с просьбой соблюдать эти настройки.
«Мы работали над этим вместе с другими людьми, обеспокоенными тем, как искусственный интеллект влияет на то, как мы воспринимаем наши данные», - добавил Грабер. «Я думаю, что это позитивное направление».
Оригинал
Уникальность