В субботу швейцарский журнал Das Magazin опубликовал расследование о том, как технологии персонализированной рекламы в сети Facebook повлияли на итоги выборов в США и референдума о выходе Великобритании из ЕС. Как отмечает немецкий Spiegel, многие журналисты уже стали называть расследование «текстом года». В нем есть все: и новейшие технологии; и универсальное оружие, которое попало из хороших рук в плохие; и ежедневная слежка за каждым из нас; и таинственные заказчики; и превращение из нищего в принца (и наоборот).
Термин Big Data значит то, что все, что мы делаем — в интернете или «офлайн» — оставляет цифровой след. Покупка по кредитке, запрос в Google, прогулка со смартфоном в кармане, каждый лайк в соцсети: все это сохраняется. Долгое время никто не мог понять, для чего хорошего могли бы пригодиться эти данные — ну лишь кроме тех случаев, когда в ленте Facebook всплывает реклама средств от гипертонии, потому что недавно мы искали в Google «как понизить давление». Непонятно было и то, чем же является Big Data для человечества — большой опасностью или большим достижением? Но с 9 ноября мы знаем на это ответ. Ведь и за предвыборной кампанией Трампа в интернете, и за кампанией в поддержку Brexit стоит одна и та же компания, исследующая Big Data: Cambridge Analytica и ее директор Александр Никс. Кто хочет понять природу этих голосований (и природу того, что ожидает Европу в ближайшие месяцы), должен начать с примечательного события, произошедшего в 2014 году в британском Кембриджском университете. А именно, на кафедре психометрии Козинского.
В 2008 году студент из Варшавы Михал Козинский начал новую жизнь: он поступил в престижный английский Кембридж, в Центр психометрии, лабораторию Кэвендиш, самую первую лабораторию по психометрии в мире. Со своими однокурсниками он придумал и запустил приложение для Facebook под названием MyPersonality. Пользователю предлагалось ответить на огромный список вопросов («легко ли вас вывести из себя в состоянии стресса? Есть ли у вас склонность критиковать окружающих?»), получив затем свой «профиль личности», а создатели приложения получали бесценные личные данные. Вместо ожидавшихся данных по дюжине однокурсников, создатели получили информацию по сотням, тысячам, а затем и миллионам людей. Два докторанта собрали тем самым крупнейший «урожай» данных в истории психологических исследований.
Процесс, который Козинский сотоварищи разработал за последующие несколько лет, достаточно прост. Во-первых, тестируемый получает список вопросов, онлайн-тест. Из ответов на него ученые вычисляют личные ценности испытуемого. Далее, Козинский с командой изучают действия испытуемого: лайки и репосты в Facebook, а также его пол, возраст и место жительства. Так исследователи получают связи. Из простого анализа данных в сети могут получится необычные выводы. Например, если мужчина подписан на страничку бренда косметики MAC, он с высокой вероятностью является геем. Наоборот, сильный показатель гетеросексуальности — если человек поставил лайк хип-хоп группе Wu-Tang Clan из Нью-Йорка. Поклонник Леди Гаги с высокой долей вероятности экстраверт, а человек, ставящий «нравится» философским постам — интроверт.
Козинский и его коллеги беспрестанно совершенствовали свою модель. В 2012 году Козинский доказал, что анализа 68 лайков в Facebook достаточно, чтобы определить цвет кожи испытуемого (с 95% вероятностью), его гомосексуальность (88% вероятности) и приверженность Демократической или Республиканской партии США (85% вероятности). Но процесс идет дальше: интеллектуальное развитие, религиозные предпочтения, пристрастие к алкоголю, курению или наркотикам. Данные даже позволяли узнать, развелись ли родители испытуемого до его совершеннолетия или нет. Модель оказалась настолько хороша, что стало возможным предугадывать ответы испытуемого на определенные вопросы. Опьяненный успехом, Козинский продолжал: скоро модель смогла лучше узнавать личность после десяти изученных лайков, нежели его коллеги по работе. После 70 лайков — лучше, чем друг. После 150 лайков — лучше, чем родители. После 300 лайков — лучше, чем партнер.
Козинский и команда могут оценивать людей по Большой пятерке критериев исходя из их юзерпика, фотографии в соцсетях. Или даже по числе друзей: хороший показатель экстраверсии! Но мы также сдаем личные данные, когда находимся не в сети. Датчик движения в смартфоне показывает, размахиваем ли мы рукой с ним, как далеко ездим (коррелирует с эмоциональной нестабильностью). Как замечает Козинский, смартфон — это огромный психологический опросник, который мы вольно или невольно заполняем. Что особенно важно, это работает и в обратную сторону: можно не только создавать из данных психологический портрет, вы можете искать среди этих портретов нужные. Например, обеспокоенные папаши, озлобленные интроверты, не определившиеся с выбором сторонники демократов. По сути, Козинский изобрел поисковую систему по людям.
В день третьих дебатов между Трампом и Клинтон команда Трампа отправила в соцсети (преимущественно, Facebook) свыше 175 тыс. различных вариаций посланий. Они различались лишь в мельчайших деталях, чтобы максимально точно психологически подстроиться под конкретных получателей информации: заголовки и подзаголовки, фоновые цвета, использование фото или видео в посте: «Таким способом мы можем дотянуться до нужных деревень, кварталов или домов, даже до конкретных людей». В квартале Маленький Гаити в Майами была запущена информация об отказе Фонда Клинтон участвовать в ликвидации последствий землетрясения в Гаити — чтобы разубедить жителей отдавать свои голоса Клинтон. Это было еще одной целью: удержать электорат Клинтон (например, сомневающихся леваков, афроамериканцев и молодых девушек) от урны для голосования, «подавлять» их выбор, по выражению одного из сотрудников Трампа. Использовались и так называемые «темные посты» Facebook: платные объявления посреди ленты новостей, которые могли попадаться только определенным группам лиц. Например, афроамериканцам показывали посты с видео, на котором Клинтон сравнивала чернокожих мужчин с хищниками.
Статья полностью