Цифровая политика. Техника молодёжи. Как big data помогли победить Обаме?

В предыдущий раз мы закончили на той мысли, что всемирно известный поисковик играет совершенно особую роль в политической жизни США. Вещь достаточно очевидная для тех, кто предметно интересуется заокеанскими реалиями. Да и как в стороне может оставаться организация, индексирующая нашу жизнь! Туманным можно считать только схему ее участия.

Большие данные и выборы Обамы

Настало время от политики перейти к технологиям. Для начала попробуем посмотреть, благодаря чему впервые в истории великой демократии президентом стал представитель этнического меньшинства. Это была поистине знаковая победа.

Несмотря на то, что сам штаб Обамы вполне скептически отзывался о консультантах из технической группы, судя по всему они сыграли решающую роль в его избрании. Самому ему говорить было нечего – первые четыре года прошли под знаком удивления от его непопулярности. Критика сыпалась с самых неожиданных сторон и основные политические центры силы на момент 2010 года были ему недоступны.

В фильме со сложнопереводимом на русский названием «Moneyball» тренер унылой бейсбольной команды, плетущийся во втором дивизионе, находит рецепт успеха в самом неожиданном месте. «Все команды первой лиги приобретают звезд. У нас нет денег на такие покупки. Мы должны научиться покупать победы!»

Принцип столь же хорошо ложащийся на реалии двухпартийной политической системы, как и на профессиональный спорт. Лидеров мнений не всегда можно купить – нужно покупать сами мнения. Сразу же после объявления участия предвыборной гонке 2012 на стороне демократов компании BlueLabs, в понимающей прессе США поднялся гвалт – вот сейчас-то мы и станем жертвами всевидящего ока. “Big Data” выходит на арену большой политики.

Обама президент США и большие данные

Демократия, пусть даже номинальная, всегда предполагала взвешивание каждого публичного слова и адресную направленность деклараций кандидатов. Забавные примеры можно найти в ранней американской истории. ДеВитт Клинтон (какая поразительная ирония!), выступавший против Джеймса Мэдисона в самом начале 1812 года произносил пылкие речи в поддержку далекой европейской войны в южных и западных штатах, а на северо-востоке призывал порвать с французским императором. Как мы видим, в таргетированной рекламе нет ничего нового.

За 200 лет заокеанские реалии продвинулись немного вперед и теперь таргетировать можно не регионы страны и даже не отдельные населенные пункты, а индивидуальных избирателей.

Это может показаться невероятным, но в случае изощренной политики речь идет не о таких уж и «Больших Данных». Если судить по комментариям главы соответствующей службы в администрации Обамы, Дэна Вагнера, нам всего лишь нужно порядка 15 терабайт. Цифра смехотворная – уважающий себя оператор сотовой связи в месяц собирает около 15 пентабайт данных, а тот самый Google обрабатывал по 20 пентабайт в день (на момент 2007 года – сейчас раз в 10 больше). За все время предвыборной гонки демократами было собрано около 2 пентабайт – при желании такой объем вполне можно обработать порционно на домашней рабочей станции.

Один из первых трюков с данными назывался Optimizer. Мы о нем кратко упоминали в первом из материалов нашей серии. Смысл в том, чтобы показывать телерекламу (грандиозная статья в бюджете кампании) только правильной аудитории.

Я Обама и использую большие данные, а ты?

Несмотря на то, что результат эксперимента был крайне положительным и удалось номинально сэкономить порядка 20% рекламного бюджета, многие из аналитиков были настроены скептически. Если вы знаете за какую партию голосовал тот или иной гражданин в прошлый раз, вам известен его пол, раса и возраст, признаки типа: играет ли он с друзьями в гольф на выходных или предпочитает красное вино вместо белого, существенно не меняют прогнозов его политических предпочтений.

Точно в том же духе высказались и главы исследовательских отделов обеих партий (на тот момент республиканцы вбросили мяч в игру) – потребительское поведение избирателей переоценено и такого рода информация влияет на доли процентов от общей числа голосов.

Тем более аккуратность таргетирования порой вызывает больше вопросов, чем сам анализ сегментов.

Основной инструмент аналитики демократов – система Catalyst, – хорошо работала с белой аудиторией. Тут по имеющейся базовой информации их ловили с 90% вероятностью. Для латиноамериканцев цифры были ниже – всего лишь 73%. А для афроамериканцев то же самое упражнение удавалось выполнить только в 68% случаев. Правоверные иудеи идентифицировались шансом в 25%, а католики – 38%.

Речь идет не о вероятности исполнения сложных прогнозов, а о базовом сегментировании. Ответе на вопрос кто тот самый человек, поведение которого мы предсказываем.

Такая неряшливость, вопреки всему, не стала проблемой. В ряде случаев, более широкое сообщение столь же эффективно, как и узко таргетированное. Само послание при правильной подаче способно скорректировать эффект своего появления. Психологический трюк, известный всем коммивояжерам мира.

В 2012 году Обама помимо всего прочего активно экспериментировал с email-рассылками. Опробовано было все, что вошло в «золотой фонд» маркетинга последующих лет: призывы, аскетичный дизайн, отслеживание откликов и т. д. В результате многочисленных экспериментов выиграл «универсальный» подход.

Тоже самое происходило и с агитацией – чем абстрактнее, тем лучше работали лозунги. Точные инструменты только появлялись на рынке и важна была надежность. Для кампаний, стремящихся к точности в прогнозах отклика, чем больше данных тем лучше. Однако, с одними голыми данными невозможно выиграть сложную двухлетнюю гонку. Необходимо представлять побудительные мотивы избирателей.

Внутри штаба демократов была создана специальная команда – The Victory Lab. Она исследовала не только и не столько психологические аспекты поведения электоральной базы, но в большей степени движущие силы собственных агитаторов. Что и как говорить для достижения высокой эффективности привлечения голосов.

Хороший пример подобных экспериментов: люди были склонны жертвовать для любимого кандидата больше, чем у них просят, если им специально говорят о персональной скидке :-) Сказывается чувство собственного достоинства и гражданская ответственность. Также микромеценаты охотнее тратят странные суммы, типа 17 или 139 долларов. Они подозревают, что в таком случае они идут на благое дело, а не разбазариваются по дороге в Вашингтон.

Все такие исследования складывались в единую базу и становились точно таким же основанием для принятия управленческих решений, как и сами конечные данные об избирателях. Вся кампания опиралась на несколько сотен исследований над группой в 200 с лишним тысяч человек.

Президент Обама big data

На конец 2011 года большая часть работы была уже проделана. Оставалось лишь использовать рычаг. Им оказался инновационный «target sharing» – включение в кампанию соцсетей. Catalyst и Analyst Institute (еще одна интересная структура) еще в 2010 году заключили специальный контракт с Facebook, позволяющий им выборочно просматривать контактные данные пользователей. В соглашении, показанном прессе, речь идет о публичных данных. Но, как показала практика, технологии не всегда бывают добросовестны. Несколько исков со стороны обиженных пользователей побудили социальную сеть досрочно анонсировать появления API для получения любым желающим открытых данных.

В сухом остатке демократов оказалась информация более чем 600 000 потенциальных голосов.

Руководитель службы Big Data штаба Обамы уже после выборов демонстративно жал плечами – сколько конкретно человек нам удалось привлечь на свою сторону через соцсети сказать трудно. Не очевидно даже общее количество нулей этом числе. Доподлинно известно лишь, что в ряде случаев речь шла о коммерческих соглашениях с рекламодателями Facebook. Т.е. глубокой интеграции между политической повесткой и рядовой покупкой пользователем кроссовок или турпутевки. Deep Data.

Если посчитать все усилия, приложенные советниками будущего президента, мы наберем не так уж много активированных избирателей. Каких-нибудь 3-4 миллиона человек. Казалось бы, явно недостаточно для уверенной победы в 300 миллионной стране. Однако, первое впечатление обманчиво. Основной базой выборной агитации являются не свой, демократический, а колеблющийся электорат в маркированных городах и штатах. Обама победил своего конкурента с перевесом около 4% голосов. Это уже пограничная цифра в статистике. Технологии, по общему мнению, смогли обеспечить ему ¾ этого числа.

Пустячок, а приятно.

Большие Данные для маленькой такой кампании.