Читать «Здравый смысл врет. Почему не надо слушать свой внутренний голос» онлайн - страница 65

Дункан Уоттс

В общей сложности в течение двух месяцев в конце 2009 года нам удалось отследить более 39 млн таких «событий» диффузии, инициированных более чем 1,6 млн пользователей. Для каждого события мы посчитали количество ретвитов обсуждаемого URL: сперва непосредственными подписчиками пользователя-инициатора («сида»), потом их подписчиками, потом подписчиками их подписчиков, и так далее – в итоге проследив весь каскад ретвитов, запущенных одним-единственным первоначальным твитом. Как показано на схеме ниже, одни каскады были широкими и плоскими, другие – узкими и глубокими. Третьи – очень большими, со сложной структурой: некоторое время они оставались маленькими, а затем вдруг начинали резко увеличиваться. Впрочем, большинство каскадов – примерно 98 % – не распространялись вообще.

Каскады на Twitter

Последнее наблюдение крайне важно. Как мы будем подробно обсуждать в следующей главе, стремясь понять, почему некоторые вещи «распространяются как зараза» – загруженные миллионы раз видео с YouTube или смешные послания, циркулирующие по электронной почте или Facebook , – грубейшей ошибкой будет учитывать лишь те немногие из них, которые действительно стали популярными. В большинстве ситуаций изучать можно только «успехи», ибо никто просто-напросто не дает себе труд отслеживать неудачи. Поэтому последние имеют тенденцию очень быстро исчезать в мусорной корзине истории. В сети Twitter, однако, мы можем проследить каждое событие – маленькое или большое. Это, в свою очередь, позволяет установить, кто именно влиятелен, насколько он влиятельнее обычного человека и возможно ли выявить различия между ними так, чтобы это можно было использовать на практике.

Мы старались сымитировать поведение гипотетического маркетолога – то есть, используя знания о свойствах и прошлом поведении примерно миллиона человек, попытаться предсказать, насколько влиятельным каждый из них окажется в будущем. Основываясь на этих прогнозах, маркетолог мог затем «профинансировать» некую группу людей, чтобы она опубликовала необходимую ему информацию, сгенерировав серию каскадов. Чем точнее он мог предсказать величину каскада, инициированного каждым конкретным человеком, тем эффективнее определялся бюджет для спонсируемых твитов.

Проведение такого эксперимента на практике по-прежнему очень трудновыполнимо, поэтому мы сделали все возможное для максимального приближения к реальности. В частности, использовали уже собранные данные, разделив их на две половины: первый месяц стал «историей», а второй – «будущим». Затем мы вложили все наши «исторические» данные в статистическую модель – включая количество подписчиков у каждого пользователя, подписчиков их подписчиков, частоту твитов после регистрации, а также успешность вызывания каскадов в течение этого периода. Потом мы использовали эту модель для предсказания влиятельности каждого пользователя в наших «будущих» данных, а в конце сравнили результаты с тем, что произошло на самом деле.