Читать «Критическая масса, как одни явления порождают другие» онлайн - страница 330

Филипп Болл

Таким образом, сеть WWW все же может быть отнесена к малым мирам, но со специфической топологией, характеризующейся степенным законом распределения, из чего вытекает свойство безмасштабной связности. Альберт и ее группа подсчитали, что если увеличить домен университета Нотр-Дам до размеров всей Сети, сохранив при этом его структуру, то любые две веб-страницы будут разделены в среднем 19 ссылками, при предполагаемом дальнейшем росте числа веб-страниц в 10 раз среднее число таких ссылок увеличится всего на две. То есть сама структура Сети гарантированно обеспечивает возможность достижения нужного сайта посредством всего нескольких соединений.

На первый взгляд представляется даже странным, почему эти простые закономерности не были обнаружены сразу? По мнению большинства пользователей и исследователей Сети, сложность анализа ее работы обусловлена чудовищным объемом циркулирующей в Сети бесполезной информации. Поисковые программы затрачивают массу времени, пробираясь через завалы «мусора», поскольку не существует возможности выделить только полезные ссылки. Возникает парадоксальная ситуация, при которой каждый важный документ можно действительно найти через 19 переключений, но при этом приходится просматривать массу ненужных документов, так что поразительная связность Сети автоматически снижает эффективность работы поисковых программ. Кроме того, огромные сложности для поиска информации создает непрерывное изменение размеров и параметров Сети, что заставляет любые поисковые программы тратить время на регистрацию и индексацию гигантского количества появляющихся новых страниц, а также их «привязки» к уже существующим документам. По оценкам специалистов, даже лучшие поисковые программы могут просматривать не более трети содержания Сети, а большинство программ оперируют примерно лишь с '/ш ее объема

Ладе Адамик, специалисту из исследовательского центра фирмы «Ксерокс» (Пало-Альто, Калифорния), удалось показать, что присущие Сети особенности малых миров могут быть использованы для создания более эффективных поисковых программ. Она предложила воспользоваться высокой степенью кластеризации веб-страниц, относящихся к связанным тематикам. Топология таких крупных кластеров отличается от топологии случайных графов. «Умная» поисковая машина могла бы воспользоваться этой кластеризацией для ограничения области запросов и тем самым повысить скорость и эффективность поиска. Такое осмысленное поведение представляет собой значительный шаг вперед по сравнению со случайным блужданием программ по лабиринту Сети.