Читать «Критическая масса, как одни явления порождают другие» онлайн - страница 328

Филипп Болл

Проблема точного определения структур Интернета и Паутины остается открытой. Можно ли описать эти структуры случайными графами?

Будут ли они похожи на рассмотренные в предыдущей главе сети малых миров? Или их можно уподобить ветвящимся иерархическим деревьям, напоминающим строение наших легких? Или они представляют собой нечто другое?

МАСШТАБ НЕ ИМЕЕТ СМЫСЛА

Создание карты всемирной Паутины напоминает построение схемы лабиринта. Такую карту легко нарисовать, разглядывая строение лабиринта откуда-то сверху, например из гондолы воздушного шара, однако Паутина существует не в физическом, а в абстрактном киберпространстве, так что рассмотреть ее с высоты птичьего полета не удастся, мы должны войти в нее и ощупью продвигаться вперед, отмечая по дороге все тупики и разветвления.

Затея странная, но что нам остается еще делать? Мы создали Сеть, но не можем точно сказать, что же мы, собственно, создали. Самый простой метод изучения лабиринта состоит в его постепенном и методическом исследовании методом «ощупывания», и именно такую попытку в 1999 году предприняла группа ученых из университета Нотр-Дам штата Индиана (Река Альберт, Хавонг Джинг и Альберт-Ласло Барабаши). Для решения этой формально картографической задачи они просто запустили в лабиринт «робота», поручив ему составить схему всех замкнутых маршрутов по Паутине. Разумеется, робот тоже был виртуальным, т. е. представлял собой компьютерную программу, которая позволяла входить на все сайты и проверять все гиперссылки. На каждом сайте робот получал набор новых сайтов и продолжал свою работу, переходя все к большему числу сайтов. После каждого такого «налета» на сайт робот информировал своих создателей о числе обнаруженных гиперссылок по каждой из веб-страниц134.

Понятно, что анализ фантастического количества документов в Паутине не под силу роботу с самой совершенной программой, поэтому исследователи поручили ему изучить только связи домена, относящегося непосредственно к университету Нотр-Дам (www.nd.edu). При этом было выявлено 325 729 документов HTML (HTML — стандартный гипертекстовый язык написания документов, придуманный Тимом Бернерсом-Ли), связанных посредством примерно 1,5 миллиона связей-ссылок. Разработчики программы попытались на основе этой довольно обширной и репрезентативной базы данных определить некоторые характеристики сети в целом.

Прежде всего Альберт и ее коллеги оценили распределение вероятностей входящих и исходящих ссылок и показали, что оно описывается степенным

Рис. 16.2. Распределение вероятностей входящих гиперссылок для HTML-документов в Паутине подчиняется степенному закону, которому соответствует прямая линия в логарифмических координатах. Аналогичное распределение зафиксировано и для исходящих ссылок. Это указывает на то, что Паутина представляет собой безмасштабную сеть.