Читать «Знание-сила, 2008 № 05 (971)» онлайн - страница 3
Журнал «Знание-сила»
Чтобы машина хотя бы имитировала мышление, Бернерс-Ли предложил снабдить всю информацию в Сети особыми метками — так называемыми «tags», «этикетками», универсальными идентификаторами, с помощью которых можно отсылать к категориям, соответствующим тому или иному слову. Элементарный пример: в одном случае слово «лук» должно нести метку о том, что речь идет об оружии, в другом — о растении. Слово «Столыпин» будет отсылать к термину «политик», а «Топтыгин» — это, допустим, «животное».
По мере того, как слова сетевых текстов будут обрастать подобными «этикетками», компьютер научится давать изощренные ссылки, подверстывая к той или иной дате, например, сведения о погоде в тот день, если рядом с датой указан географический пункт, и добавляя фотографии, которые соответствуют словам «солнечная погода», «дождь» или «снег». Машине не составит труда собрать исчерпывающее досье на тему «Шорские поэты ХХ века», выискивая все упоминания о В.Кадышеве, А.Бельчегешеве или С.Торбокове. Да мало ли что она сумеет теперь!
Разумеется, составление подобных ссылок очень трудоемко, поэтому 99% сайтов не охвачено пока семантическим Интернетом. Так, в Германии в октябре 2007 года Министерство экономики приступило к проекту «Тесей», рассчитанному на пять лет и предусматривающему семантическую модернизацию немецкоязычного Интернета. Бюджет проекта — 180 миллионов евро.
В берлинском Свободном университете разрабатывают еще одну версию семантического Интернета — «K-Space». Здесь пытаются научить компьютеры понимать сообщения, передаваемые, например, по радио. Для этого машина должна уметь разлагать звуковую информацию на музыку, речь и шумы, а затем преобразовывать речевые сообщения в печатный текст, снабжая слова пометкой, кем это было сказано. Со временем можно научить поисковые машины анализировать телевизионную информацию.
Ученые Остинского университета вместе с сотрудниками созданной ими компании работают над еще более честолюбивым проектом. Вот уже четверть века они переводят на язык компьютера всю информацию о повседневной жизни человека. В архивах, создаваемых ими, найдется место любой банальности. «Стол — предмет быта», «все живые существа когда-нибудь рождаются», «крановщик — это человек», «люди — это живые существа» и так далее. Кроме того, они ввели уже свыше 15 тысяч правил, позволяющих делать различные умозаключения на основе известных высказываний. Например, при одном упоминании «крановщик Ivanoff» машина, используя банк данных, должна догадаться, что «крановщик Ivanoff когда-то родился», поскольку он — тоже человек. Для нас, современников этого имярека, подобный вывод — само собой разумеющийся, а для обычного компьютера — пока нечто недостижимое. Когда эта машина будет располагать достаточно большим запасом знаний, она — такова идея исследователей — сама начнет черпать информацию из Интернета — подобно тому, как человек, овладевший иностранным языком, пополняет багаж знаний из чтения книг, газет и журналов на языке, который был ему прежде не знаком.