Читать «Альтернатива: мы или конкуренты» онлайн - страница 46
Алексей Колик
– в-третьих, извлекать и скачивать с сайта любые тексты, в том числе содержащие заданные слова, сущности или предложения. Иными словами, для каждой группы сайтов могут быть заданы определенные онтологии (сущности) и скачаны будут с сайтов только те тексты, которые содержат указанные онтологии. При этом существует опция, которая позволяет скачивать тексты, появившиеся только после определенной даты.
– в-четвертых, позволяет извлекать с интернет-ресурсов изобразительный материал, и что более важно для конкурентной разведки фотоизображения, с автоматическим извлечением из них метаданных;
– в-пятых, и возможно это самая любопытная функция программы, она тщательно обследует весь сайт, включая страницы, не связанные ссылками с другими страницами ресурса, или страницы, фактически находящиеся в своего рода «сером», или даже невидимом интернете.
Метапоисковые машины
Метапоисковая машина не имеет собственных пауков и собственной базы данных. Она в неизменном виде размещает запрос в тех поисковых машинах, которые отметил пользователь, а затем дожидается ответа от них и выдает результат со всех машин на одной странице. Для удобства пользователя эти результаты содержат пометку о том, с какой поисковой машины был получен тот или иной ответ.
Метапоисковая машина:
– посылает запрос на огромное количество разных поисковых систем и поисковых серверов, с последующим определением наиболее вероятных источников информации на одной странице;
– тестирует Сеть на предмет наличия информации, релевантной запросу;
– не обладая собственной индексной базой данных, метапоисковая система выступает в качестве шлюза, который передает через свой интерфейс запросы на автономные ИПС и возвращает результаты поиска;
– обрабатывает полученные результаты, удаляет повторяющиеся адреса ресурсов и представляет более широкий спектр того, что представлено в сети Интернет в виде обобщенного результата;
– метасистема допускает передачу запросов не только на автоматические индексы, но и в те каталоги, которые сопровождаются локальной поисковой машиной;
– позволяет оценить результативность применения отдельных ИПС для решения конкретной поисковой задачи.
Примеры некоторых метапоисковых машин:
– Copernic (http://www.copernic.com).
Сторожевые роботы
Ни специалисту конкурентной разведки, ни сотруднику отдела маркетинга или сбыта недостаточно просто знать, на какой страничке Интернета содержится нужная информация. Надо иметь возможность своевременно и точно отслеживать изменения на этой страничке. Каждый может себе представить, насколько сложна, а чаще всего и вовсе неосуществима эта задача. Вряд ли даже самый внимательный и скрупулезный человек в состоянии быстро и точно оценить изменения в тексте – скажем, в прайс-листе, – занимающем пять страниц. Для решения подобной проблемы несколькими компаниями разработано специальное программное обеспечение – так называемые «сторожевые роботы»: ознакомившись со страницей, они сохраняют ее образ в своей базе данных, а при повторном посещении сравнивают актуальное состояние ресурса с этим образом. Программа отмечает изменившиеся места, которые становятся похожи на выделенные маркером фрагменты текста на бумажном носителе. Более того, удаление кусков материала также фиксируется многими программами данной категории – как правило, внизу страницы, дабы не мешать восприятию человеком информации. «Сторожевые роботы» могут запускаться пользователем вручную, а могут и работать автоматически, по расписанию.