Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лаб. работа №2 Служба WWW_Поисковые системы.DOC
Скачиваний:
8
Добавлен:
10.12.2018
Размер:
3.58 Mб
Скачать

Особенности поисковых машин

Поисковые машины устроены гораздо сложнее каталогов. В структуре поисковой машины выделяют три составляющих – специальную программу, именуемую поисковым роботом (спайдер, гусеница), базу данных документов, называемую индексом, и интерфейсную часть, предназначенную для взаимодействия с пользователем. Поисковый робот осуществляет просмотр сети с целью выявления новых документов для включения их в базу данных поисковой машины.

В процессе занесения документов в индекс поисковая машина составляет список слов документа, которые являются потенциальными ключевыми словами. И когда вы запрашиваете информацию, машина ищет документы в существующем индексе. Важным моментом является то, что поиск осуществляется не на реальном пространстве документов сети, а в некоторой модели, содержание которой может значительно отличаться от действительного содержания Интернет в момент проведения поиска.

Поисковая машина

Среди наиболее известных поисковых систем выделяют поисковую машину Yandex <Яндекс>. Ее адрес в Интернет http://www.yandex.ru

Яндекс относится к гибридным системам – одновременно присутствуют элементы, как каталога, так и поисковой машины.

Основные разделы каталога располагаются в центре страницы. Ниже расположены ссылки на основные службы сайта.

Рис.2 Поисковая система Яндекс

Охарактеризуем некоторые службы Яндекса.

Здесь вы можете зарегистрироваться и получить адрес электронной почты имя@yandex.ru

Здесь собран перечень различных словарей, энциклопедий и можно осуществлять поиск одновременно по имеющимся источникам.

Данная служба дает возможность искать информацию по ведущим информационным агентствам. Здесь же можно заказать доставку новостей по электронной почте.

В верхней части страницы расположена Панель поиска.

Рис.3 Поиск информации с помощью Яндекса

Для примера ввели запрос «Цицерон». Через несколько секунд получили результат поиска. Обратите внимание на строку заголовка – в скобках указывается количество найденных страниц. Если много документов – поставьте флажок «искать в найденном» на Панели поиска.

Ссылка похожие документы дает нам возможность найти большее количество необходимых документов.

Допустим, Ваш запрос состоит из двух ключевых слов. Целесообразно между ними ставить знак «+», чтобы сузить круг поиска с целью уменьшения количества выданных документов. И наоборот знак «-» ставится с целью исключения тех документов, которые содержат ненужные понятия. Приведем примеры организации запросов в Яндексе:

Законы России находит документы, содержащие одновременно `законы` и `России`, а также по отдельности.

Законы and Россия находит документы, содержащие и `законы` и `Россия`

Закон ~России находит документы, содержащие `законы`, но не содержащие `Россия`.

Поисковая машина

В 1996г. был запущен в эксплуатацию поисковый механизм Рамблер (http://www.rambler.ru).

В данной системе работает рейтинговая система Рамблер Top 100, которая считается одним из лучших классификаторов Российского Интернет (Рунет). Она располагается в центре главной страницы Рамблера, разделы которой могут быть отсортированы по алфавиту или по категориям.

Организация поиска в Рамблере такая же как в Яндексе. Степень значимости ключевых слов также определяется знаками «+» и «-». По умолчанию найденные документы сортируются по релевантности, то есть соответствующие запросу. Однако можно попросить отсортировать документы по дате.

Рис.4 Поисковая система Rambler

Выше поисковой панели располагаются различные службы Рамблера, слева внизу – рубрики каталога.

Эффективность поиска в сети в значительной мере зависит от опыта и кругозора пользователя. Когда вы ищете материалы по определенной тематике, ни в коем случае не следует полагаться на «интеллект» машины: вы сами должны учитывать особенности лексики данной темы, возможное сочетание терминов и т.п.