- •Лабораторная работа №3 Службы Интернет: World Wide Web и поисковые системы
- •Теоретическая часть 1. Служба World Wide Web
- •Формат представления документов html
- •Протокол передачи гипертекста
- •Понятие гипертекстовый ссылки
- •Как создать гиперссылку в текстовом документе?
- •Практическая часть 1
- •Теоретическая часть 2. Поисковые службы Общее представление о поисковых службах
- •Информационно-поисковые системы на пространстве www
- •Особенности каталогов
- •Особенности поисковых машин
- •Поисковая машина
- •Поисковая машина
- •Практическая часть 2.
- •Контрольные вопросы.
Особенности поисковых машин
Поисковые машины устроены гораздо сложнее каталогов. В структуре поисковой машины выделяют три составляющих – специальную программу, именуемую поисковым роботом (спайдер, гусеница), базу данных документов, называемую индексом, и интерфейсную часть, предназначенную для взаимодействия с пользователем. Поисковый робот осуществляет просмотр сети с целью выявления новых документов для включения их в базу данных поисковой машины.
В процессе занесения документов в индекс поисковая машина составляет список слов документа, которые являются потенциальными ключевыми словами. И когда вы запрашиваете информацию, машина ищет документы в существующем индексе. Важным моментом является то, что поиск осуществляется не на реальном пространстве документов сети, а в некоторой модели, содержание которой может значительно отличаться от действительного содержания Интернет в момент проведения поиска.
Поисковая машина
Среди наиболее известных поисковых систем выделяют поисковую машину Yandex <Яндекс>. Ее адрес в Интернет http://www.yandex.ru
Яндекс относится к гибридным системам – одновременно присутствуют элементы, как каталога, так и поисковой машины.
Основные разделы каталога располагаются в центре страницы. Ниже расположены ссылки на основные службы сайта.
Рис.2 Поисковая система Яндекс
Охарактеризуем некоторые службы Яндекса.
Здесь вы можете зарегистрироваться и получить адрес электронной почты имя@yandex.ru
Здесь собран перечень различных словарей, энциклопедий и можно осуществлять поиск одновременно по имеющимся источникам.
Данная служба дает возможность искать информацию по ведущим информационным агентствам. Здесь же можно заказать доставку новостей по электронной почте.
В верхней части страницы расположена Панель поиска.
Рис.3 Поиск информации с помощью Яндекса
Для примера ввели запрос «Цицерон». Через несколько секунд получили результат поиска. Обратите внимание на строку заголовка – в скобках указывается количество найденных страниц. Если много документов – поставьте флажок «искать в найденном» на Панели поиска.
Ссылка похожие документы дает нам возможность найти большее количество необходимых документов.
Допустим, Ваш запрос состоит из двух ключевых слов. Целесообразно между ними ставить знак «+», чтобы сузить круг поиска с целью уменьшения количества выданных документов. И наоборот знак «-» ставится с целью исключения тех документов, которые содержат ненужные понятия. Приведем примеры организации запросов в Яндексе:
Законы России находит документы, содержащие одновременно `законы` и `России`, а также по отдельности.
Законы and Россия находит документы, содержащие и `законы` и `Россия`
Закон ~России находит документы, содержащие `законы`, но не содержащие `Россия`.
Поисковая машина
В 1996г. был запущен в эксплуатацию поисковый механизм Рамблер (http://www.rambler.ru).
В данной системе работает рейтинговая система Рамблер Top 100, которая считается одним из лучших классификаторов Российского Интернет (Рунет). Она располагается в центре главной страницы Рамблера, разделы которой могут быть отсортированы по алфавиту или по категориям.
Организация поиска в Рамблере такая же как в Яндексе. Степень значимости ключевых слов также определяется знаками «+» и «-». По умолчанию найденные документы сортируются по релевантности, то есть соответствующие запросу. Однако можно попросить отсортировать документы по дате.
Рис.4 Поисковая система Rambler
Выше поисковой панели располагаются различные службы Рамблера, слева внизу – рубрики каталога.
Эффективность поиска в сети в значительной мере зависит от опыта и кругозора пользователя. Когда вы ищете материалы по определенной тематике, ни в коем случае не следует полагаться на «интеллект» машины: вы сами должны учитывать особенности лексики данной темы, возможное сочетание терминов и т.п.