
- •Н.А. Борисов, а.А. Лукин
- •Подготовлено на кафедре прикладной информатики.
- •Введение
- •Тема 1. Локальная вычислительная сеть Windows nt
- •Работа с Сетевым окружением
- •Передвижение в сети
- •Доступ к сети с помощью Проводника
- •Начало работы
- •Тема 2. Программа-браузер ms Internet Explorer
- •Выделение ссылок
- •Сохранение информации, получаемой с Web-страниц
- •Сохранение активной страницы на вашем компьютере
- •Сохранение страницы или изображения, не открывая их для просмотра
- •Копирование информации со страницы в документ
- •Использование изображения из Web-страницы в качестве фонового для рабочего стола
- •Сочетания клавиш, используемые в обозревателе Internet Explorer
- •Адреса некоторых Web-серверов
- •Тема 3. Поиск информации в сети интернет Проблема поиска и средства его организации
- •Каталоги и базы данных
- •Поисковые системы (поисковые машины, поисковые серверы, поисковые роботы)
- •Метапоисковые системы
- •Обзор наиболее популярных поисковых систем
- •Как выбрать поисковую машину
- •1. Охват и глубина
- •2. Скорость обхода и актуальность ссылок
- •3. Качество поиска (субъективный показатель)
- •4. Скорость поиска
- •5. Поисковые возможности (работа с языком документа, язык запросов)
- •6. Дополнительные удобства
- •Тема 4. Правила составления запросов
- •Как поисковые машины трактуют слова в запросе?
- •Как поисковые машины трактуют некоторые специальные символы в запросе?
- •Варианты поиска Тонкий поиск
- •Расширенный поиск
- •Словарный фильтр
- •Сайт/вершина
- •Изображение
- •Попробуйте использовать язык запросов
- •Искать без морфологии
- •Поиск картинок и фотографий
- •Детальное описание языка запросов Как трактуются слова
- •Естественно-языковый поиск
- •Основные операторы
- •Поиск с расстоянием
- •Поиск в зонах
- •Поиск в определенных элементах
- •Ранжирование результата поиска
- •Синтаксис языка запросов (строгий поиск)
- •Поиск в элементах
- •Советы по проведению поиска
- •Тема 5. Работа с почтовой программой Outlook Express
- •Тема 6. Связь и организация работы с помощью программы Microsoft Outlook 97
- •Основные принципы работы с Outlook
- •Литература
- •Содержание
Как выбрать поисковую машину
При поиске в Интернет важны две составляющие - полнота (ничего не потеряно) и точность (не найдено ничего лишнего). Обычно это все называют одним словом - релевантность, то есть соответствие ответа вопросу.
1. Охват и глубина
Под охватомимеется в виду объем базы поисковой машины, который измеряется тремя показателями – общим объемом проиндексированной информации, количеством уникальных серверов и количеством уникальных документов. Подглубинойпонимается – существует ли ограничение на количество страниц или на глубину вложенности директорий на одном сервере.
Как проверить:Некоторые машины пишут на своем сайте статистику робота. Но можно проверить и самому – надо задать несколько поисковых запросов, состоящих из одного слова (чтобы исключить влияние языка запросов, в том числе – различного трактования пробела), и при этом смотреть на статистику результатов, выдаваемую машиной – обычно в начале списка указано, сколько всего было найдено документов. Помимо того, что слова должны быть из разных областей, хорошо еще взять слова разныхвесов– редкие, «средние» и «тяжелые» (частотные), и сравнить количество найденного.Тяжелыеслова, в частности, тестируют полнотекстовость (индексацию всех слов документа) поисковой машины.
Глубину хождения робота проверить сложнее - для этого надо взять какие-то сайты, например, с разветвленной структурой архивов, и проверить, проиндексированы ли документы, на которые можно попасть только, например, за 6 переходов по ссылкам.
2. Скорость обхода и актуальность ссылок
Скорость обхода Сетипоказывает, насколько быстро происходит индексация свежедобавленного ресурса и насколько быстро обновляется информация в базе. Важным показателем качества поисковой машины (ее робота) является не толькозахватновых территорий: но и отслеживание состояния уже охваченных. Сервера исчезают и появляются, страницы на них обновляются. Ссылки, которые выдает поисковая машина в списке найденного, должны, во-первых, существовать, и, во-вторых, их содержание должно соответствовать запросу.
Как проверить:Объективную информацию можно получить, проанализировавлогисерверов – робот поисковой машины представляется обычно именем своей машины (или похожим образом), так что можно увидеть, как часто он бывает на сервере, сколько страниц просматривает и т.д. К сожалению, обычно для изучения бывает доступенлогтолько своего сайта, поэтому остается экспериментальный способ.
Для определения скорости обхода надо создать где-нибудь страничку текста, добавить ее в поисковые машины и посмотреть, как быстро она начнет находиться. Или изменить уже имеющуюся страничку. Для определения актуальности ссылок – проверить документы хотя бы на первой странице списка найденного по нескольким запросам. Сообщение Not Foundсвидетельствует о том, что документ более не существует.
3. Качество поиска (субъективный показатель)
Каждая поисковая машина имеет свои алгоритм сортировки результатов поиска. Чем ближе к началу списка оказывается нужный вам документ, тем лучше работает релевантность.
Как проверить:Только путем эксперимента. Рекомендуется для сравнения делать запросы разной длины. Можно также использовать язык запросов, при этом те, кому неохота читать описание, могут воспользоваться развернутой страницей запроса («расширенный поиск» вАпортеиЯндексе, «детальный запрос» вРэмблере– варианты перевода на русский язык «advanced search»).
Кроме релевантности, существуют важные пользовательские характеристики.