Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
28
Добавлен:
27.03.2015
Размер:
89.6 Кб
Скачать
  1. Сайты для взрослых - сравнивается способность поисковиков фильтровать ссылки на порносайты по запросам, не относящимся к порнотематике.

Данный анализатор собирает результаты поиска по запросам, которые могут использоваться для поиска эротического или даже порнографического контента, но могут быть заданы и пользователями, которые ищут «обычную» информацию или товары, – в том числе и детьми.

Качество поиска, осуществляемого поисковыми системами, можно определить как процент новых пользователей, удовлетворенных результатами поисковой машины и выбравшие ее для себя в качестве поисковика по умолчанию. Например, пришли 1000 новых пользователей, через год остались 400, остальные ушли к конкурентам, качество поисковика - 0,4 (40%).

Другое определение характеризует качество поиска как процент ответов, оцененных экспертами как идеальные ("валидные", "релевантные", "удовлетворительные") по отношению к общему количеству ответов поисковой системы за единицу времени. Например, в течение недели (дня, часа, 10 секунд и т.п.) поисковик выдал 10000 ответов, асессоры оценили все, хорошими признаны 3500, качество поисковика - 0,35 (35%).

В России наиболее крупными и популярными поисковыми указателями являются:

  • «Яndex» (www.yandex.ru)

  • «Pамблер» (www.rambler.ru)

  • «Google» (www.google.ru)

  • «Апорт2000» (www.aport.ru)

Для оптимальной и быстрой работы с поисковыми системами существуют определенные правила написания запросов. Подробный перечень для конкретного поискового сервера можно, как правило, найти на самом сервере по ссылкам Помощь, Подсказка, Правила составления запроса и т.п.

Задавая образ поиска в поисковой системе, следует иметь в виду, что алгоритмы поиска информации в сети, подобно поиску информации в базе данных, основаны на логике.

1. Несколько ключевых слов, разделенных пробелом, соответствуют операции логического сложения: ИЛИ (OR). Например, указав ключ: <Социальная коммуникация>, мы получим список всех документов, в которых встречается слово «Социальная» или слово «коммуникация».

2. Несколько слов, заключенных в кавычки, воспринимаются как единое целое. Например, «Социальная коммуникация».

3. Знак + между словами равносилен операции логического умножения: И (AND). Указав в запросе ключ < Социальная + коммуникация>, получим все документы, в которых имеются эти два слова одновременно, но они могут быть расположены в любом порядке и вразброс.

4. Знак *, или подстановочный знак, - это малоизвестная функция, которая может быть очень действенной. Если в запросе указать звездочку (*), то она будет означать любое неизвестное поисковое слово, что позволяет найти самые лучшие соответствия. Например, запрос <Google *> выдаст результаты о многих продуктах Google. Запрос < Дума проголосовала * по * законопроекту > выдаст результаты о разных голосованиях по различным законопроектам. Обратите внимание, что оператор * работает только с целыми словами, а не частями слов.

Некоторые слова и символы по умолчанию исключаются из запроса в связи с их малой информативностью. Это так называемые стоп - слова - самые частотные слова русского и английского языков, например, предлоги, частицы и артикли. Очень часто опускаются апострофы и тире. Большинство поисковых машин их знают и сами освобождают от них сформулированный пользователем запрос. Это связано с тем, что факт присутствия этих слов может заметно замедлить поиск и отрицательно повлиять на его результат и полноту. В то же время есть возможность обозначить необходимость этих слов в запросе. Для этого следует взять запрос в двойные кавычки или воспользоваться поиском точной фразы в расширенном поиске.

Если запрос составлен из нескольких слов без применения операторов и конструкций языка запросов, то машина будет пытаться найти документы, в которых встречаются все слова запроса. При этом для каждого запроса всегда вводится так называемое ограничение контекста - положительное число. По умолчанию принимается расстояние равное 40 словам.

Задание

Проанализировать работу поисковых систем Google, Яндекс, Апорт, Рамблер на предмет качества осуществляемого ими поиска и освоить основные приемы поиска информации в сети Интернет.

Порядок выполнения

  1. Протестировать поисковые системы Google, Яндекс, Апорт, Рамблер.

  2. Заполнить таблицу «Сравнение поисковых систем» (см. таблица 3).

  3. Сделать вывод о качестве поиска, осуществляемого каждой из рассмотренных поисковых систем.

  4. Осуществить поиск средствами вышеперечисленных поисковых систем и заполнить таблицу «Результаты поиска» (см. таблица 4).

  5. Дополнить таблицу 4 самостоятельно построенными запросами.

  6. Познакомиться с избранными документами и оценить их релевантность (смысловое соответствие результатов поиска указанному запросу).

  7. Сравнить результаты поиска (только первые блоки) всех серверов и прокомментировать их.

  8. Подготовить отчет о выполнении лабораторной работы, приложив к нему заполненные таблицы 3 (с проставленным рейтингом проанализированных систем (от 1 до 4)) и 4.