Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебник 4 фарм.doc
Скачиваний:
8
Добавлен:
23.11.2019
Размер:
2.58 Mб
Скачать
  1. Поисковые машины.

Поисковая система это - сайт, что предоставляет возможность поиска информации в Интернете. Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в Интернет - магазинах, а также информацию в группах новостей Usernet. В последнее время появился новый тип поисковых движков, основанных на технологии RSS, а также среди XML-данных разного типа.

Комплекс программ, обеспечивающий функциональность поисковой системы, называют поисковый движок или поисковая машина. Основными критериями качества работы поисковой машины являются релевантность, полнота базы, учёт морфологии языка. Индексация информации осуществляется специальными поисковыми роботами. Основные проблемы в работе поисковых систем описаны в статье “Глубокая паутина” в Википедии. Улучшение работы поисковых систем — это одна из приоритетных задач сегодняшнего Интернета.

Лидер поисковых машин Интернета, Google занимает более 60 % мирового рынка, а значит, шесть из десяти находящихся в сети людей обращаются к его странице в поисках информации в Интернете. Сейчас регистрирует ежедневно около 50 млн. поисковых запросов и индексирует более 8 миллиардов web - страниц. Google может находить информацию на 117 языках (на 28 апреля 2008). Интерфейс Google содержит довольно сложный язык запросов, позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и т. д.

Перечислим общие элементы и особенности языка запросов поисковых систем:

Большинство_используют: + или - (включить или исключить термин из поискового предписания); «кавычки» (для обозначения фразы, устойчивого словосочетания).

Некоторые вместо знаков + или – используют союзы AND, AND NOT.

Большинство позволяют использовать символы усечения слова слева * (например: wish* - будут найдены: wish, wishes, wishful, wishbone, and wishy-washy)

Некоторые поисковые системы чувствительны к заглавным и строчным буквам (например, если вы ищете материалы о людях с фамилией Stone с помощью AltaVista, следует обязательно использовать заглавную букву, поскольку в противном случае будут найдены все сайты, где встречается слово stone - камень).

Таблица 1 - Логические операторы поисковых систем.

Элемент

Что он означает

Пример запроса

пробел или & +

логическое “И” (в пределах предложения)

семейное право

&&

логическое “И” (в пределах документа)

рецепты && (плавленый сыр)

|

логическое ИЛИ

фото | фотография | снимок | фотоизображение

( )

группирование слов

(технология | изготовление) (масла | творога)

~ или -

союз “И НЕ “ (в пределах предложения)

дума ~ закон

~~

союз “И НЕ “ (в пределах документа)

путеводитель по Парижу ~~ (агентство | тур)

«»

поиск фразы

«антология поэзии»

! перед словом

точная форма слова

!настоящий! момента - Настоящий закон вступает в силу спустя две недели с момента его опубликования.

$title («»)

Выражение присутствует в поле «Заголовок» (Title) HTML-документа.

$title («флора и фауна»)

- страницы с названиями схожими с «Флора и фауна Сибири»

  1. Для того, чтобы правильно построить стратегию поиска нужно, прежде всего, решить для себя какого рода информацию вы хотите получить – некую общую, описывающую объект или явление в целом, или же какие-то детали, частности, которые могут встретиться в полном тексте какого-то документа. В первом случае – целесообразно использовать директорию, во втором – поисковую систему.

  2. Если же, начиная поиск, вы еще не представляете точно, что и как много вы хотите получить в результатах запроса рекомендуется использовать разные поисковые инструменты в комплексе.

  3. Также, можно воспользоваться средствами формирования запроса, предлагаемыми сайтом. Их можно выхвать, щелкнув на строке «Расширенный поиск»:

Откроется окно, как показано на рисунке ниже. Для уточнения параметров поиска, необходимо ответить на предлагаемые вопросы – выбрать соответствующие ответы из раскрывающихся списков.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]