Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИСЭ-пособие.doc
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
1.99 Mб
Скачать

3. Средства контекстного поиска:

  • указание расстояния между словами;

  • указания порядка следования слов;

  • поиск по полям документа HTML (слово в названии, заголовке и т. п.).

4. Запрос по образцу (найти такой же, найти подобный) позволяет выделять в наборе выданных документов особо полезный документ и автоматически формировать запрос на основе ключевых слов этого документа. Этот тип запросов позволяет сформулировать более точный запрос с использованием новых ключевых слов.

5. Поиск фразы поиск документов, содержащих конкретное словосочетание или фразу.

6. Поиск с использованием всех словоформ слова поиск с элементами морфологического анализа. Это средство особенно важно при поиске в русскоязычных текстах.

7. Определение области поиска (наименование сервиса), домена (серверы с определенным расширением имени, su, ru) и т. п.

8. Запрос на естественном языке. Запрос на русском языке можно делать в Яndex, Google и других поисковых системах. При внешней привлекательности данный вид запроса не очень эффективен — поиск будет не совсем точным и полным т. к. запрос автоматически индексируется и система сама выделяет из него ключевые слова,

При расчете критерия выдачи в поисковых системах учитываются:

  • частота слова в документе;

  • его местоположение (в заголовке, подзаголовке, HTML-дескрипторах).

Документы сортируются в порядке убывания релевантности, информация о них выдается в виде:

  • URL-адреса;

  • названия;

  • нескольких первых строк или краткого описания (резюме, автоматическая аннотация или реферат).

В конкретных поисковых системах может быть предложен различный набор этих инструментов.

При использовании средств мета-поиска запрос осуществляется одновременно несколькими поисковыми системами, результат поиска объединяется в общий, упорядоченный по степени релевантности список. Каждая система обрабатывает только часть узлов сети, это позволяет значительно расширить базу поиска. К подобному классу можно также отнести «персональные программы поиска», которые позволяют формировать свои собственные инструменты мета-поиска (например, автоматически опрашивать часто посещаемые узлы).

Примерами систем данного вида могут служить: IBM InfoMarket, которая выполняет поиск в Yahoo, OpenText, Magellan, различных коммерческих ресурсах и группах новостей одновременно, генерируя ранжированные результаты обработки запроса; MetaCrawler, которая посылает запросы восьми различным серверам поиска:

OpenText, Lycos, WebCrawler, InfoSeek, Excite, AltaVista, Yahoo и Galaxy, поддерживает булевы операции и поиск фраз.

Известно, что для количественной оценки эффективности ИПС используется формальное измерение точности и полноты поиска, полученное на основе экспериментов в контролируемых условиях. Это требует наличия экспериментальной системы с фиксированным числом документов, стандартного набора запросов и множества документов, релевантных и нерелевантных каждому обрабатываемому в эксперименте запросу. Создание подобных условий в контексте Web крайне затруднено. Как уже говорилось, различные серверы поиска работают с разными индексами, различающимися полнотой охвата документов Web.

Таким образом, достаточно сложно осуществить объективное сравнение эффективности поиска различных поисковых систем.