Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТЕМА 7_ИПС.doc
Скачиваний:
4
Добавлен:
17.04.2019
Размер:
148.48 Кб
Скачать

3.3. Инструментарий поисковых систем сетевой службы www

3.1. Инструментарий формирования запросов в ипс

Самой популярной поисковой системой считается AltaVista. Она имеет одну из самых крупных индексных баз и всемирную зону охвата. Сервер расположен в США. Данная система обрабатывает и русские серверы. Индексирование выполняется по всему тексту документа. AltaVista поддерживает полный булев поиск, поиск по фразам. Результаты ранжируются по релевантности. Приоритет отдается:

  • документам, содержащим искомые термины в числе первых нескольких слов;

  • документам, где термины находятся близко друг от друга;

  • документам, содержащим несколько вхождений терминов.

Результаты выборки включают в себя заголовок, аннотацию документа, его размер и дату последней модификации.

Самым известным представителем глобальных каталогов является система Yahoo.

Если англоязычные документы лучше искать применяя глобальные поисковые системы, то при поиске русскоязычных документов целесообразнее пользоваться поисковыми системами, которые индексируют только русскоязычную часть Интернет. Подобные поисковые серверы называются локальными.

Основными полнотекстовыми поисковыми системами, представленными в русскоязычном секторе Интернет считаются Яndex, Rambler, Апорт, TELA-ПОИСК. Системы проводят автоматическое сканирование документов только с доменов ru, su и других доменов, принадлежащих странам ближнего зарубежья России.

При формировании запроса в ИПС могут использоваться следующие инструменты (рис. 2):

1. Отдельные ключевые словаэтот вид запроса целесообразно использовать только для узко специальных терминов. В противном случае количество найденных документов может достигать нескольких десятков тысяч, т. е. такой поиск становится бессмысленным.

2. Логические операторы (булев поиск).

3. Средства контекстного поиска:

  • указание расстояния между словами;

  • указания порядка следования слов;

К инструментам формирования запросов в ИПС относятся:

1. Отдельные ключевые слова

2. Логические операторы (булев поиск)

3. Средства контекстного поиска

  • указание расстояния между словами;

  • указания порядка следования слов;

  • поиск по полям документа HTML (слово в названии, заголовке и т. п.).

4. Запрос по образцу (QBE)

5. Поиск фразы

6. Поиск с использованием всех словоформ слова

7. Определение области поиска

8. Запрос на естественном языке

Рис. 2. Инструментарий формирования запросов в ИПС

  • поиск по полям документа HTML (слово в названии, заголовке и т. п.).

4. Запрос по образцу (QBE) (найти такой же, найти подобный) позволяет выделять в наборе выданных документов особо полезный документ и автоматически формировать запрос на основе ключевых слов этого документа. Этот тип запросов позволяет сформулировать более точный запрос с использованием новых ключевых слов.

5. Поиск фразыпоиск документов, содержащих конкретное

словосочетание или фразу.

6. Поиск с использованием всех словоформ словапоиск с элементами морфологического анализа. Это средство особенно важно при поиске в русскоязычных текстах.