Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛАБ.РАБ.№1.doc
Скачиваний:
2
Добавлен:
01.05.2025
Размер:
992.26 Кб
Скачать

Язык запросов

При выполнении расширенного поиска поисковые машины используют язык запросов, предусматривающий применение специальных символов и операторов, включая операторы логических отношений.

Синтаксис языка запросов русскоязычных поисковых машин приведен в приложении А, а некоторых зарубежных в приложении Б.

Логический оператор И

Для поиска документов, в которых встречаются одновременно оба слова используется логический оператор И или AND (или &).

Например, чтобы найти документы, в которых одновременно встречаются слова цена и монитор в русскоязычных поисковых системах можно в запросе разделить слова пробелом

цена монитор

или использовать знак &

цена & монитор

В Яндексе по этим запросам будут найдены документы, в которых есть и слово цена и слово монитор, причем эти слова должны быть в одном предложении, а по запросу цена && монитор– эти слова должны быть в одном документе.

Примечание. Пробел, введенный в запросе между ключевыми словами, в различных поисковых системах может трактоваться по-разному, чаще всего как логическое И (в Яндексе – в пределах предложения). Исключением является Alta Vista – в этой системе пробел трактуется как логическое ИЛИ.

Логический оператор ИЛИ

Запрос слово1 OR слово2 позволяет искать документы, содержащие хотя бы одно из этих слов, либо оба слова вместе. Часто используется для поиска слов-синонимов.

Например, запрос вида

фото|фотография|фотоснимок|фотоизображение

практически во всех поисковых системах задает поиск документов, содержащих любое из перечисленных слов или все слова одновременно.

Логический оператор НЕ (И НЕ)

Запрос слово1 AND NOT слово2 задает поиск документов, содержащих слово1, но не содержащих слово2. Например, в Апорте и Рамблере по запросу

фрукты NOT яблоки

будут найдены документы, содержащие слово фрукты, но не содержащие слово яблоки. В Яндексе по запросу

банки ~ закон

будут найдены все документы, содержащие слово банки, рядом с которым в пределах предложения нет слова закон.

Грамматические формы и поиск цитат

Русскоязычные поисковые системы, как правило, ищут слова во всех грамматических формах (по правилам русского языка). Порядок, в котором были введены слова, в этом случае значения не имеет. Например, по запросу шел человек, среди прочих будут найдены документы, содержащие слова люди идут.

Можно дать указание поисковые системы не перебирать все словоформы, а осуществить точный поиск («точная форма» обычно требуется для поиска цитат). Для этого в Яндксе используется !, который ставится перед словом, а в Рамблере это слово (фраза) заключается в кавычки.

Использование шаблонов

При составлении запросов поисковые системы позволяют использовать шаблоны: * - для обозначения любой последовательности символов в Апорте, Рамблере, системах AltaVista и Northern Light, ? – для обозначения одного произвольного символа в Рамблере, % - для обозначения одного произвольного символа в системе AltaVista. Например, в Рамблере запрос

слово*

осуществляет поиск документов, в которых встречаются слова, начинающиеся с последовательности символов слово (слово, словом, словосочетание и т д.), а запрос

сл?в?

– поиск документов, в которых встречаются слова, первые два символа которых сл, предпоследний в, третий и последний – любые символы (слово, слова, слове, слева, слива и т. д.).

Группирование слов

Практически во всех поисковых системах (за исключением Google) слова могут быть сгруппированы с помощью круглых скобок. Скобки задают порядок действия логических операторов. Допускается многократная вложенность скобок. Например, по запросу

(дитанционное OR дистантное) AND образование

будут выданы документы, где встречаются одновременно слова дитанционное и образование либо дистантное и образование. По запросу дитанционное OR дистантное AND образование были бы выданы документы, содержащие либо слово дитанционное, либо одновременно дистантное и образование (оператор AND действует первым).

Использование знаков «+» и «-»

Многие системы имеют поддержку знаков + и (за исключением Рамблера). Если требуется, чтобы указанное в запросе слово, обязательно присутствовало в найденном документе, следует поставить перед ним знак + (между знаком + и послед словом не должно быть пробела). Например, по запросу высшее+образование будут найдены документы, где упоминается только высшее образование, а по запросу высшее образование – документы в которых встречаются и высшее образование и среднее образование и т. д.

Если необходимо исключить какое-либо слово из результата поиска, перед ним ставится знак (минус, который нужно писать слитно с последующим словом). Например, запрос

объявления продажа авиационной техники –вертолеты

покажет ссылки на документы с разнообразными объявлениями о продаже авиационной техники за исключением вертолетов.

Поиск фраз

Для поиска документов, содержащих фразы со строгим порядком слов (устойчивые словосочетания), практически во всех поисковых системах используются кавычки. Так по запросу

«рыночная экономика»

будут найдены документы с фразой в следующих формах: рыночной экономикой, рыночную экономику, рыночной экономике и т. д.

Поиск слов по близости

Некоторые поисковые системы умеют искать слова, находящиеся на заданном расстоянии друг от друга.

В Яндексе операторы ограничения расстояния имеют вид : /( n m ) где n – минимальное, а m – максимальное допустимое расстояние в словах, и &&/(n m) - где n – минимальное, а m – максимальное допустимое расстояние в предложениях (расстояние между соседними словами равно 1, расстояние между соседними словами стоящими в обратном порядке равно –1).

Так в Яндексе запрос

высшее/(-2 3) образование

указывает, что слово высшее должно находиться от слова образование в интервале от 2 слов слева до 3 слов справа.

Запись /n эквивалентна записи /(-n +n) и означает, что расстояние между словами не должно превышать n слов. Например, запрос

поставщики /2 ПК

позволяет найти документы, которые содержат и слово поставщики и слово ПК, причем эти слова должны находиться в одном предложении и расстояние между ними должно быть не более двух слов.

Если порядок слов и расстояние между словами известны точно, можно воспользоваться записью /+n, которая задает поиск слов стоящих друг за другом. Например, запрос

высшее /+1 образование

означает, что слово образование должно следовать непосредственно за словом высшее.

Задание веса слова

В Яндексе пользователь может задать вес слова (или выражения), увеличив, таким образом, релевантность документа, содержащего это слово или выражения. Например, в Яндексе по запросу

электронная коммерция:5

будут найдены те же документы, что и по запросу электронная коммерция. Разница состоит в том, что в первом случае вверху результирующего списка окажутся документы где чаще встречается именно слово коммерция.

Поиск в элементах документа

Дополнительной возможностью многих поисковые системы является поиск в определенных зонах документов – в заголовке, тексте, ключевых словах, описании документа, тексте ссылок, подписях к изображениям.

Например, в Яндексе запрос $title(ПК) ищет в заголовках документов слово ПК. Тот же самый запрос в Апорте выглядит след образом title=(ПК). В Яндексе запрос $anchor(ЦОК|ИСК) ищет документы, имеющие в тексте ссылок одно из слов ЦОК или ИСК. В Апорте тот же самый запрос записывается следующим образом anchor =( ЦОК|ИСК).

Кроме того, можно ограничить поиск информации списком серверов (сайтов) или, наоборот, исключить заведомо ненужные серверы (сайты) из поиска. Например, по запросу url = www.timacad.ru & TACIS & проект Апорт выдаст документы, расположенные на сервере www.timacad.ru и содержащие слова: ТАCIS и проект.

По запросу МГУ~~#url=«www.msu.ru*» Яндекс будет искать упоминания МГУ везде, кроме ее собственного сервера (www.msu.ru).

Можно также искать документы, содержащие ссылки на определенные URL. Если нужно работать не с конкретным URL, а со всеми, начинающимися с данной последовательности символов, используют *. Так, по запросу #link=«www.timacad.ru*» Яндекс покажет все документы, которые ссылаются на данный сервер.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]