Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lecture5_2012.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
196.1 Кб
Скачать

Глубоководная рыба тактостома

Чтобы Alta Vista срабатывала на группе слов, только когда они стоят рядом, нужно заключить эту группу в кавычки:

"Глубоководная рыба" тактостома

Можно исключить из результатов все документы, в которых есть слово "грамматостопия", приписав его со знаком "минус":

"Глубоководная рыба" тактостома -грамматостопия

Если нужно найти все вхождения слова, даже когда оно входит в состав других слов, пользуйтесь символом *. Например, рыба* даст вам все тексты, в которых есть "рыба", "рыбак", "рыбалка" и т. д.

Результаты поиска

Результаты поиска Alta Vista, как и Yahoo, выдает в виде списка ссылок на документы, но вместо описания каждого документа рядом с его заголовком вы увидите просто первые несколько строк его текста.

Alta Vista сортирует результаты так, чтобы на первом месте стояли "самые важные" документы. Учитываются следующее факторы:

  • входят ли ключевые слова в заголовок документа;  

  • содержатся ли эти слова в первых нескольких строках документа;  

  • насколько близко друг к другу в тексте обнаружены ключевые слова.  

Поиск специальных элементов

Любой WWW-документ имеет, помимо обычного текста, те или иные специальные элементы), такие как заголовок документа, гипертекстовые ссылки, команды вставки изображений и т. п. При обычном поиске все эти элементы учитываются наравне с обычным текстом. Однако иногда вам может понадобиться найти документ именно по значению того или иного специального элемента. В Alta Vista это делается с помощью добавления в запрос особого вида выражений:

  • anchor:<текст> (здесь и ниже, если <текст> состоит из нескольких слов, их нужно заключить в кавычки). Это выражение позволяет найти все документы, на которых <текст> встречается внутри рабочей части гипертекстовой ссылки, - т. е. того текста, который на экране выделяется подчеркиванием и реагирует на щелчок мышью.  

  • host:<доменный адрес> позволяет найти все документы, в URL которых входит <доменный адрес>, - другими словами, все страницы, расположенные на сервере с этим адресом.  

  • image:<имя файла> ищет все документы, включающие в себя графический файл с указанным именем. С помощью того же выражения можно искать "альтернативный текст" , который изображается на месте этого рисунка в его отсутствие.  

  • link:<URL или доменный адрес> позволяет найти все документы, содержащие ссылку на указанный URL или на URL с указанным доменным адресом. Таким образом нетрудно будет выяснить, к примеру, кто и откуда ссылается на вашу собственную страницу.  

  • text:<текст>. Это выражение добавлено к остальным для полноты картины - просто чтобы охватить специальными выражениями все элементы HTML-документа. Его смысл - поиск <текста> только в обычном, видимом на экране содержимом документа.  

  • title:<текст> ищет документы, у которых <текст> содержится в заголовке.  

  • url:<фрагмент URL> ищет документы, в URL которых входит указанный фрагмент (если <фрагмент URL> состоит из нескольких слов, разделенных пробелами и взятых в общую пару кавычек, то искомый URL должен содержать все эти слова в любом порядке).  

Свои специальные элементы есть и в статьях Usenet, также индексируемых на Alta Vista. Для поиска в Usenet применяется следующие выражения:

  • from:<электронный адрес или его фрагмент> ищет только те статьи, у которых в поле From, т. е. в адресе отправителя, стоит указанная последовательность символов.  

  • subject:<текст> ограничивает поиск теми статьями, у которых в поле Subject (указывающем тему сообщения) содержится данный текст.  

  • newsgroups:<название группы или его фрагмент> ограничивает поиск статьями в тех конференциях, чье название совпадает с указанным или содержит его в себе.  

  • summary:<текст> ищет статьи, у которых указанный текст входит в текст описания в поле Summary.  

  • keywords:<текст> ищет статьи, у которых указанный текст входит в список ключевых слов в поле Keywords.  

Все эти выражения можно использовать как по отдельности, так и вместе друг с другом или в сочетании с обычными ключевыми словами. Кроме того, как и для ключевых слов, перед любым из этих выражений можно поставить знак "минус", поменяв его смысл на противоположный (т. е. если выражение без минуса ищет все, что удовлетворяет некоему условию, то с минусом оно будет искать только то, что не отвечает этому условию).

Усложненный поиск - Advanced Search

Бланк для "усложненного" запроса отличается от бланка простого запроса в первую очередь присутствием двух полей для ввода ключевых слов. Второе из этих полей, озаглавленное Results Ranking Criteria, на самом деле полностью аналогично полю ввода на бланке простого поиска - в нем можно использовать те же специальные выражения, знаки +,- и * и т. п.

Однако здесь это поле играет лишь вспомогательную роль, определяя порядок сортировки полученных результатов - документы, содержащие ключевые слова из поля Ranking, будут стоять в списке первыми (подробнее о принципах сортировки результатов см. выше). Ключевые слова для собственно поиска должны вводиться в первом из полей, Selection Criteria.

Запросы в этом поле строятся по иным правилам, нежели в поле Ranking или при простом поиске. Вместо символов + и - здесь нужно употреблять специальные операторы и скобки, строя из них логические выражения для поиска. Операторов существует четыре:

  • AND (или &) связывает ключевые слова операцией "логического И": документ должен содержать оба слова, объединенные этим оператором.  

  • OR (или |) связывает ключевые слова операцией "логического ИЛИ": документ должен содержать хотя бы одно из слов, объединенных этим оператором.  

  • NOT (или !) меняет смысл одного ключевого слова или выражения на противоположный: например, если "A & B" требует присутствия как A, так и B, то "! (A & B)" выдаст все документы, кроме тех, в которых A и B содержатся одновременно.  

  • NEAR, или ~ ("оператор близости", proximity operator), используется для указания того, что два или более ключевых слова должны располагаться в искомом тексте близко друг к другу. Например, если вы напишете "Борис ~Алексеев", то в ответ получите документы, содержащие строки "Борис Алексеев", "Алексеев, Борис", "Борис Викторович Алексеев" и т. п. "Близко расположенными" Alta Vista считает слова, между которым стоит не более десяти других слов.  

Если вы знакомы с алгеброй логических операций, то вы, наверно, и сами уже догадались, что эти операторы обладают разным приоритетом: в любом выражении сначала выполняется оператор NEAR, затем NOT, затем AND и, наконец, OR. Чтобы изменить порядок выполнения операторов, используйте круглые скобки.

Например, чтобы найти информацию о некоем Льве Константиновиче Толстом, не погибнув под обвалом ссылок на его знаменитых однофамильцев-писателей (Льва Николаевича, Алексея Константиновича и Алексея Николаевича), нужно написать такое выражение:

Толстой ~((Лев | Л.) & ! (Алексей | А.)) ~((Константинович | К.) & ! (Николаевич | Н.))

К сожалению, это магическое заклинание не защитит нас от появления "К. Л. Толстого", так как порядок слов в операторе NEAR задать, к сожалению, невозможно.

Если вы действительно зададите это вычурное выражение для поиска, то, к удивлению своему, обнаружите, что на первое место в списке результатов вышли "Литературные анекдоты" Д. Хармса, где многажды упоминается Лев Толстой. Дело в том, что поскольку именно Льва Константиновича Толстого в Интернете пока нет, Alta Vista пытается найти для вас документы, хотя бы частично удовлетворяющие запросу.

Такой синтаксис построения запроса допустим только в поле Selection Criteria, в то время как набор и порядок расположения результатов зависят от содержимого обоих полей - и Selection Criteria, и Results Ranking Criteria. Здесь возможны три случая:

  • Если поле Selection содержит некое выражение, а поле Ranking оставлено пустым, то результаты, удовлетворяющие запросу, будут выданы без всякой сортировки.  

  • Если оба поля содержат один и тот же набор ключевых слов без каких-либо операторов (или, что то же самое, если поле Selection оставлено пустым), то ответ будет тем же, что и при использовании простого поиска с данными ключевыми словами. Результаты будут отсортированы по количеству и расположению ключевых слов (см. выше).  

  • Если поле Ranking содержит слова, которых нет в поле Selection, то эти слова служат дополнительным ограничителем поиска (т. е. они как бы приписываются ко всему выражению в поле Selection через оператор AND), а результаты сортируются по наличию в них этих дополнительных слов.  

Кроме того, внизу бланка поиска расположены два поля для ввода дат, которые позволяют задать промежуток времени, в который были созданы или изменены интересующие вас документы. Это имеет смысл делать для периодически обновляемых документов - например, сводок погоды или статей Usenet.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]