
- •20. Дополнительные средства и способы поиска
- •21. Логические основы формирования запроса
- •22. Электронные каталоги глобального масштаба.
- •Yahoo! (yahoo/)
- •Ореn Dirесtоry Рrоjусt (dmoz/)
- •About (about/)
- •25. Глобальные поисковые системы.
- •26. Поисковые системы AltaVista и Google
- •27. Поисковая система Яндекс
20. Дополнительные средства и способы поиска
Существуют и дополнительные способы поиска в Интернете, которые используют возможности, предоставляемые некоторыми другими службами Сети, ее персоналом, а также ее пользователями, которые способствуют поиску информации. К таким службам можно отнести телеконференции (форумы) (способ взаимодействия пользователей в Интернете, посредством которого один из пользователей оставляет сообщения на информационном ресурсе сети (сайте), а другие пользователи могут читать в любое удобное для них время), электронные объявлений (строятся по принципу телеконференций), чаты (от (игл. chat - болтать) (способ взаимодействия пользователей в Интерне-ie, посредством которого происходит общение пользователей в режиме реального времени), серверы, ведущие поиск информации через электронную почту (один из возможных способов обращения к средствам информационного поиска) и др. Данные способы являются дополнительными, поскольку они:
не предназначены для массового использования;
не являются универсальными (накапливают адреса в недостаточном объеме или по узким направлениям);
не являются стандартными или обязательными для того, кто их предоставляет (т.е. нет гарантии получения ответа на запрос).
21. Логические основы формирования запроса
Пробел или символ &-логическое И. Означает, что каждое из слов запроса должно входить в одно и тоже предложение искомого документа. Сдвоенный символ && - в пределах документа.
Запятая или символ I –логическое ИЛИ. Означает, что в искомом документе в одном из предложении должно содержаться одно из Этих слов.
Тильда ~ -бинарный оператор И НЕ. Наличие указывает, что в предложении будет искаться только первое слово из запроса, а второе будет игнорироваться. Сдвоенные символы ~~ указывает на то, что поиск терминов, содержащихся в запросе будет производиться в пределах всего документа.
Круглые скобки () – группирование слов в предложение, для этого его надо взять в скобки. Вместо одного слова в запросе можно подставлять целое выражение. Скобки задают также порядок действия логических операторов . Внутри скобок можно использовать все знаки пунктуации и ограничение расстояния.
Фигурные скобки {} – естественно-языковый запрос
Знак / . Если между двумя словами поставлен этот знак и за ним сразу введено число, значит требуется, чтобы расстояние между словами не превышало этого числа слов. Если порядок слов и расстояние между ними точно известны, можно использовать пунктуация /+n – т.е. задается поиск слов, стоящих подряд.
Символы /(nm). Ограничение по расстоянию в общем виде между словами. Где n – минимально, а m – максимально допустимое расстояние. Практически все знаки пунктуации в запросе можно комбинировать с ограничением расстояния. Если знаки ограничения по расстоянию стоят после двойных операторов [например &&/(nm)], то употребленные там числа – это расстояние не в словах, а в предложениях .
title= слово(или сочетание слов в круглых скобках) после знака равенства должны искаться в заголовках документов. В этом случае синтаксис запроса имеет вид $title (термин )
А - для поиска в ссылках. В этом случае синтаксис запроса имеет вид $A(это/+1 ссылка/+1 на/+1сайт/+1 СумГУ).
$$ - для ограничения области поиска – осуществлять его не по всему документу, а только по тем, которые были найдены в предыдущем поиске. В этом случае синтаксис запроса имеет вид $title (термин)$$
subtree =название раздела – позволяет при индексировании задать нужные каталоги и названия разделов, к которым они будут относиться. В этом случае синтаксис запроса имеет вид студент#subtree=ssu. Задается поиск документов в разделе ssu, содержащих слово студент.
слово:число - оператор веса и уточнения запроса позволяет пользователю повлиять на порядок сортировки. Задание веса слова или выражения применяется для того, чтобы увеличить релевантность документов, содержащих взвешенное выражение. Например студент отличник:5 - то наверху списка окажутся документы, где чаще встречается слово отличник.
слово<-уточняющее слово – позволяет увеличить релевантность документов, содержащих уточняющее выражение. Например по запросу студент<-отличник будут найдены все документы, содержащие слово студент, при этом первыми будут выданы документы, содержащие слово отличник.
Вывод документа: название документа, начало текста, размер файла, URL ссылающийся на оригинальный документ, дата последнего обновления, степень соответствия запросу, кодировка. Обеспечивается подсветка искомых слов в найденных документах. Есть возможность поиска похожих документов и повторного поиска только в найденных документах.
Для каждого найденного документа Яnдех вычисляет величину релевантности содержания документа поисковому запросу. Список найденных документов перед выдачей пользователю сортируется по этой величине в порядке убывания. Релевантность документа зависит от ряда факторов, в т.ч. от частотных характеристик искомых слов, веса слова или выражения, близости искомых слов в тексте документа друг к другу и т.д.
Наличие индексации дает возможность выделить слова, найденные согласно запроса в тексте. Слова выделяются угловыми стрелочками. Каждая стрелочка ссылается на следующее или предыдущее «найденное» слово.
Если запрошенное слово было найдено в заголовке, то оно выделяется там угловыми скобками, а внизу выдается соответствующее сообщение.