Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
it 20-27.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
47.65 Кб
Скачать

20. Дополнительные средства и способы поиска

Существуют и дополнительные способы поиска в Интернете, кото­рые используют возможности, предоставляемые некоторыми другими службами Сети, ее персоналом, а также ее пользователями, которые способствуют поиску информации. К таким службам можно отнести телеконференции (форумы) (способ взаимодействия пользователей в Интернете, посредством которого один из пользователей оставляет сообщения на информационном ресурсе сети (сайте), а другие пользо­ватели могут читать в любое удобное для них время), электронные объявлений (строятся по принципу телеконференций), чаты (от (игл. chat - болтать) (способ взаимодействия пользователей в Интерне-ie, посредством которого происходит общение пользователей в режиме реального времени), серверы, ведущие поиск информации через элек­тронную почту (один из возможных способов обращения к средствам информационного поиска) и др. Данные способы являются дополни­тельными, поскольку они:

  •  не предназначены для массового использования;

  • не являются универсальными (накапливают адреса в недос­таточном объеме или по узким направлениям);

  • не являются стандартными или обязательными для того, кто  их предоставляет (т.е. нет гарантии получения ответа на  запрос).

21. Логические основы формирования запроса

Пробел или символ &-логическое И. Означает, что каждое из слов запроса должно входить в одно и тоже предложение искомого документа. Сдвоенный символ && - в пределах документа.

Запятая или символ I –логическое ИЛИ. Означает, что в искомом документе в одном из предложении должно содержаться одно из Этих слов.

Тильда ~ -бинарный оператор И НЕ. Наличие указывает, что в предложении будет искаться только первое слово из запроса, а второе будет игнорироваться. Сдвоенные символы ~~ указывает на то, что поиск терминов, содержащихся в запросе будет производиться в пределах всего документа.

Круглые скобки () – группирование слов в предложение, для этого его надо взять в скобки. Вместо одного слова в запросе можно подставлять целое выражение. Скобки задают также порядок действия логических операторов . Внутри скобок можно использовать все знаки пунктуации и ограничение расстояния.

Фигурные скобки {} – естественно-языковый запрос

Знак / . Если между двумя словами поставлен этот знак и за ним сразу введено число, значит требуется, чтобы расстояние между словами не превышало этого числа слов. Если порядок слов и расстояние между ними точно известны, можно использовать пунктуация /+n – т.е. задается поиск слов, стоящих подряд.

Символы /(nm). Ограничение по расстоянию в общем виде между словами. Где n – минимально, а m – максимально допустимое расстояние. Практически все знаки пунктуации в запросе можно комбинировать с ограничением расстояния. Если знаки ограничения по расстоянию стоят после двойных операторов [например &&/(nm)], то употребленные там числа – это расстояние не в словах, а в предложениях .

title= слово(или сочетание слов в круглых скобках) после знака равенства должны искаться в заголовках документов. В этом случае синтаксис запроса имеет вид $title (термин )

А - для поиска в ссылках. В этом случае синтаксис запроса имеет вид $A(это/+1 ссылка/+1 на/+1сайт/+1 СумГУ).

$$ - для ограничения области поиска – осуществлять его не по всему документу, а только по тем, которые были найдены в предыдущем поиске. В этом случае синтаксис запроса имеет вид $title (термин)$$

subtree =название раздела – позволяет при индексировании задать нужные каталоги и названия разделов, к которым они будут относиться. В этом случае синтаксис запроса имеет вид студент#subtree=ssu. Задается поиск документов в разделе ssu, содержащих слово студент.

слово:число - оператор веса и уточнения запроса позволяет пользователю повлиять на порядок сортировки. Задание веса слова или выражения применяется для того, чтобы увеличить релевантность документов, содержащих взвешенное выражение. Например студент отличник:5 - то наверху списка окажутся документы, где чаще встречается слово отличник.

слово<-уточняющее слово – позволяет увеличить релевантность документов, содержащих уточняющее выражение. Например по запросу студент<-отличник будут найдены все документы, содержащие слово студент, при этом первыми будут выданы документы, содержащие слово отличник.

Вывод документа: название документа, начало текста, размер файла, URL ссылающийся на оригинальный документ, дата последнего обновления, степень соответствия запросу, кодировка. Обеспечивается подсветка искомых слов в найденных документах. Есть возможность поиска похожих документов и повторного поиска только в найденных документах.

Для каждого найденного документа Яnдех вычисляет величину релевантности содержания документа поисковому запросу. Список найденных документов перед выдачей пользователю сортируется по этой величине в порядке убывания. Релевантность документа зависит от ряда факторов, в т.ч. от частотных характеристик искомых слов, веса слова или выражения, близости искомых слов в тексте документа друг к другу и т.д.

Наличие индексации дает возможность выделить слова, найденные согласно запроса в тексте. Слова выделяются угловыми стрелочками. Каждая стрелочка ссылается на следующее или предыдущее «найденное» слово.

Если запрошенное слово было найдено в заголовке, то оно выделяется там угловыми скобками, а внизу выдается соответствующее сообщение.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]