Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Документальные информационно-поисковые системы.doc
Скачиваний:
114
Добавлен:
10.05.2014
Размер:
5.47 Mб
Скачать

26. Расширенное логическое выражение запроса (обобщенная форма). Основные виды операторов и операндов.

Логическое выражение поискового условия – это синтаксическая конструкция языка, задающая порядок и способ вычисления величины, принимающей значение «0» или «1» В соответствии с правилами выражение представляет собой последовательность операндов, соединённых друг с другом знаками операций. Некоторые фрагменты выражения м.б. заключены в скобки.

Нотация Бэкуса для такого выражения следующая:

<Выражение>::=<Операнд>?<Выражение><Операция>

<Операнд>?<Операнд><Операция><Выражение>? (<Выражение>)<Операция><Операнд>? <Операнд><Операция>(<Выражение>)

В качестве операнда в поисковом выражении выступают термины (дескрипторы), а в качестве операции – одна из логических операций AND, OR, XOR и NOT.

Оператор критериязадаёт условие включения или сравнения дескрипторов запроса и терминов, содержащихся в указанных полях документов.

«=» EQ – позволяет найти документы, для которых указанная область поиска равна результату вычисления выражения условия.

«<>» NE– позволяет найти документы, которые не содержат в указанной области поиска результат вычисления выражения условия

«>» GT – позволяет найти документы, которые содержат в указанной области поиска значения большие, чем результат вычисления выражения условия

«>=» GE- …. Значения большие или равные результату вычисления выражения условия

«<» LT- ….. значения меньшие, чем результат вычисления выражения условия

«<=» LE- …. Значения меньшие или равные результату вычисления выражения условия.

Контекстные операторы

<дескриптор1>оператор<дескриптор2>

CTR[N] - позволяет найти документы, в заданной области поиска которых в одном предложении присутствуют поисковые дескрипторы, расположенные в указанном порядке на расстоянии не более N слов друг от друга

NEAR[N] – …… на расстоянии не более N слов друг от друга

SENT[N] - …. Находящиеся в одном предложении

CON[N] - … в ИПС IRBIS включён оператор пересечения полей, служащий для отбора документов, в заданных полях которых имеется не менее N одинаковых поисковых терминов

<имя поля1> CON[N] <имя поля2>

N от 1 до 255!

27. Назначение и организация инвертированной формы представления документальной информации. Примерная организация поисковых массивов документальной ипс дескрипторного типа.

Технология поиска основывается на 2 типах организации массивов объектов – прямой и инвертированной.

Прямая организация - когда документы размещаются последовательно (не алфавит и не классификация), например, в порядке их поступления.

Инвертированная технология - документы разбиваются на подмножества, которые могут быть классифицированы и имеют индексы, в которых отображается содержание документов. Упорядоченные документы составляют инвертированный справочник. Проводится поиск в инвертированном справочнике. Запрос сравнивается с классом, потом с содержанием документов этого класса. Благодаря этому уходит меньше времени на поиск, т.к. легче просмотреть индекс документа, чем весь документ.

Запрос обычно представляется как набор атрибутов. Атрибуты могут быть представлены в ключевой или позиционной форме.

Позиционная форма - табличный способ: каждому атрибуту соответствует колонка, каждая ячейка которой содержит значение атрибута.

Ключевая форма – имя атрибута = значение. В документальных системах, в которых поисковые образы представлены набором дескрипторов, атрибут задается предикатом «поисковый образ имеет в составе дескриптор». Сам дескриптор является значением атрибута.

Дескрипторы – это ключевые слова, которые по определенным правилам отобраны из основного словарного состава языка и у которых искусственно устранены синонимия, полисемия и омонимия.