Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Голицына Информационные системы 2004.pdf
Скачиваний:
323
Добавлен:
16.08.2013
Размер:
5.01 Mб
Скачать

OR (ИЛИ) – например:

KW:(‘ЧАСТНАЯ СОБСТВЕННОСТЬ’ OR ‘ЧАСТНАЯ

ТОРГОВЛЯ’)

означает, что в результаты поиска включаются все документы, в которых в поле KW встречаются термины (словосочетания) «ЧАСТНАЯ СОБСТВЕННОСТЬ» или «ЧАСТНАЯ ТОРГОВЛЯ» или оба вместе:

ЧАСТНАЯ

ЧАСТНАЯ ТОРГОВЛЯ

AND (И) –например:

KW:(‘ЧАСТНАЯ СОБСТВЕННОСТЬ’ AND ‘ЧАСТНАЯ

ТОРГОВЛЯ’)

означает, что в результаты поиска включаются только те документы, в которых в поле KW встречаются оба термина «ЧАСТНАЯ СОБСТВЕННОСТЬ» и «ЧАСТНАЯ ТОРГОВЛЯ».

ЧАСТНАЯ

ЧАСТНАЯ ТОРГОВЛЯ

NOT (НЕ) – например:

KW:(‘ЧАСТНАЯ СОБСТВЕННОСТЬ’ NOT ‘ЧАСТНАЯ

ТОРГОВЛЯ’)

означает, что в результаты поиска включаются документы, в которых в поле KW встречается термин «ЧАСТНАЯ СОБСТВЕННОСТЬ» и не встречается «ЧАСТНАЯ ТОРГОВЛЯ».

ЧАСТНАЯ

ЧАСТНАЯ ТОРГОВЛЯ

4.5.2. Условие поиска

Условие поиска устанавливает критерии соответствия поисковых дескрипторов запроса некоторой области поиска, представляющей собой совокупность структурных единиц документа – полей.

<Условие поиска> ::=<Область поиска><Оператор критерия><Выражение условия> |

<Результат поиска>

123

Область поиска внутри документа задается именем отдельного поля или логическим выражением, объединяющим имена нескольких полей.

Выражение условия – набор терминов (поисковых дескрипторов), объединенных с помощью булевых или контекстных операторов в логическое выражение.

Оператор критерия задает условие включения или сравнения дескрипторов запроса и терминов, содержащихся в указанных полях документов.

В простейшем случае предложение запроса состоит из имени поля, оператора вхождения и одного дескриптора, например:

KW : РОССИЯ

Область поиска. Область поиска задается именами структурных единиц документа – полей.

<Область поиска> ::= <Имя поля>| (<Область поиска> <Логическая операция> <Область поиска>)

Из нотации видно, что допускается использование логических операций при формировании области поиска. Например:

(AB OR TI): (РОССИЯ NOT СССР)

означает, что в результат поиска включаются все документы, в которых хотя бы в одном из заданных полей (или в обоих) встречается дескриптор РОССИЯ, но не встречается дескриптор СССР.

Отличительная особенность представляемого ИПЯ – возможность формирования логического выражения как в правой, так и в левой части условия поиска.

Если в условии поиска область поиска явно не задана, то поиск проводится в области, заданной «по умолчанию». Область поиска «по умолчанию» задается обычно либо средствами описания документа (схемой), либо параметрами интерфейсных форм построения запроса.

Оператор критерия. Для связи области поиска с терминами запроса используются следующие операторы критерия (вхождения, сравнения):

<Оператор критерия> ::= : | = | EQ | <> | NE | > | GT | >= | GE | < | LT | <= | LE

-:(условие вхождения) – позволяет найти документы, которые содержат в указанной области поиска результат вычисления выражения условия;

-=(условие "равно", или EQ) - позволяет найти документы, для которых указанная область поиска равна результату вычисления выражения условия;

-<>(условие "не равно", или NE) - позволяет найти документы, которые не содержат в указанной области поиска результат вычисления выражения условия;

124

->(условие "больше", или GT) - позволяет найти документы, которые содержат в указанной области поиска значения больше, чем результат вычисления выражения условия;

->=(условие "больше или равно", или GE) - позволяет найти документы, которые содержат в указанной области поиска значения больше или равные результату вычисления выражения условия;

-<(условие "меньше", или LT) - позволяет найти документы, которые содержат в указанной области поиска значения меньше, чем результат вычисления выражения условия;

-<=(условие "меньше или равно", или LE) - позволяет найти документы, которые содержат в указанной области поиска значения меньше или равные результату вычисления выражения условия.

Выражение условия. Синтаксис выражения условия в ИПЯ следующий:

<Выражение условия> ::= <Дескриптор> | <Выражение условия> <Операция> <Выражение условия> |

(<Выражение условия> <Операция> <Выражение условия>) <Операция> ::= <Логическая операция> <Контекстная операция> <Контекстная операция> ::=

=CTX|CTX[N]|+|NEAR|NEAR[N]|SENT|CON[N]

При использовании в запросе нескольких дескрипторов они должны быть связаны контекстными или логическими операторами и помещены в круглые скобки.

Контекстные операторы – это оператор расстояния (NEAR[N]), оператор расстояния со строгим следованием (CTX[N]), оператор предложения (SENT) и оператор пересечения полей (CON[N]). Параметр N (в операторах NEAR и CTX) может принимать значения от 0 до 255 (по умолчанию N равно 0). Отсутствие параметра означает следование терминов в поле непосредственно друг за другом (идентично значению

0).

Оператор CTX позволяет найти документы, в заданной области поиска которых в одном предложении присутствуют поисковые дескрипторы, расположенные в указанном порядке на расстоянии не более N слов друг от друга. Выражение условия имеет вид:

<дескриптор1> CTX[N] <дескриптор2>

Оператор NEAR позволяет найти документы, в заданной области поиска которых в одном предложении присутствуют поисковые дескрипторы на расстоянии N слов друг от друга (в произвольном порядке). Выражение условия имеет вид:

<дескриптор1> NEAR[N] <дескриптор2>

Оператор SENT позволяет найти документы, в заданной области поиска которых поисковые дескрипторы находятся в одном предложении. Выражение условия имеет вид:

125