- •5.2. Фактографические аис
- •5 .2. Фактографические аис
- •5.2. Фактографические аис
- •5.2. Фактографические аис
- •5.2. Фактографические аис
- •5.3. Документальные ис
- •5.3. Документальные ис
- •290 Глава 5. Программные оболочки информационных систем
- •294 Глава 5. Программные оболочки информационных систем
- •5.4. Автоматизированные библиотечные информационные системы (абис)
290 Глава 5. Программные оболочки информационных систем
н
ия
допускается использование скобок,
задающих дополнительные
приоритеты выполнения условий поиска.
Условие поиска. Условие поиска устанавливает критерии соответствия поисковых дескрипторов запроса некоторой области поиска, представляющей собой совокупность структурных единиц документа — полей.
Условие_поиска имеет разновидности:
Область поиска Оператор критерия Выражение условия; Результат поиска.
Область поиска внутри документа задается именем отдельного поля или логическим выражением, объединяющим имена нескольких полей.
Выражение условия — набор терминов (поисковых дескрипторов), объединенных с помощью булевых или контекстных операторов в логическое выражение.
Оператор критерия задает условие включения или сравнения дескрипторов запроса и терминов, содержащихся в указанных полях документов.
В простейшем случае предложение запроса состоит из имени поля, оператора вхождения и одного дескриптора, например:
KW
РОССИЯ.
Область поиска задается именами структурных единиц документа — полей. Разновидности области_поиска:
Имя_поля;
Область_поиска Логическая__операция Область__поиска.
Из нотации видно, что допускается использование логических операций при формировании области поиска. Например:
(АВ OR TI): (РОССИЯ NOT СССР)
означает, что в результат поиска включаются все документы, в которых хотя бы в одном из заданных полей (реферат, заголовок или в обоих) встречается дескриптор РОССИЯ, но не встречается дескриптор СССР. ,■
Отличительная особенность ИПЯ IRB1S — возможность формирования логического выражения как в правой, так и в левой части условия поиска.
Оператор критерия. Для связи области поиска с терминами запроса используются следующие операторы критерия (вхождения, сравнения):
«:» (условие вхождения) — позволяет найти документы, которые содержат в указанной области поиска результат вычисления выражения условия;
«=» (условие «равно», или EQ) — позволяет найти документы, для которых указанная область поиска равна результату вычисления выражения условия;
«О» (условие «не равно», или NE) — позволяет найти документы, которые не содержат в указанной области поиска результат вычисления выражения условия;
«>» (условие «строго больше», или GT) — позволяет найти документы, которые содержат в указанной области поиска значения, большие, чем результат вычисления выражения условия;
«>=» (условие «больше или равно», или GE) — позволяет найти документы, которые содержат в указанной области поиска значения, большие или равные результату вычисления выражения условия;
«<» (условие «строго меньше», или LT) — позволяет найти документы, которые содержат в указанной области поиска значения, меньшие, чем результат вычисления выражения условия; «<=» (условие «меньше или равно», или LE) — позволяет найти документы, которые содержат в указанной области поиска значения, меньшие или равные результату вычисления выражения условия.
Выражение условия. Синтаксис выражения условия в
ИПЯ следующий:
Выражение_условия:
Дескриптор;
Выражение_условия Операция Выражение_условия,
где Операция — Логическая операция ИЛИ Контекстный_оператор, причем
Логическая_операция — это, как и ранее:
И (AND, «пробел»), ИЛИ (OR, «,»)hHE(NOT, «л»),
Контекстный оператор — это
СТХ, СТХ[N], +, NEAR, NEAR[N] , SENT, CON[N].
При использовании в запросе нескольких дескрипторов они должны быть связаны контекстными или логическими операторами и помещены в круглые скобки.
Синтаксис и семантика использования дескрипторов. Для поиска информации в БД поисковые дескрипторы могут быть заданы одним из перечисленных способов:
выбор из частотного словаря;
ввод с клавиатуры;
отметка ключевых слов в тексте документа;
выбор терминов из специализированных словарных, рубрикационных или тезаурусных структур.
При задании поисковых дескрипторов допускается использование операторов (символов) маскирования, алгоритма нормализации и ссылок на ранее полученные результаты поиска.
Маскирование. ИПЯ разрешает употребление символов маскирования двух видов:
маскирование (или замена) произвольного числа рядом стоящих символов дескриптора (символы «*» или «$»);
маскирование одного (непустого) символа дескриптора (символ «%»)
Символы маскирования могут использоваться вместо любого символа дескриптора, и их количество внутри дескриптора неограниченно.
Параметризированные символы маскирования произвольного количества символов (например, «* (N) »), означают, что в дескрипторе на месте символа маскирования может стоять произвольная последовательность длиной не более чем N символов (где N— от 0 до 255).
Нормализация. Для расширения возможностей дескрипторного языка на этапе сопоставления поискового образа документа (ПОД) и поискового образа запроса (ПОЗ) может быть использован аппарат нормализации дескрипторов.
Правила нормализации дескриптора ПОЗ следующие:
три первые буквы дескриптора остаются без изменения;
все следующие гласные буквы заменяются символом маскирования произвольного числа рядом стоящих букв;
конечные буквы в, г, м, х в дескрипторе заменяются симво лом маскирования произвольного числа рядом стоящих букв;
в конце дескриптора проставляется символ маскирования произвольного числа рядом стоящих букв (если после всех преобразований конечный символ дескриптора не является символом маскирования).
Нормализованный таким образом дескриптор ПОЗа позволяет обеспечить более полный дескрипторный поиск с использованием только лишь частотного словаря БД.
Рассмотрим, например, запрос, который на естественном языке представляет собой предложение: «Частотный анализ терминов словаря». Такой запрос в системе (с применением правил нормализации) автоматически преобразуется в следующий ПОЗ:
част$тн$ AND анал$з$ AND терм$н$ AND слов$р$
Нормализованный таким образом ПОЗ обеспечивает поиск по логическому выражению с разрешением символов маскирования:
част$тн$ = частотность, частотности, частотный, частотные,
частотных, частотного, частотной;
анал$з$ = анализ, анализа, анализе, анализу, анализируется,
анализируются;
терм$н$ = термин, термина, термину, термином, термины, терминов, терминах, терминология, терминологии, терминологию, терминологические, терминологическим, терминологических, терминологической, терминологический, терминосистем, терминологичности;
слов$р$ = словарь, словаря, словаре, словарем, словарей, словарные, словарными, словарных, словарного, словоформа, словоформе, словоформы, словоформ, словарные, словар-но-грамматический, словоупотреблений.
Использование ранее полученных результатов поиска. В качестве операнда Условия_поиск.а в Предложении_запроса может использоваться ранее полученный Результат_поиска.
Для включения в Предложение^запроса результатов ранее проведенного поиска используются ссылки на номер предложения в текущем запросе.
Например, запрос может иметь вид:
#2 and ((KW or AB) : Россия)
где #2 — ссылка на результат второго предложения запроса.
