- •Информационные системы
- •ВВЕДЕНИЕ
- •1. Информация. Основные свойства и определения
- •1.1. Информация как основной предмет информатики
- •1.2. Соотношение понятий «информация», «данные», «знания»
- •1.2.1. Информация
- •1.2.2. Данные
- •1.2.3. Знания
- •1.3. Свойства информации
- •1.3.1. Кумулятивность информации
- •1.3.2. Концентрация информации
- •1.3.3. Эмерджентность и неассоциативность информации
- •1.3.4. Стaрение информации
- •1.3.5. Межотраслевые свойства и рассеяние информации
- •1.4. Информационные единицы
- •Контрольные вопросы
- •2. Информационные системы и технологии обработки информации
- •2.1. Состав и структура информационной системы
- •2.1.1. Классификация информационных систем
- •2.1.2. Основные компоненты ИС
- •2.2. Информационные компоненты в системах управления
- •2.2.2. Информация в системах обработки и генерации знания
- •2.3. Информационные технологии
- •2.4. О реализации процесса поиска информации
- •Контрольные вопросы
- •3. Модели и структуры данных информационных систем
- •3.1. Семантика ИС, основанных на концепции баз данных
- •3.2. Идентификация и поиск информации
- •3.3. Представление предметной области и модели данных
- •3.4. Структура информации и структура данных
- •3.6.1. Преобразование представлений
- •Контрольные вопросы
- •4. Модели поиска и оценки эффективности
- •4.1. Оценка экономической и технической эффективности
- •4.1.1. Экономическая эффективность
- •4.1.2. Техническая эффективность
- •4.2. Математические модели оценки технической эффективности
- •4.3.2. Модель механизма поиска по совпадению терминов
- •4.3.3. Модель механизма поиска по логическому выражению
- •4.3.4.1. Модель механизма поиска документов-аналогов
- •4.3.4.2. Модель механизма эвристического поиска
- •4.5. Информационно-поисковый язык документальной ИПС
- •4.5.1. Предложение запроса
- •4.5.2. Условие поиска
- •4.5.3. Синтаксис и семантика использования дескрипторов
- •4.5.4. Использование ранее полученных результатов поиска
- •5. Лингвистическое обеспечение ИС
- •5.2. Состав и структура лингвистического обеспечения
- •Линейные
- •5.3. Классификации
- •5.3.1. Библиотечно-библиографические классификации
- •5.3.1.2. Алфавитно-предметные классификации
- •5.3.1.3. Фасетные классификации
- •5.3.2. Классификации изобретений
- •5.3.3. Отраслевые классификационные системы
- •5.4.1. Координатное индексирование
- •5.4.2. Семантическая сила дескрипторных ИПЯ
- •5.5.1. Линейные терминологические структуры
- •Рубрика
- •Слов
- •5.5.2. Иерархические терминологические структуры
- •6. Поисковые задачи и технологии информационного поиска
- •6.2. Поисковые задачи и виды информационного поиска
- •6.2.1. Типология поисковых задач
- •6.2.2. Типология информационных потребностей
- •7.3. Технология поиска и интерфейс АИПС
- •7.3.1. Творческий процесс и стереотипы мышления
- •7.3.2. Интерфейс пользователя
- •Таблица 7.1.
- •7.4.3. Типология и стереотипы поведения пользователей
- •7.5.1.1. Стратегия поиска и классификация АИПС
- •7.5.1.2. Методы поиска
- •7.5.3. Поисковые интерфейсы
- •7.5.3.1. Организация интерфейсных объектов
- •7.5.3.2. Роль системы в процессе взаимодействия
- •8. Интерфейсные средства информационного поиска
- •8.1.1. Формирование запроса «по образцу»
- •8.1.2. Конструктор запроса «по шагам»
- •8.1.3. Конструктор запроса «Логическое выражение»
- •8.1.4. Использование формулировок ранее сохраненных запросов
- •8.2.1. Поиск аналогов
- •8.2.2. Эвристический поиск
- •8.2.3. Поиск по обратной связи
- •8.3. Технологические объекты построения предложения запроса
- •8.3.1. Частотный словарь
- •8.3.2. Тематический рубрикатор
- •8.3.3. Тезаурус
- •8.3.4. Иерархический словник
- •Список сокращений
- •ЕЯ – естественный язык.
- •ИС – информационная система.
- •ТСС – тематико-статистический спектр множества документов.
- •Литература
- •Глоссарий
- •Приложения
OR (ИЛИ) – например:
KW:(‘ЧАСТНАЯ СОБСТВЕННОСТЬ’ OR ‘ЧАСТНАЯ
ТОРГОВЛЯ’)
означает, что в результаты поиска включаются все документы, в которых в поле KW встречаются термины (словосочетания) «ЧАСТНАЯ СОБСТВЕННОСТЬ» или «ЧАСТНАЯ ТОРГОВЛЯ» или оба вместе:
ЧАСТНАЯ |
ЧАСТНАЯ ТОРГОВЛЯ |
AND (И) –например:
KW:(‘ЧАСТНАЯ СОБСТВЕННОСТЬ’ AND ‘ЧАСТНАЯ
ТОРГОВЛЯ’)
означает, что в результаты поиска включаются только те документы, в которых в поле KW встречаются оба термина «ЧАСТНАЯ СОБСТВЕННОСТЬ» и «ЧАСТНАЯ ТОРГОВЛЯ».
ЧАСТНАЯ |
ЧАСТНАЯ ТОРГОВЛЯ |
NOT (НЕ) – например:
KW:(‘ЧАСТНАЯ СОБСТВЕННОСТЬ’ NOT ‘ЧАСТНАЯ
ТОРГОВЛЯ’)
означает, что в результаты поиска включаются документы, в которых в поле KW встречается термин «ЧАСТНАЯ СОБСТВЕННОСТЬ» и не встречается «ЧАСТНАЯ ТОРГОВЛЯ».
ЧАСТНАЯ |
ЧАСТНАЯ ТОРГОВЛЯ |
4.5.2. Условие поиска
Условие поиска устанавливает критерии соответствия поисковых дескрипторов запроса некоторой области поиска, представляющей собой совокупность структурных единиц документа – полей.
<Условие поиска> ::=<Область поиска><Оператор критерия><Выражение условия> |
<Результат поиска>
123
Область поиска внутри документа задается именем отдельного поля или логическим выражением, объединяющим имена нескольких полей.
Выражение условия – набор терминов (поисковых дескрипторов), объединенных с помощью булевых или контекстных операторов в логическое выражение.
Оператор критерия задает условие включения или сравнения дескрипторов запроса и терминов, содержащихся в указанных полях документов.
В простейшем случае предложение запроса состоит из имени поля, оператора вхождения и одного дескриптора, например:
KW : РОССИЯ
Область поиска. Область поиска задается именами структурных единиц документа – полей.
<Область поиска> ::= <Имя поля>| (<Область поиска> <Логическая операция> <Область поиска>)
Из нотации видно, что допускается использование логических операций при формировании области поиска. Например:
(AB OR TI): (РОССИЯ NOT СССР)
означает, что в результат поиска включаются все документы, в которых хотя бы в одном из заданных полей (или в обоих) встречается дескриптор РОССИЯ, но не встречается дескриптор СССР.
Отличительная особенность представляемого ИПЯ – возможность формирования логического выражения как в правой, так и в левой части условия поиска.
Если в условии поиска область поиска явно не задана, то поиск проводится в области, заданной «по умолчанию». Область поиска «по умолчанию» задается обычно либо средствами описания документа (схемой), либо параметрами интерфейсных форм построения запроса.
Оператор критерия. Для связи области поиска с терминами запроса используются следующие операторы критерия (вхождения, сравнения):
<Оператор критерия> ::= : | = | EQ | <> | NE | > | GT | >= | GE | < | LT | <= | LE
-”:” (условие вхождения) – позволяет найти документы, которые содержат в указанной области поиска результат вычисления выражения условия;
-”=” (условие "равно", или EQ) - позволяет найти документы, для которых указанная область поиска равна результату вычисления выражения условия;
-”<>” (условие "не равно", или NE) - позволяет найти документы, которые не содержат в указанной области поиска результат вычисления выражения условия;
124
-”>” (условие "больше", или GT) - позволяет найти документы, которые содержат в указанной области поиска значения больше, чем результат вычисления выражения условия;
-”>=” (условие "больше или равно", или GE) - позволяет найти документы, которые содержат в указанной области поиска значения больше или равные результату вычисления выражения условия;
-”<” (условие "меньше", или LT) - позволяет найти документы, которые содержат в указанной области поиска значения меньше, чем результат вычисления выражения условия;
-”<=” (условие "меньше или равно", или LE) - позволяет найти документы, которые содержат в указанной области поиска значения меньше или равные результату вычисления выражения условия.
Выражение условия. Синтаксис выражения условия в ИПЯ следующий:
<Выражение условия> ::= <Дескриптор> | <Выражение условия> <Операция> <Выражение условия> |
(<Выражение условия> <Операция> <Выражение условия>) <Операция> ::= <Логическая операция> <Контекстная операция> <Контекстная операция> ::=
=CTX|CTX[N]|+|NEAR|NEAR[N]|SENT|CON[N]
При использовании в запросе нескольких дескрипторов они должны быть связаны контекстными или логическими операторами и помещены в круглые скобки.
Контекстные операторы – это оператор расстояния (NEAR[N]), оператор расстояния со строгим следованием (CTX[N]), оператор предложения (SENT) и оператор пересечения полей (CON[N]). Параметр N (в операторах NEAR и CTX) может принимать значения от 0 до 255 (по умолчанию N равно 0). Отсутствие параметра означает следование терминов в поле непосредственно друг за другом (идентично значению
0).
Оператор CTX позволяет найти документы, в заданной области поиска которых в одном предложении присутствуют поисковые дескрипторы, расположенные в указанном порядке на расстоянии не более N слов друг от друга. Выражение условия имеет вид:
<дескриптор1> CTX[N] <дескриптор2>
Оператор NEAR позволяет найти документы, в заданной области поиска которых в одном предложении присутствуют поисковые дескрипторы на расстоянии N слов друг от друга (в произвольном порядке). Выражение условия имеет вид:
<дескриптор1> NEAR[N] <дескриптор2>
Оператор SENT позволяет найти документы, в заданной области поиска которых поисковые дескрипторы находятся в одном предложении. Выражение условия имеет вид:
125