- •Информационные системы
- •ВВЕДЕНИЕ
- •1. Информация. Основные свойства и определения
- •1.1. Информация как основной предмет информатики
- •1.2. Соотношение понятий «информация», «данные», «знания»
- •1.2.1. Информация
- •1.2.2. Данные
- •1.2.3. Знания
- •1.3. Свойства информации
- •1.3.1. Кумулятивность информации
- •1.3.2. Концентрация информации
- •1.3.3. Эмерджентность и неассоциативность информации
- •1.3.4. Стaрение информации
- •1.3.5. Межотраслевые свойства и рассеяние информации
- •1.4. Информационные единицы
- •Контрольные вопросы
- •2. Информационные системы и технологии обработки информации
- •2.1. Состав и структура информационной системы
- •2.1.1. Классификация информационных систем
- •2.1.2. Основные компоненты ИС
- •2.2. Информационные компоненты в системах управления
- •2.2.2. Информация в системах обработки и генерации знания
- •2.3. Информационные технологии
- •2.4. О реализации процесса поиска информации
- •Контрольные вопросы
- •3. Модели и структуры данных информационных систем
- •3.1. Семантика ИС, основанных на концепции баз данных
- •3.2. Идентификация и поиск информации
- •3.3. Представление предметной области и модели данных
- •3.4. Структура информации и структура данных
- •3.6.1. Преобразование представлений
- •Контрольные вопросы
- •4. Модели поиска и оценки эффективности
- •4.1. Оценка экономической и технической эффективности
- •4.1.1. Экономическая эффективность
- •4.1.2. Техническая эффективность
- •4.2. Математические модели оценки технической эффективности
- •4.3.2. Модель механизма поиска по совпадению терминов
- •4.3.3. Модель механизма поиска по логическому выражению
- •4.3.4.1. Модель механизма поиска документов-аналогов
- •4.3.4.2. Модель механизма эвристического поиска
- •4.5. Информационно-поисковый язык документальной ИПС
- •4.5.1. Предложение запроса
- •4.5.2. Условие поиска
- •4.5.3. Синтаксис и семантика использования дескрипторов
- •4.5.4. Использование ранее полученных результатов поиска
- •5. Лингвистическое обеспечение ИС
- •5.2. Состав и структура лингвистического обеспечения
- •Линейные
- •5.3. Классификации
- •5.3.1. Библиотечно-библиографические классификации
- •5.3.1.2. Алфавитно-предметные классификации
- •5.3.1.3. Фасетные классификации
- •5.3.2. Классификации изобретений
- •5.3.3. Отраслевые классификационные системы
- •5.4.1. Координатное индексирование
- •5.4.2. Семантическая сила дескрипторных ИПЯ
- •5.5.1. Линейные терминологические структуры
- •Рубрика
- •Слов
- •5.5.2. Иерархические терминологические структуры
- •6. Поисковые задачи и технологии информационного поиска
- •6.2. Поисковые задачи и виды информационного поиска
- •6.2.1. Типология поисковых задач
- •6.2.2. Типология информационных потребностей
- •7.3. Технология поиска и интерфейс АИПС
- •7.3.1. Творческий процесс и стереотипы мышления
- •7.3.2. Интерфейс пользователя
- •Таблица 7.1.
- •7.4.3. Типология и стереотипы поведения пользователей
- •7.5.1.1. Стратегия поиска и классификация АИПС
- •7.5.1.2. Методы поиска
- •7.5.3. Поисковые интерфейсы
- •7.5.3.1. Организация интерфейсных объектов
- •7.5.3.2. Роль системы в процессе взаимодействия
- •8. Интерфейсные средства информационного поиска
- •8.1.1. Формирование запроса «по образцу»
- •8.1.2. Конструктор запроса «по шагам»
- •8.1.3. Конструктор запроса «Логическое выражение»
- •8.1.4. Использование формулировок ранее сохраненных запросов
- •8.2.1. Поиск аналогов
- •8.2.2. Эвристический поиск
- •8.2.3. Поиск по обратной связи
- •8.3. Технологические объекты построения предложения запроса
- •8.3.1. Частотный словарь
- •8.3.2. Тематический рубрикатор
- •8.3.3. Тезаурус
- •8.3.4. Иерархический словник
- •Список сокращений
- •ЕЯ – естественный язык.
- •ИС – информационная система.
- •ТСС – тематико-статистический спектр множества документов.
- •Литература
- •Глоссарий
- •Приложения
Если в запросе заданы условия для нескольких поисковых областей, то (по правилам построения такого предложения запроса) соответствующие поисковые выражения всегда связываются оператором
AND (И), обеспечивая таким образом отбор документов из базы данных по принципу обязательного выполнения условий по всем специфицированным областям.
Поисковое условие для отдельного поля синтаксически представляет собой определенное ранее <Выражение условия> и может быть введено и отредактировано с помощью клавиатуры в выделенной области редактирования в соответствии со всеми возможностями ИПЯ, в том числе с использованием допустимых операций, символов маскирования и скобочных конструкций.
Для реализации технологии последовательного формирования поискового множества документов конструктор предусматривает возможность обязательного связывания результата поиска по сформированному предложению запроса с результатом поиска по предыдущему предложению. Соответствующий набор параметров позволяет либо «Уточнить» предыдущий результат (в этом случае в итоговый результат включаются документы, удовлетворяющие вновь построенному предложению запроса и присутствующие в предыдущей выдаче), либо «Добавить» новый результат к предыдущему (в итоговый результат включаются как ранее найденные документы, так и документы, удовлетворяющие новому условию).
8.1.2. Конструктор запроса «по шагам»
Конструктор запросов «по шагам» реализует технологию последовательного построения предложения запроса.
Предложение может включать логически связанные условия поиска, относящиеся к разным полям документа. В этом режиме запрос формируется либо последовательным добавлением в конец текущего условия терминов из поискового словаря, уточняя, расширяя или ограничивая значение предыдущего термина или ранее подготовленной части условия в целом, либо последовательным добавлением в предложение запроса нового условия поиска.
Интерфейсные средства конструктора представлены формой
«Запрос» и двумя диалоговыми окнами: «Конструктор запроса для области поиска» и «Область поиска».
Форма «Запрос» (рис. *.5) предназначена для просмотра словаря и включает область словаря, область предложения запроса и панель инструментов.
Форма «Запрос» представляет собой интерактивное средство, позволяющее:
-просматривать частотные словари базы данных;
-просматривать документы базы данных, содержащие выделенный
вокне просмотра словаря термин;
-отбирать термины словаря в предложение запроса;
-редактировать термины перед добавлением в предложение
запроса.
При подготовке поискового предложения в форме «Запрос» инициированием соответствующей закладки в верхней части формы выбирается область поиска (в данном случае это может быть только отдельное поисковое поле), после чего из словаря этого поля в предложение запроса включаются выбранные дескрипторы (термины словаря, которые могут быть предварительно отредактированы).
Рис. 8.3. Конструктор запроса «по шагам» - добавление термина
Каждый дескриптор включается в запрос путем связывания его с предыдущим термином логическим или контекстным оператором в соответствии с возможностями, определяемыми диалогом
«Конструктор запроса для области поиска» (рис. 8.3).
Для включения в запрос дополнительного условия поиска инициируется диалог «Область поиска» для определения логической связи с ранее подготовленной частью предложения запроса (рис.8.4).
Например, в режиме Конструктора «по шагам» может быть сформировано следующее предложение запроса:
(ALL : ((ПРИВАТИЗАЦИЯ) и ТРАНСПОРТ)) и KD : (СТАТЬЯ)
Такой способ построения запроса характеризуют фиксированная расстановка скобок в логической формуле и, соответственно, зафиксированный порядок выполнения операций.
Семантика окна «Конструктор запроса для области поиска»
следующая:
-Добавить: включение выбранного дескриптора в запрос при помощи оператора OR.
-Уточнить: включение выбранного дескриптора в запрос при помощи оператора AND.
-Исключить: включение выбранного дескриптора в запрос при помощи оператора NOT.
-Словосочетание: включение выбранного дескриптора в запрос при помощи оператора CTX.
-Предложение: включение выбранного дескриптора в запрос при помощи оператора SENT.
-С выражением: позволяет указать порядок связывания включаемого термина с ранее сформированным выражением, т.е. в скобки заключается все ранее сформированное выражение условия.
-С последним словом выражения: позволяет изменить приоритет выполнения операций, заключив в скобки последний и текущий дескрипторы выражения условия.
Рис. 8.4. Конструктор запроса «по шагам» - добавление условия поиска
8.1.3. Конструктор запроса «Логическое выражение»
Конструктор запроса «Логическое выражение» ориентирован на профессионального пользователя, знакомого с синтаксисом и семантикой булевоподобных выражений.
Конструктор представлен формами «Запрос» и «Параметры поиска».
Форма «Запрос» предназначена для просмотра словаря и редактирования поискового предложения запроса. Форма включает область словаря, область редактирования предложения запроса и панель инструментов и функционально отличается от формы «Запрос» конструктора «по шагам», во-первых, использованием механизма «выбора и вставки» имен полей и поисковых терминов по положению текстового курсора, и во-вторых – возможностью редактировать поисковое условие в области предложения запроса (рис. 8.5).
Рис. 8.5. Формирование логического выражения запроса
Кроме того, конструктор позволяет устанавливать дополнительные параметры поиска, используя форму «Параметры поиска».
Семантика формы «Параметры поиска» представлена списком параметров, управляющих процессом поиска в режиме логического выражения. Такими параметрами являются: «Тип поиска», «Доопределение выражения» и «Ограничение выдачи».
Параметр «Тип поиска» может принимать одно из трех значений:
-Стандартный поиск – означает, что проводится поиск по сформулированному в окне формирования запроса логическому выражению (реализуется модель механизма поиска по логическому выражению).
-Нечеткий поиск – означает, что скобки в предложении запроса игнорируются, а логические или контекстные операторы заменяются оператором OR (ИЛИ) (т.е. будут отобраны документы, содержащие хотя бы один из терминов предложения запроса в заданной области поиска). При этом множество документов результата делится на кластеры в зависимости от количества содержащихся в них терминов, соответствующих дескрипторам запроса, а результирующая выдача сортируется в порядке убывания номера кластера (реализуется модель механизма поиска по совпадению терминов).
-Только термины запроса – означает, что в результате поиска по булевоподобному выражению будут отобраны документы, содержащие
вуказанных полях только термины, заданные в предложении запроса.
Параметр «Доопределение выражения» позволяет:
-Установить (или отменить) режим поиска с автомаскированием, т.е. с применением при поиске встроенных процедур нормализации дескрипторов запроса. В главе 5 представлены правила применения нормализации при формулировке поискового запроса.
-Задать логическое выражение (или одно имя поля) для области поиска по умолчанию. Область поиска по умолчанию применяется в предложении запроса к терминам, для которых не задано выражение для области поиска.
Параметр «Ограничение выдачи» позволяет установить (или отменить) режим поиска, при котором по предложению запроса отбираются только новые документы, т.е. документы, которые не были включены либо ни в одну выдачу в рамках текущего запроса, либо в выдачу по последнему предложению запроса.