- •Информационные системы
- •ВВЕДЕНИЕ
- •1. Информация. Основные свойства и определения
- •1.1. Информация как основной предмет информатики
- •1.2. Соотношение понятий «информация», «данные», «знания»
- •1.2.1. Информация
- •1.2.2. Данные
- •1.2.3. Знания
- •1.3. Свойства информации
- •1.3.1. Кумулятивность информации
- •1.3.2. Концентрация информации
- •1.3.3. Эмерджентность и неассоциативность информации
- •1.3.4. Стaрение информации
- •1.3.5. Межотраслевые свойства и рассеяние информации
- •1.4. Информационные единицы
- •Контрольные вопросы
- •2. Информационные системы и технологии обработки информации
- •2.1. Состав и структура информационной системы
- •2.1.1. Классификация информационных систем
- •2.1.2. Основные компоненты ИС
- •2.2. Информационные компоненты в системах управления
- •2.2.2. Информация в системах обработки и генерации знания
- •2.3. Информационные технологии
- •2.4. О реализации процесса поиска информации
- •Контрольные вопросы
- •3. Модели и структуры данных информационных систем
- •3.1. Семантика ИС, основанных на концепции баз данных
- •3.2. Идентификация и поиск информации
- •3.3. Представление предметной области и модели данных
- •3.4. Структура информации и структура данных
- •3.6.1. Преобразование представлений
- •Контрольные вопросы
- •4. Модели поиска и оценки эффективности
- •4.1. Оценка экономической и технической эффективности
- •4.1.1. Экономическая эффективность
- •4.1.2. Техническая эффективность
- •4.2. Математические модели оценки технической эффективности
- •4.3.2. Модель механизма поиска по совпадению терминов
- •4.3.3. Модель механизма поиска по логическому выражению
- •4.3.4.1. Модель механизма поиска документов-аналогов
- •4.3.4.2. Модель механизма эвристического поиска
- •4.5. Информационно-поисковый язык документальной ИПС
- •4.5.1. Предложение запроса
- •4.5.2. Условие поиска
- •4.5.3. Синтаксис и семантика использования дескрипторов
- •4.5.4. Использование ранее полученных результатов поиска
- •5. Лингвистическое обеспечение ИС
- •5.2. Состав и структура лингвистического обеспечения
- •Линейные
- •5.3. Классификации
- •5.3.1. Библиотечно-библиографические классификации
- •5.3.1.2. Алфавитно-предметные классификации
- •5.3.1.3. Фасетные классификации
- •5.3.2. Классификации изобретений
- •5.3.3. Отраслевые классификационные системы
- •5.4.1. Координатное индексирование
- •5.4.2. Семантическая сила дескрипторных ИПЯ
- •5.5.1. Линейные терминологические структуры
- •Рубрика
- •Слов
- •5.5.2. Иерархические терминологические структуры
- •6. Поисковые задачи и технологии информационного поиска
- •6.2. Поисковые задачи и виды информационного поиска
- •6.2.1. Типология поисковых задач
- •6.2.2. Типология информационных потребностей
- •7.3. Технология поиска и интерфейс АИПС
- •7.3.1. Творческий процесс и стереотипы мышления
- •7.3.2. Интерфейс пользователя
- •Таблица 7.1.
- •7.4.3. Типология и стереотипы поведения пользователей
- •7.5.1.1. Стратегия поиска и классификация АИПС
- •7.5.1.2. Методы поиска
- •7.5.3. Поисковые интерфейсы
- •7.5.3.1. Организация интерфейсных объектов
- •7.5.3.2. Роль системы в процессе взаимодействия
- •8. Интерфейсные средства информационного поиска
- •8.1.1. Формирование запроса «по образцу»
- •8.1.2. Конструктор запроса «по шагам»
- •8.1.3. Конструктор запроса «Логическое выражение»
- •8.1.4. Использование формулировок ранее сохраненных запросов
- •8.2.1. Поиск аналогов
- •8.2.2. Эвристический поиск
- •8.2.3. Поиск по обратной связи
- •8.3. Технологические объекты построения предложения запроса
- •8.3.1. Частотный словарь
- •8.3.2. Тематический рубрикатор
- •8.3.3. Тезаурус
- •8.3.4. Иерархический словник
- •Список сокращений
- •ЕЯ – естественный язык.
- •ИС – информационная система.
- •ТСС – тематико-статистический спектр множества документов.
- •Литература
- •Глоссарий
- •Приложения
8. Интерфейсные средства информационного поиска
Как отмечалось в главе 6, функционирование современных ИПС основывается на двух предположениях: 1) документы, необходимые пользователю, объединены наличием некоторых характеристических признаков; 2) пользователь способен указать эти признаки. Оба эти предположения на практике редко выполняются и можно говорить только о вероятности их выполнения. Поэтому, процесс поиска информации обычно представляет собой последовательность шагов пользователя, который, обращаясь к различным интерфейсным объектам, так или, иначе - формирует поисковый запрос, более или менее адекватно отражающий эти характеристические признаки.
С точки зрения «интеллектуальности» средств поиска и в зависимости от характера информации (и возможностей разработчика) в основу конкретной, соответственно, более или менее сложной АИПС может быть положена одна из следующих технологий поиска: литеральный поиск – поиск подстроки, происходящий без привлечения знаний о лексической, грамматической и семантической структуре обрабатываемого материала; поиск, в ходе которого используется лексико-грамматическая информация, то есть привлекаются лингвистические словари, программы морфологического анализа текста; семантический поиск, осуществляющийся на основании знания об отношениях между понятиями предметной области, выраженными средствами естественного языка.
В последнем случае носителями такого рода информации, в частности, являются тезаурусы, уже более трех десятилетий использующиеся для информационного поиска. Кроме того, огромную роль в организации диалога между пользователем и информационнопоисковой системой играют хотя и менее сложные, но разнообразные словарные структуры. Используя их, пользователь может развивать поиск, модифицируя запрос (выражение его информационной потребности) согласно особенностям представления объекта поиска средствами конкретной ИПС и базы данных.
Некоторые решения интерфейсных средств представления запросов будут рассмотрены ниже на примере АИС IRBIS.
8.1. Средстваформированиязапросов
Поисковые механизмы построены на основе ИПЯ, однако технология и средства формирования запроса, предоставляемые пользователю в виде поисковых интерфейсов, не должны требовать от него обязательного знания и навыков построения выражений алгебраического вида.
Поисковые интерфейсные средства условно можно разделить на два класса. Первый класс (сценарии типа «укажи и выбери») - это конструкторы запросов, которые позволяют, используя термины поисковых словарей или других поисковых структур (тезаурусов, рубрикаторов, словников), в режиме диалога построить выражение той или иной сложности, которое на следующем шаге (выполнения поиска) даст результат.
Второй класс – это средства, реализующие простейший сценарий типа «укажи и получи». В этом случае пользователь выделяет в отображаемом объекте (документе или множестве документов) значимые с его точки зрения элементы (термины в документе или словаре; документы в выборке или протоколе) и, используя механизмы поиска по сходству (поиск аналогов, эвристический поиск, поиск с использованием обратной связи), получает выдачу, минуя этап составления поискового выражения.
В основу формирования поискового запроса по технологии «укажи и выбери» в системе положено три различных подхода к построению выражений запросов разной степени сложности (ориентированных на разные степени подготовленности пользователя):
-Конструктор запроса «по образцу» реализует традиционный для библиографического поиска форматно-ориентированный интерфейс. Имеет жестко фиксированную модель поискового условия, предполагающую обязательное выполнение частных условий, относимых к полям, выбираемым из предопределенных списков. Причем, по умолчанию предполагается, что отдельное условие - это список терминов (синонимов), обычно выбираемых из словаря и обозначающих одно и тоже понятие.
-Конструктор формирования запроса «по шагам»
характеризуется большей гибкостью. Здесь поисковые термины также выбираются из словаря, но могут связываться любыми отношениями. Причем, построенные таким образом лексические выражения, относимые к отдельным полям, в свою очередь могут связываться операторами, выбираемыми из списка. Такой конструктор позволяет формировать достаточно сложные предложения запроса последовательным наращиванием либо выражения условия (путем добавления очередного термина), либо всего предложения (путем добавления нового условия поиска). Необходимо отметить, что сложные
предложения запроса требуют достаточно хорошей предварительной структуризации.
- Конструктор формирования логического выражения запроса путем непосредственного набора выражения запроса с возможностью обращения в произвольном порядке к словарям, спискам имен полей и т.д.
8.1.1. Формирование запроса «по образцу»
Режим поиска «по образцу» ориентирован на автоматизированное формирование достаточно простого логического выражения, объединяющего условия, относимые обычно к взаимно ограничивающим разнотипным полям документа.
Например, по условию:
PB:(М.) и KW:(SCIENTOMETRICS или БИБЛИОМЕТРИЯ) и
DT:(1999 или 2000)
будут найдены библиографические описания документов, опубликованных в Москве в 1999 или 2000 гг., поисковые образы которых содержат понятие «библиометрия».
Средства построения запроса в конструкторе следующие (рис.8.1):
-панель просмотра словаря текущего поискового поля;
-панель шаблона, представляющего для каждой поисковой области окно выбора поискового поля и окно поискового условия для этого поля;
-панель инструментов.
Рис. 8.1. Формирование запроса «по образцу» с использованием словаря
Формирование запроса начинается с выбора области поиска (имени поля) в одной из групп, представленных на панели шаблона. Список полей группы специфицируется текущей схемой БД.
Например, группа «Заглавия» может включать поля: «Осн. Заглавие [TI]», «Источник [SO]», «Место издания [PB]» и «Серия [SER]». Выбор поля вызывает отображение соответствующего словаря на панели просмотра словаря.
Любой термин или группу подряд выделенных курсором терминов в области отображения словаря средствами панели инструментов можно поместить в область поискового условия, создаваемого для этого поля. При этом, добавляемые термины автоматически связываются оператором ИЛИ, обеспечивая, таким образом, отбор документов из базы данных по условию присутствия в документе хотя бы одного из них.
Перед добавлением термина в запрос, его можно сначала отредактировать (включая добавление символов маскирования).
Для перехода к формированию логического выражения для другой области поиска необходимо активизировать комбинированный список другой группы имен полей и выбрать нужное поле (рис. 8.2).
Рис. 8.2. Выбор имени поля в бланке запроса