Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Голицына Информационные системы 2004.pdf
Скачиваний:
323
Добавлен:
16.08.2013
Размер:
5.01 Mб
Скачать

8. Интерфейсные средства информационного поиска

Как отмечалось в главе 6, функционирование современных ИПС основывается на двух предположениях: 1) документы, необходимые пользователю, объединены наличием некоторых характеристических признаков; 2) пользователь способен указать эти признаки. Оба эти предположения на практике редко выполняются и можно говорить только о вероятности их выполнения. Поэтому, процесс поиска информации обычно представляет собой последовательность шагов пользователя, который, обращаясь к различным интерфейсным объектам, так или, иначе - формирует поисковый запрос, более или менее адекватно отражающий эти характеристические признаки.

С точки зрения «интеллектуальности» средств поиска и в зависимости от характера информации (и возможностей разработчика) в основу конкретной, соответственно, более или менее сложной АИПС может быть положена одна из следующих технологий поиска: литеральный поиск – поиск подстроки, происходящий без привлечения знаний о лексической, грамматической и семантической структуре обрабатываемого материала; поиск, в ходе которого используется лексико-грамматическая информация, то есть привлекаются лингвистические словари, программы морфологического анализа текста; семантический поиск, осуществляющийся на основании знания об отношениях между понятиями предметной области, выраженными средствами естественного языка.

В последнем случае носителями такого рода информации, в частности, являются тезаурусы, уже более трех десятилетий использующиеся для информационного поиска. Кроме того, огромную роль в организации диалога между пользователем и информационнопоисковой системой играют хотя и менее сложные, но разнообразные словарные структуры. Используя их, пользователь может развивать поиск, модифицируя запрос (выражение его информационной потребности) согласно особенностям представления объекта поиска средствами конкретной ИПС и базы данных.

Некоторые решения интерфейсных средств представления запросов будут рассмотрены ниже на примере АИС IRBIS.

8.1. Средстваформированиязапросов

Поисковые механизмы построены на основе ИПЯ, однако технология и средства формирования запроса, предоставляемые пользователю в виде поисковых интерфейсов, не должны требовать от него обязательного знания и навыков построения выражений алгебраического вида.

Поисковые интерфейсные средства условно можно разделить на два класса. Первый класс (сценарии типа «укажи и выбери») - это конструкторы запросов, которые позволяют, используя термины поисковых словарей или других поисковых структур (тезаурусов, рубрикаторов, словников), в режиме диалога построить выражение той или иной сложности, которое на следующем шаге (выполнения поиска) даст результат.

Второй класс – это средства, реализующие простейший сценарий типа «укажи и получи». В этом случае пользователь выделяет в отображаемом объекте (документе или множестве документов) значимые с его точки зрения элементы (термины в документе или словаре; документы в выборке или протоколе) и, используя механизмы поиска по сходству (поиск аналогов, эвристический поиск, поиск с использованием обратной связи), получает выдачу, минуя этап составления поискового выражения.

В основу формирования поискового запроса по технологии «укажи и выбери» в системе положено три различных подхода к построению выражений запросов разной степени сложности (ориентированных на разные степени подготовленности пользователя):

-Конструктор запроса «по образцу» реализует традиционный для библиографического поиска форматно-ориентированный интерфейс. Имеет жестко фиксированную модель поискового условия, предполагающую обязательное выполнение частных условий, относимых к полям, выбираемым из предопределенных списков. Причем, по умолчанию предполагается, что отдельное условие - это список терминов (синонимов), обычно выбираемых из словаря и обозначающих одно и тоже понятие.

-Конструктор формирования запроса «по шагам»

характеризуется большей гибкостью. Здесь поисковые термины также выбираются из словаря, но могут связываться любыми отношениями. Причем, построенные таким образом лексические выражения, относимые к отдельным полям, в свою очередь могут связываться операторами, выбираемыми из списка. Такой конструктор позволяет формировать достаточно сложные предложения запроса последовательным наращиванием либо выражения условия (путем добавления очередного термина), либо всего предложения (путем добавления нового условия поиска). Необходимо отметить, что сложные

предложения запроса требуют достаточно хорошей предварительной структуризации.

- Конструктор формирования логического выражения запроса путем непосредственного набора выражения запроса с возможностью обращения в произвольном порядке к словарям, спискам имен полей и т.д.

8.1.1. Формирование запроса «по образцу»

Режим поиска «по образцу» ориентирован на автоматизированное формирование достаточно простого логического выражения, объединяющего условия, относимые обычно к взаимно ограничивающим разнотипным полям документа.

Например, по условию:

PB:(М.) и KW:(SCIENTOMETRICS или БИБЛИОМЕТРИЯ) и

DT:(1999 или 2000)

будут найдены библиографические описания документов, опубликованных в Москве в 1999 или 2000 гг., поисковые образы которых содержат понятие «библиометрия».

Средства построения запроса в конструкторе следующие (рис.8.1):

-панель просмотра словаря текущего поискового поля;

-панель шаблона, представляющего для каждой поисковой области окно выбора поискового поля и окно поискового условия для этого поля;

-панель инструментов.

Рис. 8.1. Формирование запроса «по образцу» с использованием словаря

Формирование запроса начинается с выбора области поиска (имени поля) в одной из групп, представленных на панели шаблона. Список полей группы специфицируется текущей схемой БД.

Например, группа «Заглавия» может включать поля: «Осн. Заглавие [TI]», «Источник [SO]», «Место издания [PB]» и «Серия [SER]». Выбор поля вызывает отображение соответствующего словаря на панели просмотра словаря.

Любой термин или группу подряд выделенных курсором терминов в области отображения словаря средствами панели инструментов можно поместить в область поискового условия, создаваемого для этого поля. При этом, добавляемые термины автоматически связываются оператором ИЛИ, обеспечивая, таким образом, отбор документов из базы данных по условию присутствия в документе хотя бы одного из них.

Перед добавлением термина в запрос, его можно сначала отредактировать (включая добавление символов маскирования).

Для перехода к формированию логического выражения для другой области поиска необходимо активизировать комбинированный список другой группы имен полей и выбрать нужное поле (рис. 8.2).

Рис. 8.2. Выбор имени поля в бланке запроса