Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
22
Добавлен:
23.05.2017
Размер:
2.53 Mб
Скачать

сколько документальных областей, в той или иной степени соответствующих потребности пользователя. Принципиальным моментом является то, что система готовит альтернативы, обеспечивая тем самым упорядоченность и идентифицируемость направлений дальнейшего перебора. Сравнительная характеристика видов поиска, реализующих кластерные технологии, приведена в табл 7.5.

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 7.5.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Лексическая

 

 

 

 

 

 

Специализированные

 

 

Стартовый

основа для

Механизм по-

Постобработка

 

 

объект

 

реформули-

 

иска

 

 

выдачи

интерфейсные сред-

Вид поиска

 

 

 

 

 

ства управления

 

 

ровки запроса

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Поиск по тер-

Отдельный

Термины,

 

Булев поиск по

 

 

 

 

 

 

минам,

выде-

просматри-

выделенные

всем

тексто-

 

 

 

 

 

 

ленным

в до-

ваемый

до-

пользовате-

вым

полям с

 

Нет

 

Нет

кументе

 

кумент

 

лем

 

 

автоматиче-

 

 

 

 

 

 

 

 

 

ской

нормали-

 

 

 

 

 

 

 

 

 

 

 

 

 

зацией терми-

 

 

 

 

 

 

 

 

 

 

 

 

 

нов

 

 

 

 

 

 

 

 

Поиск «анало-

Отдельный

Содержание

Нечеткий

по-

Ранжирование

Диалоговая панель

гов»

 

просматри-

просматри-

иск: по усло-

по

суммарно-

«Поиск аналогов»

 

 

ваемый

до-

ваемого

до-

вию частично-

му числу вхо-

 

 

 

 

 

кумент

 

кумента

 

го вхождения с

ждений

поис-

 

 

 

 

 

 

 

 

 

 

указанным по-

ковых

терми-

 

 

 

 

 

 

 

 

 

 

рогом

 

нов

 

 

 

 

 

Эвристический

Множество

Термины всех

Поиск по

ста-

В

соответст-

 

 

 

поиск

 

документов

поисковых

 

тистически

вии

с

поряд-

 

 

 

 

 

предложения

полей из

до-

наиболее

зна-

ком

ранжиро-

 

 

 

 

 

запроса

из

кументов,

 

чимым класте-

вания

класте-

 

 

 

 

 

протокола

 

отмеченных

рам

терминов

ров

 

 

 

Нет

 

 

 

 

как

релевант-

из словника

 

 

 

 

 

 

 

 

ные

(словни-

 

 

 

 

 

 

 

 

 

 

 

 

 

ка не предъ-

 

 

 

 

 

 

 

 

 

 

 

 

 

являемого

 

 

 

 

 

 

 

 

 

 

 

 

 

 

пользовате-

 

 

 

 

 

 

 

 

 

 

 

 

 

лю)

 

 

 

 

 

 

 

 

 

 

 

Контекстный

Множество

Отмеченные

Поиск по кла-

В

соответст-

1.

Словник;

поиск

 

документов

термины

 

стерам терми-

вии

с

поряд-

2.

Предложения про-

 

 

предложения

словника соз-

нов из словни-

ком ранжиро-

токола, содержащие

 

 

запроса

из

даваемого

 

ка,

отмечен-

вания

класте-

результат

поиска по

 

 

протокола

 

системой

из

ных

как

реле-

ров

 

 

каждому

кластеру

 

 

 

 

всех

поиско-

вантные

 

 

 

 

терминов

 

 

 

 

 

вых

полей

 

 

 

 

 

 

 

 

 

 

 

 

 

документов,

 

 

 

 

 

 

 

 

 

 

 

 

 

отмеченных

 

 

 

 

 

 

 

 

 

 

 

 

 

как

релевант-

 

 

 

 

 

 

 

 

 

 

 

 

 

ные

 

 

 

 

 

 

 

 

 

 

 

Контрольные вопросы

1.Перечислите типы информационной потребности пользователя

иопределите их связь уровнями информационных объектов.

2.Роль стереотипов в процессе организации и управления поис-

ком.

3.Дайте сравнительную оценку характера деятельности человека

икомпьютерной системы.

4.Приведите основные процессы в уровневой модели взаимодействия пользователя и системы.

5.Дайте определение понятия «интерфейс пользователя».

6.Охарактеризуйте модели взаимодействия пользователя с АИПС

ибазой данных.

7.Охарактеризуйте влияние интерфейсных средств на адаптацию пользователя.

8.Приведите примеры диалоговых интерфейсных средств обучения пользователя работе с АИПС и базой данных.

9.Проведите сравнительный анализ вербальной и кластерной стратегий поиска.

10.Определите зависимость методов построения запроса и стратегий поиска.

8. Интерфейсные средства информационного поиска

Как отмечалось в главе 6, функционирование современных ИПС основывается на двух предположениях: 1) документы, необходимые пользователю, объединены наличием некоторых характеристических признаков; 2) пользователь способен указать эти признаки. Оба эти предположения на практике редко выполняются и можно говорить только о вероятности их выполнения. Поэтому, процесс поиска информации обычно представляет собой последовательность шагов пользователя, который, обращаясь к различным интерфейсным объектам, так или, иначе - формирует поисковый запрос, более или менее адекватно отражающий эти характеристические признаки.

С точки зрения «интеллектуальности» средств поиска и в зависимости от характера информации (и возможностей разработчика) в основу конкретной, соответственно, более или менее сложной АИПС может быть положена одна из следующих технологий поиска: литеральный поиск – поиск подстроки, происходящий без привлечения знаний о лексической, грамматической и семантической структуре обрабатываемого материала; поиск, в ходе которого используется лексико-грамматическая информация, то есть привлекаются лингвистические словари, программы морфологического анализа текста; семантический поиск, осуществляющийся на основании знания об отношениях между понятиями предметной области, выраженными средствами естественного языка.

В последнем случае носителями такого рода информации, в частности, являются тезаурусы, уже более трех десятилетий использующиеся для информационного поиска. Кроме того, огромную роль в организации диалога между пользователем и информационно-поисковой системой играют хотя и менее сложные, но разнообразные словарные структуры. Используя их, пользователь может развивать поиск, модифицируя запрос (выражение его информационной потребности) согласно особенностям представления объекта поиска средствами конкретной ИПС и базы данных.

Некоторые решения интерфейсных средств представления запросов будут рассмотрены ниже на примере АИС IRBIS.

8.1. Средстваформированиязапросов

Поисковые механизмы построены на основе ИПЯ, однако технология и средства формирования запроса, предоставляемые пользователю в виде поисковых интерфейсов, не должны требовать от него обязательного знания и навыков построения выражений алгебраического вида.

Поисковые интерфейсные средства условно можно разделить на два класса. Первый класс (сценарии типа «укажи и выбери») - это конструкторы запросов, которые позволяют, используя термины поисковых словарей или других поисковых структур (тезаурусов, рубрикаторов, словников), в режиме диалога построить выражение той или иной сложности, которое на следующем шаге (выполнения поиска) даст результат.

Второй класс – это средства, реализующие простейший сценарий типа «укажи и получи». В этом случае пользователь выделяет в отображаемом объекте (документе или множестве документов) значимые с его точки зрения элементы (термины в документе или словаре; документы в выборке или протоколе) и, используя механизмы поиска по сходству (поиск аналогов, эвристический поиск, поиск с использованием обратной связи), получает выдачу, минуя этап составления поискового выражения.

В основу формирования поискового запроса по технологии «укажи и выбери» в системе положено три различных подхода к построению выражений запросов разной степени сложности (ориентированных на разные степени подготовленности пользователя):

-Конструктор запроса «по образцу» реализует традиционный для библиографического поиска форматно-ориентированный интерфейс. Имеет жестко фиксированную модель поискового условия, предполагающую обязательное выполнение частных условий, относимых к полям, выбираемым из предопределенных списков. Причем, по умолчанию предполагается, что отдельное условие - это список терминов (синонимов), обычно выбираемых из словаря и обозначающих одно и тоже понятие.

-Конструктор формирования запроса «по шагам» характеризу-

ется большей гибкостью. Здесь поисковые термины также выбираются из словаря, но могут связываться любыми отношениями. Причем, построенные таким образом лексические выражения, относимые к отдельным полям, в свою очередь могут связываться операторами, выбираемыми из списка. Такой конструктор позволяет формировать достаточно сложные предложения запроса последовательным наращиванием либо выражения условия (путем добавления очередного термина), либо всего предложения (путем добавления нового условия поиска). Необходимо отметить, что сложные предложения запроса требуют достаточно хорошей предварительной структуризации.

- Конструктор формирования логического выражения запроса путем непосредственного набора выражения запроса с возможностью обращения в произвольном порядке к словарям, спискам имен полей и т.д.

8.1.1. Формирование запроса «по образцу»

Режим поиска «по образцу» ориентирован на автоматизированное формирование достаточно простого логического выражения, объединяющего условия, относимые обычно к взаимно ограничивающим разнотипным полям документа.

Например, по условию:

PB:(М.) и KW:(SCIENTOMETRICS или БИБЛИОМЕТРИЯ) и

DT:(1999 или 2000)

будут найдены библиографические описания документов, опубликованных в Москве в 1999 или 2000 гг., поисковые образы которых содержат понятие «библиометрия».

Средства построения запроса в конструкторе следующие (рис.8.1):

-панель просмотра словаря текущего поискового поля;

-панель шаблона, представляющего для каждой поисковой области окно выбора поискового поля и окно поискового условия для этого поля;

-панель инструментов.

Рис. 8.1. Формирование запроса «по образцу» с использованием словаря

Формирование запроса начинается с выбора области поиска (имени поля) в одной из групп, представленных на панели шаблона. Список полей группы специфицируется текущей схемой БД.

Например, группа «Заглавия» может включать поля: «Осн. Заглавие [TI]», «Источник [SO]», «Место издания [PB]» и «Серия [SER]». Выбор поля вызывает отображение соответствующего словаря на панели просмотра словаря.

Любой термин или группу подряд выделенных курсором терминов в области отображения словаря средствами панели инструментов можно поместить в область поискового условия, создаваемого для этого поля. При этом, добавляемые термины автоматически связываются оператором ИЛИ, обеспечивая, таким образом, отбор документов из базы данных по условию присутствия в документе хотя бы одного из них.

Перед добавлением термина в запрос, его можно сначала отредактировать (включая добавление символов маскирования).

Для перехода к формированию логического выражения для другой области поиска необходимо активизировать комбинированный список другой группы имен полей и выбрать нужное поле (рис. 8.2).

Рис. 8.2. Выбор имени поля в бланке запроса

Если в запросе заданы условия для нескольких поисковых областей, то (по правилам построения такого предложения запроса) соответствующие поисковые выражения всегда связываются оператором AND

(И), обеспечивая таким образом отбор документов из базы данных по принципу обязательного выполнения условий по всем специфицированным областям.

Поисковое условие для отдельного поля синтаксически представляет собой определенное ранее <Выражение условия> и может быть введено и отредактировано с помощью клавиатуры в выделенной области редактирования в соответствии со всеми возможностями ИПЯ, в том числе с использованием допустимых операций, символов маскирования и скобочных конструкций.

Для реализации технологии последовательного формирования поискового множества документов конструктор предусматривает возможность обязательного связывания результата поиска по сформированному предложению запроса с результатом поиска по предыдущему предложению. Соответствующий набор параметров позволяет либо «Уточнить» предыдущий результат (в этом случае в итоговый результат включаются документы, удовлетворяющие вновь построенному предложению запроса и присутствующие в предыдущей выдаче), либо «Добавить» новый результат к предыдущему (в итоговый результат включаются как ранее найденные документы, так и документы, удовлетворяющие новому условию).

8.1.2. Конструктор запроса «по шагам»

Конструктор запросов «по шагам» реализует технологию последовательного построения предложения запроса.

Предложение может включать логически связанные условия поиска, относящиеся к разным полям документа. В этом режиме запрос формируется либо последовательным добавлением в конец текущего условия терминов из поискового словаря, уточняя, расширяя или ограничивая значение предыдущего термина или ранее подготовленной части условия в целом, либо последовательным добавлением в предложение запроса нового условия поиска.

Интерфейсные средства конструктора представлены формой «За-

прос» и двумя диалоговыми окнами: «Конструктор запроса для области поиска» и «Область поиска».

Форма «Запрос» (рис. *.5) предназначена для просмотра словаря и включает область словаря, область предложения запроса и панель инструментов.

Форма «Запрос» представляет собой интерактивное средство, позволяющее:

-просматривать частотные словари базы данных;

-просматривать документы базы данных, содержащие выделенный

вокне просмотра словаря термин;

-отбирать термины словаря в предложение запроса;

-редактировать термины перед добавлением в предложение запро-

са.

При подготовке поискового предложения в форме «Запрос» инициированием соответствующей закладки в верхней части формы выбирается область поиска (в данном случае это может быть только отдельное поисковое поле), после чего из словаря этого поля в предложение запроса включаются выбранные дескрипторы (термины словаря, которые могут быть предварительно отредактированы).

Рис. 8.3. Конструктор запроса «по шагам» - добавление термина

Каждый дескриптор включается в запрос путем связывания его с предыдущим термином логическим или контекстным оператором в соответствии с возможностями, определяемыми диалогом «Конструктор запроса для области поиска» (рис. 8.3).

Для включения в запрос дополнительного условия поиска инициируется диалог «Область поиска» для определения логической связи с ранее подготовленной частью предложения запроса (рис.8.4).

Например, в режиме Конструктора «по шагам» может быть сформировано следующее предложение запроса:

(ALL : ((ПРИВАТИЗАЦИЯ) и ТРАНСПОРТ)) и KD : (СТАТЬЯ)

Такой способ построения запроса характеризуют фиксированная расстановка скобок в логической формуле и, соответственно, зафиксированный порядок выполнения операций.

Семантика окна «Конструктор запроса для области поиска» сле-

дующая:

-Добавить: включение выбранного дескриптора в запрос при помощи оператора OR.

-Уточнить: включение выбранного дескриптора в запрос при помощи оператора AND.

-Исключить: включение выбранного дескриптора в запрос при помощи оператора NOT.

-Словосочетание: включение выбранного дескриптора в запрос при помощи оператора CTX.

-Предложение: включение выбранного дескриптора в запрос при помощи оператора SENT.

-С выражением: позволяет указать порядок связывания включаемого термина с ранее сформированным выражением, т.е. в скобки заключается все ранее сформированное выражение условия.

-С последним словом выражения: позволяет изменить приоритет выполнения операций, заключив в скобки последний и текущий дескрипторы выражения условия.

Рис. 8.4. Конструктор запроса «по шагам» - добавление условия поиска

8.1.3. Конструктор запроса «Логическое выражение»

Конструктор запроса «Логическое выражение» ориентирован на профессионального пользователя, знакомого с синтаксисом и семантикой булевоподобных выражений.

Конструктор представлен формами «Запрос» и «Параметры поис-

ка».

Форма «Запрос» предназначена для просмотра словаря и редактирования поискового предложения запроса. Форма включает область словаря, область редактирования предложения запроса и панель инструментов и функционально отличается от формы «Запрос» конструктора «по шагам», во-первых, использованием механизма «выбора и вставки» имен полей и поисковых терминов по положению текстового курсора, и во-вторых – возможностью редактировать поисковое условие в области предложения запроса (рис. 8.5).

Рис. 8.5. Формирование логического выражения запроса

Кроме того, конструктор позволяет устанавливать дополнительные параметры поиска, используя форму «Параметры поиска».

Семантика формы «Параметры поиска» представлена списком параметров, управляющих процессом поиска в режиме логического выражения. Такими параметрами являются: «Тип поиска», «Доопределение выражения» и «Ограничение выдачи».