Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Голицына Информационные системы 2004.pdf
Скачиваний:
323
Добавлен:
16.08.2013
Размер:
5.01 Mб
Скачать

Эти объекты, являясь технологически вспомогательными, используются на разных этапах поиска и обеспечивают возможность более или менее адекватного выражения информационной потребности пользователя. При этом для отражения индивидуальных особенностей ИПП, они, как интерфейсные объекты, не могут быть эффективно использованы, поскольку, в следствие усредненной природы, представляют ПрО в целом.

Для этого на промежуточном интерфейсном уровне можно использовать иерархически организованные структуры, отражающие пользовательское видение системы понятий предметной области. Причем, каждый такой объект представляет как общепринятое, так и индивидуальное видение ПрО. Интегральность такого представления достигается за счет того, что оно реализуется объектами как уровня ресурсов (подборками документов, ссылками на ассоциированные ресурсы и т.д.), так и уровня терминологии (тезаурусами, рубрикаторами, словниками)

При таком подходе информационная система может помимо стандартных и расширенных поисковых возможностей иметь средства систематизации информационных массивов, формирования и развития компонентов лингвистического обеспечения, а также оценки и анализа результатов поиска. Такими средствами, ориентирующими пользователя в предметной области в части терминологии, могут быть:

-автоматическое формирование наборов терминов для расширения

запроса;

-терминологические таблицы, организованные в виде семантических сетей, каждому узлу в которых сопоставлен некоторый набор документов;

-средства автоматизированного ведения пользовательских минитезаурусов и тематических рубрикаторов и др.

7.5.3.2. Роль системы в процессе взаимодействия

Сложность разработки представления интерфейсных инструментов в целом заключается в том, что неизвестно, каким образом пользователи будут воспринимать объекты, систематизированные и сгруппированные разработчиком в соответствии с его, разработчиком, пониманием. Основой для прогнозирования возможных реакций и действий пользователя является выявление типичности поведения пользователей.

Процесс взаимодействия можно рассматривать на трех уровнях: глобальном, тематическом и отдельного шага58.

Глобальная структура процесса взаимодействия зависит от цели ОД, состояния предметной области и будет определять стратегию поиска. Тематическая структура зависит от характера отдельных задач,

58 В контексте ОД этому соответствуют следующие этапы: определение цели, выделение задач и подзадач, решение задач.

их проработанности, политематичности и будет определять характер навигации – последовательности выполнения отдельных поисков информации по различным направлениям. Структура шага соответствует отдельной технологии нахождения документов по отдельному запросу и будет определяться набором средств, доступных пользователю (их наличием в интерфейсе, а также готовностью пользователя к их применению) .

Развитые АИС могут иметь несколько интерфейсных решений. Применительно к случаю категорий пользователей можно рассматривать:

1)интерфейс конечного пользователя, обеспечивающий выбор объектов и методов из предлагаемого (чаще всего фиксированного) набора;

2)интерфейс системного администратора, обеспечивающий не только расширенный набор средств, но и позволяющий изменять или создавать новые интерфейсные объекты или сценарии.

По типу диалога (в зависимости от степени активности сторон) можно выделить три уровня системной активности:

1)диалог в режиме “запрос-ответ”, когда в ответ на запрос (объект единственного типа) система формирует ответ, включающий объекты, возможно, другого, но также единственного типа;

2)режим информационно-советующих систем, когда помимо прямого ответа на запрос система формирует или обеспечивает доступ к справочной или оценочной информации;

3)режим симметричного (равноправного) диалога, т.е. с активной ролью системы.

При этом активность системы по отношению к пользователю может реализовываться различными путями:

непосредственным вмешательством в процесс через изменение параметров процедур, например, изменением порога выдачи или сценария поиска;

построением прямых или косвенных оценок параметров выдачи (показателей эффективности поиска);

генерацией технологических объектов, являющихся дополнительными или альтернативными по отношению к тем, которые получены пользователем (например, построение словников при реформулировании запроса по обратной связи).

Это позволяет компенсировать односторонность представления пользователя о способе выражения (обозначения) предмета поиска и таким образом уйти от ситуации конкурирования (за “наилучший” запрос) различных способов выражения запроса к состоянию целенаправленного сочетания альтернатив.

Особенностью поисковых моделей человеко-машинного взаимодействия является различие принципов (основания) «системности». АИПС – кибернетическая система, целенаправленно созданная и имеющая детерминированную структуру, причем ее поведение (динамика) оценивается с точки зрения устойчивости. Субъект поиска (система потребления информации) - саморазвивающаяся, синергетическая система, самоорганизация которой основана на противоречии, и часто приводит к структурной реорганизации, а целостность определяется свойствами, не сводящимися к сумме свойств составляющих ее элементов. Эта особенность определяет различие в уровне требований к адаптивным возможностям взаимодействующих систем и организации диалога. Профессиональному пользователю система должна предоставить набор средств, обеспечивающий адаптацию через настройку (целенаправленный выбор конфигурации и параметров самим пользователем). В других случаях система должна предлагать набор типовых стратегий и технологий поиска, выбор которых может производиться как пользователем, так и системой на основании диагностики поведения пользователя.

Таким образом, интерфейсные решения определяются:

размерностью пространства отображения (одномерного - строка, двумерного - рабочий стол экрана, многомерного, использующего псевдотрехмерные изображения, цветовые и фоновые выделения);

реактивностью системы, зависящей от средств обмена между терминалом пользователя и процессором, реализующим функции системы (режим удаленного терминала, полный диалог в режиме реального времени, режим пакетного обмена).

Роль системы на основных этапах поиска представлены в таблице

7.3.

Таблица 7.3.

 

 

Этап поиска

 

 

 

Роль

 

 

 

 

 

 

 

 

 

 

 

системы

 

 

Определение

(локализация

и

Обеспечение

 

 

 

 

формализация) темы запроса и

метаинформирования

 

о

идентификация ресурса

 

 

тематике,

 

наполнении,

 

 

 

 

 

 

 

структуре и методах доступа

 

 

 

 

 

 

 

к выбранному ресурсу

 

 

Формирование, а также структурное и

Предоставление

 

 

 

лексическое

 

 

адаптирование

вспомогательных

 

 

 

выражения запроса

 

 

 

 

информационных

объектов

 

 

 

 

 

 

 

(словарей,

 

 

тезаурусов,

 

 

 

 

 

 

 

шаблонов и т.д.)

 

 

 

Отбор документов по критерию, по

Предоставление

 

выбора

возможности

адекватному степени

механизма

 

поиска

или,

неопределенности

информационной

например,

 

автоматическое

потребности

 

 

 

 

 

расширение лексики запроса

Формирование и управление выдачей

Обеспечение

 

 

 

 

найденных документов

 

 

 

масштабирования

 

 

 

 

 

 

 

 

 

 

(форматирования)

 

 

 

 

 

 

 

 

 

 

пространства

представления

 

 

 

 

 

 

 

выданных

 

документов,

а

 

 

 

 

 

 

 

также

сортировки

 

и,

 

 

 

 

 

 

 

возможно,

ранжирования

по

 

 

 

 

 

 

 

некоторому

формальному

 

 

 

 

 

 

 

критерию соответствия

 

Оценка результатов поиска с точки

Количественная

 

оценка

зрения

полноты

 

удовлетворения

динамики

 

выдач

 

и

информационной потребности (т.е.

обеспечение

возможности

завершение поискового процесса) или

выборочного

обращения

к

их соответствия цели поиска и степени

результатам отдельных этапов

освоения информационного ресурса по

процесса поиска

 

 

 

теме запроса

 

 

 

 

 

 

 

 

 

 

 

Развитие

запроса

 

по

технологии

Адекватное

информирование

«реформулирования по обратной связи

о возможностях

развития

по релевантности» или использование

запроса и

средствах

оценки

других

 

ресурсов,

 

например,

результата

 

 

 

 

 

ассоциированных

 

баз

данных

 

 

 

 

 

 

вторичной

 

или

 

 

справочной

 

 

 

 

 

 

информации

 

 

 

 

 

 

 

 

 

 

 

Интерфейс системы, являясь той операционной средой, которая может обеспечить решение двойственной задачи (получение результата

и нахождение средств его получения), должен удовлетворять следующим требованиям:

1)Организация пространства по принципу однородности;

2)Предоставление информации для оценки результата;

3)Возможность отслеживания и изменения "траектории движения";

4)Возможность планирования «навигации» (подсказки к дальнейшим действиям);

5)Наличие информации для оценки степени завершенности процесса;

Соответственно, оптимизационная задача процесса поиска – при временных ограничениях максимизировать показатели выдачи и получить максимальную (субъективную) уверенность в качестве поиска, предоставляя пользователю в процессе диалога альтернативные направления, а также количественные и качественные оценки их соответствия запросу.

Обобщенная схема поиска, приведенная на рис. 7.6, представлена на примере АИПС IRBIS, которая имеет следующие основные интерфейсные блоки59:

-интерфейс формирования запроса,

-интерфейс поискового модуля,

-интерфейс обработки результата и развития поиска.

59 Примеры реализации интерфейсов подготовки и развития запроса приведены в гл. 8.

 

Диалоговые средства подготовки запроса

 

 

 

 

 

Запрос по

Запрос по

Запрос с

 

 

 

Запрос

образцу

шагам

редактирование

 

 

 

 

 

 

 

 

 

 

 

 

Статистически–значимые словосочетания

 

 

 

Просмотр

 

Статистически–значимые термины

 

 

 

 

словаря

 

 

 

 

 

 

Контекстно–значимые термины

 

 

 

Словарь

 

 

 

 

 

 

 

 

 

 

 

 

Словарь

 

Поиск по статистически – значимым терминам

 

 

Модификация выражения

 

 

 

 

 

 

Поиск по статистически – значимым терминам и словосочетаниям

 

 

 

 

Поиск по контекстно – значимым терминам

 

Корзина

 

Логическое выражение

Поиск

Реформулирование запроса по

 

 

запроса

 

 

 

 

 

 

 

 

 

 

обратной связи

 

 

 

 

Идентиф-ры

 

Просмотр

Документ

Индексы

 

 

результата

 

документов

 

Док-ты

 

 

 

 

маркирование

Поиск

 

 

 

 

 

аналогов

 

 

 

 

 

 

Темы

 

 

 

Построение

 

Эвристическ

 

 

 

Просмотр

й

Запросы

 

 

 

словника

 

 

Просмотр

поиск

 

 

 

 

словника

 

 

 

протокола

 

 

 

 

 

Протокол

 

 

маркирование

Контекстны

 

 

маркирование

Выделенные

поиск

 

 

 

 

 

 

 

 

 

результаты

 

 

Протокол

 

 

Рис. 7.6. Обобщенная технологическая схема поиска

Кластеры

 

 

 

терминов

Интерфейсы формирования запроса, особенно значимые при начальном входе в информационное пространство базы, подразделяются на «вербальные» и «кластерные».

Первые являются процедурно ориентированными средствами, обеспечивающими формирование на ИПЯ логического выражения той или иной сложности, что предполагает предварительную60 структуризацию на семантическом уровне и лексическую адаптацию запроса. Представленные в системе процедурные интерфейсы – конструкторы запроса «по образцу», «по шагам» и редактор запроса, являются типовыми решениями с различным уровнем дружественности61. Эта группа является практически полной с точки зрения степеней свободы выбора операционных объектов для случая спецификации запроса в виде обобщенного логического выражения. Характер ограничений на уровне компонентов составного выражения отбора (логической связки выражений для отдельных областей поиска) отражен в таблице 7.4.

Таблица 7.4

 

 

 

 

 

 

Конструктор

Конструктор

Редактор

Компоненты выражения

«по образцу»

«по шагам»

запроса

 

 

 

 

 

 

Фиксировано

Линейное

 

Скобочное

 

Ограничения на условие

шаблоном.

выражение

без

выражение

любой

Оператор

вложенности

 

сложности

 

поиска

 

 

фиксирован

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(обычно И)

 

 

 

 

 

 

 

 

 

 

Фиксировано

Выбор из списка

Скобочное

 

Область

 

 

Имя поля

или ограниченный

 

 

выражение

любой

 

 

 

 

выбор

 

 

сложности

 

поиска

 

 

 

 

 

 

 

 

 

Оператор

Нет или фиксирован

Выбор из списка

Любой

 

 

 

 

 

 

 

 

 

 

 

 

(обычно ИЛИ)

 

 

 

 

Оператор отбора

 

 

 

Фиксирован

Выбор из списка

Любой

 

 

 

 

 

 

Выра

 

Термин

или

Скобочное

 

 

 

 

 

 

Нет

предшествующее

выражение

любой

 

 

 

 

 

ж.

 

 

 

 

 

 

выражение

 

сложности

 

 

 

Операн

 

 

 

 

 

 

 

 

 

 

Скобочное

 

Операнд-

 

д

 

Терм

Выбор из списка

 

 

выражение

любой

значение

 

 

 

 

Выбор из списка

сложности

с

 

 

 

 

ин

или ввод

отбора

 

 

 

 

 

 

операторами

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

усечения

 

 

 

Оператор

 

фиксирован

Выбор из списка

Любой

 

 

 

 

 

 

 

(обычно ИЛИ) или

 

 

 

 

 

 

 

 

 

 

ввод

 

 

 

 

60Это противоречит практически и «идеологически» значимому требованию не заставлять человека обрабатывать вводимые данные вне системы [Коутс1990] и на практике приводит к низкой эффективности поиска.

61Здесь «дружественность» сводится исключительно к снижению уровня требований к подготовленности пользователя за счет снижения синтаксической сложности выражения.

Интерфейсы формирования запроса, основанные на «кластерных» методах, используют операционные объекты с разным уровнем отражения информационного содержания базы:

на «атомарном» уровне - это в основном инвертированные формы (словари, индексы) или документы БД, представляемые в физической последовательности;

на уровне тематическом - это структуризации с иерархической или линейной упорядоченностью через тематические рубрикации или типовые запросы;

на уровне частных запросов - это коллекции выражений запросов и сохраняемые запросы (выражения и соответствующие результаты поиска).

Интерфейс поискового модуля обеспечивает выбор и управление механизмом отбора документов по сформированному условию поиска, включая:

предобработку выражения: нормализацию или автоматическое усечение терминов, лексическое расширение выражения, связывание с предыдущими или уточняющими условиями;

выбор метода отбора (критерия смыслового соответствия) – булев или нечеткий поиск, определение порога выдачи;

постобработку результата – сортировку, ранжирование или кластеризацию найденных документов по содержанию или вычисляемым показателям.

Интерфейсные средства обработки результата и развития поиска использует два типа операционных объектов – отдельные документы и коллекции документов. Особенностью предложенной схемы является функциональное подобие интерфейсных блоков и то, что помимо функций обработки материала документов (печать, редактирование, сортировка, вывод в файл и т.д.), система предоставляет средства развития процесса поиска либо путем модификации выражения, либо путем реформулирования запроса по обратной связи по релевантности.

Модификация выражения запроса является методически достаточно простой операцией - выражение редактируется переносом в него статистически или контекстно значимых терминов из словников или документов.

Поиск путем реформулирования запроса на основе лексики документов, релевантность которых подтверждена пользователем, реализуется двумя типами поисковых технологий: непосредственным использованием лексики отдельного документа или на основе терминов, статистически взвешенных на множестве документов.

Приведенные кластерные технологии являются эвристическими в том смысле, что в результате процесса поиска формируется одна или несколько документальных областей, в той или иной степени соответствующих потребности пользователя. Принципиальным моментом является то, что система готовит альтернативы, обеспечивая тем самым упорядоченность и идентифицируемость направлений дальнейшего перебора. Сравнительная характеристика видов поиска, реализующих кластерные технологии, приведена в табл 7.5.

Таблица 7.5.

 

 

 

 

 

Лексическая

 

 

 

Специализированные

 

 

Стартовый

 

 

основа для

Механизм

 

Постобработка

 

 

объект

 

реформулировки

поиска

 

выдачи

 

интерфейсные

Вид поиска

 

 

средства управления

 

 

 

запроса

 

 

 

 

 

 

 

 

 

 

 

 

Поиск

по

Отдельный

 

Термины,

 

Булев поиск по

 

 

 

 

терминам,

 

просматриваемый

выделенные

 

всем текстовым

 

 

 

 

выделенным

в

документ

 

пользователем

полям

с

Нет

 

Нет

документе

 

 

 

 

 

 

автоматической

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

нормализацией

 

 

 

 

 

 

 

 

 

 

 

терминов

 

 

 

 

 

Поиск

 

Отдельный

 

Содержание

 

Нечеткий

 

Ранжирование

Диалоговая панель

«аналогов»

 

просматриваемый

просматриваемого

поиск:

по

по

«Поиск аналогов»

 

 

документ

 

документа

 

условию

 

суммарному

 

 

 

 

 

 

 

 

 

 

частичного

 

числу

 

 

 

 

 

 

 

 

 

 

вхождения

с

вхождений

 

 

 

 

 

 

 

 

 

 

указанным

 

поисковых

 

 

 

 

 

 

 

 

 

 

порогом

 

терминов

 

 

 

Эвристический

Множество

 

Термины

всех

Поиск

по

В

 

 

 

поиск

 

документов

 

поисковых

полей

статистически

соответствии с

 

 

 

 

 

предложения

 

из

документов,

наиболее

 

порядком

 

 

 

 

 

запроса

из

отмеченных

как

значимым

 

ранжирования

 

Нет

 

 

протокола

 

релевантные

 

кластерам

 

кластеров

 

 

 

 

 

 

 

 

 

 

 

 

 

(словника

не

терминов

из

 

 

 

 

 

 

 

 

предъявляемого

словника

 

 

 

 

 

 

 

 

 

пользователю)

 

 

 

 

 

 

Контекстный

Множество

 

Отмеченные

 

Поиск

по

В

1.

Словник;

поиск

 

документов

 

термины словника

кластерам

 

соответствии с

2.

Предложения

 

 

предложения

 

создаваемого

терминов

из

порядком

протокола,

 

 

 

запроса

из

системой из всех

словника,

 

ранжирования

содержащие

 

 

протокола

 

поисковых

полей

отмеченных

 

кластеров

результат

поиска по

 

 

 

 

документов,

 

как

 

 

каждому

кластеру

 

 

 

 

отмеченных

как

релевантные

 

 

терминов

 

 

 

 

 

релевантные

 

 

 

 

 

 

 

Контрольные вопросы

1.Перечислите типы информационной потребности пользователя

иопределите их связь уровнями информационных объектов.

2.Роль стереотипов в процессе организации и управления поиском.

3.Дайте сравнительную оценку характера деятельности человека

икомпьютерной системы.

4.Приведите основные процессы в уровневой модели взаимодействия пользователя и системы.

5.Дайте определение понятия «интерфейс пользователя».

6.Охарактеризуйте модели взаимодействия пользователя с АИПС

ибазой данных.

7.Охарактеризуйте влияние интерфейсных средств на адаптацию пользователя.

8.Приведите примеры диалоговых интерфейсных средств обучения пользователя работе с АИПС и базой данных.

9.Проведите сравнительный анализ вербальной и кластерной стратегий поиска.

10.Определите зависимость методов построения запроса и стратегий поиска.