- •Информационные системы
- •ВВЕДЕНИЕ
- •1. Информация. Основные свойства и определения
- •1.1. Информация как основной предмет информатики
- •1.2. Соотношение понятий «информация», «данные», «знания»
- •1.2.1. Информация
- •1.2.2. Данные
- •1.2.3. Знания
- •1.3. Свойства информации
- •1.3.1. Кумулятивность информации
- •1.3.2. Концентрация информации
- •1.3.3. Эмерджентность и неассоциативность информации
- •1.3.4. Стaрение информации
- •1.3.5. Межотраслевые свойства и рассеяние информации
- •1.4. Информационные единицы
- •Контрольные вопросы
- •2. Информационные системы и технологии обработки информации
- •2.1. Состав и структура информационной системы
- •2.1.1. Классификация информационных систем
- •2.1.2. Основные компоненты ИС
- •2.2. Информационные компоненты в системах управления
- •2.2.2. Информация в системах обработки и генерации знания
- •2.3. Информационные технологии
- •2.4. О реализации процесса поиска информации
- •Контрольные вопросы
- •3. Модели и структуры данных информационных систем
- •3.1. Семантика ИС, основанных на концепции баз данных
- •3.2. Идентификация и поиск информации
- •3.3. Представление предметной области и модели данных
- •3.4. Структура информации и структура данных
- •3.6.1. Преобразование представлений
- •Контрольные вопросы
- •4. Модели поиска и оценки эффективности
- •4.1. Оценка экономической и технической эффективности
- •4.1.1. Экономическая эффективность
- •4.1.2. Техническая эффективность
- •4.2. Математические модели оценки технической эффективности
- •4.3.2. Модель механизма поиска по совпадению терминов
- •4.3.3. Модель механизма поиска по логическому выражению
- •4.3.4.1. Модель механизма поиска документов-аналогов
- •4.3.4.2. Модель механизма эвристического поиска
- •4.5. Информационно-поисковый язык документальной ИПС
- •4.5.1. Предложение запроса
- •4.5.2. Условие поиска
- •4.5.3. Синтаксис и семантика использования дескрипторов
- •4.5.4. Использование ранее полученных результатов поиска
- •5. Лингвистическое обеспечение ИС
- •5.2. Состав и структура лингвистического обеспечения
- •Линейные
- •5.3. Классификации
- •5.3.1. Библиотечно-библиографические классификации
- •5.3.1.2. Алфавитно-предметные классификации
- •5.3.1.3. Фасетные классификации
- •5.3.2. Классификации изобретений
- •5.3.3. Отраслевые классификационные системы
- •5.4.1. Координатное индексирование
- •5.4.2. Семантическая сила дескрипторных ИПЯ
- •5.5.1. Линейные терминологические структуры
- •Рубрика
- •Слов
- •5.5.2. Иерархические терминологические структуры
- •6. Поисковые задачи и технологии информационного поиска
- •6.2. Поисковые задачи и виды информационного поиска
- •6.2.1. Типология поисковых задач
- •6.2.2. Типология информационных потребностей
- •7.3. Технология поиска и интерфейс АИПС
- •7.3.1. Творческий процесс и стереотипы мышления
- •7.3.2. Интерфейс пользователя
- •Таблица 7.1.
- •7.4.3. Типология и стереотипы поведения пользователей
- •7.5.1.1. Стратегия поиска и классификация АИПС
- •7.5.1.2. Методы поиска
- •7.5.3. Поисковые интерфейсы
- •7.5.3.1. Организация интерфейсных объектов
- •7.5.3.2. Роль системы в процессе взаимодействия
- •8. Интерфейсные средства информационного поиска
- •8.1.1. Формирование запроса «по образцу»
- •8.1.2. Конструктор запроса «по шагам»
- •8.1.3. Конструктор запроса «Логическое выражение»
- •8.1.4. Использование формулировок ранее сохраненных запросов
- •8.2.1. Поиск аналогов
- •8.2.2. Эвристический поиск
- •8.2.3. Поиск по обратной связи
- •8.3. Технологические объекты построения предложения запроса
- •8.3.1. Частотный словарь
- •8.3.2. Тематический рубрикатор
- •8.3.3. Тезаурус
- •8.3.4. Иерархический словник
- •Список сокращений
- •ЕЯ – естественный язык.
- •ИС – информационная система.
- •ТСС – тематико-статистический спектр множества документов.
- •Литература
- •Глоссарий
- •Приложения
4.1.2.Техническая эффективность
Ввопросе исследования технической эффективности информационных систем можно различить две точки зрения. Первая — это точка зрения пользователей, вторая — точка зрения администраторов системы. Однако в любом случае рассматривается основная функция ИПС – выдача информации в ответ на поисковый запрос.
Вопросы эффективности, интересующие администраторов, очень близки к следующим вопросам пользователей:
- Удовлетворяет ли система основным требованиям пользователей?
- Каковы основные причины невыдачи релевантных документов? - Каковы основные причины выдачи нерелевантных
документов?
Кроме того, администраторов интересуют расходы и доходы системы (то же интересует и пользователей, когда им приходится платить за обслуживание).
Из многих возможных показателей оценки технической эффективности, интересующих пользователей, основными принято считать следующие шесть [Солтон1979]:
1.Полнота поиска, т. е. способность системы выдавать все релевантные документы.
2.Точность поиска, т. е. способность системы отфильтровывать все нерелевантные документы.
3.Усилия (интеллектуальные или физические), затрачиваемые пользователями на формулирование запросов и просмотр выдаваемой информации.
4.Время с момента поступления запроса в систему до выдачи
ответа.
5.Форма представления выдачи (что определяет дальнейшие возможности использования выданных материалов пользователями).
6.Полнота информационного массива в целом, т. е. степень охвата всех релевантных документов, которые могут быть интересны пользователям.
Упомянутые показатели оценки эффективности отражают и определяются эффективностью технических, лингвистических и организационных решений, заложенных в основу конкретной ИПС. Обобщенная схема взаимосвязи показателей эффективности и основных компонентов системы, как определяющих их факторов, приведена на рис. 4.1.
100
Показатели эффективности (за исключением полноты и точности) сравнительно легко измерить:
-затраты труда пользователей можно выразить через время, необходимое для формулирования запроса, диалога с системой и просмотра выданной системой информации;
-время реакции системы можно измерить непосредственно;
-форму представления выдачи можно оценить в процентном отношении к полному тексту.
Экономическая
эффективность
Стоимость ввода и |
Техническая |
Стоимость вывода |
индексирования |
эффективность |
|
Полнота и точность |
Точность |
Время поиска |
Полнота |
индексирования |
|
|
|
|
Механизм |
|
|
|
Механизм поиска |
|
|
|
Средства |
|
|
индексир-я |
|
|
|
|
|
|
|
вывода |
|
|
|
|
|
|
|
|
|
|
|
|
Язык индексирования |
|
Язык управления |
и поиска (ИПЯ) |
Информационный |
данными |
|
фонд |
|
Рис. 4.1. Взаимосвязь показателей эффективности и компонентов ИПС
Определенные трудности может представить оценка степени охвата релевантных поисковой потребности документов, т.к. чаще всего заранее неизвестно общее количество материалов, потенциально представляющих интерес в данной предметной области.
Вычисление же мер полноты и точности является наиболее трудным как принципиально, так и практически.
101