- •Информационные системы
- •ВВЕДЕНИЕ
- •1. Информация. Основные свойства и определения
- •1.1. Информация как основной предмет информатики
- •1.2. Соотношение понятий «информация», «данные», «знания»
- •1.2.1. Информация
- •1.2.2. Данные
- •1.2.3. Знания
- •1.3. Свойства информации
- •1.3.1. Кумулятивность информации
- •1.3.2. Концентрация информации
- •1.3.3. Эмерджентность и неассоциативность информации
- •1.3.4. Стaрение информации
- •1.3.5. Межотраслевые свойства и рассеяние информации
- •1.4. Информационные единицы
- •Контрольные вопросы
- •2. Информационные системы и технологии обработки информации
- •2.1. Состав и структура информационной системы
- •2.1.1. Классификация информационных систем
- •2.1.2. Основные компоненты ИС
- •2.2. Информационные компоненты в системах управления
- •2.2.2. Информация в системах обработки и генерации знания
- •2.3. Информационные технологии
- •2.4. О реализации процесса поиска информации
- •Контрольные вопросы
- •3. Модели и структуры данных информационных систем
- •3.1. Семантика ИС, основанных на концепции баз данных
- •3.2. Идентификация и поиск информации
- •3.3. Представление предметной области и модели данных
- •3.4. Структура информации и структура данных
- •3.6.1. Преобразование представлений
- •Контрольные вопросы
- •4. Модели поиска и оценки эффективности
- •4.1. Оценка экономической и технической эффективности
- •4.1.1. Экономическая эффективность
- •4.1.2. Техническая эффективность
- •4.2. Математические модели оценки технической эффективности
- •4.3.2. Модель механизма поиска по совпадению терминов
- •4.3.3. Модель механизма поиска по логическому выражению
- •4.3.4.1. Модель механизма поиска документов-аналогов
- •4.3.4.2. Модель механизма эвристического поиска
- •4.5. Информационно-поисковый язык документальной ИПС
- •4.5.1. Предложение запроса
- •4.5.2. Условие поиска
- •4.5.3. Синтаксис и семантика использования дескрипторов
- •4.5.4. Использование ранее полученных результатов поиска
- •5. Лингвистическое обеспечение ИС
- •5.2. Состав и структура лингвистического обеспечения
- •Линейные
- •5.3. Классификации
- •5.3.1. Библиотечно-библиографические классификации
- •5.3.1.2. Алфавитно-предметные классификации
- •5.3.1.3. Фасетные классификации
- •5.3.2. Классификации изобретений
- •5.3.3. Отраслевые классификационные системы
- •5.4.1. Координатное индексирование
- •5.4.2. Семантическая сила дескрипторных ИПЯ
- •5.5.1. Линейные терминологические структуры
- •Рубрика
- •Слов
- •5.5.2. Иерархические терминологические структуры
- •6. Поисковые задачи и технологии информационного поиска
- •6.2. Поисковые задачи и виды информационного поиска
- •6.2.1. Типология поисковых задач
- •6.2.2. Типология информационных потребностей
- •7.3. Технология поиска и интерфейс АИПС
- •7.3.1. Творческий процесс и стереотипы мышления
- •7.3.2. Интерфейс пользователя
- •Таблица 7.1.
- •7.4.3. Типология и стереотипы поведения пользователей
- •7.5.1.1. Стратегия поиска и классификация АИПС
- •7.5.1.2. Методы поиска
- •7.5.3. Поисковые интерфейсы
- •7.5.3.1. Организация интерфейсных объектов
- •7.5.3.2. Роль системы в процессе взаимодействия
- •8. Интерфейсные средства информационного поиска
- •8.1.1. Формирование запроса «по образцу»
- •8.1.2. Конструктор запроса «по шагам»
- •8.1.3. Конструктор запроса «Логическое выражение»
- •8.1.4. Использование формулировок ранее сохраненных запросов
- •8.2.1. Поиск аналогов
- •8.2.2. Эвристический поиск
- •8.2.3. Поиск по обратной связи
- •8.3. Технологические объекты построения предложения запроса
- •8.3.1. Частотный словарь
- •8.3.2. Тематический рубрикатор
- •8.3.3. Тезаурус
- •8.3.4. Иерархический словник
- •Список сокращений
- •ЕЯ – естественный язык.
- •ИС – информационная система.
- •ТСС – тематико-статистический спектр множества документов.
- •Литература
- •Глоссарий
- •Приложения
4. Модели поиска и оценки эффективности
Принятие решения о создании или вводе в эксплуатацию любой конкретной системы зависит не только от ответа на вопрос, способна ли она функционально обеспечить все поставленные перед ней задачи, но и от того, насколько эффективно она будет работать. При этом принято различать экономическую и техническую (операционную) эффективность.
Экономическая эффективность системы определяется денежными (или иногда – временными) затратами, необходимыми для выполнения данного набора задач.
Техническая эффективность информационной системы определяется ее способностью обеспечить потребителям требуемый уровень информационного обслуживания.
При комплексной оценке системы должны рассматриваться оба критерия, т.к. жизнеспособность системы в равной степени зависит и от качества выполнения тех или иных операций, и от стоимости их выполнения.
4.1. Оценка экономической и технической эффективности
По сравнению со средствами анализа технической (операционной) эффективности средства анализа экономической эффективности не так хорошо развиты. Это во многом объясняется тем, что получение точных данных о преимуществах усовершенствованных информационных служб в большинстве случаев невозможно. Кроме того, при определении затрат на информационные системы почти неизбежно сталкиваются с несравнимыми ситуациями, так как различия в затратах между такими системами, как автоматизированная и традиционная, не обязательно точно отражают значение каждой из систем. Автоматизированная система может, например, использоваться помимо задач информационного поиска и для решения других задач, или она может в отличие от традиционной системы функционировать 24 часа в сутки. Таким образом, в оценке экономической эффективности используется большое количество скрытых факторов, которые могут мешать конкретному анализу и привести к ненадежным или бессмысленным результатам.
И тем не менее вопрос анализа затрат необходимо рассматривать, так как маловероятно, чтобы информационные системы разрабатывались или внедрялись без каких-либо попыток оценить их потенциальную экономическую эффективность.
96
4.1.1. Экономическая эффективность
Принято различать анализ экономической эффективности затрат
ианализ соотношения затраты-выигрыш. В первом случае требуется найти самые недорогие методы выполнения заданного набора операций или получить максимальные результаты при данных затратах. Во втором случае требуется систематическое сравнение стоимости выполнения отдельных операций и выигрыша, получаемого в результате их выполнения.
Встоимость системы обычно включаются первоначальные затраты, необходимые на разработку, испытания и оценку; операционные затраты, которые являются переменными и зависят от решаемых задач, участвующего персонала и количества требуемого оборудования; и, наконец, фиксированные затраты на аренду, налоги
идругие стандартные расходы. Выигрыш, получаемый от усовершенствованной информационной системы, может быть связан либо с уменьшением затрат, либо с увеличением экономической эффективности, но чаще всего при замене ручных операций автоматизированными снижение затрат трудно документировать. Преимущества сложных информационных систем могут тогда состоять в улучшении возможности принимать решения, увеличении экономической эффективности, стимулировании исследовательских возможностей и тому подобном, причем значение всех этих факторов обычно невозможно точно учесть. Анализ эффективности затрат должен основываться на следующих положениях:
1.Должны быть четко определены цели системы.
2.Для достижения целей должны быть предусмотрены альтернативы.
3.Должна быть определена стоимость реализации альтернатив.
4.Должна быть создана модель, связывающая стоимость реализации альтернатив с целями, которые должны быть достигнуты.
5.Необходимо провести ранжирование альтернатив путем оценки для каждого случая затрат и ожидаемой эффективности.
Для случая информационного поиска, когда задан объем работы (количество документов, объем и стоимость документов, среднее число запросов и т. д.), основные альтернативы и выбор вариантов относятся к операциям индексирования и ввода документов, а также к процессам поиска и вывода информации.
Вообще говоря, любой критерий качества, например данный уровень точности, может достигаться многими различными способами, каждый из которых требует своего уровня затрат: так, точность можно повысить использованием высокоспецифичного языка индексирования, при этом необходима высокая квалификация индексаторов и большие затраты на индексирование; или же индексирование может
97
проводиться менее тщательно, но результаты до передачи их потребителям должны просматриваться опытными экспертами, снижая тем самым стоимость индексирования, но увеличивая время поиска; и, наконец, можно переложить бремя на пользователей, предоставив им возможность самим вести поиск, уточняя формулировки запросов в надежде получить лучшие результаты.
Во многих случаях имеется возможность получить количественную информацию, связывающую различные системные альтернативы с эффективностью или качеством результатов, выдаваемых системой. В качестве примеров можно привести следующие зависимости:
-Зависимость между охватом массива и ожидаемым количеством выдач: значительный процент всех выдач приходится на очень небольшую долю документов массива, поэтому стоимость добавления к массиву большого числа менее продуктивных документов трудно оправдать с точки зрения улучшения результатов работы системы.
-Зависимость между временем индексирования и эффективностью поиска. Существует прямая связь между временем и полнотой индексирования и соответствующей ожидаемой полнотой поиска; к сожалению, при больших значениях полноты поиска потребляемые ресурсы для индексирования увеличиваются намного быстрее, чем полнота поиска, поэтому когда время или полнота индексирования превышают некоторый предел, вступает в действие закон уменьшающейся отдачи.
-Специфичность языка индексирования и баланс между полнотой и точностью. Обычно создание более специфичного языка индексирования обходится дороже и он дает более высокую точность, но он же может быть причиной ухудшения полноты; очевидно, что желаемый уровень точности и, следовательно, значение специфичности языка зависят от размера массива. При этом для очень больших массивов высокая точность является определяющей.
-Зависимость сложности средств автоматизации от ограничений в процессе обработки. Вообще говоря, разнообразные средства обработки позволяют обеспечить больший выбор выходных продуктов, например, упорядоченную выдачу документов. Однако более сложные средства обработки дороже по стоимости и по эксплуатации.
Даже если различные альтернативы можно надежно оценить количественно, может оказаться трудным принять оперативное решение, так как большие фиксированные затраты, связанные с реализацией, бывает нелегко возместить путем введения оплаты за предоставляемые услуги. До тех пор, пока не будет достигнуто согласие о ценности и выигрыше, которые дают информационные системы,
98
анализ затрат не дает полного ответа, требуемого для принятия решений.
99