- •Информационные системы
- •ВВЕДЕНИЕ
- •1. Информация. Основные свойства и определения
- •1.1. Информация как основной предмет информатики
- •1.2. Соотношение понятий «информация», «данные», «знания»
- •1.2.1. Информация
- •1.2.2. Данные
- •1.2.3. Знания
- •1.3. Свойства информации
- •1.3.1. Кумулятивность информации
- •1.3.2. Концентрация информации
- •1.3.3. Эмерджентность и неассоциативность информации
- •1.3.4. Стaрение информации
- •1.3.5. Межотраслевые свойства и рассеяние информации
- •1.4. Информационные единицы
- •Контрольные вопросы
- •2. Информационные системы и технологии обработки информации
- •2.1. Состав и структура информационной системы
- •2.1.1. Классификация информационных систем
- •2.1.2. Основные компоненты ИС
- •2.2. Информационные компоненты в системах управления
- •2.2.2. Информация в системах обработки и генерации знания
- •2.3. Информационные технологии
- •2.4. О реализации процесса поиска информации
- •Контрольные вопросы
- •3. Модели и структуры данных информационных систем
- •3.1. Семантика ИС, основанных на концепции баз данных
- •3.2. Идентификация и поиск информации
- •3.3. Представление предметной области и модели данных
- •3.4. Структура информации и структура данных
- •3.6.1. Преобразование представлений
- •Контрольные вопросы
- •4. Модели поиска и оценки эффективности
- •4.1. Оценка экономической и технической эффективности
- •4.1.1. Экономическая эффективность
- •4.1.2. Техническая эффективность
- •4.2. Математические модели оценки технической эффективности
- •4.3.2. Модель механизма поиска по совпадению терминов
- •4.3.3. Модель механизма поиска по логическому выражению
- •4.3.4.1. Модель механизма поиска документов-аналогов
- •4.3.4.2. Модель механизма эвристического поиска
- •4.5. Информационно-поисковый язык документальной ИПС
- •4.5.1. Предложение запроса
- •4.5.2. Условие поиска
- •4.5.3. Синтаксис и семантика использования дескрипторов
- •4.5.4. Использование ранее полученных результатов поиска
- •5. Лингвистическое обеспечение ИС
- •5.2. Состав и структура лингвистического обеспечения
- •Линейные
- •5.3. Классификации
- •5.3.1. Библиотечно-библиографические классификации
- •5.3.1.2. Алфавитно-предметные классификации
- •5.3.1.3. Фасетные классификации
- •5.3.2. Классификации изобретений
- •5.3.3. Отраслевые классификационные системы
- •5.4.1. Координатное индексирование
- •5.4.2. Семантическая сила дескрипторных ИПЯ
- •5.5.1. Линейные терминологические структуры
- •Рубрика
- •Слов
- •5.5.2. Иерархические терминологические структуры
- •6. Поисковые задачи и технологии информационного поиска
- •6.2. Поисковые задачи и виды информационного поиска
- •6.2.1. Типология поисковых задач
- •6.2.2. Типология информационных потребностей
- •7.3. Технология поиска и интерфейс АИПС
- •7.3.1. Творческий процесс и стереотипы мышления
- •7.3.2. Интерфейс пользователя
- •Таблица 7.1.
- •7.4.3. Типология и стереотипы поведения пользователей
- •7.5.1.1. Стратегия поиска и классификация АИПС
- •7.5.1.2. Методы поиска
- •7.5.3. Поисковые интерфейсы
- •7.5.3.1. Организация интерфейсных объектов
- •7.5.3.2. Роль системы в процессе взаимодействия
- •8. Интерфейсные средства информационного поиска
- •8.1.1. Формирование запроса «по образцу»
- •8.1.2. Конструктор запроса «по шагам»
- •8.1.3. Конструктор запроса «Логическое выражение»
- •8.1.4. Использование формулировок ранее сохраненных запросов
- •8.2.1. Поиск аналогов
- •8.2.2. Эвристический поиск
- •8.2.3. Поиск по обратной связи
- •8.3. Технологические объекты построения предложения запроса
- •8.3.1. Частотный словарь
- •8.3.2. Тематический рубрикатор
- •8.3.3. Тезаурус
- •8.3.4. Иерархический словник
- •Список сокращений
- •ЕЯ – естественный язык.
- •ИС – информационная система.
- •ТСС – тематико-статистический спектр множества документов.
- •Литература
- •Глоссарий
- •Приложения
2.1. Состав и структура информационной системы
Для определения состава и взаимосвязей компонентов системы приведем предварительно определения следующих основных понятий.
Система (от греч. systema – целое, составленное из частей соединение) – совокупность элементов, взаимодействующих друг с другом и образующих определенную целостность.
Элемент системы – часть системы, имеющая определенное функциональное назначение. Сложные элементы систем, в свою очередь состоящие из более простых взаимосвязанных элементов, часто называют подсистемами9.
Организация системы – внутренняя упорядоченность, согласованность взаимодействия элементов системы (проявляющаяся, в частности, в ограничении разнообразия состояний элементов системы)
Структура системы – состав, порядок и принципы взаимодействия элементов системы, определяющие основные свойства системы.
Архитектура системы – совокупность свойств системы, существенных для организации взаимодействия ее составляющих.
Целостность системы – принципиальная несводимость свойств системы к сумме свойств отдельных ее элементов (эмерджентность) и, в то же время, зависимость свойств каждого элемента от его места и функции внутри системы.
С точки зрения формы существования системы выделяют абстрактные и материальные системы.
Абстрактные системы – это системы, которые имеют в качестве операционных объектов преимущественно идеализированные, например, знания, теории, гипотезы.
Материальные системы подразделяются на технические, эргатические и эргатехнические (смешанного типа). Именно эргатехнические системы - материальные системы «человек-машина», состоящие из эргатического элемента (человека-оператора) и технического элемента (машины), будут составлять основной предмет изучения.
Информационная система (ИС) – материальная система,
организующая, хранящая и преобразующая информацию. Это система, основным предметом и продуктом труда в которой является информация.
Автоматизированная система обработки данных (СОД) -
комплекс взаимосвязанных методов и средств преобразования данных, необходимых пользователю. Здесь данные понимаются как информация,
9 Существенным фактором с точки зрения абстрактности (идеальности природы) определения понятия «система» является то, что отдельный элемент какой-либо системы (как и сама система) может также быть элементом другой системы.
представленная в формализованном виде, пригодном для автоматической обработки при возможном участии человека.
Системы обработки знаний (СОЗ) - автоматизированные СОД,
имеющие специальное программное обеспечение для анализа семантики информации и ее гибкой логической структуризации.
В основу построения эффективных автоматизированных СОД (как систем наиболее эффективного типа) положены следующие принципы:
−принцип интеграции – обрабатываемые данные, однажды введенные в систему, многократно используются для решения возможно большего числа задач, чем максимально устраняется дублирование данных и операций их преобразования;
−принцип системности – обработка данных в различных «разрезах» с целью получения информации, необходимой для принятия решений на всех уровнях и во всех функциональных подсистемах управления;
−принцип комплексности – механизация и автоматизация процедур преобразования данных на всех стадиях технологического процесса.
2.1.1. Классификация информационных систем
Понятие системы тесно связано с эффективностью обработки информации, что, в свою очередь, базируется на специализированности компонентов и процессов. Такая специализированность (ориентация на определенный класс задач) обусловлена обычно свойствами обрабатываемых объектов. Информация, как основной объект обработки, может быть классифицирована следующим образом:
−по характеру, определяемому свойствами объектов предметной области – четкие или лингвистические10 переменные;
−по принадлежности к подсистеме управления - информация по целевой подсистеме, по сопровождению системы, по связи с внешней средой, по обеспечивающей, управляемой и управляющей подсистемам;
−по форме представления – числовая или вербальная (словесная);
−по изменчивости во времени - условно-постоянная и условнопеременная;
−по способу передачи (используемому носителю) - письменная или электронная, спутниковая или телефонная и т.д.;
−по режиму передачи - в нерегламентные сроки, по запросу или принудительно;
10 Лингвистическими переменными называют величины, которые могут иметь несколько значений. Впервые это понятие было введено в лингвистике для обозначения свойств слов иметь несколько смыслов в зависимости от контекста, например, ключ для дверного замка и ключ – водный источник.
−по назначению - экономическая, техническая, социальная, организационная и т.д.;
−по стадиям жизненного цикла объекта – этап научноисследовательской или опытно-конструкторской работы, организационно-технологическая подготовка производства, эксплуатация и т.д.;
−по отношению объекта управления к субъекту - между системой
ивнешней средой, по вертикали и горизонтали, между управляющей и управляемой подсистемой.
С точки зрения применения информационные системы могут классифицироваться:
1) по характеру использования результатной информации:
−информационно-поисковые (сбор, хранение, выдача информации по запросу пользователя);
−информационно-советующие (системы поддержки принятия решений);
−информационно-управляющие (результатная информация непосредственно участвует в формировании управляющих воздействий);
2) по функциональному назначению:
−производственные ИС;
−коммерческие ИС;
−маркетинговые ИС;
−финансовые ИС и т.д.
3) по объектам управления
−ИС автоматизированного проектирования;
−ИС управления технологическими процессами;
−ИС управления предприятием и т. д.
4) по степени автоматизации процессов обработки
−ИС с ручной обработкой информации;
−ИС механизированной обработки информации;
−ИС автоматизированной обработки информации;
−ИС автоматической обработки информации.
Другим аспектом типологии ИС является «информационный», что позволяет выделить следующие классы, определяющиеся, по существу, технологией создания и использования информации, основанной на концепции баз данных, свойства которых и переносятся на информационные системы.
По форме представляемой информации можно выделить фактографические, документальные, мультимедийные, что в той или иной степени соответствует цифровой, символьной и другим формам представления информации в вычислительной среде.
По типу хранимой (исключая мультимедийную) информации
можно выделить фактографические, документальные, лексикографические БД. Лексикографические базы – это классификаторы, кодификаторы, словари основ слов, тезаурусы, рубрикаторы и т.д., которые обычно используются в качестве справочных совместно с документальными или фактографическими БД. Документальные базы подразделяются по уровню представления информации – полнотекстовые (обрабатывающие так называемые «первичные» документы) и библиографическо-реферативные (обрабатывающие «вторичные» документы, отражающие на адресном и содержательном уровне первичный документ).
По типу используемой модели данных выделяют традиционно три класса БД: иерархические, сетевые, реляционные. Развитие технологий обработки данных привело к появлению постреляционных, объектноориентированных, многомерных БД, которые в той или иной степени соответствуют трем упомянутым классическим моделям.
По топологии хранения данных различают локальные и распределенные ИС.
По типологии доступа и характеру использования хранимой информации ИС могут быть разделены на специализированные и интегрированные11.
По функциональному назначению (характеру решаемых с помощью ИС задач и, соответственно, характеру использования данных) можно выделить операционные и справочно-информационные. К последним можно отнести ретроспективные ИС (электронные каталоги библиотек, БД статистической информации и т.д.), которые используются для информационной поддержки основной деятельности и не предполагают внесение изменений в уже существующие записи, например, по результатам этой деятельности. Операционные ИС предназначены для управления различными технологическими процессами. В этом случае данные не только извлекаются из БД, но и изменяются (в том числе добавляются), в том числе в результате этого использования.
По сфере возможного применения можно различать универсальные и специализированные (или проблемноориентированные) системы.
По степени доступности можно выделить общедоступные и ИС с ограниченным доступом пользователей. В последнем случае говорят об управляемом доступе, индивидуально определяющем не только набор доступных данных, но и характер операций, которые доступны пользователю.
11 В последнем случае правильнее говорить об интегрированных информационных системах, объединяющих в общей среде разнородные данные, хранимые возможно в разнотипных базах, но используемые для решения одной прикладной задачи.
Следует отметить, что представленная классификация не является полной и исчерпывающей. Она в большей степени отражает исторически сложившееся состояние дел в сфере деятельности, связанной с разработкой и применением баз данных.