
- •Содержание
- •Тема 1. Общие сведения об информационных системах, теории систем 10
- •Тема 2. Модели как основа теории информационных систем 77
- •Тема 3. Описание динамики информационных систем 98
- •Тема 4. Реляционные основы проектирования информационных систем 136
- •Тема 5. Информационные модели принятия решений 191
- •Тема 6. Проблемы принятия решений в четких и нечетких информационных пространствах 246
- •Введение
- •Тема 1. Общие сведения об информационных системах, теории систем
- •1.1. Понятие системы
- •1.1.1. Основные свойства системы
- •Характеристика основных свойств системы
- •1.1.2. Дескриптивный и конструктивный подходы к определению системы
- •1.1.3. Основные категории системного подхода
- •Классификация категорий системного подхода
- •1.1.4. Основные задачи теории систем
- •Основные задачи и функции системного анализа
- •1.1.5. Логика и методология системного анализа
- •Принципы системного анализа и их характеристика
- •Характеристика основных подходов в системном анализе
- •Методы системного анализа
- •Системные теории, их авторы и характеристика
- •Контрольные вопросы
- •1.2. Понятие информации
- •1.2.1. Количественные методы оценки и характеристики информации
- •Качественные характеристики информации
- •Меры информации
- •1.2.2. Атрибутивный, логико-семантический и прагматический аспекты теории информации
- •1.2.3. Уровни представления информации
- •1.2.4. Стандарты, относящиеся к терминам и определениям понятий на уровнях представления информации
- •Контрольные вопросы
- •1.3. Понятие информационной системы
- •1.3.1. Взаимосвязь информационного процесса, информационной технологии, информационной системы
- •1.3.2. Структура информационной системы
- •1.3.3. Принципы построения информационных систем
- •1.3.4. Классификация информационных систем
- •Общая классификация систем
- •1.3.5. Уровни представления информации в информационных системах
- •Контрольные вопросы
- •Тема 2. Модели как основа теории информационных систем
- •2.1. Качественные и количественные методы описания информационных систем
- •Контрольные вопросы
- •2.2. Кибернетический подход к описанию функциональных преобразований в информационной системе
- •Контрольные вопросы
- •2.3. Метод имитационного моделирования систем
- •Контрольные вопросы
- •Тема 3. Описание динамики информационных систем
- •3.1. Информация как элемент управления
- •Этапы формирования информационного обеспечения
- •Контрольные вопросы
- •3.2. Информационные потоки
- •3.2.1. Используемые виды информационных потоков
- •3.2.2. Принципы построения информационных потоков
- •Контрольные вопросы
- •3.3. Агрегатное описание информационных систем
- •Операторы переходов агрегата
- •Частные случаи агрегата
- •Контрольные вопросы
- •3.4. Математическое и имитационное моделирование динамики сложной информационной системы
- •Преимущества моделирования динамики системы
- •Имитационное моделирование
- •Недостатки моделирования динамики системы
- •Контрольные вопросы
- •3.5. Элементы управления в информационной системе
- •Этапы разработки управления системой
- •Контрольные вопросы
- •Тема 4. Реляционные основы проектирования информационных систем
- •4.1. Концептуальное, инфологическое и физическое моделирование предметной области
- •Модели «сущность-связь» (er-модель)
- •Моделирование локальных представлений
- •Контрольные вопросы
- •4.2. Выделение информативных свойств объектов предметной области Выявление классов объектов и связей
- •Отличия между классом объектов и свойством
- •Связи между классами объектов
- •Правило чтения связи
- •Контрольные вопросы
- •4.3. Общность реляционного подхода при проектировании баз данных
- •4.3.1. Переход от er-модели к схеме реляционной базы данных
- •4.3.2. Нормализация отношений
- •4.3.3. Языки манипулирования реляционными данными
- •4.3.4. Независимость данных
- •4.3.5. Понятие логической и физической целостности данных
- •4.3.6. Способы организации данных
- •Контрольные вопросы
- •Тема 5. Информационные модели принятия решений
- •5.1. Интеллектуализация процесса анализа данных
- •5.1.1. Технология Data Mining
- •5.1.2. Olap – системы оперативной аналитической обработки данных
- •5.1.3. Системы поддержки принятия решений
- •Контрольные вопросы
- •5.2. Этапы проектирования интеллектуальных информационных систем
- •Контрольные вопросы
- •Этапы проектирования интеллектуальных информационных систем.
- •5.3. Общая постановка задачи оптимизации интеллектуальных информационных систем
- •Классификация задач оптимизации
- •Регламентированные и оптимизирующие проектные переменные системы
- •Реконфигурация структуры системы
- •Контрольные вопросы
- •Общая постановка задачи оптимизации интеллектуальных информационных систем.
- •5.4. Перспективы развития информационных систем и технологий для работы с данными в виртуальных корпоративных структурах
- •5.4.1. Основные виды виртуальных корпоративных структур
- •Виртуальный удаленный доступ
- •Виртуальное малое предприятие
- •Виртуальные команды
- •Виртуальные предприятия
- •Виртуальная корпорация
- •Виды виртуальных корпораций
- •Особенности информационного обеспечения виртуальных корпораций
- •5.4.2. Когнитивная графика, гипертекстовая технология, геоинформационные системы Когнитивная графика
- •Задачи когнитивной компьютерной графики
- •Гипертекстовая технология
- •Географические информационные системы
- •Контрольные вопросы
- •Тема 6. Проблемы принятия решений в четких и нечетких информационных пространствах
- •6.1. Основы теории принятия решений
- •Контрольные вопросы
- •6.2. Основные типы метрических пространств
- •6.2.1. Метризация информационных пространств при четкой постановке задачи. Локальные метрики
- •6.2.2. Дивизимные и агломеративные стратегии поиска альтернатив
- •6.2.3. Функции полезности. Минимаксные подходы
- •Контрольные вопросы
- •Функции полезности. Минимаксные подходы.
- •6.3. Решение задачи многоцелевой оптимизации при нечеткой постановке задачи
- •6.3.1. Нечеткие множества и отношения: основные свойства
- •Стандартные функции принадлежности
- •6.3.2. Операции над нечеткими множествами и отношениями
- •Операции над нечеткими множествами и отношениями
- •6.3.3. Формирование нечетких отношений с использованием экспертных знаний
- •6.3.4. Нечеткие и лингвистические переменные. Нечеткие системы Нечеткие и лингвистические переменные
- •Нечеткие системы
- •6.3.5. Формулировка измерительных задач как задач многоцелевой оптимизации в нечеткой среде
- •Контрольные вопросы
- •6.4. Модели представления знаний
- •Продукционные модели
- •Семантические сети
- •Формальные логические модели
- •Контрольные вопросы
- •Заключение
- •Список литературы Основная
- •Дополнительная
- •Терминологический словарь
Контрольные вопросы
-
Классификация задач принятия оптимальных решений.
-
Схема процесса принятия решения.
-
Как оценивается эффективность принятого решения?
-
Перечислите основные этапы процесса постановки задач принятия оптимальных решений.
-
Охарактеризуйте основные методы формализации постановки и принятия решений с учетом неопределенностей.
6.2. Основные типы метрических пространств
6.2.1. Метризация информационных пространств при четкой постановке задачи. Локальные метрики
Многие фундаментальные закономерности и свойства множеств и других математических объектов обусловливаются взаимным расположением составляющих их элементов. Такие свойства отражают «геометрические» особенности связей между элементами или пространственную структуру множеств. Одной из важнейших функциональных характеристик структурных отношений между элементами множества является понятие близости элементов, тесно связанное с понятиями расстояния между элементами, сходимости последовательности и непрерывности функции. Любое множество, в котором тем или иным образом введено понятие близости элементов, принято называть пространством, а его элементы – точками пространства.
Неотрицательная действительная функция dX, определенная на прямом произведении X×X множества X, называется метрикой на множестве Х, если для любых элементов множества Х она удовлетворяет следующим условиям (аксиомам):
-
симметрии: dX(x, y) = dX(y, x);
-
тождества: dX(x, y) = 0 ⇔ x = y;
-
треугольника: dX(x, y) ≤ dX(x, z) + dX(z, y).
Числовое значение функции dX(x, y) называется расстоянием между элементами x и y множества X. Множество Х метризуемо, если на нем может быть введена некоторая метрика. Метризуемое множество Х с заданной на нем метрикой dX называется метрическим пространством и обозначается (X, dX). Требования, налагаемые на метрику, называются аксиоматикой метрического пространства. Задавая различные метрики на одном и том же множестве элементов X, получаем разные метрические пространства. Разные метрические пространства также получаются, если ввести одну и ту же метрику на различных множествах элементов. Свойства метрических пространств: открытость и замкнутость, замыкание, связность, плотность, сепарабельность, полнота и пополнение, компактность. Метрические пространства являются частным случаем топологических пространств.
Понятие топологического пространства можно рассматривать как аксиоматизацию понятия близости точки к множеству: точка близка к множеству, если она принадлежит его замыканию. Топология это как бы до- или внеметрическая форма (метод) отображения реальности, в которой остается только некоторая упорядоченность и смежность (в т.ч., связность). Кроме того, от понятия пространства сохраняется в большинстве случаев понятие размерности, но эти различия становятся трансформируемыми, могут определенным образом преобразовываться одно в другое, что в метрике принципиально невозможно, там размерность аксиоматизирована. Теория метрических пространств является аксиоматизацией понятия близости точек: в метрическом пространстве каждой паре точек соответствует вещественное число – расстояние между ними, основные свойства которого описываются системой аксиом. Необходимое и достаточное условие для метризуемости топологического пространства: топологическое пространство должно быть регулярным и иметь базу, распадающуюся на счётное множество локально конечных систем множеств.
Метризация (от греч. metrike – мера, размер) – процедура выделения расстояния между точками рассматриваемой шкалы; с помощью метризации осуществляется переход от нечисловой информации, полученной по номинальным ранговым шкалам, к числовой, т.е. построенной на отношениях меры, порядка и смежности. Мера – аналог бытового понятия длины, длительности, весовых отношений и т.д. Порядок – аналог некоторого относительного расположения (положительное-отрицательное, больше-меньше, слева-справа и т.д.). Смежность – это наличие «зон слияния», общих границ чего-либо. Именно через меру, порядок и смежность достаточно целостно отображается мир. Изначально любой тип таких отображений, в т.ч. и явно не метрических, осуществляется через интеллектуальные процедуры метризации – присвоения неупорядоченным множествам явлений этих самых значений меры, порядка, смежности.
Метризация осуществляется посредством процессов, соответствующих понятиям функций, функционалов и операторов. Эти процессы в самом мышлении являются операционными, т.е. обеспечивают мышление как его операционная система, среда. Именно после такой обработки из множественных (сенсорных, интуитивных, чувственных и пр.) неметрических и даже несвязных потоков сообщений «реальность и место объекта в ней» становится обобщенной структурированной моделью
Конструирование собственного пространства признаков и нахождение индивидуальной меры называется локальным преобразованием пространства признаков.
Задача определения контекстно-зависимой локальной метрики заключается в нахождении линейного преобразования новой векторной переменной. Для ее решения пригоден хорошо разработанный аппарат методов многомерного линейного анализа данных. Ограничение на применение этих методов накладывается требованием неотрицательности компонент весового вектора, так как различие объектов и по какому либо признаку должно обязательно приводить к увеличению расстояния либо в случае вообще не сказываться на изменении расстояния.
Критерий качества локальной метрики определяется контекстом, а его конкретная форма задается исследователем. Например, с учетом информации о принадлежности объектов к тем или иным классам эквивалентности это может быть стандартный для линейного дискриминантного анализа критерий, построенный на отношении разброса между классами к внутриклассовому разбросу. Или, имея в виду сложную неоднородную структуру классов, целесообразнее строить критерий качества на оценке первых k-ближайших объектов, то есть фактически на локальной оценке отношения правдоподобия в точке. Также не лишен смысла критерий, основанный на сравнении расстояний от объекта до его q-ближайших соседей из собственного класса с расстояниями до его r-ближайших соседей из других классов и т.п.
При построении локальной метрики могут использоваться самые различные методы, ориентированные на максимизацию заданного критерия. Нередко достаточно ограничиться только отбором центрированных признаков. Это бывает целесообразно, главным образом, при работе с бинарными признаками. Для решения данной задачи особенно эффективны алгоритмы отбора переменных типа «плюс l минус r» и эволюционные методы (например, метод случайного поиска с адаптацией).
Индивидуально сконструированные локальные метрики обеспечивают каждому объекту, как представителю своего класса, максимально возможную «сферу действия», которой нельзя достигнуть при построении общего пространства признаков и использовании одинаковой метрики для всех объектов.
Описание каждого эмпирического факта оказывается полностью избавленным от неинформативных элементов, что позволяет в дальнейшем иметь дело с чистыми «незашумленными» структурами данных. В этом описании остается только то, что действительно важно для отражения сходства и различия эмпирического факта с другими фактами в контексте решаемой задачи.
В свете представлений о контекстно-зависимых локальных метриках, очевидно, что один и тот же объект может поворачиваться разными гранями своего многомерного описания сообразно заданному контексту. К любому объекту, запечатленному в памяти как целостная многомерная структура, «привязан» набор различных локальных метрик, каждая из которых оптимизирует иерархию его сходства (различия) с другими объектами соответственно целям определенной задачи отражения отношений между объектами реального или идеального мира.
В результате построения локальных метрик отношения между объектами выражаются матрицей удаленностей. Так как локальные метрики у разных объектов могут не совпадать, то для элементов матрицы могут не выполняться требования симметричности и неравенства треугольника. Поэтому данная матрица, хотя и отражает отношения различия между объектами, не может истолковываться как матрица расстояний. Для устранения нарушений метрических отношений между элементами матрицы вводится специальный класс метрик.
Образно говоря, если окинуть взором множество объектов с точки, занимаемой объектом, в пространстве, специально сконструированном для этого объекта, то для такого взора объекты выстроятся в специфический ряд по степени удаленности от данной точки. С другой точки и в другом пространстве ряд удаленностей тех же самых объектов будет иметь свой специфический вид.
Выбор конкретного преобразования зависит от того, на каком аспекте структуры данных исследователь решает сделать акцент. Например, может использоваться преобразование в ранговую величину. Другой вариант – преобразование в классификационный показатель. В этом случае все объекты, проранжированные по удаленности, заменяются идентификатором своего класса, образно говоря, «окрашиваются» в цвета своего класса. Выбор меры зависит, с одной стороны, от вида преобразования и, с другой стороны, от того, какие особенности рядов и объектов имеется намерение оттенить при определении их сходства (различия).
Прямой способ основан на вычислении расстояния (например, евклидова). В данном случае не требуется дальнейшего подбора констант и для соблюдения метрических требований, так как они выполняются автоматически. Однако бывает более целесообразно использовать в качестве меры тот или иной коэффициент связи, например, коэффициент корреляции Пирсона, Кендалла и др. Если преобразование дает классификационную переменную, то мерой подобия может служить какой-либо коэффициент сопряженности для номинальных переменных.
После перехода от матрицы к матрице расстояний исследование совокупности объектов с привязанными к ним собственными локальными метриками может производиться всеми доступными методами и алгоритмами, использующими геометрическую метафору данных.
Сюда относятся алгоритмы автоматического группирования (кластерный анализ, иерархическое группирование, определение «точек сгущения») и методы визуализации данных, для которых исходной информацией служит матрица расстояний (многомерное шкалирование, адаптивная развертка).