
- •Дидактический план
- •Литература Основная
- •Дополнительная
- •Тематический обзор
- •Основы моделирования информационных процессов
- •Системный подход к моделированию информационных процессов
- •Предмет теории моделирования
- •Роль и место моделирования в исследовании информационных процессов и систем
- •Подходы к исследованию информационных процессов и систем
- •Классификация моделей
- •Физические модели
- •Математические модели
- •Имитация функционирования системы. Предположим, исследуется вычислительная система (вс), состоящая из процессора 1 с основной памятью, устройство вода перфокарт 4, ацпу 2 и дисплея 3 (рис. 2.).
- •Моделирование систем и языки программирования
- •Математические схемы моделирования систем
- •Основные подходы к построению математических моделей информационных процессов и систем
- •Математические схемы
- •Типовые схемы
- •Непрерывно детерминированные модели (д - схемы)
- •Дискретно – детерминированные модели (f-схемы)
- •Дискретно-стохастические модели (p-схемы)
- •Непрерывно-стохастические модели (q - схемы)
- •Сетевые модели (n-схемы). Сети Петри
- •Обобщенные модели (а-схемы)
- •Организация и проведение вычислительного эксперимента
- •Методы планирования эксперимента на модели
- •Стратегическое планирование машинных экспериментов с моделями систем
- •Тактическое планирование машинных экспериментов с моделями систем
- •Планирование и реализация статистического моделирования информационных процессов на эвм
- •Общая характеристика метода статистического моделирования
- •Псевдослучайные последовательности и процедуры их машинной генерации
- •Проверка и улучшение качества последовательностей псевдослучайных чисел
- •Моделирование случайных воздействий на системы
- •Модель posix ose
- •Модели сред открытых систем
- •Модели распределённых систем
- •Базовые информационные процессы и их классификация
- •Концептуальный уровень
- •Логический уровень
- •Физический уровень
- •Модели процесса передачи данных
- •Потери при информационном взаимодействии
- •Модель дискретного канала связи
- •Модель непрерыного канала связи
- •Информационный предел избыточности для канала с независимыми ошибками
- •Информационный предел избыточности для канала с пакетными ошибками
- •Модели процесса обработки данных
- •Модели обслуживания вычислительных задач
- •Модели планирования вычислительного процесса
- •Вычислительный граф системы обработки
- •Модели процесса хранения и накопления данных
- •Инфологическая модель предметной области
- •Информационный граф системы обработки
- •Каноническая структура информационной базы
- •Выбор ключевых реквизитов
- •Модели процесса формализации знаний
- •Логическая модель представления знаний
- •Алгоритмическая модель представления знаний
- •Семантическая модель представления знаний
- •Фреймовая модель представления знаний
- •Глоссарий
- •Теория информационных процессов и систем
Выбор ключевых реквизитов
Выделение
групповых элементов и состава
информационных элементов в группах
позволяет с помощью ориентированного
графа построить траекторию доступа к
каждому информационному элементу
группы. Доступ осуществляется через
корневую вершину графа. Для построения
ключевых реквизитов необходимо
проанализировать отношения между
групповыми информационными элементами.
Поиск информационных элементов в базе
осуществляется по требованиям
пользователя. Если k-е
требование
пользователя содержит Dk
элементов,
выбираемых из общего числа структурных
элементов инфологической модели
предметной области, то можно построить
матрицу смежности sk
для
информационного требования Dk.
Элемент
этой матрицы sij=1,
если
существует связь между элементами di,
dj
в
требовании Dk.
На
основании
элементов
могут
быть названы элементы
,
соответствующие
групповым информационным элементам
базы. В зависимости от характера
групп выделяют
,
.
Этим элементам будут соответствовать
простые группы. Если
,
,
то
получим группы — массивы. Для простых
групп образуют простой ключ, для
групп массивов — составной ключ,
включающий в себя основной и вспомогательный
ключи. При этом основной ключ определяется
терминальным, конечным элементом,
входящим в состав группы массива.
Выделение основных ключей должно быть
неизбыточным, поэтому необходимо
установить и устранить дублируемые
терминальные конечные элементы данных.
Пусть
групповому элементу
,
соответствует
множество терминальных элементов
,
а
групповому элементу d)
—
множество терминальных элементов D
(d'X
Известно,
что групповые элементы семантически
связаны, если
.
Соответственно
семантическая независимость групповых
элементов удовлетворяет условию
.
Если
последнее условие выполняется для всех
попарно выбираемых групповых элементов
данного уровня иерархии, а затем и для
всех более высоких уровней, то дублирование
отсутствует. Если условие не выполняется,
то имеют место дублируемые терминальные,
конечные элементы. Устранение дублируемых
терминальных элементов достаточно
легко осуществляйся, если групповые
элементы построены на одном и том же
типе отношений.
Пусть
групповой элемент
принадлежит
уровню иерархии n,
а элемент
—
уровню иерархии m,
причем
m<n.
При
наличии пути на графе из элемента
к
элементу
следует
убрать дублируемые терминальные
элементы из множества
.
Удаление
терминального элемента должно быть
отражено и в матрице Q.
Это
означает, что коэффициент qij=1,
показывающий
ранее связь между элементами di,
dj,
становится
равным нулю. Если групповые элементы
,
построены на разных типах отношений,
то устранение
терминальных
элементов осуществляется эвристически
с использованием той же идеи: расположением
терминального элемента на
более
высоком уровне иерархии и устранением
дублируемого элемента на нижнем уровне.
Размещение терминальных элементов на
более высоких уровнях иерархии в графе
обеспечивает уменьшение времени доступа
к конечному элементу, так как сокращается
путь от корневой вершины до терминального
элемента в графе.
При
построении канонической структуры
информационной базы необходимо устранить
также избыточные связи между групповыми
элементами. При наличии таких связей
по одному и тому же ключу могут вызываться
разные групповые элементы данных, что
является недопустимым. Избыточная
связь между группами
,
может на графе представляться
непосредственно дугой (i,j),
соединяющей
групповые элементы данных, либо путем,
включающим в себя ряд дуг. Если избыточной
оказывается дуга (i,j),
то
она легко обнаруживается по матрице
Q
для
элемента qij=1.
Заменяем этот элемент на нулевой, что
соответствует устранению избыточной
дуги. Если путь, связывающий групповые
элементы данных, включает несколько
дуг, то необходимо найти матрицу Qk,
где к=2,3,...,Nk,
Nk
—
максимальное число групповых элементов
данных. Тогда
получим
квадратную матрицу, элемент которой
показывает число путей, ведущих из
группы
группу
.
Если
в исходной матрице Q
элемент
qij=
1,
а в полученной матрице Qk
элемент
,
то связь является избыточной. Для
удаления этой связи заменяем qij=1
на нулевой элемент. Граф, получаемый
после удаления избыточных терминальных
элементов и избыточных связей между
групповыми элементами данных,
определяет каноническую структуру
информационной базы. Таким образом,
каноническая структура задает логически
не избыточную информационную базу.
Выделение групповых элементов данных
в канонической структуре позволяет
объединить множество значений конечных
элементов (реквизитов) в логические
записи и тем самым упорядочить их в
памяти ЭВМ. Структура логических записей
и связей между ними
должна
быть такова, чтобы обеспечить минимум
суммарного времени работы с наборами
данных как при решении функциональных
задач, так и при их корректировке. Поэтому
необходимо установить характеристики
канонической структуры информационной
базы.
Существенными
являются длины групповых элементов
данных представляющие собой сумму длин
терминальных элементов, входящих в
данную группу. Для группы
длина
группового элемента
где
— длина терминального элемента данных.
Интегральная оценка длин логических
записей может быть произведена на основе
вектора
.
Любая информационная база характеризуется таким параметром, как время доступа пользователя к данным. Однако на этапе создания канонической структуры физическая организация базы данных неизвестна, поэтому реальное время поиска данных не удается определить. Тем не менее, нужно оценить минимальное значение времени обращения к базе данных каш в процессе решения функциональной задачи, так и в процессе корректировки базы.
Для групповых элементов данных в канонической структуре может быть задана матрица
Т=
||i||,
где i
— минимальное время доступа к
терминальным элементам di,
входящим в группу
.
Если функциональная задача решается
на основе вычислительного алгоритма
aj,
то
время работы алгоритма с реквизитами
di
определяется
как
где
—
время поиска реквизита di
при
решении задачи на основе алгоритма аj.
Значение
этого времени зависит от вида обработки
реквизита di
в
выбранном алгоритме (возможна
последовательная обработка значений
данных либо обработка по ключу). При
использовании алгоритмов коррекции
корректируются все отношения, которые
содержат изменяемый ключевой реквизит
и зависимые от него реквизиты. Значение
времени работы алгоритма с данными
определяется количеством копий,
присутствующих в корректируемых
реквизитах. На уровне канонической
структуры число копий задается количеством
экземпляров терминальных элементов,
входящих в группу
.
Обычно
алгоритм коррекции имеет возможность
обращаться по ключу к информационным
элементам базы данных
,
где
,
если
;
,
в противном случае. Методика построения
канонической структуры информационной
базы практически не меняется в зависимости
от того, строится централизованная либо
распределенная информационная база.
При создании распределенной
информационной базы матрица Q
раскрывается
для каждого пользователя. На графе
для каждого пользователя формируются
групповые и терминальные элементы
данных. Полное множество групповых
элементов находится путем пересечения
групповых элементов данных отдельных
пользователей. Таким образом, каноническую
структуру информационной базы можно
считать универсальной формой
представления мифологической модели
предметов, области и безызбыточной
формой модели накопления данных. От
канонической структуры переходят к
логической структуре информационной
базы и к физической организации
информационных массивов. Каноническая
структура является также основой
автоматизации основных процессов
предпроектного анализа предметной
областей пользователей.