Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Моделирование систем Теория.doc
Скачиваний:
1
Добавлен:
01.05.2025
Размер:
3.58 Mб
Скачать
      1. Выбор ключевых реквизитов

Выделение групповых элементов и состава информационных элементов в группах позволяет с помо­щью ориентированного графа построить траекторию доступа к каждому информационному элементу группы. Доступ осуществляется через корневую вершину графа. Для построения ключевых реквизи­тов необходимо проанализировать отношения между групповыми информационными элементами. Поиск информационных элементов в базе осуществляется по требованиям пользователя. Если k-е тре­бование пользователя содержит Dk элементов, выбираемых из об­щего числа структурных элементов инфологической модели предметной области, то можно построить матрицу смежности sk для информационного требования Dk. Элемент этой матрицы sij=1, если существует связь между элементами di, dj в требовании Dk. На основании элементов могут быть названы элементы , соответ­ствующие групповым информационным элементам базы. В зависи­мости от характера групп выделяют , . Этим элемен­там будут соответствовать простые группы. Если , , то получим группы — массивы. Для простых групп образуют про­стой ключ, для групп массивов — составной ключ, включающий в себя основной и вспомогательный ключи. При этом основной ключ определяется терминальным, конечным элементом, входящим в состав группы массива. Выделение основных ключей должно быть неизбыточным, поэтому необходимо установить и устранить дуб­лируемые терминальные конечные элементы данных.

Пусть групповому элементу , соответствует множество тер­минальных элементов , а групповому элементу d) — множест­во терминальных элементов D (d'X Известно, что групповые элеме­нты семантически связаны, если . Соответственно семантическая независимость групповых элементов удовлетворяет условию . Если последнее условие выполняется для всех попарно выбираемых групповых элементов данного уровня иерархии, а затем и для всех более высоких уровней, то дублирова­ние отсутствует. Если условие не выполняется, то имеют место дублируемые терминальные, конечные элементы. Устранение дуб­лируемых терминальных элементов достаточно легко осуществля­йся, если групповые элементы построены на одном и том же типе отношений.

Пусть групповой элемент принадлежит уровню иерархии n, а элемент — уровню иерархии m, причем m<n. При наличии пути на графе из элемента к элементу следует убрать дублиру­емые терминальные элементы из множества . Удаление терми­нального элемента должно быть отражено и в матрице Q. Это означает, что коэффициент qij=1, показывающий ранее связь между элементами di, dj, становится равным нулю. Если групповые элементы , построены на разных типах отношений, то устранение терминальных элементов осуществляется эвристически с использованием той же идеи: расположением терминального элемента на более высоком уровне иерархии и устранением дублируемого элемента на нижнем уровне. Размещение терминальных элементов на более высоких уровнях иерархии в графе обеспечивает уменьшение времени доступа к конечному элементу, так как сокращается путь от корневой вершины до терминального элемента в графе.

При построении канонической структуры информационной базы необходимо устранить также избыточные связи между групповыми элементами. При наличии таких связей по одному и тому же ключу могут вызываться разные групповые элементы данных, что являет­ся недопустимым. Избыточная связь между группами , может на графе представляться непосредственно дугой (i,j), соединяющей групповые элементы данных, либо путем, включающим в себя ряд дуг. Если избыточной оказывается дуга (i,j), то она легко об­наруживается по матрице Q для элемента qij=1. Заменяем этот элемент на нулевой, что соответствует устранению избыточной дуги. Если путь, связывающий групповые элементы данных, вклю­чает несколько дуг, то необходимо найти матрицу Qk, где к=2,3,...,Nk, Nk — максимальное число групповых элементов данных. Тогда получим квадратную матрицу, элемент которой показывает чис­ло путей, ведущих из группы группу . Если в исходной матрице Q элемент qij= 1, а в полученной матрице Qk элемент , то связь является избыточной. Для удаления этой связи заменяем qij=1 на нулевой элемент. Граф, получаемый после удаления избы­точных терминальных элементов и избыточных связей между груп­повыми элементами данных, определяет каноническую структуру информационной базы. Таким образом, каноническая структура задает логически не избыточную информационную базу. Выделение групповых элементов данных в канонической структуре позволяет объединить множество значений конечных элементов (реквизитов) в логические записи и тем самым упорядочить их в памяти ЭВМ. Структура логических записей и связей между ними должна быть такова, чтобы обеспечить минимум суммарного времени работы с наборами данных как при решении функциональных задач, так и при их корректировке. Поэтому необходимо установить харак­теристики канонической структуры информационной базы.

Существенными являются длины групповых элементов данных представляющие собой сумму длин терминальных элементов, вхо­дящих в данную группу. Для группы длина группового элемента где — длина терминального элемента данных. Интеграль­ная оценка длин логических записей может быть произведена на основе вектора .

Любая информационная база характеризуется таким параметром, как время доступа пользова­теля к данным. Однако на этапе создания канонической структуры физическая организация базы данных неизвестна, поэтому реальное время поиска данных не удается определить. Тем не менее, нужно оценить минимальное значение времени обращения к базе данных каш в процессе решения функциональной задачи, так и в процессе корректировки базы.

Для групповых элементов данных в каноничес­кой структуре может быть задана матрица

Т= ||i||, где i — мини­мальное время доступа к терминальным элементам di, входящим в группу . Если функциональная задача решается на основе вычис­лительного алгоритма aj, то время работы алгоритма с реквизита­ми di определяется как где — время поиска реквизита di при решении задачи на основе алгоритма аj. Значение этого времени зависит от вида обработки реквизита di в выбранном алгоритме (возможна последовательная обработка значений дан­ных либо обработка по ключу). При использовании алгоритмов коррекции корректируются все отношения, которые содержат изме­няемый ключевой реквизит и зависимые от него реквизиты. Значе­ние времени работы алгоритма с данными определяется количе­ством копий, присутствующих в корректируемых реквизитах. На уровне канонической структуры число копий задается количеством экземпляров терминальных элементов, входящих в группу . Обыч­но алгоритм коррекции имеет возможность обращаться по ключу к информационным элементам базы данных

, где , если ; , в противном случае. Методика постро­ения канонической структуры информационной базы практически не меняется в зависимости от того, строится централизованная либо распределенная информационная база. При создании распре­деленной информационной базы матрица Q раскрывается для каж­дого пользователя. На графе для каждого пользователя формиру­ются групповые и терминальные элементы данных. Полное множе­ство групповых элементов находится путем пересечения групповых элементов данных отдельных пользователей. Таким образом, каноническую структуру информационной базы можно считать универ­сальной формой представления мифологической модели предмет­ов, области и безызбыточной формой модели накопления данных. От канонической структуры переходят к логической структуре информационной базы и к физической организации информационных массивов. Каноническая структура является также основой автоматизации основных процессов предпроектного анализа предметной областей пользователей.