- •Первая часть лекций по курсу базы данных
- •1. Введение в банки данных
- •1.1. Понятие банка данных
- •1.2. Компоненты банка данных
- •1.3. Пользователи банков данных
- •1.4. Классификация банков данных
- •Классификация БнД по экономико-организационным признакам.
- •1.5. Этапы проектирования баз данных
- •2. 1. Общие сведения об инфологическом моделировании
- •2. 2. Построение модели “объект — свойство — отношение”
- •2.3. Сравнение методик построения er-моделей
- •Тема : Схемы и подсхемы.
- •Тема: Модели данных.
- •Сетевые структуры.
- •Реляционные бд.
- •Тема: Манипулирование отношениями (Реляционная алгебра).
- •Тема: Принципы нормализации.
- •Тема: Организационные проблемы:
- •Целостность данных. Контроль типов.
- •Восстановление данных. Типы отказов.
- •Отказы транзакций.
Тема: Модели данных.
Совокупность данных, изображенных на рис. 7, описывается как двумерный (плоский) файл.
Каждая запись имеет одинаковый набор полей, и поэтому файл может быть представлен в виде двумерной матрицы. Типы структур могут быть представлены как деревья или сети.
Деревья.
Дерево представляет собой иерархию элементов, называемых узлами. На самом верхнем уровне иерархии имеется только один узел – корень.
Каждый узел, кроме корня, связан с одним узлом на более высоком уровне, называемым исходным узлом для данного узла. Каждый узел, кроме корня, связан с одним или несколькими элементами на более низком уровне. Они называются порожденными. Элементы, расположенные в корце ветви, то есть не имеющие порожденных, называются листьями.
Дерево может быть определено как иерархия узлов с двойными связями, такими что:
самый верхний уровень иерархии имеет один узел, называемый корнем;
все узлы, кроме корня, связываются с одним и только одним узлом на более высоком уровне по отношению к ним самим.
Корень
Узел степени 4 (выходит 4 вершины)
Лист второго уровня
Порожденные
элементы
Семейство
размерности 6
Диаграмма
max
пути
Уровень 4 насчитывает
5 элементов
Листья
Диаграмма пути
(глубина 3)
Рис. 16
Диаграмма дерева имеет высоту 4(число уровней), момент 22(число узлов), вес 16(число листьев), основание 1(число корней).
Сбалансированное дерево – дерево, в котором каждый узел имеет одинаковое число ветвей, причем процесс включения новых ветвей в узлы дерева идет сверху вниз, а на каждом уровне дерева – слева направо. На рис. 17 приведены примеры сбалансированных и несбалансированных деревьев.
Сбалансированное дерево
Несбалансированные деревья
Рис.17
Древовидная структура, в которой допускается не более двух ветвей для одного узла, называется двоичным деревом.
Двоичные деревья, как и другие сбалансированные деревья представляют основной интерес для физического, а не логического представления данных.
Иерархическим файлом называется файл, в котором записи связаны в виде древовидной структуры. На рис. 18 приведен файл типа «основная запись – детальная запись», представляющая собой общий вид иерархического файла с двумя типами записей.
Рис.18
Однородные структуры – структуры у которых каждый узел дерева может быть представлен одним и тем же типом записи.
Иерархическая модель данных лежит в основе таких СУБД, как Ока и ИНЕС.
Иерархическая модель данных ИНЕС представляет БД в виде дерева, терминальные вершины которого соответствуют элементарным данным, корень – всей БД, а прочие вершины – структурным информационным объектам различной сложности. Такое дерево отражает логическую структуру информации и называется ИНЕС деревом БД. Но реальные данные содержатся только в терминальных вершинах. Посредством использования ссылочных связей модель допускает создание сетей и потенциально бесконечных деревьев. Дерево БД, помимо собственно данных, содержит также информацию о структуре, типах и именах информационных объектов, повторяющуюся для многих однородных объектов. Эта информация задается администратором БД в виде схемы БД на ЯОД и преобразуется соответствующим транслятором в дерево описания данных. Данные, представленные в БД присутствуют в двух частях ДОД и дереве данных, содержащем, собственно, значения данных.
В системе ИНЕС существует три категории типов данных:
Элементарные;
Структурные;
Ссылочные.
Категория элементарных данных состоит из шести родовых типов, параметр каждого из которых определяет количество байтов памяти, отводимой под представление одного значения. Элементарные данные находятся в терминальных вершинах ДД. К простым типам относятся: целый, вещественный, десятичный, символьный и двоичной последовательности, и перечислений. В ИНЕС существует два основных типа структурных данных: структуры и массивы. Структура может быть собственно структурой или условной структурой (объединением), массив может быть простым массивом (аналог последовательного файла), массивом с номерами (аналог файла с прямым доступом) или массивом с ключами (индивидуально – последовательные файлы). В ИНЕС имеется четыре вида ссылочных данных: ссылка на значение, ссылка на шаблон, ссылка на словарное данное типа идентификатор и типа код.
Данное типа ссылки на значение является указателем на другое данное (аналог указателя Си).
Ссылка на шаблон означает, что данное, описанное посредством такой ссылки, имеет тот же тип, что и данное, на которое делается ссылка, при этом соответственно совпадают типы всех подчиненных им данных (аналог определения типа Паскаль).
Данному со ссылкой на словарное данное типа идентификатор ставится в соответствие набор данных, называемых словарем типа идентификатор.
В ДД записывается только крайний идентификатор, а текст и соответствующий ему идентификатор в словарь.
В дополнение к словарям типа идентификатор могут существовать словари типа код. Эти данные имеют форму: код – текст – синонимы. Пример: шифр предприятия – полное наименование предприятия – краткое наименование предприятия.
