
Даталогическое проектирование
Результатом даталогического проектирования является концептуальная схема БД, включающая определение всех информационных элементов (единиц) и связей, в том числе задание типов, характеристик и имен.
Нужно построить корректную схему БД, в которой отсутствуют нежелательные зависимости между атрибутами отношений, ориентируясь на реляционную модель данных.
Проектирование схемы БД выполним путем декомпозиции (разбиения), когда исходное множество отношений, входящих в схему БД заменяется другим множеством отношений (число их при этом возрастает), являющихся проекциями исходных отношений. Классическая технология проектирования реляционных баз данных связана с теорией нормализации, основанной на анализе функциональных зависимостей между атрибутами отношений. Функциональные зависимости определяют устойчивые отношения между объектами и их свойствами в рассматриваемой предметной области. Функционально зависимым считается такой атрибут, значение которого однозначно определяется значением другого атрибута.
Процесс проектирования с использованием декомпозиции представляет собой процесс последовательной нормализации схем отношений, при этом каждая последующая итерация соответствует нормальной форме более высокого уровня и обладает лучшими свойствами, по сравнению с предыдущей итерацией. Каждой нормальной форме соответствует некоторый определенный набор ограничений, и отношение находится в некоторой нормальной форме, если удовлетворяет свойственному ей набору ограничений. Процесс нормализации – это разбиение таблицы на две или более с целью ликвидации дублирования данных и потенциальной их противоречивости. Окончательная цель нормализации сводится к получению такого проекта базы данных, в котором «каждый факт появляется лишь в одном месте». Использование ненормализованных таблиц может привести к нарушению целостности данных (противоречивости информации) в БД.
Переменная отношения находится в первой нормальной форме (1НФ) тогда и только тогда, когда в любом допустимом значении отношения каждый егокортежсодержит только одно значение для каждого из атрибутов.
В реляционной модели отношение всегда находится в первой нормальной форме по определению понятия отношение. Что же касается различных таблиц, то они могут не быть правильными представлениями отношений и, соответственно, могут не находиться в 1НФ.
Переменная отношения находится во второй нормальной форме (2НФ) тогда и только тогда, когда она находится в первой нормальной форме, и каждый не ключевой атрибут неприводимо (функционально полно) зависит от ее потенциального ключа.
Переменная отношения находится в третьей нормальной форме (3НФ) тогда и только тогда, когда она находится во второй нормальной форме, и отсутствуют транзитивные функциональные зависимости не ключевых атрибутов от ключевых атрибутов.
Если же, любая функциональная связь между атрибутами отношения сводится к полной функциональной зависимости от возможного первичного ключа, то отношение такого вида находится в нормальной форме Бойса-Кодда (НФБК).
Иные нормальные формы используются крайне редко, поэтому мы остановимся на приведенных четырех формах.
Используя данные определения, были сформированы новые сущности и связи, которые помещены в схему базы данных (Рисунок 5).
Схема базы данных
Рисунок
5 – Схема базы данных