Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Умк_Базы.doc
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
3.2 Mб
Скачать

4.2. Нормализация отношений в бд

При изучении данной темы Вы должны познакомиться с математическим аппаратом, применяемым для проектирования реляционных баз данных.

По данной теме выполняется лабораторная работа № 3, а также раздел “Концептуальное проектирование” курсового проекта. Рекомендации по выполнению этих заданий приведены в методических указаниях 3.4.

Для проверки изучения материала темы Вам предстоит также ответить на вопросы для самопроверки.

Если Вы испытываете затруднения в ответе на какой-либо вопрос, обратитесь к главам 11, 12 учебника [1] или к материалам учебного пособия [8].

4.2.1. Понятие о нормальных формах

Как отмечалось в предыдущей, теме второй составляющей алгебры является ее носитель. В реляционной модели носителем является набор специальным образом сконструированных нормализованных отношений – то, что на концептуальном уровне и является собственно базой данных. Важнейшие цели, которым служит база данных – это снижение избыточности данных и повышение достоверности отображения информации. Любое априорное знание об ограничениях на данные может служить этим целям. Один из методов формализации этих знаний основан на теории нормализации – установление ограничений между данными, которые частично отражает их семантику. Проектирование реляционной базы это фактически выделение нормальных форм.

Этот метод основан на фундаментальном в теории реляционных баз данных понятии зависимости (FD) между атрибутами отношений и выводимым из него понятия - реляционного ключа (RK).

Определение FD

В схеме отношения R (X, Y, …) атрибут X функционально определяет атрибут Y (условное обозначение XY), если в любой момент времени любому элементу проекции R[X] соответствует только один элемент проекции R[Y], в любом экземпляре схемы R.

Стрелка "" разделяет ФЗ на левую и правую части. При этом левую часть ФЗ, иногда называют детерминантой.

Функциональная зависимость это не функция в точном математическом смысле, так как допускается, что со временем она может изменяться (так же как изменяется и отношение R).

Полный набор имен атрибутов {A1, …, An} отношения R принято обозначать символом UR, Ai UR, (i=1, ..., n где n – степень отношения), а множество постулированных на R ограничений (функциональных, многозначных зависимостей и зависимостей соединений) обозначают FR.

FR может связывать и совокупность атрибутов: f: {A1, ..., An}  {B1, ..., Bm}.

Для вывода из заданного множества FR замыкания множества зависимостей (всех зависимостей присущих R, обозначается F+R) или получения минимального покрытия набора FR (такого набора зависимостей H, что H+=F+R и удаление любой зависимости из H приводит к нарушению этого равенства), используют аксиомы Армстронга или их расширения и правила вывода построенные на этих аксиомах.

Например, для функциональных зависимостей FD справедливы следующие аксиомы:

1. Рефлексивность. Если Y X UR, то зависимость X Y логически следует из FD. Зависимость вида X X называют тривиальной.

2. Пополнение. Если справедлива зависимость X Y и Z UR, то также будет справедлива и зависимость XZ YZ.

3. Транзитивность (транзитивные зависимости). Если справедлива зависимость X Y и Y Z, то также справедлива и зависимость X Z.

Доказано что перечисленные выше аксиомы являются непротиворечивыми и надежными, поэтому выделенные из UR (на основе аксиом и постулированных FR) заключения (проекции на R) являются истинными.

В отличие от математического определения отношения, отношение R в реляционной модели нормализовано, что подразумевает использование в качестве элементов кортежа атомарных значений (элемент кортежа не может быть множеством, мощность которого превышает единицу).

Отношение, обладающее свойством атомарности элементов его составляющих, называется нормализованным или, что то же самое, находящимся в первой нормальной форме (1НФ). Нормальные формы, в которых находятся отношения, составляют иерархию, в которой формы с большими номерами не обладают некоторыми нежелательными свойствами, характерными для форм с меньшими номерами. В теории нормальных форм для реляционных БД рассматривается пять уровней нормализации: 1НФ – 5НФ и форма Бойса-Кодда (промежуточная между 3НФ и 4НФ). Каждый из следующих уровней ограничивает типы допустимых FD отношения.

Для отношений, не находящихся в нормальных формах, существуют аномалии модификации. Различают аномалии добавления, изменения и удаления.

Как отмечается во всех руководствах по проектированию реляционных схем, выделенные множества UR, F+R являются исходными (входными) данными для автоматизированных методов построения реляционных баз данных (см. параграф 4.2.2). Однако если процессы построения F+R, RK удается формализовать полностью, то процесс формирования FR не поддается полной формализации.