Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Вопросы к ГОСу -общий текст.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
428.47 Кб
Скачать

18. Проектирование бд на основе алгоритмов нормализации. Достоинства и недостатки подхода.

Процесс проектирования представляет собой процесс нормализации схем отношений, причем каждая следующая нормальная форма обладает свойствами лучшими, чем предыдущая.

В основе процесса проектирования лежит метод нормализации, декомпозиция отношения, находящегося в предыдущей нормальной форме, в два или более отношения, удовлетворяющих требованиям следующей нормальной формы.

Нормализация – это разбиение таблицы на две или более, обладающих лучшими свойствами при включении, изменении и удалении данных. Окончательная цель нормализации сводится к получению такого проекта базы данных, в котором каждый факт появляется лишь в одном месте, т.е. исключена избыточность информации. Это делается не столько с целью экономии памяти, сколько для исключения возможной противоречивости хранимых данных.

Алгоритм нормализации происходит в след. этапах:

Шаг 1. Построение 1НФ (первой нормальной формы - данные хранятся в плоской двухмерной таблице без неповторяющихся составных единиц информации, векторов и повторяющихся групп)

  • отсутствуют сложные атрибуты

  • определены ключевые атрибуты, от которых зависят все другие

  • все атрибуты записываются в одной таблице

Получение исходного множества функциональных зависимостей.

Рассматриваются все сочетания атрибутов (1,2 ,3, …..n).

Не рассматриваются варианты, которые являются следствием теорем о функциональных зависимостях.

Выполняются следующие операции:

  1. Удаляются итоговые и пустые строки;

  2. Для каждого проекта копируются ячейки «номер проекта» и «название проекта», заполняются пустые ячейки.

  3. Вставляется строка заголовка полей.

  4. Определяется ключ (составной).

Шаг 2. Построение формы 2НФ (второй нормальной формы)

  • удовлетворяет требованиям 1НФ

  • не содержит частных зависимостей (т.е. нет атрибутов, которые зависят от части составного ключа).

Частная зависимость – это зависимость атрибута от части сложного ключа.

Поиск минимального покрытия функциональных зависимостей: множество, из которого удалены зависимости, являющиеся следствием оставшихся зависимостей.

F={f1, f2, …. , fn}

Шаг 3. Построение формы 3НФ (Третьей нормальной формы):

  • удовлетворяет второй

  • не содержит транзитивных зависимостей

Транзитивная зависимость – это зависимость одного атрибута от другого, не входящего в сложный ключ.

Для каждого fi создать отношение

 Шаг 4. Построение схемы БД.

Если первичный ключ исходного отношения не вошел ни в одну проекцию, то создать дополнительное отношение, содержащее этот ключ

Примечание:

Для взаимно однозначных зависимостей принято выделять «старший» атрибут, который затем представляет все атрибуты взаимно однозначного соответствия.

Нормальная форма Бойса-Кодда

Отношение соответствует нормальной форме Бойса-Кодда, если оно соответствует третьей нормальной форме, и все определители являются кандидатами на использование в качестве ключа.

Четвертая нормальная форма

Отношение находится в четвертой нормальной форме, если оно соответствует нормальной форме Бойса-Кодда, и в ней нет многозначных зависимостей.

Недостатки нормализации

Совместная обработка связанных таблиц может существенно замедлить обработку, пожтому иногда специально проводят денормализацию. Денормализация - это не незаконченная нормализация. Это приведение структуры базы данных в состояние, не соответствующее критериям нормализации, обычно проводимое с целью ускорения операций чтения из базы за счет добавления избыточных данных.

Достоинства нормализации: исключена избыточность информации, исключена противоречивость хранимых данных.