Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Inform.docx
Скачиваний:
7
Добавлен:
21.04.2019
Размер:
203.09 Кб
Скачать

35.Принцип нормализации для проектирования реляционных баз данных.

Элементы теории нормальных форм

В реляц базах схема отношений содержит как структур, так и семантич инф-ию. Структурная инф-ия связана с объявленным отношением. Семантическая инф-ия выражается мн-вом функциональных зависимостей между атрибутами отношений. Некот функ зависимости могут быть нежелательными из-за побоч эффектов или аномалий, к-рые они вызывают при модификации БД. В этом случае наличие нежелат функ зависимостей выдляют в процедуре,к-рая наз-ся декомпозицией, при к-рой данной мн-во зависимостей заменяется др мн-вом,к-рое является проекцией первого.

Нормализация – это пошаговый процесс замены данной схемы отношения другой схемой, в к-рой отношения имеют более простую и регулярную форму. Декомпозиция должна сохранять эквивалентность схем при замене одной схемы на др. Декомпозиция без потерь гарантирует обратимость.

К проектированию БД можно подойти и более формально, превратив процесс проектирования в математическую процедуру[17]. Цель этой процедуры одна - спроектировать оптимальную в некотором смысле структуру данных. Выбор той или иной структуры таблиц может привести к несовершенствам или наоборот обеспечить удобство использования данных.

Полная декомпозиция отношения - это совокупность произвольного числа его проекций, соединение которых идентично исходному отношению (разбиение крупной таблицы на более мелкие).

Процесс проектирования с использованием декомпозиции представляет собой процесс последовательной нормализации схем отношений, при этом каждая последующая итерация соответствует нормальной форме более высокого уровня и обладает лучшими свойствами по сравнению с предыдущей.

Проблемы, возникающие из-за неудачной структуры данных:

1. Аномалия изменения (избыточность и потенциальная противоречивость). Информация во многих столбцах многократно повторяется. Чем больше данных в отношении, тем больше дублируется информации и тем больше непроизводительных затрат. Из-за наличия многих дублей одних и тех же данных возможна ситуация, когда одна часть избыточных копий будет изменена, а другая - нет.

2. Аномалия добавления. В отношение нельзя включить поставщика, если он не осуществил ни одной поставки. Однако зачастую требуется учесть поставщика, данные о котором потенциально могут понадобиться.

3. Аномалия удаления. При удалении факта поступления товара от поставщика может потеряться и информация об этом поставщике, хотя она может пригодиться в дальнейшем.

Нормализация - разбиение таблицы на две или более, обладающие лучшими свойствами при добавлении, изменении и удалении данных.

Каждой нормальной форме соответствует некоторый определенный набор ограничений, и отношение находится в некоторой нормальной форме, если удовлетворяет свойственному ей набору ограничений.

В теории реляционных БД обычно выделяется следующая последовательность нормальных форм:

первая нормальная форма: таблица находится в первой нормальной форме (1НФ) тогда и только тогда, когда ни одна из ее строк не содержит в любом своем поле более одного значения и ни одно из ее ключевых полей не пусто;

вторая нормальная форма: таблица находится во второй нормальной форме (2НФ), если она удовлетворяет определению 1НФ и все ее поля, не входящие в первичный ключ, связаны полной функциональной зависимостью с первичным ключом;

третья нормальная форма: таблица находится в третьей нормальной форме (3НФ), если она удовлетворяет определению 2НФ и не одно из ее не ключевых полей не зависит функционально от любого другого не ключевого поля;

нормальная форма Бойса--Кодда: таблица находится в нормальной форме Бойса-Кодда (НФБК), если и только если любая функциональная зависимость между его полями сводится к полной функциональной зависимости от возможного ключа;

пятая нормальная форма или форма проекции-соединения: таблица находится в пятой нормальной форме (5НФ) тогда и только тогда, когда в каждой ее полной декомпозиции все проекции содержат возможный ключ. Таблица, не имеющая ни одной полной декомпозиции, также находится в 5НФ;

четвертая нормальная форма: является частным случаем 5НФ, когда полная декомпозиция должна быть соединением ровно двух проекций. Весьма не просто подобрать реальную таблицу, которая находилась бы в 4НФ, но не была бы в 5НФ.

Основные свойства нормальных форм:

• каждая следующая нормальная форма в некотором смысле улучшает свойства предыдущей;

• при переходе к следующей нормальной форме свойства предыдущих нормальных форм сохраняются.

Окончательная цель нормализации сводится к получению такого проекта базы данных, в котором каждый факт появляется лишь в одном месте, т.е. исключена избыточность информации. Это делается не столько с целью экономии памяти, сколько для исключения возможной противоречивости хранимых данных.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]