Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
BD-2007-0.doc
Скачиваний:
4
Добавлен:
01.03.2025
Размер:
2.68 Mб
Скачать

6.3. Нормализация

Нормализация – это метод организации реляционной базы данных с целью сокращения избыточности. В ходе этого процесса неоптимальная таблица разбивается на две и более таблиц, между которыми создаются отношения. Нормализация является частью этапа проектирования и выполняется над существующими таблицами.

Целью нормализации можно назвать следующую: добиться, чтобы структура базы данных обеспечивала принцип "по одному факту в одном месте".

Нормализация является основой для удаления из сущностей нежелательных транзитивных и функциональных зависимостей.

Под функциональной зависимостью подразумевается, что значение атрибута может быть определено по значению некоторого другого атрибута. Например, зная название страны, можно определить ее столицу. Следовательно, между страной и столицей имеется функциональная зависимость.

Нормализация позволяет проектировать БД, в которых нет ненужных избыточных данных и, следовательно, противоречий, которые могут повлечь за собой проблемы производительности или потерю информации при проектировании. Нормализация заставляет разработчика создавать больше таблиц, равномернее распределяя в них информацию, что приводит к снижению избыточности.

Нормализация определяется в виде наборов правил, известных как нормальные формы. Каждая следующая нормальная форма основана на предыдущей форме, поэтому, например, третья форма более желанна, чем вторая.

Что дает нормализация? Она:

  • позволяет снизить избыточность данных,

  • приводит к улучшению целостности данных. Потребность поддержки целостности данных в приложениях уменьшается и, следовательно, повышается их производительность,

  • формализует простые идеи до уровня, при котором имеющих большой практический смысл при проектировании базы данных.

Нормализация обычно выполняется на этапе проектирования, поэтому под рукой не оказывается готовых данных, на которых можно было бы выполнить проверку.

Ниже кратко рассматриваются (без особых доказательств) правила для первых нескольких уровней нормализации.

При этом следует помнить, что в большинстве случаев для решения практических задач достаточно третьей нормальной формы.

6.3.1. Первая нормальная форма

В реляционной базе данных таблицы почти всегда по умолчанию находятся в первой нормальной форме.

Основные принципы первой нормальной формы

  • главный ‑ заключается в том, что любая запись таблицы должна содержать описание одной сущности,

  • второй – таблица должна иметь первичный ключ. Это может быть либо составной ключ из ряда полей, либо счетчик,

  • третий – ячейки не должны содержать групп значений. Если в ячейке содержится группа значений, то пропадает возможность осуществлять отбор записей отдельно по каждому из критериев. Следует очень внимательно относиться к ситуации, когда в ячейку заносится несколько значений.

Повторяющиеся группы значений должны быть удалены из одной таблицы и помещены в новую (связанную) таблицу.

Отношение находится в первой нормальной форме тогда и только тогда, когда на пересечении каждого столбца и каждой строки находятся только элементарные значения атрибутов.

Пример ненормализованного отношения:

Преподаватель

День недели

Номер пары

Название дисциплины

Тип занятий

Группа

Иванов И.И.

Понед.

Вторник

1

1

Системный анализ

Операционные системы

Семинар

Лекция

КТ-202

КТ II

Петров П.П.

Понед.

Вторник

2

3

Физика

Физика

Практ.

Практ.

КТ-203

КТ-202

Для нормализации этого отношения достаточно дополнить каждую строку фамилией преподавателя с инициалами, разделить первый столбец на три (Фамилия, Имя, Отчество) и рассматривать эти строки как отдельные кортежи.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]