Курсовая ПрБД, 2 курс 3 семестр (для ИВТ и т.п.) / ПБД_метод к КР_v07[2024-2025]
.pdf
В ER-модели степень участия может быть только унарной или бинарной. Связи большей степени приводятся к бинарному виду.
1.3 Логическое проектирование БД
Целью логического проектирования является развитие концептуальной схемы БД с учетом принимаемой модели БД (иерархической, сетевой, реляционной и т.д.). На этапе логического проектирования прежде всего проверяют, что бы схема была приведена к третьей нормальной форме (набору нормализованных отношений с кратностью связей 1:N).
1) Удаление и проверка элементов, не отвечающих принятой модели данных
1.1) Удаление связей N:M
Если в концептуальной схеме присутствуют связи N:M, то их следует устранить путем определения промежуточной сущности. Связь N:M заменяется двумя связями типа 1:M, устанавливаемыми со вновь созданной сущностью (вводится ассоциативный объект).
Рис. 3. Замена связи N:M
11
1.2) Удаление связей с атрибутами
Связи с атрибутами должны быть преобразованы в сущности.
В разработанной концептуальной схеме существовала связь N:M («Тип пользователя» : «Действия»), которая имела собственные атрибуты. После устранения связь N:M, ее атрибуты перешли в сущность «Настройка прав» (см. Рис. 3, неключевые атрибуты).
1.3) Удаление сложных связей (со степенью участия более 2)
Сложную связь заменяют необходимым количеством бинарных связей 1:N со вновь созданной сущностью, которая и показывает эту связь.
1.4) Удаление рекурсивных связей (со степенью участия 1)
Рекурсивную связь заменяют, определив дополнительную сущность и необходимое количество связей.
Рис. 4. Замена рекурсивной связи
В данной схеме можно принять следующее правило: если в сущности «Сотрудник» атрибуты «Табельный номер» и «idРуководитель» совпадают, то набор атрибутов в сущности «Сотрудник» характеризует руководителя.
1.5) Удаление многозначных атрибутов (атрибутов имеющих несколько значений)
12
Многозначность устраняется путем введения новой сущности и связи 1:N. Данное преобразование, помимо соответствия реляционной модели данных, также позволяет хранить любое количество телефонов по одному филиалу.
Рис. 5. Удаление многозначных атрибутов
1.6) Удаление избыточных связей
Связь является избыточной, если одна и та же информация может быть получена не только через нее, но и с помощью другой связи.
Рис. 6. Избыточные связи
В приведенном примере одну из связей «Руководит» можно смело удалить (лучше между «Руководителем филиала» и «Сотрудником»).
1.7) Перепроверка связей 1:1
13
В процессе определения сущностей могли быть созданы сущности, которые на самом деле являются одной. В этом случае их следует объединить. Например, в приведенном выше примере (Рис. 6) сущности «Филиал» и «Руководитель филиала» лучше объединить.
2) Проверка модели с помощью правил нормализации
Основная идея нормализации заключается в том, чтобы каждый факт хранился в одном месте, т.е. чтобы не было дублирования данных. Многие из требований нормализации, как правило, уже учитываются при выполнении предыдущих шагов проектирования.
Ниже приводятся краткие сведения из теории нормализации. Проектирование реляционной БД представляет собой пошаговый про-
цесс создания набора отношений (таблиц, сущностей), в которых отсутствуют нежелательные функциональные зависимости.
Функциональная зависимость определяется следующим образом. Пусть A и B – произвольные наборы атрибутов отношения. Тогда B функционально зависит от A (A → B), в том и только в том случае, если каждому значению A соответствует в точности одно значение B. Левая часть функциональной зависимости (A) называется детерминантом, а правая (B) – зависимой частью. В частности, в отношении А может быть первичным ключом, а B – набором неключевых атрибутов, так как одному значению первичного ключа в точности соответствует одно значение набора неключевых атрибутов.
Если в БД отсутствуют нежелательные функциональные зависимости, то это обеспечивает минимальную избыточность данных, что в свою очередь ведет к уменьшению объема памяти, необходимой для хранения данных. Процесс устранения таких зависимостей получил название нормализация. Она выполняется в виде последовательности тестов для некоторого отношения (таблицы, сущности) с целью проверки его соответствия (или несоответствия) набору ограничений для заданной нормальной формы.
При проектировании БД, как правило, ограничиваются третьей нормальной формой, что позволяет предотвратить возможное возникновение избыточности данных и аномалии обновлений.
1 НФ. Отношение находится в 1НФ, если на пересечении каждого столбца и строки находятся только элементарные (атомарные, неделимые) значения атрибутов.
14
Степень неделимости (атомарности), т.е. решение о том, следует разбивать неатомарный атрибут на атомарные или оставить его псевдоатомарным, определяется проектировщиком БД исходя из конкретных условий. Если при обработке таблиц нет необходимости различать атомарные составляющие псевдоатомарного атрибута, то его можно не делить (например, атрибуты «Фамилия, имя, отчество», «Адрес» и т.д.).
2 НФ. Отношение находится во 2НФ, если оно находится в 1НФ, и каждый неключевой атрибут характеризуется полной функциональной зависимостью от первичного ключа.
Полная функциональная зависимость определяется следующим образом. В некотором отношении атрибут В полностью зависит от атрибута А, если атрибут В функционально зависит от полного значения атрибута А и не зависит от какого-либо подмножества полного значения атрибута А.
Например, таблица «Оценки по экзаменам» характеризуется следующим набором атрибутов {Номер зачетной книжки, Дисциплина, Дата сдачи, ФИО студента, № группы, Оценка}. Очевидно, что первичным ключом является набор {Номер зачетной книжки, Дисциплина, Дата сдачи}. Полной функциональной зависимостью обладает только один неключевой атрибут «Оценка». Атрибуты «ФИО студента» и «№ группы» могут быть однозначно определены по части первичного ключа – «Номер зачетной книжки». Таким образом, требуется разбиение исходной таблицы на две.
Рис. 7. Обеспечение полной функциональной зависимости
15
3 НФ. Отношение находится в 3НФ, если оно находится во 2НФ и никакой неключевой атрибут функционально не зависит от другого неключевого атрибута, т. е. нет транзитивных зависимостей.
Транзитивная зависимость. Если для атрибутов А, В и С некоторого отношения существуют зависимости вида А → В и В → С, то атрибут С транзитивно зависит от атрибута А через атрибут В.
Например, таблица «Работник» характеризуется набором атрибутов {Табельный номер, Фамилия, Имя, Отчество, Должность, Зарплата, …}, первичный ключ – {Табельный номер}. В этой таблице от первичного ключа («Табельный номер») зависит неключевой атрибут «Должность», а от «Должности» другой неключевой атрибут «Зарплата». Для приведения к 3НФ необходимо добавить новую таблицу.
Рис. 8. Устранение транзитивной зависимости
НФБК. Отношение находится в нормальной форма Бойса-Кодда, если оно находится в 3НФ и каждый детерминант отношения является его возможным ключом.
Отступление от НФБК возможно, когда в таблице имеется несколько составных потенциальных ключей (детерминантов), причем часть атрибутов
16
одного потенциального ключа характеризуется полной функциональной зависимостью от части другого потенциального ключа.
Например, таблица «Поставка деталей» характеризуется набором атрибутов {ID поставщика, Наименование поставщика, ID детали, Количество деталей}, потенциальные ключи – {ID поставщика, ID детали} и {Наименование поставщика, ID детали}. Подразумевается, что не может быть двух поставщиков с одним наименованием. Атрибут «ID поставщика» характеризуется полной функциональной зависимостью от атрибута «Наименование поставщика» и наоборот. Чтобы устранить эту нежелательную зависимость, следует один из этих ключей принять в качестве первичного и добавить новую таблицу, куда вынести два указанных атрибута.
потенциальный
ключ №1
потенциальный ключ №2
Рис. 9. Приведения отношения к НФБК
Отличие НФБК от 2НФ заключается в том, что выносимый в отдельную таблицу атрибут («Наименование поставщика») входит в состав потенциального ключа, а не является простым неключевым атрибутом («ФИО студента» и «№ группы»).
4 НФ. Отношение находится в 4НФ в том и только в том случае, если в нем отсутствуют нетривиальные многозначные зависимости.
Нетривиальная многозначная зависимость. В отношении с атрибутами А, В и С существует нетривиальная многозначная зависимость, если для каждого значения атрибута А имеется набор значений атрибута В (A −>> B) и набор значений атрибута С (A −>> С), но между атрибутами В и С нет зависимостей.
17
Например, таблица «Экзамены» характеризуется набором атрибутов {Номер группы, Номер зачетной книжки, Дисциплина}, первичный ключ – весь набор атрибутов. В данной таблице имеется две многозначные зависимости: номер группы определяет список студентов, которые в ней учатся (Номер группы −>> Номер зачетной книжки), и номеру группы соответствует список дисциплин учебного плана, по которым требуется сдавать экзамены (Номер группы −>> Дисциплина). В то же время между номером зачетной книжки и дисциплиной зависимость отсутствует. Для приведения таблицы к 4НФ требуется разбить ее на две.
Рис. 10. Приведения отношения к 4НФ
5 НФ (нормальная форма проекции соединения, PJNF). Отношение находится в 5НФ, если в нем нет зависимостей соединения.
Зависимость соединения. В отношении с атрибутами А, В и С существует зависимость соединения, если для каждого значения атрибута А имеется набор значений атрибута В (A −>> B) и набор значений атрибута С (A −>> С), а также существует многозначная зависимость между атрибутами В и С (В −>> С или С −>> B).
Например, таблица «Дисциплины» характеризуется набором атрибутов {Кафедра, Преподаватель, Дисциплины}, первичный ключ – весь набор атрибутов. В данной таблице имеется несколько многозначных зависимостей: на кафедре работает несколько преподавателей (Кафедра −>> Преподаватель), кафедра ведет несколько дисциплин учебного плана (Кафедра −>> Дисциплина), преподаватель может вести несколько дисциплин (Преподаватель −>> Дисциплина) и, наоборот, одну дисциплину могут вести разные преподаватели (Дисциплина −>> Преподаватель). Для устранения зависимости соединения следует разбить исходную таблицу на три.
18
Рис. 11. Приведения отношения к 5НФ
3) Определение требований поддержки целостности данных
Ограничения целостности данных представляют собой ограничения, которые вводятся с целью предотвращения помещения в базу противоречивых данных. К этим ограничениям относятся:
–обязательные данные – атрибуты, которые всегда должны содержать одно из допустимых значений (NOT NULL). Например, Фамилия сотрудника должна быть обязательно задана. Обязательными также являются все атрибуты, входящие в первичный ключ сущности;
–домены – наборы допустимых значений для атрибута. Например, номер курса должен быть положительным числом в диапазоне от 1 до 4 или форма обучения студента может принимать одно из двух допустимых значений – «ДО» (дневное) или «ЗО» (заочное);
–бизнес-правила (бизнес-ограничения) – ограничения, принятые в рассматриваемой предметной области. Например, дата бронирования не должна быть позже сегодняшней даты и т.д.;
–ссылочная целостность – набор ограничений, определяющих действия при вставке, обновлении и удалении записей (экземпляров сущности). Например:
o при наличии обязательной связи вставка записи в дочернюю сущность требует обязательного заполнения атрибутов внешнего ключа, и введенному значению должна соответствовать запись родительской сущности;
o аналогичное требование выдвигается при обновлении внешнего ключа в дочерней сущности;
19
oудаление записи из дочерней сущности или вставка записи в родительскую не вызывают нарушения ссылочной целостности;
oудаление записи в родительской сущности может требовать удаления всех связанных записей в дочерней сущности.
1.4Физическое проектирование БД
Целью физического проектирования является преобразование логической схемы с учетом синтаксиса, семантики и возможностей выбранной СУБД. Этап физического проектирования существенно зависит от особенностей выбранной СУБД, поэтому ниже приведены общие рекомендации.
1) Анализ необходимости введения контролируемой избыточности
При реализации проекта часто для достижения большей эффективности системы требуется снизить требования к уровню нормализации отношений, т.е. внести некоторую избыточность данных. Процесс внесения таких изменений в БД называется денормализацией.
Ниже приведены отдельные виды денормализации, которые могут повысить производительность системы.
1.1) Использование производных данных
С точки зрения физического проектирования любой производный атрибут либо может сохраняться в БД, либо при каждом обращении к нему его значение будет вычисляться заново. Например, стаж работы сотрудника может каждый раз вычисляться как разность атрибутов «Дата принятия на работу» и сегодняшняя дата либо храниться как отдельный атрибут «Стаж».
Проектировщик при использовании производных данных должен оце-
нить:
–дополнительную стоимость хранения производных данных и поддержки согласованности с текущими значениями тех данных, на основании которых они вычисляются, т.е. минусы хранения производных данных;
–издержки на выполнение вычислений значений производных атрибутов при каждом обращении к ним – плюсы.
1.2) Дублирование атрибутов
1.2.1) Объединение отношений, связанных 1:1
20
