
Датологическое проектирование базы данных
Проектная стадия, включающая этапы логического и физического проектирования, в теории баз данных носит название датологического проектирования. Датологическое проектирование баз данных – это разработка способов представления на машинных носителях и компьютерной обработки информации, подлежащей отражению в базе данных. Результатом первого этапа датологического проектирования является логическая модель базы данных, которая представляет собой СУБД – ориентированную модель базы данных. Этап логического проектирования требует выбора модели данных: иерархическая, сетевая, реляционная, постреляционная (объектная). После выбора конкретной модели данных необходимо преобразовать концептуальную модель в логическую базы данных.. при преобразовании концептуальной модели в логическую модель сущности и связанные с ними атрибуты преобразуются в логические записи.
Логическая запись – упорядоченная совокупность элементов данных, входящих в структуру базы данных. Элемент данных (поле) – это наименьшая логическая единица описания объекта (сущности), имеющая обозначение и определенное значение.
Например. Реляционная модель данных «Студент»
Отображение каждого элемента Е –модели в отношение; нормализацию полученных отношений; рационализацию полученной схемы отношений; интерпретацию реляционной схемы в виде совокупности взаимосвязанных таблиц.
Ф |
№ зач.кн. |
Дата рождения |
Адрес места жительства |
Код специальности |
Наименование специальности |
|
|
|
|
|
|
Имя атрибута
Значение атрибута
Набор полей фактографической базы данных.
Типичные поля документальной базы данных в соответствии со структурой библиографической записи являются: Ф.И.О. автора; заглавие издания и т.д.
Совокупность значений всех атрибутов, характеризующих экземпляр сущности, образует строку таблицы (логическую запись).
Набор значений какого-либо атрибута для различных для различных экземпляров сущности образует домен (столбец таблицы).
Среди атрибутов выделяется главный атрибут – ключ таблицы, по значению которого можно найти требуемый экземпляр сущности. Каждая сущность может обладать одним или несколькими ключами, один из кт принимается за первичный (основной) ключ. Например, «Студент» - первичный ключ «№ зач.кн.»
Технология проектирования реляционных баз данных связана с теорией нормализации, основанной на анализе функциональных зависимостей между атрибутами отношений. Нормализация - это разбиение таблицы на несколько, обладающих лучшими свойствами при обновлении, включении и удалении данных. Выделяют пять уровней нормализации. Однако на практике наиболее часто используют три уровня нормализации таблиц.
В процессе построения логической модели данных осуществляется процедура нормализации, кт позволяет сгруппировать атрибуты одной или нескольких сущностей так, чтобы устранить дублирование и обеспечить непротиворечивость хранимых системе данных.
Нормализация отношений – формальный аппарат ограничений на формирование отношений (таблиц), кт позволяет устранить дублирование. Обеспечивает непротиворечивость хранимых в базе данных, уменьшает трудозатраты на ведение (ввод, корректировку) БД.
Первая нормальная форма.
Отношение называется нормализованным или приведенным к первой нормальной форме, если все его атрибуты простые (более неделимы).
Преобразование отношений к первой нормальной форме может привести к увеличению количества реквизитов (полей) отношения и изменению ключа.
Нормализация к первой нормальной форме, если каждое из ее полей является неделимым и не содержит никаких повторяющихся групп. Например, поле «Ф.И.О.», приведенной нормальной форме, будет содержать три поля: «фамилия», «имя», «отчество».
Вторая нормальная форма.
Описательные реквизиты информационного объекта логически связаны с общим для них ключом, эта связь носит характер функциональной зависимости реквизитов.
Отношение будет находиться во второй нормальной форме, если оно находится в первой нормальной форме и все неключевые поля функционально полно зависят от первичного ключа таблицы и от каждого поля в ключевом ключе, если последний состоит из нескольких полей. Приведение отношений ко второй нормальной норме связано с определением функциональной зависимости атрибутов, т.е. зависимости, при которой в экземпляре сущности определенному значению ключевого атрибута соответствует только одно значение описательного атрибута.
Функциональная зависимость реквизитов – зависимость, при которой в экземпляре информационного объекта определенному значению ключевого реквизита соответствует только одно значение описательного реквизита.
Такое определение функциональной завимости позволяет при анализе всех взаимосвязей реквизитов предметной области выделить самостоятельные информационные объекты. В случае составного ключа вводится понятие функциональной полной зависимости.
Функционально полная зависимость неключевых (описательных) атрибутов заключается в том, что каждый неключевой атрибут функционально зависит от ключа . но не находится в функциональной зависимости ни от какой части составного ключа.
Отношение будет находится во второй нормальной форме, если оно находится в первой нормальной форме, и каждый неключевой атрибут функционально полно зависит от составного ключа.
Например, от ИНН сотрудника (простой реквизит) функционально зависят реквизиты, описывающие каждого сотрудника: фамилия, имя, отчество, занимаемая долность и т.д.
Третья нормальная форма.
Отношение будет находиться в третьей нормальной форме, если оно находится в отношении второй нормальной формы и каждое неключевое поле (неключевой атрибут) нетранзитивно зависит от первичного ключа.
Транзитивная зависимость наблюдается в том случае, если один из двух описательных реквизитов зависит от ключа, а другой описательный реквизит от первого описательного реквизита.
Для устранения транзитивной зависимости описательных описательных реквизитов необходимо провести «расщепление» исходной сущности, в результате чего часть атрибутов удаляется из исходного отношения и включается в состав другого, возможно, вновь созданного отношения. Например, если среди атрибутов отношения «студент» числятся атрибуты «группа», «староста», то в результате нормализации они должны быть выделены в новые отношения «группа». При этом каждое неключевое поле таблицы должно быть независящим от других неключевых полей.
Например, для устранения транзитивной зависимости описательных реквизитов необходимо провести «расщепление» исходного информационного объекта. В результате расщепления часть реквизитов удаляется от исходного информационного объекта и включается в состав других (возможно , вновь созданных) информационных объектов.
Три поля – «ИНН сотрудника», «№ отдела», «Начальник» - находятся в транзитивной зависимости. Поле «№отдела» в таблице «Сотрудник» зависит от «ИНН сотрудника», а «Начальник» зависит от «№отдела». Для устранения транзитивной зависимости необходимо часть полей таблицы «Сотрудники» перенести в другую таблицу – «Отделы»
Сотрудники |
Работники
|
Отделы
|
ИНН |
ИНН |
Отдел |
Фамилия |
Фамилия |
Начальник |
Имя |
Имя |
|
Отчество |
Отчество |
|
Дата |
Дата |
|
Отдел |
Отдел |
|
Начальник |
|
|
Свойства нормальных форм: каждая следующая нормальная форма улучшает свойства предыдущей, при переходе к следующей нормальной форме свойства предыдущих нормальных форм сохраняются.