
- •Понятие базы данных. Пример
- •Что понимается под структурированием данных в базе данных?
- •Классификация баз данных. Архитектуры централизованных баз данных с сетевым доступом.
- •Структурные элементы базы данных.
- •Описание логической структуры записи файла базы данных
- •Понятия первичного и вторичного ключей в базе данных
- •Сетевая модель данных: основные понятия, описание, схема Сетевая модель данных
- •Свойства таблиц (отношений) в реляционной модели данных
- •Способы наглядного представления информационного объекта
- •По какому принципу атрибуты (реквизиты) группируются в отношения в реляционной модели данных?
- •Что такое нормализация отношений? Первая норма форма
- •Вторая норма форма. Понятие полной функциональной зависимости описательных реквизитов.
Свойства таблиц (отношений) в реляционной модели данных
Каждая реляционная таблица представляет собой двумерный массив и обладает следующими свойствами:
каждый элемент таблицы — один элемент данных;
все столбцы в таблице однородные, т.е. все элементы в столбце имеют одинаковый тип (числовой, символьный и т.д.) и длину;
каждый столбец имеет уникальное имя;
одинаковые строки в таблице отсутствуют;
порядок следования строк и столбцов может быть произвольным.
Способы наглядного представления информационного объекта
Информационный объект - это описание реального объекта, явления, процесса, события в виде совокупности логически связанных реквизитов (информационных элементов).
Информационный объект определенного реквизитного состава и структуры образует класс (тип), ему присваивается уникальное имя (символьное обозначение).
Информационный объект имеет множество реализаций - экземпляров, каждый из которых представлен совокупностью конкретных значений реквизитов и идентифицируется значением ключа (простого - один реквизит или составного - несколько реквизитов). Остальные реквизиты информационного объекта являются описательными. Одни и те же реквизиты в одних информационных объектах могут быть ключевыми, а в других - описательными. Информационный объект может иметь несколько ключей.
По какому принципу атрибуты (реквизиты) группируются в отношения в реляционной модели данных?
Одни и те же данные могут группироваться в таблицы (отношения) различными способами, т.е. возможна организация различных наборов отношений взаимосвязанных информационных объектов. Группировка атрибутов в отношениях должна быть рациональной, т.е. минимизирующей дублирование данных и упрощающей процедуры их обработки и обновления. Определенный набор отношений обладает лучшими свойствами при включении, модификации, удалении данных, чем все остальные возможные наборы отношений, если он отвечает требованиям нормализации отношений.
Что такое нормализация отношений? Первая норма форма
Нормализация отношений — формальный аппарат ограничений на формирование отношений (таблиц), который позволяет устранить дублирование, обеспечивает непротиворечивость хранимых в базе данных, уменьшает трудозатраты на ведение (ввод, корректировка) базы данных.
Е. Коддом выделены три нормальные формы отношений и предложен механизм, позволяющий любое отношение преобразовать к 3-ьей (самой совершенной) нормальной форме.
Первая нормальная форма (1НФ)
Отношение называется нормализованным или приведенным к 1-ой норме, если все его атрибуты просты (далее неделимы).
Пример 1. Отношение
Студент = (Номер, Фамилия, Имя, Отчество, Дата, Группа)
находится в 1-ой нормальной форме.
Преобразование отношения к 1-ой нормальной форме может привести к увеличению количества реквизитов (полей) отношения и изменению ключа.
Вторая норма форма. Понятие полной функциональной зависимости описательных реквизитов.
Вторая нормальная форма
Предварительно поясним понятия:
«функциональная зависимость» и
«полная функциональная зависимость».
Пусть А и В — два атрибута некоторого отношения. Говорят, что А функционально зависит от В, если в любой момент времени каждому значению А соответствует не более, чем одно значение В. Это обозначается так: АВ.
В нормализованном отношении все неключевые атрибуты (т.е. описательные реквизиты) функционально зависят от ключа отношения, то есть определенному значению ключевого реквизита соответствует только одно значение описательного реквизита.
Такое определение функциональной зависимости позволяет при анализе всех взаимосвязей атрибутов предметной области (ПО) выделить самостоятельные информационные объекты.
Пример графического изображения функциональных зависимостей атрибутов ИО «Студент»:
Номер |
|
Фамилия |
|
Имя |
|
Отчество |
|
Дата |
|
Группа |
|
В случае составного ключа (состоящего из нескольких атрибутов) вводится понятие функционально полной зависимости.
Говорят, что неключевой атрибут функционально полно зависит от составного ключа, если он функционально зависит от ключа, но не находится в функциональной зависимости ни от какой части составного ключа.
Пример 4. В отношении R2 атрибуты ФИО сотрудника, Оклад, Комната, Телефон не находятся в полной функциональной зависимости от ключа отношения, так как они функционально зависят от части ключа Таб. №.
Рационально ли в этой таблице хранить поле Оклад?
Имеет место дублирование информации, если сотрудник имеет много детей. При изменении оклада придется исправлять несколько записей.
Проблема с бездетными сотрудниками — им не соответствует ни одна запись, то есть БД не может содержать сведений о таких сотрудниках.
То есть отношение требует дальнейших преобразований.
Отношение будет находиться во 2-ой НФ, если оно находится в 1НФ, и каждый неключевой атрибут функционально полно зависит от составного ключа.
В нашем примере отношение R2 следует преобразовать в два отношения R3 и R4, каждое из которых находится в 2НФ.
R3 «Дети»
Таб. № сотрудника |
Имя ребенка |
Возраст |
211 |
Саша |
10 |
211 |
Женя |
7 |
211 |
Вася |
3 |
358 |
Вова |
5 |
360 |
Женя |
8 |
360 |
Вова |
6 |
R4 «Сотрудники»
Таб. № сотрудника |
ФИО сотрудника |
Оклад |
Комната |
Телефон |
211 |
Иванов Л.А |
150 |
12 |
616 |
211 |
Иванов Л.А |
150 |
12 |
616 |
211 |
Иванов Л.А |
150 |
12 |
616 |
358 |
Темкин М.Г. |
170 |
12 |
616 |
360 |
Кошкин В.К. |
240 |
5 |
306 |
360 |
Кошкин В.К |
240 |
5 |
306 |
То есть построено отношение R3, из которого были исключены атрибуты, не зависящие функционально полно от составного ключа;
Образовали отношение R4, куда вошли атрибуты, которые функционально зависят от части «Таб №» составного ключа.
Третья нормальная форма. Транзитивная зависимость описательных реквизитов
Третья нормальная форма
Эта форма опирается на понятие нетранзитивной зависимости.
П
усть
А, В, С — три атрибута некоторого
отношения. При этом А
В и ВС, но обратное
отсутствует, то есть СВ
или ВА.
Тогда говорят, что С транзитивно зависит от А.
В отношении R4 содержится пример транзитивной зависимости:
Тав.№ Комната Телефон
Хранение в отношении атрибутов, находящихся в транзитивной зависимости от ключа порождает ряд неудобств
№ телефона — это характеристика комнаты, поэтому сведения о телефоне будут многократно дублироваться для всех сотрудников, рабочие места которых расположены в одной комнате;
Изменение № телефона потребует корректировки большого числа записей.
Сложности возникают, если в комнате нет, например, временно рабочих мест или когда единственный обитатель комнаты переселился в другую. Отношение R4 позволяет содержать информацию о комнате и установленном в нем телефоне только, когда за комнатой закреплено рабочее место хотя бы одного сотрудника.
Отношение будет находиться в 3НФ, если оно находится в 2НФ, и каждый неключевой атрибут нетранзитивно зависит от первичного ключа.
Для устранения транзитивной зависимости описательных реквизитов необходимо провести расщепление исходного информационного объекта. При этом часть атрибутов удаляется из исходного ИО и включается в состав других (возможно, вновь созданных ) информационных объектов.
R5
Таб. № сотрудника |
ФИО сотрудника |
Оклад |
Комната |
211 |
Иванов Л.А |
150 |
12 |
211 |
Иванов Л.А |
150 |
12 |
211 |
Иванов Л.А |
150 |
12 |
358 |
Темкин М.Г. |
170 |
12 |
360 |
Кошкин В.К. |
240 |
5 |
360 |
Кошкин В.К |
240 |
5 |
R5
Комната |
Телефон |
12 |
616 |
12 |
616 |
12 |
616 |
12 |
616 |
5 |
306 |
5 |
306 |
То есть в процессе приведения отношений ко 2НФ и №НФ число отношений в схеме БД увеличивается.
Типы связей между отношениями в базе данных.
Связь Один-ко-многим - наиболее часто используемый тип связи между таблицами. В такой связи каждой записи в таблице А может соответствовать несколько записей в таблице В (поля с этими записями называют внешними ключами), а запись в таблице В не может иметь более одной соответствующей ей записи в таблице А.
При связи Многие-ко-многим одной записи в таблице А может соответствовать несколько записей в таблице В, а одной записи в таблице В - несколько записей в таблице А. Такая схема реализуется только с помощью третьей (связующей) таблицы, ключ которой состоит по крайней мере из двух полей, одно из которых является общим с таблицей А, а другое - общим с таблицей В.
При связи Один-к-одному запись в таблице А может иметь не более одной связанной записи в таблице В и наоборот. Этот тип связи используют не очень часто, поскольку такие данные могут быть помещены в одну таблицу. Связь с отношением Один-к-одному применяют для разделения очень широких таблиц, для отделения части таблицы в целях ее защиты, а также для сохранения сведений, относящихся к подмножеству записей в главной таблице.
Тип создаваемой связи зависит от полей, для которых определяется связь:
-связь Один-ко-многим создается в том случае, когда только одно из полей является ключевым или имеет уникальный индекс, т.е. значения в нем не повторяются;
-связь Один-к-одному создается в том случае, когда оба связываемых поля являются ключевыми или имеют уникальные индексы;
- связь Многие-ко-многим фактически представляет две связи типа один-ко -многим через третью таблицу, ключ которой состоит, по крайней мере, из двух полей, общих для двух других таблиц.
17) Понятие информационно-логической модели предметной области
Информационно-логическая модель отображает данные предметной области в виде совокупности информационных объектов и связей между ними. Эта модель представляет данные, подлежащие хранению в базе данных. При разработке модели данных могут использоваться два подхода. В первом подходе сначала определяются основные задачи, для решения которых строится база, и выявляются потребности задач в данных. При втором подходе сразу устанавливаются типовые объекты предметной области. Наиболее рационально сочетание обоих подходов. Это связано с тем, что на начальном этапе, как правило, нет исчерпывающих сведений обо всех задачах. Использование такой технологии тем более оправдано, что гибкие средства создания реляционной базы данных в Access позволяют на любом этапе разработки внести изменения в базу данных и модифицировать ее структуру без ущерба для введенных ранее данных.