- •Лекция №1 Введение. Основные понятия.
- •Субд ms Access
- •Лекция 2. Системы управления бд
- •1. Файловые системы.
- •2. История развития.
- •3. Функции субд
- •4. Типовая организация современной субд
- •5. Архитектура многопользовательских субд.
- •Лекция №3 Процесс разработки бд.
- •Логическая структура бд преобразуется в физическую с учетом аспектов производительности. Элементы модели "сущность-связь"
- •Основные понятия er-диаграмм
- •Пример разработки простой er-модели
- •Концептуальные и физические er-модели
- •Лекция №4 Реляционная модель данных
- •Аномалии отношений
- •Лекция №5 Нормализация отношений
- •4Нф (Четвертая Нормальная Форма)
- •Лекция №6 Реляционная алгебра.
- •Типы данных.
- •Создание таблиц.
- •Команды модификации.
- •Встроенные функции
- •Группировка и агрегаты.
- •Связи между таблицами.
- •Операторы работы с множествами
- •Подзапросы.
- •Условная логика
- •Представления и хранимые процедуры и триггеры.
- •Конструкция while
- •Транзакции и типы хранилищ бд.
- •Тестирование производительность InnoDb и MyIasm
- •Применение
- •Индексы.
- •1. Чтение данных с диска
- •2. Поиск данных в MySql
- •3. Сортировка данных
- •4. Выбор индексов в MySql
- •Уникальные индексы
- •5. Составные индексы
- •Устройство составного индекса
- •Поиск по диапазону
- •Сортировка
- •6. Использование explain для анализа индексов
- •Когда создавать индексы?
- •Администрирование сервера.
- •Разделение прав пользователей;
Лекция №5 Нормализация отношений
Нормальная форма — требование, предъявляемое к структуре таблиц в теории реляционных баз данных для устранения из базы избыточных функциональных зависимостей между атрибутами (полями таблиц).
Процесс преобразования отношений базы данных к виду, отвечающему нормальным формам, называется нормализацией.
Цель нормализации: исключить избыточное дублирование данных, которое является причиной аномалий, возникших при добавлении, редактировании и удалении кортежей(строк таблицы).
Аномалией называется такая ситуация в таблице БД, которая приводит к противоречию в БД либо существенно усложняет обработку БД. Причиной является излишнее дублирование данных в таблице, которое вызывается наличием функциональных зависимостей от не ключевых атрибутов.
Аномалии-модификации проявляются в том, что изменение одних данных может повлечь просмотр всей таблицы и соответствующее изменение некоторых записей таблицы.
Аномалии-удаления — при удалении какого либо кортежа из таблицы может пропасть информация, которая не связана на прямую с удаляемой записью.
Аномалии-добавления возникают, когда информацию в таблицу нельзя поместить, пока она не полная, либо вставка записи требует дополнительного просмотра таблицы.
О любой таблице данных, если она удовлетворяет определению отношения говорят, что она находится в 1 нормальной форме. То есть Отношение находится в 1НФ, если все его атрибуты являются простыми, все используемые домены должны содержать только скалярные значения. Не должно быть повторений строк в таблице.
Например, есть таблица «Автомобили»:
Фирма |
Модели |
BMW |
M5, X5M, M1 |
Nissan |
GT-R |
Фирма |
Модели |
BMW |
M5 |
BMW |
X5M |
BMW |
M1 |
Nissan |
GT-R |
Отношение находится во 2НФ, если оно находится в 1НФ и каждый не ключевой атрибут зависит от Первичного Ключа(ПК).
Например, дана таблица:
Модель |
Фирма |
Цена |
Скидка |
M5 |
BMW |
5500000 |
5% |
X5M |
BMW |
6000000 |
5% |
M1 |
BMW |
2500000 |
5% |
GT-R |
Nissan |
5000000 |
10% |
Таблица находится в первой нормальной форме, но не во второй. Цена машины зависит от модели и фирмы. Скидка зависит от фирмы, то есть зависимость от первичного ключа неполная. Исправляется это путем декомпозиции на два отношения, в которых не ключевые атрибуты зависят от ПК.
Модель |
Фирма |
Цена |
М5 |
BMW |
5500000 |
Х5М |
BMW |
600000 |
М1 |
BMW |
2500000 |
GT-R |
Nissan |
5000000 |
Фирма |
Скидка |
BMW |
5% |
Nissan |
10% |
Рассмотрим таблицу:
-
Модель
Магазин
Телефон
BMW
Риал-авто
87-33-98
Audi
Риал-авто
87-33-98
Nissan
Некст-Авто
94-54-12
Модель – первичный ключ данного отношения. Здесь мы видим, что Магазин функционально зависит от Модели, а телефон от Магазина. Таким образом телефон зависит и от Модели тоже, хоть и косвенно. Поэтому можно считать, что отношение находится во 2НФ. Такого рода зависимости между атрибутами:
Модель->Магазин->Телефон
называются транзитивными.
Отношение находится в 3НФ, если оно находится во 2НФ и не имеет транзитивных зависимостей.
Магазин |
Телефон |
Риал-Авто |
87-33-98 |
Некст-Авто |
95-54-12 |
|
|
Модель |
Магазин |
BMW |
Риал-авто |
Audi |
Риал-авто |
Nissan |
Некст-Авто |
Отношение находится в НФБК если каждый детерминант является потенциональным ключом.
Пусть требуется хранить данные о поставках деталей некоторыми поставщиками. Предположим, что наименования поставщиков являются уникальными. Кроме того, каждый поставщик имеет свой уникальный номер. Данные о поставках можно хранить в следующем отношении:
Номер поставщика PNUM |
Наименование поставщика PNAME |
Номер детали DNUM |
Поставляемое количество VOLUME |
1 |
Фирма 1 |
1 |
100 |
1 |
Фирма 1 |
2 |
200 |
1 |
Фирма 1 |
3 |
300 |
2 |
Фирма 2 |
1 |
150 |
2 |
Фирма 2 |
2 |
250 |
3 |
Фирма 3 |
1 |
1000 |
Таблица 1 Отношение "Поставки"
Данное отношение содержит два потенциальных ключа - {PNUM, DNUM} и {PNAME, DNUM} и находится в 3НФ.
Отношение
"Поставки" не находится в НФБК,
т.к. имеются зависимости
(PNUM
PNAME и PNAME
PNUM),
детерминанты которых не являются
потенциальными ключами.
Исправляем с помощью декомпозиции:
Таким образом, описанный ранее алгоритм нормализации неприменим к данному отношению. Очевидно, однако, что аномалия данного отношения устраняется путем декомпозиции его на два следующих отношения:
Номер поставщика PNUM |
Наименование поставщика PNAME |
1 |
Фирма 1 |
2 |
Фирма 2 |
3 |
Фирма 3 |
Номер поставщика PNUM |
Номер детали DNUM |
Поставляемое количество VOLUME |
1 |
1 |
100 |
1 |
2 |
200 |
1 |
3 |
300 |
2 |
1 |
150 |
2 |
2 |
250 |
3 |
1 |
1000 |
