
- •Рецензент
- •Лекция 1. Базы данных и системы управления базами данных
- •Понятие базы данных
- •Понятие системы управления базами данных
- •Обобщенная архитектура субд
- •Трехуровневая архитектура ansi-sparc
- •Достоинства и недостатки субд
- •Архитектура многопользовательских субд
- •Технология «клиент/сервер»
- •Лекция 3. Администрирование баз данных. Системный каталог Понятие независимости данных
- •Общая классификация пользователей бд
- •Администратор базы данных
- •Разделение функций администрирования
- •Лекция 4. Проектирование бд
- •Некоторые термины и определения, используемые при работе с базами данных
- •Принципы проектирования информационных систем
- •Жизненный цикл информационной системы
- •Этапы проектирования баз данных
- •Лекция 5. Семантическое моделирование
- •Лекция 6. Логическое проектирование субд Выбор субд
- •Метод ранжировки
- •Метод непосредственных оценок
- •Метод последовательных предпочтений
- •Оценка результатов экспертного анализа
- •Лекция 7. Даталогические модели данных
- •Иерархическая модель
- •Сетевая модель
- •Реляционная модель
- •Достоинства и недостатки даталогических моделей
- •Лекция 8. Нормализация бд. Часть1 Понятие функциональной зависимости[2]
- •Аксиомы вывода функциональных зависимостей
- •Первая нормальная форма
- •Вторая нормальная форма
- •Третья нормальная форма
- •Нормализация через декомпозицию
- •Лекция 9. Нормализация бд. Часть 2 Недостатки нормализации посредством декомпозиции
- •Нормальная форма Бойса–Кодда (нфбк)
- •Многозначные зависимости
- •Аксиомы вывода многозначных зависимостей
- •Четвертая нормальная форма
- •Зависимости соединения
- •Пятая нормальная форма
- •Обобщение этапов нормализации
- •Лекция 10. Физическая организация данных в субд Списковые структурых [2]
- •Последовательное распределение памяти
- •Связанное распределение памяти
- •Модель внешней памяти
- •Лекция 11. Методы поиска и индексирования данных Последовательный поиск [2]
- •Бинарный поиск
- •Индекс - «бинарное дерево»
- •Неплотный индекс
- •Плотный индекс
- •Инвертированный файл
- •Лекция 12. Реляционная модель данных Понятие отношениях
- •Формы представления отношений
- •Теоретические языки запросов
- •Определение реляционной полноты
- •Лекция 13. Распределенные базы данных и субд
- •Основные определения, классификация распределенных систем
- •Преимущества и недостатки распределенных субд
- •Функции распределенных субд
- •Архитектура распределенных субд
- •Лекция 15. Общее введение в sql, типы данных и средства определения доменов Часть 1. Введение
- •Краткая история языка sq [12]
- •Структура языка sql
- •Типы данных sql
- •Tочные числовые типы
- •Истинно целые типы
- •Точные типы, допускающие наличие дробной части
- •Приближенные числовые типы
- •Типы символьных строк
- •Типы битовых строк
- •Лекция 16. Общее введение в sql, типы данных и средства определения доменов Часть 2. Типы даты и времени
- •Тип даты
- •Типы времени
- •Типы временной метки
- •Типы времени и временной метки с временной зоной
- •Типы временных интервалов
- •Булевский тип
- •Типы коллекций
- •Типы массивов
- •Типы мультимножеств
- •Анонимные строчные типы
- •Типы, определяемые пользователем
- •Ссылочные типы
- •Средства определения, изменения определения и отмены определения доменов
- •Определение домена
- •Примеры определений доменов
- •Изменение определения домена
- •Примеры изменения определения домена
- •Отмена определения домена
- •Неявные и явные преобразования типа или домена
- •Неявные преобразования типов в sql
- •Явные преобразования типов или доменов и оператор cast
- •Заключение
- •Тезаурус
- •12. Кузнецов с. Д. Базы данных. Вводный курс. Http://citforum.Ru/database/advanced_intro/
Нормальная форма Бойса–Кодда (нфбк)
Схема отношения R находится в нормальной форме Бойса-Кодда (НФБК) относительно множества F-зависимостей F, если она находится в 1НФ и никакой атрибут в R не зависит транзитивно ни от одного ключа R [14].
Схема базы данных R находится в нормальной форме Бойса-Кодда (НФБК) относительно множества F-зависимостей F, если каждая схема отношения R R находится в НФБК относительно F.
НФБК включает в себя ЗНФ [14].
Схема отношения R находится в нормальной форме Бойса-Кодда (НФБК) относительно множества F-зависимостей F, если для каждого подмножества Y из R и каждого атрибута A R-Y из Y→А следует Y→R при F, т.е. если Y нетривиально определяет произвольный атрибут из R, то Y есть сверхключ R.
Для схемы отношения, не находящейся в НФБК, можно всегда провести декомпозицию в схему базы данных в НФБК [14].
С одной стороны, НФБК в некотором смысле является более сильной, чем ЗНФ, а значит, более желательной. Но, с другой стороны, НФБК имеет свои проблемы [14]. Из предыдущего изложения следует, что при заданном множестве F-зависимостей над R можно найти схему базы данных в ЗНФ, полностью характеризующую F. Для НФБК это неверно. Множество F-зависимостей может не иметь полной НФБК схемы базы данных, кроме того, проверка свойства НФБК для заданной схемы базы данных является NP-полной задачей.
Многозначные зависимости
Выше было показано, что присутствие функциональных зависимостей в реляционной схеме означает возможность декомпозиции схемы, уменьшающей избыточность и при этом сохраняющей информацию. Однако существование F-зависимостей не является необходимым условием такой декомпозиции. Рассмотрим состояние отношения Назначение табл. 10.1.
Таблица 10.1
Назначение |
РЕЙС |
ДЕНЬ-НЕДЕЛИ |
ТИП-САМОЛЕТА |
|
106 106 106 106 204 204 |
Понедельник Четверг Понедельник Четверг Среда Среда |
747 747 1011 1011 707 727 |
Кортеж <fdp> в отношении Назначение означает, что рейс № f может выполняться в день недели d на самолете типа р. В отношении не выполняются ни F-зависимость РЕЙС→ДЕНЬ-НЕДЕЛИ, ни РЕЙС→ТИП-САМОЛЕТА, однако оно без потери информации разлагается на два отношения: РЕЙС ДЕНЬ-НЕДЕЛИ и РЕЙС ТИП-САМОЛЕТА (табл.10.2).
Таблица 10.2
День назначения |
РЕЙС |
ДЕНЬ-НЕДЕЛИ |
|
106 106 204 |
Понедельник Четверг Среда |
Тип самолета назначения |
РЕЙС |
ТИП-САМОЛЕТА |
|
106 106 204 204 |
747 1011 707 727 |
Рассмотрим другое состояние отношения Назначение, задаваемое табл. 10.3. Если разложить это состояние на схемы (РЕЙС, ДЕНЬ-НЕДЕЛИ) и (РЕЙС, ТИП-САМОЛЕТА), то снова получится вариант из табл.10.2. Однако соединение отношений табл. 10.2 не восстанавливает исходного отношения.
Таблица 10.3
Назначение |
РЕЙС |
ДЕНЬ-НЕДЕЛИ |
ТИП-САМОЛЕТА |
|
106 106 106 204 204 |
Понедельник Четверг Четверг Среда Среда |
747 747 1011 707 727 |
Каковы же свойства первого состояния отношения Назначение, отсутствующие у второго, которые обеспечивают декомпозицию без потери информации? В первом случае, если самолет некоторого типа использован для выполнения маршрута в один день, он может быть использован для выполнения этого маршрута в любой другой день. Это свойство отсутствует во втором состоянии отношения Назначение, поскольку рейс №106 может использовать тип 1011 в четверг, но не в понедельник. Отношение в первом состоянии следует подвергнуть декомпозиции, ибо при заданном рейсе ДЕНЬ-НЕДЕЛИ не содержит информации об атрибуте ТИП-САМОЛЕТА, и наоборот.
Сформулируем это свойство по-другому. Если в отношении Назначение существуют кортежи <fdp> и <fd'p'>, то должен быть кортеж <fd'p>. Формальное определение следующее [14].
Пусть R – реляционная схема, X и Y – непересекающиеся подмножества R, и пусть Z=R–(XY). Отношение r(R) удовлетворяет многозначной зависимости (MV-зависимости) Х→→Y, если для любых двух кортежей t1 и t2 из r, для которых t1(X) = t2(X), в r существует кортеж t3 для которого выполняются соотношения t3(X) = t1(X), t3(Y) = t1(Y), t3(Z) = t2(Z).
Из симметрии определения относительно t1 и t2 следует, что в г существует также в r для которого
t4(X) = t1(X), t4(Y) = t2(Y), t4(Z) = t2(Z).
Пример 13. MV-зависимость РЕЙС→→ДЕНЬ-НЕДЕЛИ выполняется для отношения Назначение в состоянии табл. 10.1, но не табл. 10.3. Состояние табл. 10.1 удовлетворяет также MV-зависимости РЕЙС→→ТИП-САМОЛЕТА. Тот факт, что состояние отношения Назначение (табл.10.1) удовлетворяет двум MV-зависимостям, не является случайным [14].