- •Курс лекций
- •Содержание
- •Понятие субд. Функции субд
- •2. Проектирование бд. Нормальные формы отношений 77
- •Понятие бд и субд
- •Данные.
- •Аппаратное обеспечение.
- •Программное обеспечение.
- •Пользователи.
- •Уровни абстракции в субд. Функции абстрактных данных
- •Представления
- •Внешний уровень – внешнее представление
- •Концептуальный уровень – концептуальное представление
- •Внутренний уровень – внутреннее представление
- •Функции субд
- •Экспертные системы и базы знаний
- •Литература:
- •Модели бд
- •Обзор ранних (дореляционных) субд
- •Системы, основанные на инвертированных списках
- •Структуры данных
- •Манипулирование данными
- •Ограничения целостности
- •Иерархическая модель
- •Иерархические структуры данных
- •Манипулирование данными
- •Ограничения целостности
- •Сетевая модель
- •Сетевые структуры данных
- •Манипулирование данными
- •Ограничения целостности
- •Основные достоинства и недостатки ранних субд
- •Литература:
- •Реляционная модель и ее характеристики. Целостность в реляционной модели
- •Представление информации в реляционных бд
- •Отношения. Свойства и виды отношений
- •Свойства отношений
- •Виды отношений
- •Целостность реляционных данных
- •Потенциальные и первичные ключи
- •Внешние ключи
- •Ссылочная целостность
- •Правила внешних ключей
- •Значения null и поддержка ссылочной целостности
- •Литература:
- •Реляционная алгебра
- •Понятие реляционной алгебры
- •Замкнутость в реляционной алгебре
- •Традиционные операции над множествами
- •Объединение
- •Пересечение
- •Вычитание
- •Произведение
- •Свойства основных операций реляционной алгебры
- •Специальные реляционные операции
- •Выборка
- •Проекция
- •Естественное соединение
- •Деление
- •Операция расширения
- •Операция подведения итогов
- •Операторы обновления
- •Реляционные сравнения
- •Литература:
- •Вопросы проектирования бд
- •Понятие проектирования бд
- •Функциональные зависимости
- •Тривиальные и нетривиальные зависимости
- •Замыкание множества зависимостей и правила вывода Армстронга
- •Неприводимое множество зависимостей
- •Нормальные формы – основные понятия
- •Декомпозиция без потерь и функциональные зависимости
- •Диаграммы функциональных зависимостей
- •Литература:
- •Проектирование бд. Нормальные формы отношений
- •Первая нормальная форма. Возможные недостатки отношения в 1нф
- •Вторая нормальная форма. Возможные недостатки отношения во 2нф
- •Третья нормальная форма. Возможные недостатки отношения в 3нф
- •Сохранение зависимости
- •Нормальная форма Бойса-Кодда
- •Литература:
- •Проектирование бд. Нормальные формы отношений (продолжение)
- •Многозначные зависимости
- •Четвертая нормальная форма
- •Зависимости соединения
- •Пятая нормальная форма
- •Зависимости соединения, подразумеваемой потенциальными ключами
- •Итоговая схема процедуры нормализации
- •Литература:
- •Проектирование бд методом сущность-связь. Er-диаграммы
- •Возникновение семантического моделирования
- •Основные понятия метода
- •Диаграммы er-экземпляров и er-типа
- •Связи типа 1:1 и необязательный класс принадлежности
- •Связи типа 1:1 и обязательный класс принадлежности
- •Связи типа 1:м вариант н-о
- •Связи типа м:м и вариант класса принадлежности о-н
- •Правила формирования отношений
- •Степень связи 1:1, класс принадлежности обеих сущностей обязательный
- •Степень связи 1:1, класс принадлежности одной сущности обязательный, а второй – необязательный
- •Степень связи 1:1, класс принадлежности обеих сущностей – необязательный
- •Степень связи между сущностями 1:м (или м:1), класс принадлежности м-связной сущности обязательный
- •Степень связи 1:м (м:1)и класс принадлежности м-связной сущности – необязательный
- •Степень связи м:м, независимо от класса принадлежности сущностей
- •Методология idef1 (самостоятельное изучение)
- •Литература:
- •Язык sql
- •История создания и развития sql
- •Основные понятия sql
- •Операторы
- •Типы данных в sql
- •Константы
- •Запросы на чтение данных. Оператор select
- •Предложение select
- •Предложение from
- •Отбор строк (предложение where)
- •Условия поиска
- •Сортировка результатов запроса (предложение order by).
- •Многотабличные запросы на чтение (объединения).
- •Запросы с использованием отношения предок/потомок.
- •Прочие объединения таблиц по равенству
- •Литература:
- •Язык sql (продолжение)
- •Объединения и стандарт sql2
- •Внутренние объединения в стандарте sql2
- •Внешние объединения в стандарте sql2
- •Перекрестные объединения и запросы на объединение в sql2
- •Многотабличные объединения в стандарте sql2
- •Итоговые запросы на чтение. Агрегатные функции
- •Агрегатные функции и значения null
- •Запросы с группировкой (предложение group by)
- •Несколько столбцов группировки
- •Ограничения на запросы с группировкой
- •Вложенные запросы
- •Условия поиска во вложенном запросе
- •Литература:
- •Внесение изменений в базу данных.
- •Добавление новых данных (оператор insert).
- •Удаление существующих данных (Оператор delete)
- •Обновление существующих данных (Оператор update)
- •Определение структуры данных в sql
- •Создание таблицы (оператор create table)
- •Удаление таблицы (оператор drop table)
- •Изменение определения таблицы (оператор alter table)
- •Определения доменов
- •Индексы (операторы create/drop index)
- •Понятие представления.
- •Преимущества представлений
- •Недостатки представлений
- •Представления в sql.
- •Обновление представлений и стандарт ansi/iso
- •Удаление представления (оператор drop view)
- •Системный каталог (самостоятельное изучение)
- •Понятие системный каталог
- •Системный каталог и стандарт ansi/iso
- •Содержимое системного каталога
- •Информационная схема в стандарте sql2
- •Литература:
- •Обеспечение безопасности бд
- •Общие положения
- •Методы обеспечения безопасности
- •Избирательное управление доступом
- •Обязательное управление доступом
- •Шифрование данных
- •Контрольный след выполняемых операций
- •Поддержка мер обеспечения безопасности в языке sql
- •Директивы grant и revoke
- •Представления и безопасность
- •Литература:
- •Физическая организация бд: структуры хранения и методы доступа
- •Доступ к базе данных
- •Кластеризация
- •Индексирование
- •Плотное и неплотное индексирование
- •Структуры типа б-дерева
- •Хеширование
- •Литература:
- •Оптимизация запросов
- •Пример оптимизации реляционного выражения
- •Обзор процесса оптимизации
- •Стадия 1. Преобразование запроса во внутреннюю форму
- •Стадия 2. Преобразование в каноническую форму
- •Стадия 3. Выбор потенциальных низкоуровневых процедур
- •Стадия 4. Генерация планов вычисления запроса и выбор плана с наименьшей стоимостью
- •Преобразование выражений
- •Выборки и проекции
- •Распределительный закон
- •Коммутативность и ассоциативность
- •Идемпотентность
- •Вычисляемые скалярные выражения
- •Условия
- •Семантические преобразования
- •Статистики базы данных
- •Литература:
- •Восстановление после сбоев
- •Транзакции
- •Понятие транзакции
- •Восстановление транзакции.
- •Свойства асид.
- •Алгоритм восстановления после сбоя системы
- •Восстановление после отказов системы
- •Параллелизм. Проблемы параллелизма
- •Проблема потери результатов обновления
- •Проблема незафиксированной зависимости
- •Проблема несовместимого анализа
- •Понятие блокировки
- •Решение проблем параллелизма
- •Проблема потери результатов обновления.
- •Проблема незафиксированной зависимости.
- •Проблема несовместимого анализа
- •Тупиковые ситуации
- •Способность к упорядочению
- •Уровни изоляции транзакции
- •Поддержка в языке sql
- •Литература:
- •Технологии субд
- •Распределенные базы данных
- •Предварительные замечания.
- •Принципы функционирования распределенной бд
- •Локальная автономия
- •Независимость от центрального узла
- •Непрерывное функционирование
- •Независимость от расположения
- •Независимость от фрагментации
- •Системы типа клиент/сервер
- •Серверы баз данных
- •Литература:
- •Современные постреляционные модели бд
- •Системы управления базами данных следующего поколения
- •Ориентация на расширенную реляционную модель
- •Абстрактные типы данных
- •Генерация систем баз данных, ориентированных на приложения
- •Поддержка исторической информации и темпоральных запросов
- •Объектно-ориентированные субд
- •Модель данных ообд
- •Идентификатор объекта
- •Новые типы данных
- •Оптимизация ядра субд
- •Язык субд и запросы
- •Транзакции в оосубд
- •Блокировки в оосубд
- •Ведение версий
- •Физические хранилища
- •Литература:
- •Regions
- •WorkPlan
- •Subjects
- •Teachers
- •Students
- •Приложение б.Описание структуры учебной базы данных.
Первая нормальная форма. Возможные недостатки отношения в 1нф
Для простоты изложения предполагается, что каждое отношение имеет в точности один потенциальный ключ, который является первичным ключом. Это допущение подтверждают предлагаемые здесь доказательства. Далее в этой главе будет рассмотрен случай, когда отношение имеет два или более потенциальных ключа.
Отношение находится в первой нормальной форме тогда и только тогда, когда все используемые домены содержат только скалярные значения.
В этом определении всего лишь утверждается, что любое нормализованное отношение находится в 1НФ. Однако отношение, которое находится только в 1 НФ (т.е. не находится ни во второй, ни в третьей нормальной форме) обладает структурой, по некоторым причинам не совсем желательной. Для иллюстрации этого факта допустим, что информация о студентах и оценках содержится не в 2-х отношениях Students и Marks а в одном, назовем его SM.
SM{StNo, CityNo, GrNo, SubjNo, DocNo, Mark}
PRIMARY KEY (StNo, GrNo, SubjNo, DocNo).
Диаграмма функциональных зависимостей этого отношения будет выглядеть как показано на рис. 6 .23.
р ис. 6.23 Диаграмма функциональных зависимостей отношения SM
Обратите внимание, что диаграммы ФЗ отношения SM “сложнее”, чем диаграммы ФЗ отношений Students и Marks, из которых оно образовано. В диаграммах ФЗ отношений Students и Marks все стрелки начинаются только от первичных ключей, тогда как в диаграмме ФЗ отношения SM появляются дополнительные стрелки. Ниже приведена таблица данных для отношения SM (Error: Reference source not found).
SM |
||||||
StNo |
StName |
GrNo |
CityNo |
SubjNo |
DocNo |
Mark |
1 |
Иванов |
1 |
1 |
1 |
127 |
5 |
1 |
Иванов |
1 |
1 |
5 |
128 |
4 |
2 |
Петров |
1 |
3 |
1 |
127 |
3 |
рис. 6.24 Данные отношения SM.
Несмотря на то, что отношение SM, как и Students и Marks находится в 1й НФ, оно очевидно обладает избыточностью, поскольку, например, в каждом кортеже для студента Иванова указан его номер “1”, код его группы – “1” и код города, в котором он проживает – “1”. Аналогичная ситуация с другими студентами.
Избыточность в отношении SM приводит к разным аномалиям обновления, получившим такое название по историческим причинам, т.е. к трудностям при выполнении операций обновления типа INSERT (вставка), DELETE (удаление) и UPDATE (обновление). Для начала рассмотрим избыточность типа студент—код города студента, соответствующую функциональной зависимости StNo ®CityNo, и перечисленные ниже проблемы с операциями обновления.
Операция вставки (INSERT). Нельзя вставить данные о студенте, проживающем в некотором городе, не указывая хотя бы одну, полученную этим студентом, оценку. Действительно, в таблице SM не показан студент Сидоров из г. Пятихатки потому, что до тех пор, пока этот студент не получит оценку по какому либо предмету, для него не задано значение первичного ключа.
Операция удаления (DELETE). Если удалить единственный кортеж отношения SM для некоторого студента, будет удалена не только информация о соответствующей оценке, но и информация о студенте и городе, в котором он проживает. Например, если в отношении SM удалить кортеж со значением Петров атрибута StName, будет утрачена вся информация об этом студенте.
Замечание. В действительности проблема заключается в том, что в отношении SM содержится очень много совместной информации, поэтому при удалении некоторого кортежа приходится удалять слишком иного другой информации. А точнее, отношение SM содержит информацию о студентах и об оценках. Таким образом, удаление информации об оценке вызывает также удаление информации о студенте. Для решения этой проблемы нужно разделить информацию на несколько частей, т.е. разместить информацию о студентах в одном отношении, а об оценках – в другом. Таким образом, неформально процедуру нормализации можно охарактеризовать как процедуру разбиения логически несвязанной информации по отдельным отношениям.
Операция модификации (UPDATE). Фамилия студента и код города, в котором он проживает повторяется в отношении SM множество раз, и это приводит к возникновению проблем при обновлении. Если студент меняет фамилию или переезжает в другой город, то возникает проблема, связанная либо с поиском в отношении SM всех кортежей, в которых присутствует информация об этом студенте, либо с получением несовместимого результата (в одном кортеже городом проживания студента будет один город, а в другом кортеже, городом проживания этого студента, будет другой город).
Для решения проблемы избыточности, которая характерна для отношения SM достаточно заменить его двумя другими:
Students{StNo, GrNo, StName, CityNo}
и
Marks{StNo, SubjNo, DocNo, Mark}
Важно отметить, что переработанная таким образом структура позволяет преодолеть все перечисленные ранее проблемы, связанные с операциями обновления.
Операция вставки (INSERT). Теперь с помощью вставки соответствующего кортежа в отношение Students можно включить информацию о студенте и городе, в котором он проживает, даже если он в настоящий момент не получил не одной оценки.
Операция удаления (DELETE). Теперь можно исключить информацию об оценке, удаляя соответствующий кортеж из отношения Marks, при этом информация о студенте и городе, в котором он проживает, не утрачивается.
Операция модификации (UPDATE). В переработанной структуре фамилия студента и информация о городе, в котором он проживает, появляется всего один раз, поскольку существует только один кортеж для данного студента в отношении Students (атрибут StNo является первичным ключом для такого отношения). Иначе говоря, избыточность данных StNo-StName-StCity устранена. Благодаря этому теперь можно один раз изменить в соответствующем кортеже отношения Students название города для какого-либо студента.