- •Курс лекций
- •Содержание
- •Понятие субд. Функции субд
- •2. Проектирование бд. Нормальные формы отношений 77
- •Понятие бд и субд
- •Данные.
- •Аппаратное обеспечение.
- •Программное обеспечение.
- •Пользователи.
- •Уровни абстракции в субд. Функции абстрактных данных
- •Представления
- •Внешний уровень – внешнее представление
- •Концептуальный уровень – концептуальное представление
- •Внутренний уровень – внутреннее представление
- •Функции субд
- •Экспертные системы и базы знаний
- •Литература:
- •Модели бд
- •Обзор ранних (дореляционных) субд
- •Системы, основанные на инвертированных списках
- •Структуры данных
- •Манипулирование данными
- •Ограничения целостности
- •Иерархическая модель
- •Иерархические структуры данных
- •Манипулирование данными
- •Ограничения целостности
- •Сетевая модель
- •Сетевые структуры данных
- •Манипулирование данными
- •Ограничения целостности
- •Основные достоинства и недостатки ранних субд
- •Литература:
- •Реляционная модель и ее характеристики. Целостность в реляционной модели
- •Представление информации в реляционных бд
- •Отношения. Свойства и виды отношений
- •Свойства отношений
- •Виды отношений
- •Целостность реляционных данных
- •Потенциальные и первичные ключи
- •Внешние ключи
- •Ссылочная целостность
- •Правила внешних ключей
- •Значения null и поддержка ссылочной целостности
- •Литература:
- •Реляционная алгебра
- •Понятие реляционной алгебры
- •Замкнутость в реляционной алгебре
- •Традиционные операции над множествами
- •Объединение
- •Пересечение
- •Вычитание
- •Произведение
- •Свойства основных операций реляционной алгебры
- •Специальные реляционные операции
- •Выборка
- •Проекция
- •Естественное соединение
- •Деление
- •Операция расширения
- •Операция подведения итогов
- •Операторы обновления
- •Реляционные сравнения
- •Литература:
- •Вопросы проектирования бд
- •Понятие проектирования бд
- •Функциональные зависимости
- •Тривиальные и нетривиальные зависимости
- •Замыкание множества зависимостей и правила вывода Армстронга
- •Неприводимое множество зависимостей
- •Нормальные формы – основные понятия
- •Декомпозиция без потерь и функциональные зависимости
- •Диаграммы функциональных зависимостей
- •Литература:
- •Проектирование бд. Нормальные формы отношений
- •Первая нормальная форма. Возможные недостатки отношения в 1нф
- •Вторая нормальная форма. Возможные недостатки отношения во 2нф
- •Третья нормальная форма. Возможные недостатки отношения в 3нф
- •Сохранение зависимости
- •Нормальная форма Бойса-Кодда
- •Литература:
- •Проектирование бд. Нормальные формы отношений (продолжение)
- •Многозначные зависимости
- •Четвертая нормальная форма
- •Зависимости соединения
- •Пятая нормальная форма
- •Зависимости соединения, подразумеваемой потенциальными ключами
- •Итоговая схема процедуры нормализации
- •Литература:
- •Проектирование бд методом сущность-связь. Er-диаграммы
- •Возникновение семантического моделирования
- •Основные понятия метода
- •Диаграммы er-экземпляров и er-типа
- •Связи типа 1:1 и необязательный класс принадлежности
- •Связи типа 1:1 и обязательный класс принадлежности
- •Связи типа 1:м вариант н-о
- •Связи типа м:м и вариант класса принадлежности о-н
- •Правила формирования отношений
- •Степень связи 1:1, класс принадлежности обеих сущностей обязательный
- •Степень связи 1:1, класс принадлежности одной сущности обязательный, а второй – необязательный
- •Степень связи 1:1, класс принадлежности обеих сущностей – необязательный
- •Степень связи между сущностями 1:м (или м:1), класс принадлежности м-связной сущности обязательный
- •Степень связи 1:м (м:1)и класс принадлежности м-связной сущности – необязательный
- •Степень связи м:м, независимо от класса принадлежности сущностей
- •Методология idef1 (самостоятельное изучение)
- •Литература:
- •Язык sql
- •История создания и развития sql
- •Основные понятия sql
- •Операторы
- •Типы данных в sql
- •Константы
- •Запросы на чтение данных. Оператор select
- •Предложение select
- •Предложение from
- •Отбор строк (предложение where)
- •Условия поиска
- •Сортировка результатов запроса (предложение order by).
- •Многотабличные запросы на чтение (объединения).
- •Запросы с использованием отношения предок/потомок.
- •Прочие объединения таблиц по равенству
- •Литература:
- •Язык sql (продолжение)
- •Объединения и стандарт sql2
- •Внутренние объединения в стандарте sql2
- •Внешние объединения в стандарте sql2
- •Перекрестные объединения и запросы на объединение в sql2
- •Многотабличные объединения в стандарте sql2
- •Итоговые запросы на чтение. Агрегатные функции
- •Агрегатные функции и значения null
- •Запросы с группировкой (предложение group by)
- •Несколько столбцов группировки
- •Ограничения на запросы с группировкой
- •Вложенные запросы
- •Условия поиска во вложенном запросе
- •Литература:
- •Внесение изменений в базу данных.
- •Добавление новых данных (оператор insert).
- •Удаление существующих данных (Оператор delete)
- •Обновление существующих данных (Оператор update)
- •Определение структуры данных в sql
- •Создание таблицы (оператор create table)
- •Удаление таблицы (оператор drop table)
- •Изменение определения таблицы (оператор alter table)
- •Определения доменов
- •Индексы (операторы create/drop index)
- •Понятие представления.
- •Преимущества представлений
- •Недостатки представлений
- •Представления в sql.
- •Обновление представлений и стандарт ansi/iso
- •Удаление представления (оператор drop view)
- •Системный каталог (самостоятельное изучение)
- •Понятие системный каталог
- •Системный каталог и стандарт ansi/iso
- •Содержимое системного каталога
- •Информационная схема в стандарте sql2
- •Литература:
- •Обеспечение безопасности бд
- •Общие положения
- •Методы обеспечения безопасности
- •Избирательное управление доступом
- •Обязательное управление доступом
- •Шифрование данных
- •Контрольный след выполняемых операций
- •Поддержка мер обеспечения безопасности в языке sql
- •Директивы grant и revoke
- •Представления и безопасность
- •Литература:
- •Физическая организация бд: структуры хранения и методы доступа
- •Доступ к базе данных
- •Кластеризация
- •Индексирование
- •Плотное и неплотное индексирование
- •Структуры типа б-дерева
- •Хеширование
- •Литература:
- •Оптимизация запросов
- •Пример оптимизации реляционного выражения
- •Обзор процесса оптимизации
- •Стадия 1. Преобразование запроса во внутреннюю форму
- •Стадия 2. Преобразование в каноническую форму
- •Стадия 3. Выбор потенциальных низкоуровневых процедур
- •Стадия 4. Генерация планов вычисления запроса и выбор плана с наименьшей стоимостью
- •Преобразование выражений
- •Выборки и проекции
- •Распределительный закон
- •Коммутативность и ассоциативность
- •Идемпотентность
- •Вычисляемые скалярные выражения
- •Условия
- •Семантические преобразования
- •Статистики базы данных
- •Литература:
- •Восстановление после сбоев
- •Транзакции
- •Понятие транзакции
- •Восстановление транзакции.
- •Свойства асид.
- •Алгоритм восстановления после сбоя системы
- •Восстановление после отказов системы
- •Параллелизм. Проблемы параллелизма
- •Проблема потери результатов обновления
- •Проблема незафиксированной зависимости
- •Проблема несовместимого анализа
- •Понятие блокировки
- •Решение проблем параллелизма
- •Проблема потери результатов обновления.
- •Проблема незафиксированной зависимости.
- •Проблема несовместимого анализа
- •Тупиковые ситуации
- •Способность к упорядочению
- •Уровни изоляции транзакции
- •Поддержка в языке sql
- •Литература:
- •Технологии субд
- •Распределенные базы данных
- •Предварительные замечания.
- •Принципы функционирования распределенной бд
- •Локальная автономия
- •Независимость от центрального узла
- •Непрерывное функционирование
- •Независимость от расположения
- •Независимость от фрагментации
- •Системы типа клиент/сервер
- •Серверы баз данных
- •Литература:
- •Современные постреляционные модели бд
- •Системы управления базами данных следующего поколения
- •Ориентация на расширенную реляционную модель
- •Абстрактные типы данных
- •Генерация систем баз данных, ориентированных на приложения
- •Поддержка исторической информации и темпоральных запросов
- •Объектно-ориентированные субд
- •Модель данных ообд
- •Идентификатор объекта
- •Новые типы данных
- •Оптимизация ядра субд
- •Язык субд и запросы
- •Транзакции в оосубд
- •Блокировки в оосубд
- •Ведение версий
- •Физические хранилища
- •Литература:
- •Regions
- •WorkPlan
- •Subjects
- •Teachers
- •Students
- •Приложение б.Описание структуры учебной базы данных.
Способность к упорядочению
Чередующееся выполнение заданного множества транзакций будет верным, если оно упорядочено, т.е. при его выполнении будет получен такой же результат, как и при последовательное выполнении тех же транзакций. Обосновать это утверждение помогут следующие замечания:
Отдельные транзакции считаются верными, если при их выполнении база данных переходит из одного непротиворечивого состояния в другое непротиворечивое состояние.
Выполнение транзакций одна за другой в любом последовательном порядке также является верным. При этом под выражением "любой последовательный порядок" подразумевается, что используются независимые друг от друга транзакции.
Чередующееся выполнение транзакций, следовательно, является верным, если оно эквивалентно некоторому последовательному выполнению, т.е. если оно подлежит упорядочению.
Возвращаясь к приведенным выше примерам (Error: Reference source not found – Error: Reference source not found), можно отметить, что проблема в каждом случае заключалась в том, что чередующееся выполнение транзакций не было упорядочено, т.е. не было эквивалентно выполнению либо сначала транзакции A, а затем транзакции B, либо сначала транзакции B, а затем транзакции A.
Для заданного набора транзакций любой порядок их выполнения (чередующийся или какой-либо другой) называется графиком запуска. Выполнение транзакций по одной без их чередования называется последовательным графиком запуска, а непоследовательное выполнение транзакций – чередующимся графиком запуска или непоследовательным графиком запуска. Два графика называются эквивалентными, если при их выполнении будет получен одинаковый результат, независимо от исходного состояния базы данных. Таким образом, график запуска является верным (т.е. допускающим возможность упорядочения), если он эквивалентен некоторому последовательному графику запуска.
При выполнении двух различных последовательных графиков запуска, содержащих одинаковый набор транзакций, можно получить совершенно различные результаты. Поэтому выполнение двух различных чередующихся графиков запуска с одинаковыми транзакциями может также привести к различным результатам, которые могут быть восприняты как верные.
Теорема двухфазной блокировки (не имеет отношения к протоколу двухфазной фиксации), которая может быть сформулирована следующим образом:
Если все транзакции подчиняются "протоколу двухфазной блокировки", то для всех возможных чередующихся графиков запуска существует возможность упорядочения.
При этом протокол двухфазной блокировки, в свою очередь, формулируется следующим образом.
Перед выполнением каких-либо операций с некоторым объектом (например, с кортежем базы данных) транзакция должна заблокировать этот кортеж.
После снятия блокировки транзакция не должна накладывать никаких других блокировок.
Таким образом, транзакция, которая подчиняется этому протоколу, характеризуется двумя фазами: фазой наложения блокировки и фазой снятия блокировки.
Характеристика упорядочения может быть выражена следующим образом. Если A и B являются любыми двумя транзакциями некоторого графика запуска, допускающего возможность упорядочения, то либо A логически предшествует B, либо B логически предшествует A, т.е. либо B использует результаты выполнения транзакции A, либо A использует результаты выполнения транзакции B. (Если транзакция A приводит к обновлению кортежей р, q, ... r и транзакция B использует эти кортежи в качестве входных данных, то используются либо все обновленные с помощью A кортежи, либо полностью не обновленные кортежи до выполнения транзакции A, но никак не их смесь.) Наоборот, график запуска является неверным и не подлежит упорядочению, если результат выполнения транзакций не соответствует либо сначала выполнению транзакции A, а затем транзакции B, либо сначала выполнению транзакции B, а затем транзакции A.
В настоящее время с целью понижения требований к ресурсам и, следовательно, повышения производительности и пропускной способности в реальных системах обычно предусмотрено использование не двухфазных транзакций, а транзакций с "ранним снятием блокировки" (еще до выполнения операции прекращения транзакции) и наложением нескольких блокировок. Однако следует понимать, что использование таких транзакций сопряжено с большим риском. Действительно, при использовании недвухфазной транзакции A предполагается, что в данной системе не существует никакой другой чередующейся с ней транзакции B (в противном случае в системе возможно получение ошибочных результатов).