
- •Введение в бд
- •Файловые системы
- •Системы с базами данных
- •Модели данных
- •Альтернативная терминология Терминология, используемая в реляционной модели, порой может привести к путанице, поскольку помимо предложенных двух наборов терминов существует еще один – третий.
- •Сетевая модель данных
- •Иерархическая модель данных
- •Вопросы:
- •Упражнения:
- •Реляционная модель.
- •Реляционная алгебра. Реляционное исчисление.
- •Реляционная модель
- •Реляционные языки
- •Реляционная алгебра
- •Унарные операции реляционной алгебры
- •Операции с множествами
- •Операции соединения
- •Деление
- •Реляционное исчисление
- •Реляционное исчисление кортежей
- •Реляционное исчисление доменов
- •Другие языки
- •Тема 3 Моделирование данных Модель «сущность-связь»
- •Элементы модели «сущность-связь»
- •Сущность
- •Атрибуты
- •Идентификаторы
- •Три типа бинарных связей
- •Диаграммы «сущность-связь»
- •Изображение атрибутов в диаграммах «сущность-связь»
- •Слабые сущности
- •Подтипы сущностей
- •Пример er-диаграммы
- •Диаграммы «сущность-связь» в стиле uml
- •Сущности и связи в uml
- •Представление слабых сущностей
- •Представление подтипов
- •Конструкции ооп, введенные языком uml
- •Семантическая объектная модель
- •Семантические объекты
- •Определение семантических объектов
- •Атрибуты
- •Кардинальное число атрибута
- •Экземпляры объектов
- •Парные атрибуты
- •Объектные идентификаторы
- •Домены атрибутов
- •Представления семантических объектов
- •Создание семантических объектных моделей данных
- •Пример: база данных администрации нтуу «кпи»
- •Спецификация объектов
- •Типы объектов
- •Простые объекты
- •Составные объекты
- •Гибридные объекты
- •Ассоциативные объекты
- •Объекты вида родитель/подтип
- •Объекты вида архетип/версия
- •Переход от семантической объектной модели к модели «сущность-связь»
- •Вопросы:
- •Упражнения:
- •Тема 4 Нормализация
- •Классы отношений
- •Нормальные формы от первой до пятой
- •Тема 5 Методология проектирования баз данных Введение в методологию проектирования баз данных
- •Методология концептуального проектирования базы данных
- •Методология логического проектирования реляционных баз данных
- •Суть состоит в том, что при устранении избыточности очень важно исследовать значение каждой из связей, существующих между сущностями.
- •Методология физического проектирования базы данных
- •Трехуровневая архитектура ansi-sparc
- •Система управления Базами Данных
- •1. Хранение, извлечение и обновление данных
- •2. Каталог доступный конечным пользователям
- •Поддержка транзакций
- •Сервисы управления параллельностью
- •Сервисы восстановления
- •6. Сервисы контроля доступа к данным
- •Поддержка обмена данными
- •8. Вспомогательные службы
- •Преимущества:
- •Недостатки:
- •Вопросы:
- •Упражнения:
- •История языка sql
- •Особая роль языка sql
- •Используемая терминология
- •Запись операторов sql
- •Манипулирование данными
- •Литералы
- •Простые запросы
- •Выборка строк (конструкция where)
- •Сортировка результатов (конструкция order by)
- •Использование агрегирующих функций языка sql
- •Группирование результатов (конструкция group by)
- •Ограничения на выполнение группирования (конструкция having)
- •Подзапросы
- •Ключевые слова any и all
- •Многотабличные запросы
- •Выполнение соединений
- •Внешние соединения
- •Ключевые слова exists и not exist
- •Комбинирование результирующих таблиц (операции union, intersect и except)
- •Изменение содержимого базы данных
- •Добавление новых данных в таблицу (оператор insert)
- •Модификация данных в базе (оператор update)
- •Удаление данных из базы (оператор delete)
- •Скалярные типы данных языка sql
- •Логические данные (тип boolean)
- •Символьные данные (тип character)
- •Битовые данные (тип bit)
- •Точные числовые данные (тип exact numeric)
- •Округленные числовые данные (тип approximate numeric)
- •Дата и время (тип datetime)
- •Интервальный тип данных interval
- •Скалярные операторы
- •Средства поддержки целостности данных
- •Обязательные данные
- •Ограничения для доменов
- •Целостность сущностей
- •Ссылочная целостность
- •Требования данного предприятия
- •Определение данных
- •Создание баз данных
- •Создание таблиц (оператор create table)
- •Модификация определения таблицы (оператор alter table)
- •Удаление таблиц (оператор drop table)
- •Создание индекса (оператор create index)
- •Удаление индекса (оператор drop index)
- •Представления
- •Создание представлений (оператор create view)
- •Удаление представлений (оператор drop view)
- •Замена представлений
- •Ограничения на использование представлений
- •Обновление данных в представлениях
- •Использование конструкции with check option
- •Преимущества и недостатки представлений
- •Преимущества
- •Недостатки
- •Материализация представлений
- •Использование транзакций
- •Немедленные и отложенные ограничения поддержки целостности данных
- •Управление доступом к данным
- •Идентификаторы пользователей и права владения
- •Привилегии
- •Предоставление привилегий другим пользователям (оператор grant)
- •Отмена предоставленных пользователям привилегий (оператор revoke)
- •Приложение
- •Тема 7.3 Хранимые процедуры и функции. Триггеры.
- •Создание хранимых процедур и функций
- •Простые формы выражений
- •Поддержка транзакций
- •Свойства транзакций
- •Архитектура базы данных
- •Управление параллельным доступом
- •Проблема потерянного обновления
- •Проблема зависимости от незафиксированных результатов (или "грязного" чтения)
- •Проблема анализа несогласованности
- •Упорядочиваемость и восстанавливаемость
- •Конфликтная упорядочиваемость
- •Упорядочиваемость по просмотру
- •Восстанавливаемость
- •Методы управления параллельным доступом
- •Методы блокировки
- •Двухфазная блокировка
- •Управление параллельным выполнением при использовании индексных структур
- •Защелки
- •Взаимоблокировка
- •Тайм-ауты
- •Предотвращение взаимоблокировок
- •Обнаружение взаимоблокировок
- •Частота выполнения операции обнаружения взаимоблокировок
- •Возобновление нормальной работы после обнаружения взаимоблокировки
- •Использование временных отметок
- •Правило записи Томаса
- •Сравнение методов
- •Упорядочение временных отметок в случае многих версий
- •Оптимистические методы упорядочения
- •Степень детализации блокируемых элементов данных
- •Иерархия степеней детализации
- •Блокировка с учетом нескольких степеней детализации
- •Восстановление базы данных
- •Необходимость восстановления
- •Транзакции и восстановление
- •Управление буферами базы данных
- •Функции восстановления
- •Механизм резервного копирования
- •Файл журнала
- •Создание контрольных точек
- •Методы восстановления
- •Метод восстановления с использованием отложенного обновления
- •Метод восстановления с использованием немедленного обновления
- •Метод теневого страничного обмена
- •Улучшенные модели транзакций
- •Модель вложенных транзакций
- •Эмуляция механизма вложенных транзакций с помощью точек сохранения
- •Хроники
- •Модель многоуровневых транзакций
- •Динамическая реструктуризация
- •Модели рабочих потоков
- •Общий обзор методов обработки запросов
- •Основные этапы обработки запросов
- •Динамическая и статическая оптимизация запросов
- •Декомпозиция запросов
- •Нормализация
- •Семантический анализ
- •Упрощение
- •Реструктуризация запросов
- •Эвристический подход к оптимизации запросов
- •Правила преобразования операций реляционной алгебры
- •Оценка стоимости операций реляционной алгебры
- •Статистические показатели базы данных
- •Вариант 6. Поиск по равенству значению кластеризующего (вторичного) индекса
- •Вариант 7. Поиск по равенству значению некластеризующего (вторичного) индекса
- •Составные предикаты
- •Конъюнктивная выборка без дизъюнкций
- •Выборки с дизъюнкциями
- •Конвейерная обработка данных
- •Тема 10
- •Основные типы угроз
- •Контрмеры – компьютерные средства контроля
- •Авторизация пользователей
- •Привилегии
- •Права владения и привилегии
- •Представления (подсхемы)
- •Резервное копирование и восстановление
- •Поддержка целостности
- •Шифрование
- •Raid (массив независимых дисковых накопителей с избыточностью)
- •Средства защиты субд Microsoft Access
- •Установка пароля
- •Защита на уровне пользователя
Проблема зависимости от незафиксированных результатов (или "грязного" чтения)
Проблема зависимости от незафиксированных результатов возникает в том случае, если одна из транзакций получит доступ к промежуточным результатам выполнения другой транзакции до того, как они будут зафиксированы в базе данных. В табл. 8.2 приведен пример зависимости от незафиксированных результатов, вызывающий появление ошибки. В этом примере используются те же первоначальные данные для количества студентов в ТМ-32, что и в предыдущем примере.
В этом случае транзакция Т4 увеличивает значение количества студентов в группе ТМ-32 до 40 человек, после чего выполнение транзакции отменяется, поэтому СУБД должна выполнить откат транзакции с восстановлением первоначального значения количества студентов в ТМ-32, равного 30 человек. Однако к этому моменту транзакция Т3 уже успела считать измененное значение «Кол-во студентов» (40 человек) и использовала именно это значение при выполнении операции отчисления 5 студентов из группы, после чего зафиксировала в базе данных неверный результат, равный 35 студентам (вместо правильного – 25 студентов). Значение «Кол-во студентов», считанное в транзакции Т4, называется грязными данными. От этого термина происходит второе название рассматриваемой проблемы – проблема грязного чтения.
Таблица 8.2. Пример проблемы зависимости от незафиксированных результатов
Время |
Транзакция Т3 |
Транзакция Т4 |
Поле «Кол-во студентов» записи ТМ-32 |
t1 |
|
Начало транзакции |
30 |
t2 |
|
Считывание КС из «Кол-во студентов» |
30 |
t3 |
|
КС=КС+10 |
40 |
t4 |
Начало транзакции |
Запись КС в «Кол-во студентов» |
40 |
t5 |
Считывание КС из «Кол-во студентов» |
………….. |
40 |
t6 |
КС=КС-5 |
Откат |
35 |
t7 |
Запись КС в «Кол-во студентов» |
|
35 |
t8 |
Окончание транзакции |
|
35 |
Проблему можно устранить, запретив транзакции Т3 считывать значение «Кол-во студентов» до принятия решения о том, должна ли быть выполнена фиксация или откат транзакции Т4.
Проблема анализа несогласованности
Проблема анализа несогласованности возникает в тех случаях, когда транзакция считывает несколько значений из базы данных, после чего вторая транзакция обновляет некоторые из этих значений непосредственно во время выполнения первой транзакции. Например, транзакция, суммирующая данные, выбранные из базы (скажем, вычисляющая общую сумму на счетах), получит неверное значение, если во время ее выполнения другая транзакция изменит считанные ею значения. Пример подобной ошибки приведен в табл. 8.3. Здесь транзакция Т6, вычисляющая итоговое значение, выполняется параллельно с транзакцией Т5.
Транзакция Т6 вычисляет суммирование количества студентов в группе ТМ-32 (30 человек), ТМ-31(25 студентов) и ТЗ-31(20 студентов). Однако в это же время транзакция Т5 осуществляет перевод 5 студентов из группы ТМ-32 в ТМ-31. В результате вычисленное транзакцией Т6 значение оказывается неверным (больше на 5 студентов). Эту проблему можно устранить, запретив транзакции T6 считывать значения количества студентов ТМ-32 и ТМ-31 до тех пор, пока транзакция Т5 не зафиксирует выполненные ею обновления.
Таблица 8.3. Пример проблемы устранения несогласованности
Время |
Транзакция Т5 |
Транзакция Т6 |
Поле «Кол-во студентов» записи ТМ-32 |
Поле «Кол-во студентов» записи ТМ-31 |
Поле «Кол-во студентов» записи ТЗ-31 |
Общее количество студентов
|
t1 |
|
Начало транзакции |
30 |
25 |
20 |
|
t2 |
Начало транзакции |
Сумма=0 |
30 |
25 |
20 |
0 |
t3 |
Считывание значение «Кол-во студентов» из ТМ-32 |
Считывание значение «Кол-во студентов» из ТМ-32 |
30 |
25 |
20 |
0 |
t4 |
КС=КС-5 |
Сумма=Сумма+КС |
25 |
25 |
20 |
30 |
t5 |
Запись «Кол-во студентов» в ТМ-32 |
Считывание Значение «Кол-во студентов» из ТЗ-31 |
25 |
25 |
20 |
30 |
t6 |
Считывание значение «Кол-во студентов» из ТМ-31 |
Сумма=Сумма+КС |
25 |
25 |
20 |
50 |
t7 |
КС=КС+5 |
|
25 |
30 |
20 |
50 |
t8
|
Запись в «Кол-во студентов» в ТМ-31 |
|
25 |
30 |
20 |
50 |
t9 |
Окончание транзакции |
Считывание значение «Кол-во студентов» из ТМ-31 |
25 |
30 |
20 |
50 |
t10 |
|
Сумма=Сумма+КС |
25 |
30 |
20 |
80 |
t11 |
|
Окончание транзакции |
25 |
30 |
20 |
80 |
Еще одна проблема может возникнуть, если в некоторой транзакции Т происходит повторное чтение ранее считанного элемента данных, но между этими операциями чтения была выполнена модификация этого элемента данных в другой транзакции. Таким образом, в транзакции Т будут получены два разных значения одного и того же элемента данных. Такую ситуацию иногда характеризуют как проблему неповторяемого (или нечеткого) чтения. Аналогичная проблема может произойти, если транзакция Т выполняет запрос, в котором происходит выборка из отношения ряда строк, удовлетворяющих некоторому предикату, а при повторном выполнении этого запроса в более поздний момент времени обнаруживается, что полученное множество строк содержит дополнительные (фантомные) строки, которые были вставлены другой транзакцией в период между двумя операциями чтения. Такую проблему иногда называют фантомным чтением.