- •Курс лекций
- •Содержание
- •Понятие субд. Функции субд
- •2. Проектирование бд. Нормальные формы отношений 77
- •Понятие бд и субд
- •Данные.
- •Аппаратное обеспечение.
- •Программное обеспечение.
- •Пользователи.
- •Уровни абстракции в субд. Функции абстрактных данных
- •Представления
- •Внешний уровень – внешнее представление
- •Концептуальный уровень – концептуальное представление
- •Внутренний уровень – внутреннее представление
- •Функции субд
- •Экспертные системы и базы знаний
- •Литература:
- •Модели бд
- •Обзор ранних (дореляционных) субд
- •Системы, основанные на инвертированных списках
- •Структуры данных
- •Манипулирование данными
- •Ограничения целостности
- •Иерархическая модель
- •Иерархические структуры данных
- •Манипулирование данными
- •Ограничения целостности
- •Сетевая модель
- •Сетевые структуры данных
- •Манипулирование данными
- •Ограничения целостности
- •Основные достоинства и недостатки ранних субд
- •Литература:
- •Реляционная модель и ее характеристики. Целостность в реляционной модели
- •Представление информации в реляционных бд
- •Отношения. Свойства и виды отношений
- •Свойства отношений
- •Виды отношений
- •Целостность реляционных данных
- •Потенциальные и первичные ключи
- •Внешние ключи
- •Ссылочная целостность
- •Правила внешних ключей
- •Значения null и поддержка ссылочной целостности
- •Литература:
- •Реляционная алгебра
- •Понятие реляционной алгебры
- •Замкнутость в реляционной алгебре
- •Традиционные операции над множествами
- •Объединение
- •Пересечение
- •Вычитание
- •Произведение
- •Свойства основных операций реляционной алгебры
- •Специальные реляционные операции
- •Выборка
- •Проекция
- •Естественное соединение
- •Деление
- •Операция расширения
- •Операция подведения итогов
- •Операторы обновления
- •Реляционные сравнения
- •Литература:
- •Вопросы проектирования бд
- •Понятие проектирования бд
- •Функциональные зависимости
- •Тривиальные и нетривиальные зависимости
- •Замыкание множества зависимостей и правила вывода Армстронга
- •Неприводимое множество зависимостей
- •Нормальные формы – основные понятия
- •Декомпозиция без потерь и функциональные зависимости
- •Диаграммы функциональных зависимостей
- •Литература:
- •Проектирование бд. Нормальные формы отношений
- •Первая нормальная форма. Возможные недостатки отношения в 1нф
- •Вторая нормальная форма. Возможные недостатки отношения во 2нф
- •Третья нормальная форма. Возможные недостатки отношения в 3нф
- •Сохранение зависимости
- •Нормальная форма Бойса-Кодда
- •Литература:
- •Проектирование бд. Нормальные формы отношений (продолжение)
- •Многозначные зависимости
- •Четвертая нормальная форма
- •Зависимости соединения
- •Пятая нормальная форма
- •Зависимости соединения, подразумеваемой потенциальными ключами
- •Итоговая схема процедуры нормализации
- •Литература:
- •Проектирование бд методом сущность-связь. Er-диаграммы
- •Возникновение семантического моделирования
- •Основные понятия метода
- •Диаграммы er-экземпляров и er-типа
- •Связи типа 1:1 и необязательный класс принадлежности
- •Связи типа 1:1 и обязательный класс принадлежности
- •Связи типа 1:м вариант н-о
- •Связи типа м:м и вариант класса принадлежности о-н
- •Правила формирования отношений
- •Степень связи 1:1, класс принадлежности обеих сущностей обязательный
- •Степень связи 1:1, класс принадлежности одной сущности обязательный, а второй – необязательный
- •Степень связи 1:1, класс принадлежности обеих сущностей – необязательный
- •Степень связи между сущностями 1:м (или м:1), класс принадлежности м-связной сущности обязательный
- •Степень связи 1:м (м:1)и класс принадлежности м-связной сущности – необязательный
- •Степень связи м:м, независимо от класса принадлежности сущностей
- •Методология idef1 (самостоятельное изучение)
- •Литература:
- •Язык sql
- •История создания и развития sql
- •Основные понятия sql
- •Операторы
- •Типы данных в sql
- •Константы
- •Запросы на чтение данных. Оператор select
- •Предложение select
- •Предложение from
- •Отбор строк (предложение where)
- •Условия поиска
- •Сортировка результатов запроса (предложение order by).
- •Многотабличные запросы на чтение (объединения).
- •Запросы с использованием отношения предок/потомок.
- •Прочие объединения таблиц по равенству
- •Литература:
- •Язык sql (продолжение)
- •Объединения и стандарт sql2
- •Внутренние объединения в стандарте sql2
- •Внешние объединения в стандарте sql2
- •Перекрестные объединения и запросы на объединение в sql2
- •Многотабличные объединения в стандарте sql2
- •Итоговые запросы на чтение. Агрегатные функции
- •Агрегатные функции и значения null
- •Запросы с группировкой (предложение group by)
- •Несколько столбцов группировки
- •Ограничения на запросы с группировкой
- •Вложенные запросы
- •Условия поиска во вложенном запросе
- •Литература:
- •Внесение изменений в базу данных.
- •Добавление новых данных (оператор insert).
- •Удаление существующих данных (Оператор delete)
- •Обновление существующих данных (Оператор update)
- •Определение структуры данных в sql
- •Создание таблицы (оператор create table)
- •Удаление таблицы (оператор drop table)
- •Изменение определения таблицы (оператор alter table)
- •Определения доменов
- •Индексы (операторы create/drop index)
- •Понятие представления.
- •Преимущества представлений
- •Недостатки представлений
- •Представления в sql.
- •Обновление представлений и стандарт ansi/iso
- •Удаление представления (оператор drop view)
- •Системный каталог (самостоятельное изучение)
- •Понятие системный каталог
- •Системный каталог и стандарт ansi/iso
- •Содержимое системного каталога
- •Информационная схема в стандарте sql2
- •Литература:
- •Обеспечение безопасности бд
- •Общие положения
- •Методы обеспечения безопасности
- •Избирательное управление доступом
- •Обязательное управление доступом
- •Шифрование данных
- •Контрольный след выполняемых операций
- •Поддержка мер обеспечения безопасности в языке sql
- •Директивы grant и revoke
- •Представления и безопасность
- •Литература:
- •Физическая организация бд: структуры хранения и методы доступа
- •Доступ к базе данных
- •Кластеризация
- •Индексирование
- •Плотное и неплотное индексирование
- •Структуры типа б-дерева
- •Хеширование
- •Литература:
- •Оптимизация запросов
- •Пример оптимизации реляционного выражения
- •Обзор процесса оптимизации
- •Стадия 1. Преобразование запроса во внутреннюю форму
- •Стадия 2. Преобразование в каноническую форму
- •Стадия 3. Выбор потенциальных низкоуровневых процедур
- •Стадия 4. Генерация планов вычисления запроса и выбор плана с наименьшей стоимостью
- •Преобразование выражений
- •Выборки и проекции
- •Распределительный закон
- •Коммутативность и ассоциативность
- •Идемпотентность
- •Вычисляемые скалярные выражения
- •Условия
- •Семантические преобразования
- •Статистики базы данных
- •Литература:
- •Восстановление после сбоев
- •Транзакции
- •Понятие транзакции
- •Восстановление транзакции.
- •Свойства асид.
- •Алгоритм восстановления после сбоя системы
- •Восстановление после отказов системы
- •Параллелизм. Проблемы параллелизма
- •Проблема потери результатов обновления
- •Проблема незафиксированной зависимости
- •Проблема несовместимого анализа
- •Понятие блокировки
- •Решение проблем параллелизма
- •Проблема потери результатов обновления.
- •Проблема незафиксированной зависимости.
- •Проблема несовместимого анализа
- •Тупиковые ситуации
- •Способность к упорядочению
- •Уровни изоляции транзакции
- •Поддержка в языке sql
- •Литература:
- •Технологии субд
- •Распределенные базы данных
- •Предварительные замечания.
- •Принципы функционирования распределенной бд
- •Локальная автономия
- •Независимость от центрального узла
- •Непрерывное функционирование
- •Независимость от расположения
- •Независимость от фрагментации
- •Системы типа клиент/сервер
- •Серверы баз данных
- •Литература:
- •Современные постреляционные модели бд
- •Системы управления базами данных следующего поколения
- •Ориентация на расширенную реляционную модель
- •Абстрактные типы данных
- •Генерация систем баз данных, ориентированных на приложения
- •Поддержка исторической информации и темпоральных запросов
- •Объектно-ориентированные субд
- •Модель данных ообд
- •Идентификатор объекта
- •Новые типы данных
- •Оптимизация ядра субд
- •Язык субд и запросы
- •Транзакции в оосубд
- •Блокировки в оосубд
- •Ведение версий
- •Физические хранилища
- •Литература:
- •Regions
- •WorkPlan
- •Subjects
- •Teachers
- •Students
- •Приложение б.Описание структуры учебной базы данных.
Непрерывное функционирование
Одним из основных преимуществ распределенных систем является то, что они обеспечивают более высокую надежность и доступность.
Надежность (вероятность того, что система исправна и работает в любой заданный момент) повышается благодаря работе распределенных систем не по принципу "все или ничего", а в постоянном режиме; т.е. работа системы продолжается, хотя и на более низком уровне, даже в случае неисправности некоторого отдельного компонента, например отдельного узла.
Доступность (вероятность того, что система исправна и работает в течение некоторого промежутка времени) повышается частично по той же причине, а частично благодаря возможности репликации данных (подробнее это описывается ниже).
Независимость от расположения
Основная идея независимости от расположения (которая также называется прозрачностью расположения) достаточно проста: пользователям не следует знать, в каком физическом месте хранятся данные, наоборот, с логической точки зрения пользователям следовало бы обеспечить такой режим, при котором создается впечатление, что все данные хранятся на их собственном локальном узле.
Независимость от фрагментации
В системе поддерживается фрагментация данных, если некое хранимое отношение в целях физического хранения можно разделить на части, или "фрагменты". Фрагментация желательна для повышения производительности системы, поскольку данные лучше хранить в том месте, где они наиболее часто используются. При такой организации многие операции будут чисто локальными, что снизит нагрузку на сеть.
Существует два основных типа фрагментации – горизонтальная и вертикальная, которые связаны с реляционными операциями выборки и проекции соответственно. Иначе говоря, фрагментом может быть любое произвольное подчиненное отношение, которое можно вывести из исходного отношения с помощью операций выборки и проекции. При этом следует учесть приведенные ниже допущения.
Предполагается без утраты общности, что все фрагменты данного отношения независимы, т.е. ни один из фрагментов не может быть выведен из других фрагментов либо иметь выборку или проекцию, которая может быть выведена из других фрагментов. (Если есть необходимость сохранить одну и ту же информацию в нескольких разных местах, для этого следует использовать механизм репликации системы.).Проекции не должны допускать потерю информации.
Независимость от репликации
В системе поддерживается независимость от репликации, если заданное хранимое отношение или заданный фрагмент могут быть представлены несколькими различными копиями, или репликами, хранимыми на нескольких различных узлах.
Обработка распределенных запросов.
Вопрос оптимизации более важен для распределенной, нежели для централизованной системы. Основная причина заключается в том, что для выполнения охватывающего несколько узлов запроса существует довольно много способов перемещения данных по сети. В таком случае чрезвычайно важно найти наиболее эффективную стратегию.
Управление распределенными транзакциями.
Существует два основных аспекта управления обработкой транзакций, а именно: управление восстановлением и управление параллелизмом, каждому из которых в распределенных системах должно уделяться повышенное внимание.
Независимость от аппаратного обеспечения.
Подразумевает возможность работы узлов системы на разном аппаратном обеспечении.
Независимость от операционной системы.
Подразумевает возможность работы узлов системы под управлением различных операционных систем.
Независимость от сети.
Подразумевает возможность работы узлов системы в гетерогенных сетях, с использованием различного сетевого оборудования
Независимость от СУБД.
Эта цель подразумевает использование несколько менее точной формулировки предположения о строгой однородности. В новой форме это предположение означает, что все экземпляры СУБД на различных узлах поддерживают один и тот же интерфейс, хотя они не обязательно должны быть копиями одного и того же программного обеспечения.
Распространение обновления
Как указывалось выше, основной проблемой репликации данных является то, что обновление любого логического объекта должно распространяться на все хранимые копии этого объекта. Трудности возникают из-за того, что некоторый узел, содержащий данный объект, может быть недоступен (например, из-за краха системы или данного узла) именно в момент обновления.
Общая схема устранения этой проблемы (и не единственно возможная в этом случае), называемая схемой первичной копии, будет описана далее.
Одна копия каждого реплицируемого объекта называется первичной копией, а все остальные – вторичными.
Первичные копии различных объектов находятся на различных узлах (таким образом, эта схема является распределенной).
Операции обновления считаются завершенными, если обновлены все первичные копии. В таком случае в некоторый момент времени узел, содержащий такую копию, несет ответственность за распространение операции обновления на вторичные копии.