
- •Определение базы данных, отличие бд от других информац. Систем
- •Категории бд, физич и логический уровни
- •Ограничение целостности на данные
- •Неизбыточность и непротиворечивость данных
- •Защита от программных и аппаратных сбоев
- •Принцип независимых данных. Технологическая основа его реализации.
- •Системы управления базой данных субд и её структура
- •Последовательность обработки данных в субд при выполнении запроса
- •Языковые средства работы с бд
- •Элементы данных. Определение свойства и примеры
- •Характеристика типов связей. Избыточная связь. Правила склейки
- •Древовидные модели данных, определение и примеры
- •Зависимость данных от структуры
- •Сетевые модели данных. Преобразование сложных сетевых моделей к простым сетевым и древовидным
- •Общие данные, данные пересечения, изолированные данные
- •Определение реляционной модели данных
- •Преобразование древовидной и сетевой схемы бд к реляционному виду. Преимущество реляционных бд .
- •Бинарные базисные операции реляционной алгебры и их эквиваленты в sql
- •Унарные базисные операции ра и их эквиваленты в sql
- •Дополнительный набор операций ра и их выражение через базисный набор.
- •Свойства операций ра и формальная оптимизация запросов.
- •Аномалии представления данных
- •Определение функциональной зависимости (фз) и её свойства
- •Правила для фз. Замыкание множества (фз). Первичный ключ
- •Декомпозиция отношений и свойства декомпозиций.
- •Вторая нормальная форма. Правила построения и преимущества.
- •Третья нормальная форма. Правила и построения преимущества.
- •Синтез схемы бд. Проблемы обобщенного ключа
- •Факторы, влияющие на выбор физической организации бд
- •Классификация методов доступа
- •Структура данных в индексно-последовательный метод доступа. Преимущества и недостатки при операциях.
- •Отведенное свободное пространство и область переполнения
- •Методы хеширования.
- •Обработка переполнений в методах хеширования.
- •Определение и структура в-дерева. Поиск и в-дереве
- •Дополнение записи в в-дерево.
- •Удаление записи в в-дереве.
- •Мультисписок: структура и поиск записи.
- •Инвертированный файл: структура и поиск записей.
-
Синтез схемы бд. Проблемы обобщенного ключа
Дано: схема отношения R, определенная на совокупности атрибутов U = {A1, A2, ..., An}, F – минимальное покрытие множества функциональных зависимостей в R.
Шаг 1. Функциональные зависимости XAiF, XAjF …, имеющие одинаковые левые части и совпадающие области определения, объединяются в одну зависимость XAiAj… (по правилу объединения).
Шаг 2. Строим декомпозицию (R1, R2, ..,Rk), где Ri состоит из атрибутов зависимости FiF.
Шаг 3. Для атрибутов, которые не входят ни в одну функциональную зависимость, строятся отдельные отношения, состоящее из одного атрибута.
Примечание: Если выполнено свойство соединения без потерь информации – конец построения, иначе выполняем шаг 4.
Шаг 4. Строится обобщенный ключ W (первичный ключ для отношения R) и декомпозия дополняется еще одним отношением X: 1={W}.
Шаг 5. В обобщенном ключе W определяется многозначная зависимость XY(Z) (возможно их несколько), причем атрибуты X могут полностью или частично отсутствовать в W, и выполняется декомпозиция отношения W на отношения XY и XZ: 2={XY}{XZ}.
В переменной отношения R с атрибутами A, B, C (в общем случае, составными) имеется многозначная зависимость B от A (AB) в том и только в том случае, когда множество значений атрибута B, соответствующее паре значений атрибутов A и C, зависит от значения A и не зависит от значения C.
Обобщенный ключ W – первичный ключ для отношения R, сформированного по всему множеству атрибутов U = {A1, A2, ..., An}.
-
Факторы, влияющие на выбор физической организации бд
Физическая организация – совокупность методов и средств размещения данных во внешней памяти и созданная на их основе внутренняя (физическая) модель данных.
Внутренняя модель является средством отображения логической модели в физическую среду хранения. На выбор физ. орг. влияют факторы:
-
Скорость поиска данных (главный фактор).
-
Скорость модификации данных.
-
Общий объем БД.
-
Реализация ограничений целостности на данные.
-
Обеспечение многопользовательского доступа к данным.
Перечисленные требования к физической организации БД являются противоречивыми
-
Классификация методов доступа
Метод доступа – структура индексного файла и алгоритм (программа), выполняющий операции сопровождению данных на этой структуре.
Выбор метода доступа зависит от пользовательских запросов. В основе классификации – количество исходных записей, отнесенных к общему количеству записей.
1. Получить все или многие записи. При ответе на запрос требуется просмотреть от X % до 100 % записей. Величина X зависит от класса СУБД (Oracle: X 25 %) (осуществляется последовательный просмотр файлов БД без использования поиска по ключам). Методы доступа, соответствующие этому классу, должны реализовать эффективную последовательную обработку (физически смежный последовательный файл, связанные списки).
2. Получить уникальную запись. Требуется одна запись по значению первичного ключа. Для решения этой задачи ориентированы практически все индексные методы доступа: индексно-последовательный, индексно-произвольный, иерархические индексные файлы, Б-дерево. А также прямой метод доступа и хеширование.
3. Получить некоторые записи (0 % – X %). Для реализации таких запросов используются инвертированные файлы, мультисписки, индексы-соединения. Чем лучше СУБД умеет оптимизировать запросы, тем больше значение X. Т.е. X – граница, на основании которой СУБД решает: использовать или нет индексные файлы.