
- •Введение
- •Часть 1
- •Глава 1 модели данных
- •Уровни моделей данных
- •1 Инфологические модели данных
- •1.1 Диаграмма Бахмана
- •1.2 Модель «сущность-связь»(er)
- •Нотация Мартина
- •Нотация idef1x
- •Нотация Баркера
- •2. Даталогические модели
- •2.1. Документальные модели
- •2.1.1. Ориентированные на формат документа
- •2.1.2. Дескрипторные модели
- •2.1.3. Тезаурусные модели
- •2.2. Фактографические модели
- •2.2.1. Теоретико-графовая модель
- •2.2.1.1. Иерархическая модель
- •2.2.1.2. Сетевая модель
- •2.2.2. Теоретико-множественные модели
- •2.2.2.1. Реляционная модель
- •Правила Теда Кодда
- •2.2.2.2. Бинарных ассоциаций
- •2.2.3. Объектно-ориентированные модели
- •3. Физические модели
- •3.1. Модели, основанные на файловых структурах
- •3.2. Модели, основанные на странично-сегментной организации
- •Известные сетевые субд:
- •Глава 2. Проектирование баз данных
- •1.1. Избыточность данных и аномалии обновления
- •1.2. Функциональные зависимости
- •1.3. Нормальные формы и схемы выполнения нормализации
- •1) 1Нф.
- •2) 2Нф.
- •3) 3Нф.
- •4) Нфбк (нормальная форма Бойса-Кодда).
- •5) 4Нф.
- •6) 5Нф.
- •1.4 Синтез реляционных баз данных
- •1.5 Пример синтеза
- •1.6 Пример декомпозиции
- •Часть 2
- •Реляционная алгебра
- •Введение
- •Стандартные реляционные операции
- •Свойства стандартных операций
- •Специальные операции
- •Язык sql как стандартный язык баз данных
- •Введение в sql
- •2.1.1 Функциональные возможности sql
- •2.2 Создание баз данных
- •2.2.1 Оператор create database
- •2.3 Удаление баз данных
- •2.4.3 Размер поля
- •2.4.4 Тип поля
- •2.5 Удаление таблиц
- •2.5.1 Оператор drop table
- •2.6. Данные и записи данных
- •2.6.1 Оператор select
- •2.6.2 Оператор distinct
- •2.6.3 Оператор from { таблица [ псевдоним ] } [,...]
- •2.6.4 Оператор where (условие)
- •2.6.5 Оператор group by { поле | Integer } [,...]
- •2.6.6 Оператор having( условие)
- •2.6.7 Оператор order by { поле | Integer [ asc|desc ] } [,...]
- •2.6.8 Оператор union [all] select-команда
- •2.6.9 Оператор intersect [all] select-команда
- •2.6.10 Оператор except [all] select-команда
- •2.6.11 Into { temp | scratch } таблица
- •2.6.12 Insert - добавлять данные
- •2.6.13 Values ( константа [,...] )
- •2.6.18 Unload - выгрузить данные в текстовый файл
- •2.7 Операторы
- •2.7.3 Арифметические операторы
- •2.7.4 Приоритеты операторов
- •2.8 Функции
- •2.8.3 Текстовые функции
- •2.8.4 Функции работы с временем и датами
- •2.8.5 Вспомогательные функции
- •2.9 Виды на таблицы данных (Просмотры)
- •2.9.1Create view - создать новый вид на таблицу данных
- •2.9.2 Drop view - удалить вид на таблицу данных
- •2.10 Пользовательские процедуры
- •2.10.1 Create procedure - создать пользовательскую процедуру
- •2.10.2 Dba
- •2.10.3 References { byte | text }
- •2.10.4 Default { Wert | null }
- •2.10.5 Returning { Feldtyp | references { byte | text } }
- •2.10.6 Drop procedure - удалить процедуру
- •2.12.2 Нормальный текст
- •1999 - Sql-99, sql-3 (iso/iec 9075:1999(e) Information technology - Database languages - sql)
- •2003 - Sql-2003
- •4. Виды систем баз данных
- •4.1.Oracle
- •4.1.1 Типы данных
- •4.1.1.1.Символьные типы
- •4.1.1.2.Числовые типы
- •Даты, временные метки и интервалы
- •4.1.1.3.Логические типы
- •Двоичные данные
- •4.1.1.4.Типы данных для сети Интернет
- •4.1.1.5.Типы данных «Any»
- •4.2. Mysql
- •4.2.1 Типы данных.
- •4.2.1.1.Character String (строковый)
- •4.2.1.2.National Character String (национальный строковый)
- •4.2.1.3.Binary Large Object String (двоичный)
- •4.2.1.4.Numeric (числовой)
- •4.2.1.5.Datetime (дата/время)
- •4.2.1.6.Interval (интервальный)
- •4.2.1.7.Типы enum и set
- •4.2.2Использование типов столбцов их других систем управления базами данных
- •4.3. Postgresql
- •4.3.1 Типы данных
- •4.3.1.1Числовые типы
- •4.3.1.1.Целочисленные типы
- •4.3.1.2.Числа с заданной точностью
- •4.3.1.3.Типы с плавающей точкой
- •4.3.1.4.Серийные типы
- •4.3.1.5.Денежные типы
- •4.3.1.6.Символьные типы
- •4.3.1.7.Двоичные типы данных
- •4.3.1.8.Типы дата/времени
- •4.3.1.9.Логический тип
- •4.3.1.10.Перечисления
- •5. Использованные в пример таблицы данных
- •Символьные
- •Числовые типы данных
- •Двоичные типы данных
- •Типы данных времени, даты, интервалы
- •Логические типы данных
- •Список литературы
- •Оглавление
- •Часть 1………………………………………………………….…………………………….………… 4
- •Глава 1 модели данных………………………….………………….……………….…........…. 4
- •Глава 2 проектирование баз данных…………..……………………………………...… 40
- •1.4 Синтез реляционных баз …...………………………………………………………… 44
- •Часть 2……...…...………………………………………………………………………………….… 52
Глава 2. Проектирование баз данных
Существуют два направления:
- Декомпозиция (разбиение). Исходное множество отношений заменяется другим множеством отношений. Их число возрастает.
- Синтез. Компоновка заданных элементарных зависимостей.
Нормализация – метод создания набора отношений с заданными свойствами на основе некоторых требований к данным. Процесс нормализации предложен Коддом (1972 г.). Процесс нормализации – формальный метод для оптимизации столбцов отношений и устранения аномалий.
1.1. Избыточность данных и аномалии обновления
Основная цель проектирования реляционной БД – группирование атрибутов в отношениях таким образом, чтобы минимизировать избыточность данных (сокращение объема вторичной памяти для хранения БД) и повышение надежности при работе с данными. Обычно процесс проектирования отношений реляционной БД ведется на основе разработанной ER-диаграммы или на основе просто здравого смысла разработчика. В общем случае при таком подходе расположение атрибутов в отношениях неоптимальное.
При работе с отношениями, содержащими избыточные данные, могут возникать проблемы – аномалии обновления. Аномалии обновления делят на три вида:
1) Аномалии вставки – возникают при добавлении новых несогласованных данных (нарушающих целостность данных в отношении).
2) Аномалии изменения – возникают при изменении части ранее введенных данных; частичное обновление сведений приведет к нарушению целостности данных отношения (перестанет выполняться оговоренная выше зависимость).
3) Аномалии удаления – возникают при удалении строк из отношений.
Интуитивно понятно, что решением проблем избыточности и аномалий для выше приведенного примера может стать разделение отношения на такие отношения, в которых избыточности не будет. Для выполнения такого процесса необходимо выявить все зависимости между атрибутами отношения.
1.2. Функциональные зависимости
Функциональная зависимость (ФЗ)– это соотношение проекцийR[A] иR[B] при котором в каждый момент времени любому элементуR[A] соответствует только один элемент проекцииR[B], входящий в вместе в какой-либо кортеж отношенияR.
Полная функциональная зависимость (ПФЗ). Набор атрибутов В функционально зависит от А, и не зависит функционально от любого подмножества А.
Транзитивная функциональная зависимость (ТФЗ). Пусть существует набор атрибутов С, таких что:
С не является подмножеством А;
С не включает в себя В;
Существует функциональная зависимость С от А (
);
Не существует функциональная зависимость А от С (
);
Существует функциональная зависимость B от C (
).
Детерминант отношения.Если в отношении существуют несколько ФЗ, то каждый атрибут или набор атрибутов, от которого зависит другой атрибут, называется детерминантом отношения.
Выявление смысловой зависимости между данными – один из способов формализации смысловой информации о данных.
Функциональная зависимость описывает связь типа многие-к-одному между атрибутами отношения, где много – детерминант функциональной зависимости. Функциональная зависимость является семантическим свойством атрибутов отношения.
Если в отношении R, содержащем атрибуты A и B, атрибут B функционально зависит от атрибута A (А является детерминантом атрибута B)
A→B,
то в каждом кортеже этого отношения каждое конкретное значение атрибута A всегда связано только с одним значением атрибута B. Атрибуты A и B могут быть составными атрибутами.
Особенности функциональных зависимостей, лежащие в основе процесса нормализации:
• функциональная зависимость является специализированным правилом целостности – она накладывает ограничения на допустимые значения атрибутов отношений; эту особенность можно использовать при обновлении БД, т.к. зная какие функциональные зависимости есть в отношении, можно проанализировать нарушат ли новые данные целостность данных отношения;
• функциональная зависимость является обобщением понятия потенциального ключа; функциональные зависимости позволяют определить все потенциальные ключи отношения (и соответственно – первичный ключ): все атрибуты отношения, которые не являются частью первичного (или потенциального) ключа, должны функционально зависеть от этого ключа; если не все остальные атрибуты отношения зависят от некоторого детерминанта, то этот детерминант не является потенциальным ключом этого отношения. Одни функциональные зависимости подразумевают другие зависимости. Для данного множества зависимостей S замыканием S+ называется множество всех функциональных зависимостей, подразумеваемых зависимостями множества S. Множество S обязательно является подмножеством собственного замыкания S+. Правила логического вывода Армстронга (аксиомы Армстронга) обеспечивают исчерпывающую и полную основу для вычисления замыкания S+ для заданного множества S:
- рефлексивность X→ X;
- пополнение X→Y =>XZ→Y;
- аддитивность (X→Y)and(X→Z) => X→YZ;
- проективность X→YZ =>X→Y;
- транзитивность (X→Y)and(Y→Z) => X→Z;
- псевдотранзитивность (X→Y)and(YZ→W) => X Z→W;
Два множества функциональных зависимостей S1 и S2 эквивалентны тогда и только тогда, когда они являются покрытиями друг друга, то есть S1+=S2+.
Каждое множество функциональных зависимостей эквивалентно, по крайней мере, одному неприводимому множеству. Множество функциональных зависимостей является неприводимым, если:
• каждая функциональная зависимость этого множества имеет одноэлементную правую часть;
• ни одна функциональная зависимость множества не может быть устранена без изменения замыкания этого множества;
• ни один атрибут не может быть устранен из левой части любой функциональной зависимости без изменения замыкания множества.
Если I является неприводимым множеством, эквивалентным множеству S, то проверка выполнения функциональных зависимостей из множества I автоматически проверяет выполнение всех функциональных зависимостей множества S.