
- •Содержание
- •Глава 1. Основные понятия 6
- •Глава 2. Модели данных 19
- •Глава 3. Функциональные зависимости 46
- •Глава 4. Нормализация 54
- •Глава 5. Методология концептуального проектирования 69
- •Глава 6. Методология логического проектирования баз данных реляционного типа 75
- •Глава 7. Методология физического проектирования реляционных бд 93
- •Глава 8. Язык структурированных запросов sql. 107
- •Предисловие
- •Глава 1. Основные понятия
- •1.1. Информационные системы с базами данных.
- •1.2. Функции и возможности субд
- •1.3. Программные компоненты субд
- •1.4. Архитектура среды базы данных
- •1.5. Реляционные объекты данных: терминология
- •1.6. Формальные определения
- •1.6.1. Домены
- •1.6.2. Отношения
- •1.7. Целостность реляционных данных
- •1.7.1. Потенциальные ключи
- •1. Свойством уникальности.
- •2. Свойством не избыточности.
- •1.7.2. Первичные и альтернативные ключи
- •1.7.3. Внешние ключи
- •1.7.4. Ссылочная целостность
- •1.7.5. Правила внешних ключей
- •Глава 2. Модели данных
- •2.1. Элементы er-модели
- •2.1.1. Множество сущностей
- •2.1.2. Атрибуты
- •2.1.3. Связи
- •2.1.4. Рекурсивная связь
- •2.1.5. Атрибуты связей
- •2.2. Структурные ограничения
- •2.2.1. Связь "один-к-одному"
- •2.2.2. Связь "один-ко-многим"
- •2.2.3. Связь "многие-ко-многим"
- •2.2.4. Степень участия
- •2.2.5. Многосторонние связи
- •2.2.6. Слабые множества сущностей
- •2.3. Проблемы er-моделирования (Материал данного параграфа не обязателен для изучения)
- •2.3.1. Ловушки разветвления
- •2.3.2. Ловушка разрыва
- •2.4. Ееr-модель
- •2.4.1. Суперклассы и подклассы типов сущностей
- •2.4.2. Наследование атрибутов
- •2.4.3. Специализация
- •2.4.4. Генерализация
- •2.4.5. Ограничения, накладываемые на процедуры специализации и генерализации
- •2.4.6. Категоризация
- •2.5. Реляционные модели
- •2.5.1. От er-диаграмм к реляционным схемам
- •2.5.2. От er-связей к к отношениям
- •2.5.3. Объединение отношения
- •2.5.4. Преобразование слабых множеств сущностей
- •Глава 3. Функциональные зависимости
- •3.1.Основные определения
- •3.2. Тривиальные и нетривиальные зависимости
- •3.3. Замыкание множества зависимостей
- •3.4. Правила вывода Армстронга
- •3.5. Неприводимое множество зависимостей
- •Примеры
- •Глава 4. Нормализация
- •4.1. Декомпозиция без потерь
- •4.2. Первая, вторая и третья нормальные формы.
- •Вторая нормальная форма (2нф).
- •Третья нормальная форма ( 3нф ).
- •Нормальная форма Бойса-Кодда
- •4.3. Многозначные зависимости
- •4.4. Четвертая нормальная форма (4нф)
- •4.5. Пятая нормальная форма (5нф)
- •4.6. Итоговая схема процедуры нормализации
- •4.7. Альтернативный набор определений нфбк, 4нф и 5нф
- •4.8. Выделим цели процесса нормализации
- •4.9. Другие нормальные формы
- •Глава 5. Методология концептуального проектирования
- •5.1. Источники представления пользователей о предметной области
- •5.2. Определение типов сущностей
- •5.3. Определение типов связей
- •5.4. Определение атрибутов
- •5.5. Определение доменов атрибутов
- •5.6. Определение потенциальных и первичных ключей
- •5.7. Генерализация и специализация типов сущностей
- •5.8. Создание диаграммы "сущность-связь"
- •5.9. Обсуждение локальных концептуальных моделей данных с конечными пользователями
- •Глава 6. Методология логического проектирования баз данных реляционного типа
- •6.1. Преобразование локальной концептуальной модели данных в локальную логическую модель
- •6.1.1. Удаление связей типа m:n
- •6.1.2. Удаление сложных связей
- •6.1.3. Удаление рекурсивных связей
- •6.1.4. Удаление связей с атрибутами
- •6.1.5. Удаление множественных атрибутов
- •6.1.6. Перепроверка связей типа 1:1
- •6.1.7. Удаление избыточных связей
- •6.2. Наборы отношений локальных логических моделей данных
- •6.2.1. Сильные типы сущностей
- •6.2.2. Слабые типы сущностей
- •6.2.3. Бинарные связи типа "один-к-одному" (1:1)
- •6.2.4. Бинарные связи типа "один-ко-многим" (1:м)
- •6.2.5. Связи типа "суперкласс/подкласс"
- •6.2.6. Документирование созданных отношений и атрибутов внешних ключей
- •6.3. Проверка модели с помощью правил нормализации
- •6.4. Проверка модели в отношении транзакций
- •6.5. Создание диаграмм "сущность-связь"
- •6.7.1. Слияние локальных логических моделей данных в единую глобальную модель данных
- •6.7.1.1. Анализ имен сущностей и их первичных ключей
- •6.7.1.2. Анализ имен связей
- •2. Слияние эквивалентных сущностей с различными первичными ключами
- •3. Слияние сущностей с различными именами, имеющих одинаковые или различные первичные ключи
- •7.1.1. Oписание на языке sql стандарта iso 1992 (sql2)
- •Листинг 1. Операторы языка sql, предназначенные для создания таблицы
- •7.1.2. Реализация с использованием триггеров
- •Пример 1
- •7.1.3. Реализация с использованием уникальных индексов
- •Пример 2
- •7.2. Реализация бизнес-правил предприятия в среде целевой субд
- •7.3. Организация эффективного хранения данных
- •7.3.1. Анализ транзакций.
- •7.3.2. Выбор файловой структуры.
- •Последовательные файлы
- •Хешированные файлы
- •Индексно-последовательные файлы
- •Двоичные деревья
- •7.3.3. Определение вторичных индексов.
- •7.3.4. Анализ необходимости введения контролируемой избыточности.
- •7.3.5. Определение требований к дисковой памяти.
- •Последовательные файлы
- •Хешированные файлы
- •7.4. Разработка механизмов защиты
- •7.4.1. Разработка пользовательских представлений (видов).
- •7.4.2. Определение прав доступа.
- •7.5. Организация мониторинга и настройка функционирования системы
- •Глава 8. Язык структурированных запросов sql.
- •Операторы ddl
- •Типы данных
- •Создание файла бд
- •Создание (определение) таблиц
- •Определение столбцов
- •Примеры создания таблиц
- •Удаление таблиц
- •Модификация структуры таблиц
- •Операторы, изменяющие информацию в бд
- •Добавление новых данных.
- •Удаление существующих данных.
- •Обновление существующих данных.
- •Запрос информации из бд
- •Инструкция select
- •Предложение select.
- •Предложение from.
- •Запросы
- •Порядок выполнения многотабличных запросов
- •Виды объединений
- •Предложение where.
- •Условия отбора
- •Составные или сложные условия отбора
- •Предложение group by.
- •Предложение having.
- •Предложение order by.
- •Применение оператора select в инструкции insert
1.3. Программные компоненты субд
Среда СУБД состоит из следующих программных компонентов:
1. Процессор запросов. Основной компонент СУБД, который преобразует запросы в последовательность низкоуровневых инструкций для контроллера базы данных.
2. Контроллер базы данных. Этот компонент взаимодействует с пользовательскими прикладными программами и запросами. Для выполнения поступившего запроса контроллер базы данных вызывает контроллер файлов.
3. Контроллер файлов. Этот компонент предназначен для хранения файлов и отвечает за распределение дискового пространства. Он создает и поддерживает список структур и индексы, определенные во внутренней схеме СУБД.
4. Процессор языка DML. Этот программный компонент преобразует операторы DML, вставленные в прикладные программы. Для генераций соответствующего кода препроцессор DML взаимодействует с процессором запросов.
5. Компилятор языка DDL. Компилятор языка DDL преобразует DDL-команды в набор таблиц, содержащих «данные о данных». Эти таблицы сохраняются в системном каталоге, а управляющая информация сохраняется в заголовках файлов с данными.
6. Контроллер словаря. Контроллер словаря управляет доступом к системному каталогу и работает с ним. Системный каталог доступен большинству компонентов СУБД.
Основные компоненты среды СУБД представлены на рис.1.1.
Рис.1.1. Основные компоненты СУБД
1.4. Архитектура среды базы данных
Главная особенность систем с базами данных заключается в том, чтобы предложить пользователям систем абстрактное представление о данных, скрыв особенности хранения и управления ими. Поскольку база данных является общим ресурсом информационной системы, то каждому пользователю может потребоваться свое, отличное от других представление о данных, хранимых в системе. Для удовлетворения этих потребностей комитет стандартов ANSI/ SPARC признал необходимость использования системы трехуровневого подхода при описании элементов данных. Трехуровневая архитектура состоит из: внешнего, концептуального и внутреннего уровней абстракций. Трехуровневая архитектура ANSI/SPARC представлена на рис.1.2.
Основная задача этой системы – отделение пользовательского представления базы данных от ее физической реализации.
Рис.1.2. Архитектура ANSI/SPARC
Внутренний уровень – это уровень, наиболее близкий к физическому хранению, т.е. связанный со способами хранения информации на физических устройствах.
Внутреннее представление состоит из многих экземпляров каждого типа внутренней записи (терминология ANSI/SPARC). Внутреннее представление не рассматривает физические области устройства хранения, такие, как цилиндры, дорожки и т.д. Оно предполагает, что адресное пространство имеет линейную структуру и оно бесконечно. Внутреннее представление описывается с помощью внутренней схемы. Внутренняя схема пишется с использованием внутреннего языка определения данных. Она определяет способы представления хранимых полей и записей; физическую последовательность хранимых записей; существующие индексы и т.д.
Внешний уровень наиболее близок к пользователю, точнее, это индивидуальный уровень пользователя. Пользователем может быть прикладной программист, конечный пользователь или администратор БД.
У каждого пользователя есть свой язык общения. Как правило, такие языки общения включают в себя подъязыки данных.
Существующий язык SQL практически поддерживается всеми системами БД. Его используют как самостоятельный язык запросов и как встроенный в другие языки программирования.
В соответствии с терминологией ANSI/SPARC , представление отдельного пользователя называется внешним представлением.
Внешнее представление – это содержимое БД, каким видит его пользователь (т.е. для этого пользователя внешнее представление и его БД). Например, пользователь из отдела кадров может рассматривать БД как набор записей с информацией об отделах плюс набор записей с информацией о служащих и ничего не знать о записях с информацией о деталях и поставщиках, с которыми работает пользователь в отделе обеспечения.
В общем, внешнее представление состоит из множества экземпляров каждого типа внешней записи, которые, в свою очередь, не обязательно должны совпадать с хранимыми записями. В распоряжении пользователя имеется язык определения данных и язык обработки данных (составные части любого подъязыка данных).
Операция выборки данных с их использованием будет осуществлять выборку из экземпляров внешних, а не хранимых записей.
Концептуальное представление – это представление данных такими, какие «они есть на самом деле», а не такими, какими их вынужден видеть пользователь в рамках определенного языка или используемого аппарата обеспечения.
Концептуальное представление – это представление всего содержимого базы данных.
Оно определяется с помощью концептуальной схемы. Концептуальная схема использует концептуальный язык определения данных. Определения концептуального языка должны относиться только к содержанию информации. В него нельзя включать любое рассмотрение структуры хранения, методы доступа, последовательности хранимых записей, способов индексирования, хеш-адресации и т.д.
Концептуальную схему, как правило, определяет администратор данных. Она определяет объекты, в которых заинтересовано предприятие, а также информацию, которую необходимо записывать в этих объектах.