- •Понятие бд, субд.
- •Эволюция развития баз данных.
- •Модели данных. Реляционная модель данных.
- •Модели данных. Иерархическая модель данных.
- •Модели данных. Сетевая модель данных.
- •Модели данных. Объектно—ориентированная модель данных.
- •Реляционная модель данных, основные понятия, ее свойства.
- •Типы связей в реляционной модели.
- •1: 1 «Один к одному»
- •1 : М «один ко многим»
- •М : м «многие ко многим»
- •Операции над отношениями.
- •Целостность данных
- •Архитектуры централизованных сетевых баз данных: файл-сервер, клиент-сервер.
- •Нормализация отношений. Понятие функциональной зависимости. 1 и 2 нормальные формы.
- •Нормализация отношений, Понятие транзитивной зависимости. 3 я нормальная форма.
- •Жизненный цикл базы данных.
- •Концептуальная модель
- •Логическая модель
- •Физическая модель
- •Реализация
- •Тестирование
- •Сопровождение и эксплуатация
- •Язык sql. Операторы языка.
- •Создание запросов на выборку на sql языке. (select)
- •Назначение предикатов distinct и top в операторе select.
- •Сортировка записей в операторе select.
- •Создание запросов на удаление.
- •Создание запросов на изменение на sql языке.
- •Создание групповых запросов на sql языке.
- •Понятие макроса, создание приложений с использованием макросов.
Целостность данных
Целостность данных – это согласованность (непротиворечивость) данных.
Различают доменную, категорную, ссылочную целостность данных.
Доменная целостность данных – каждый атрибут определен на своем домене.
Домен – совокупность допустимых значений атрибута.
Категорная целостность – никакой ПК не может принимать нустое значение (без ПК данные не вводятся).
Ссылочная целостность - значение внешнего ключа (FK) должно соответствовать значению ПК (PK).
Целостность данных в Microsoft Access задается в схеме данных. Частный случай целостности это каскадное обновление и каскадное удаление связанных значений.
Родители изменяются – изменяются и дети.
Архитектуры централизованных сетевых баз данных: файл-сервер, клиент-сервер.
По способу доступа к данным базы данных делятся на:
БД с локальным доступом (БД располагается на локальном компьютере пользователя);
БД с удаленным (сетевым) доступом (БД располагается на сервере, пользователь подключается к ней по сети).
По способу обработки данных различают:
Централизованные БД;
Распределенные БД.
Централизованная БД хранится на одной машине вычислительной сети, в то время как распределенная БД храниться на нескольких машинах.
Архитектура централизованных БД.
Из машин сети выделяется машина, которая хранит централизованную БД – «сервер».
Клиенты (рабочие станции) посылают команды копирования файлов БД, полученные файлы обрабатываются на клиентских машинах средствами СУБД.
К преимуществам такой архитектуре можно отнести обеспечение доступа многих пользователей к централизованной БД.
К недостаткам относится:
Низкая производительность;
Высокий сетевой трафик;
Слабая защита данных (только средствами ОС).
Архитектура клиент-сервер (двухзвенная архитектура).
При такой архитектуре увеличивается производительность, снижается сетевой трафик, возрастает уровень защищенности данных (теперь защита обеспечивается средствами СУБД совместно с ОС). Увеличивается гибкость системы (операции могут выполняться (обрабатываться) как на сервере, так и на машине).
Нормализация отношений. Понятие функциональной зависимости. 1 и 2 нормальные формы.
База данных (БД) – поименованная совокупность данных, отражающая состояние объектов и их отношения в рассматриваемой предметной области.
Система управления БД (СУБД) – совокупность языковых и программных средств, предназначенных для создания, ведения и совместного использования БД определенным кругом пользователей.
Ядром любом базы данных является модель данных. Модель данных – совокупность структур данных, операций их обработки и ограничений целостности, накладываемых на данные.
БД основываются на использовании трех основных моделей: иерархическая, сетевая и реляционная.
Реляционная модель данных является совокупностью взаимосвязанных двумерных таблиц – объектов модели.
Отношение (relation) – это двумерная таблица, обладающая определенными свойствами.
[(1) В ячейке хранится атомарное значение; (2) каждый столбец имеет уникальное имя; (3) все столбцы однородны – один тип данных на столбец; (4) возможна произвольная перестановка как строк, так и столбцов; (5) в таблице не может быть одинаковых строк]
В реляционной БД данные хранятся в виде нескольких отношений. Если бы данные хранились в виде одного отношения – то в БД наблюдалось бы излишнее дублирование данных, аномалии вставки, модификации и удаления.
Первичный ключ – минимальных набор атрибутов, который однозначно определяет каждую запись отношения (таблицы).
Студенты (номер, фамилия, групп, код_спец, специальность)
Аномалия вставки – применительно к этой таблице («Студенты») – невозможность ввести данные о новой специальности без принятия на специальность хотя бы одного студента. Должен быть определен ПК, а без студента это невозможно.
При удалении последнего студента со специальности, удаляются данные об этой специальность – таким образом, наблюдается аномалия удаления.
Аномалии модификации – можно случайным образом изменить название специальности, и тогда будет нарушение целостности данных. // Один студент будет учиться на неизвестной в учебном заведении специальности.
Нормализация отношений – это формальный аппарат ограничений на формирование отношений, который позволяет свести к минимуму дублирование информации, обеспечивает непротиворечивость данных и уменьшает трудозатраты на ведение бд.
Другими словами, нормализация отношений – это пошаговый обратимый процесс замены одной схемы отношений другой схемой, в которой отношение (таблица) имеет простую и регулярную структуру.
Эдгаром Коддом (создатель реляционной модели данных, 1970) были введены 3 нормальные формы и предложен механизм, позволяющий любое отношение привести к третьей нормальной форме.
Первая нормальная форма.
Отношение находится в 1НФ, если его атрибуты просты и далее неделимы.
Студенты (номер, фио, группа, адрес) <-не есть нормализованное отношение
Студенты( номер, фамилия, имя, отчество, группа, страна, город, улица, дом…) <-1НФ
Нормализация отношений всегда приводит к увеличению арности отношений( степеньарность; больше столбцов).
Вторая нормальная форма.
Сначала необходимо определить понятие функциональной зависимости, для понятия 2НФ.
В отношении R атрибут B функционально зависит от A, если в каждый момент времени одному значению A соответствует только одно значение B. Такая связь обозначается стрелкой «А В»
Отношение находится во второй нормальной форме (2НФ), если оно соответствует требованию 1НФ и каждый неключевой атрибут функционально зависит от ПК.
В результате нормализации должна быть исходная таблица во 2НФ. Если не получается привести отношение ко 2НФ в одной таблице, можно использовать таблицу переходник (промежуточную таблицу).