- •Недостатки файловых систем по сравнению с системами баз данных
- •Понятие системы и информационной системы. Классификация информационных систем
- •Понятие системы баз данных и ее упрощенная схема
- •Понятия интегрированности и разделяемости данных, независимости от данных и целостности данных применительно к системам баз данных
- •Жизненный цикл базы данных. Этапы концептуального, логического и физического проектирования базы данных
- •Понятия модели и модели данных. Логические модели данных
- •Иерархическая модель данных, ее достоинства и недостатки
- •Сетевая модель данных, ее достоинства и недостатки
- •Основные понятия реляционной алгебры
- •Определение сущности в реляционной алгебре. Свойства сущности
- •Понятия возможного, первичного и альтернативного ключей
- •Операции реляционной алгебры. Базовые реляционные операции
- •Теоретико-множественные;
- •Специальные.
- •Теоретико-множественные реляционные операции. Свойства реляционной операции декартова произведения
- •Специальные реляционные операции
- •Реляционные операции селекции и проекции
- •Реляционная операция соединения. Ее разновидности
- •Реляционная операция естественного соединения и ее свойства
- •Реляционная операция деления
- •Примитивные и не примитивные реляционные операции Оператор соединения
- •Оператор пересечения
- •Оператор деления
- •Типы связей между сущностями
- •Связь м:м
- •Связь между сущностями типа «многие ко многим». Ее преобразование при переходе к физической модели
- •Нормализация данных. Первая нормальная форма
- •Нормализация данных. Вторая нормальная форма
- •2 Нормальная форма
- •Нормализация данных. Третья нормальная форма и нормальная форма Кодда-Бойса
- •Нормализация данных. Четвертая и пятая нормальные формы
- •5Ая нормальная форма
- •Целостность данных
- •Основные и дополнительные правила ссылочной целостности
- •Язык sql: основные команды манипулирования данными
- •Язык sql: удаление записей из таблицы
- •Язык sql: использование операторов in, between, like и ключевого слова null в условиях отбора данных
- •Язык sql: обновление записей в таблице
- •Язык sql: выборка данных из таблиц. Использование агрегатных функций и вычисляемых полей
- •Язык sql: группировка строк набора данных
- •Язык sql: соединение таблиц (внутреннее и внешнее)
- •Язык sql: использование подзапросов
- •Язык sql: операторы exists, any, all в командах с подзапросом
- •Язык sql: основные команды определения данных
- •Язык sql: создание и использование представлений (просмотров) и индексов
- •Назначение и функции субд
- •Управление словарем данных и обеспечение безопасности данных в субд
- •Обеспечение целостности данных в субд
- •Управление многопользовательским доступом к данным в субд
- •Управление резервным копированием и восстановлением данных в субд
- •Механизм тиражирования (репликации) данных в субд
- •Типы баз данных
- •Иерархическая база данных, структура иерархических баз данных
- •Сетевая база данных, структура сетевых баз данных
- •Реляционные базы данных, структура реляционных баз данных особенности реляционных баз данных
- •Распределенные базы данных. Двенадцать правил Дейта для распределенных баз данных
- •Системы «клиент/сервер»
- •Системы поддержки принятия решений
- •Классификации
- •Структура
- •Преимущества
- •Хранилища данных. Их отличия от операционных баз данных
- •Подготовка данных применительно к хранилищам данных
- •Магазины (витрины) данных. Банки оперативных данных
- •Многомерные базы данных. Разработка (извлечение) данных
- •Технологии Big Data
- •ERwin: сильные и слабые связи между сущностями. Операции прямого и обратного проектирования
- •Операции прямого и обратного проектирования
- •Sql Server: курсоры и триггеры, их виды, процесс использования
Нормализация данных. Четвертая и пятая нормальные формы
Нормализация данных
Обычно, первоначальная логическая модель данных в виде набора взаимосвязанных сущностей не является оптимальной с точки зрения избыточности данных и наличия в них различных аномалий.
Нормализация- процесс проверки и реорганизации сущностей, в результате которых устраняются избыточные копии данных и, тем самым, предотвращается возможность появления противоречивых данных.
Процесс нормализации заключается последовательном приведении сущности к нормальным формам.
Атрибут Б сущности функционально зависит от атрибута А этой же сущности, если каждому значению атрибута А соответствует точно 1 значение Б (А однозначно определяет Б).
Если между атрибутами А и Б сущности отсутствует функциональная зависимость, однако атрибут А ограничивает диапазон изменения атрибута Б некоторым числом определенных значений, то говорят, что между такими атрибутами существует многозначная зависимость (например, между № группы и предметом, № детали и поставщиком).
Функции и многозначные зависимости между атрибутами не выводятся из структуры сущности, т.е. это семантические понятия, отражающие существование дополнительных ограничений как данные, представленные сущностью.
Сущность находится в 4й НФ. Если она находится в 3й НФ и между ее атрибутами отсутствуют многозадачные зависимости.
Для приведения сущности в 4НФ нужно создать новую сущность и поместить атрибуты с многозначной зависимостью в разн. Сущности при этом связь между сущностями не устанавливается, поскольку после установления связи атрибуты с многозначной зависимостью путем миграции вновь окажутся в 1ой сущности.
Замечание:
Сущность с мнногозадачн. Зависимостями возникает как правило после выполнение естественного соединения 2х сущностей по общему атрибуту который не является ключевым ни в одной из сущностей.(фактически это попытка хранить в 1ой сущности информацию о 2х независимых объектах).
5Ая нормальная форма
Декомпозиции без потери данных сущностей S-такая совокупность некоторого числа и ее проекций, естественны соединение которых полностью восстановят исходную сущность S.
Если сущность находится в 4Н, имел 3 или более возможных ключей и можно провести ее декомпозицию без потери данных, то привидение такой сущности к 5НФ заключается в разделении ее на сущности-проекции для каждого возможного ключа.
Приведение сущности к 5НФ выполняются достаточно редко т.к. редко можно найти сущность с 3 или > возможными ключами.
Общее замечание:
Нормализация данных сопровождается «размножением» сущностей и связей. При большом объеме данных это приводит к уменьшению производительности, поэтому на практике обычно ограничиваются привидением сущности к 3НФ.
Целостность данных
Для пользователей информационной системы недостаточно, чтобы БД просто отражала объекты и процессы предметно области. Возможно, чтобы при выполнение любых операций с данными была обеспечена их целостность. Поэтому поддержание целостности данных может рассматриваться как защита данных и неверного их изменения или разрушение.
Целостность данных определяется:
1.Целостностью таблиц.
2.целостностью внешних ключей.
3.Целостность типов данных
Целостность таблиц
Обеспечивается тем, что все таблицы должны быть снабжены первичными ключами, а поля, входили в состав первичных ключей, не должны принимать неопределенных(NULL) значений.
Фактически NULL-значение, это не значение а некий невидимый маркет показывающий, что значение поля неизвестно