
- •1. Модели организации данных. Сетевая и иерархическая модели. Реляционная модель организации данных.
- •2. Организация процессов обработки данных в бд. Внутренняя схема бд фактографических ис. Физические структуры данных. Средства ускоренного доступа к данным. Индексирование данных. Хэширование данных.
- •4. Метод нормальных форм. Выявление зависимостей между атрибутами. Нормализация отношений.
- •Нормализация реляционных таблиц-отношений определяется требованиями атомарности значений полей, а также требованием рациональности группировки полей- атрибутов по различным таблицам.
- •5. Метод сущность-связь. Основные понятия метода. Правила формирования отношений.
- •Формирование отношений для связи 1:1
- •K1vk2 – означает, что ключом сформированного отношения может быть либо к1, либо к2.
- •Формирование отношений для связи 1: m
- •6. Языки баз данных. Обработка данных. Ввод-вывод данных. Запросы. Оптимизация запросов. Процедуры, правила (триггеры) и события в базах данных.
- •1. Понятие и содержание информационного обеспечения. Структура и классификация информационных систем.
- •Определение понятия «документ»
- •Структура информационных систем
- •Основные понятия автоматизированной информационной системы (аис)
- •Классификация информационных систем
- •2. По масштабу
- •Основные показатели эффективности функционирования дис
- •Механизмы поиска документов в полнотекстовых ипс
- •3. Гипертекст, гипертекстовые информационно-поисковые системы. Модели организации данных в гипертекстовых ипс. Формирование связей документов в гипертекстовых ипс.
- •4. Распределенные ис. Понятие распределенных ис, принципы их создания и функционирования. Техника представлений. Проблемы, связанные с практической реализацией техники представлений.
- •5. Распределенные ис. Технологии и модели «Клиент-сервер». Управление транзакциями.
- •Модель файлового сервера (fs)
- •Модель сервера приложений (as)
- •Модель удаленного доступа к данным (rda)
- •Модель сервера базы данных (dbs).
- •6. Распределенные ис. Управление распределенными данными. Доступ к общим данным. Технологии объектного связывания данных. Технологии реплицирования данных.
- •1. Понятие информационной технологии. Эволюция информационных технологий; их роль в развитии экономики и общества; свойства информационных технологий; понятие платформы.
- •3. Технологии открытых систем.
- •4. Сетевые информационные технологии: электронная почта, телеконференции, доска объявлений; авторские информационные технологии; гипертекстовые и мультимедийные информационные технологии.
- •Модель файлового сервера (fs)
- •Модель сервера приложений (as)
- •Модель удаленного доступа к данным (rda)
- •Модель сервера базы данных (dbs).
4. Метод нормальных форм. Выявление зависимостей между атрибутами. Нормализация отношений.
Теория реляционных БД обладает мощным инструментом, который способен помочь разработчику оптимальным образом спроектировать структуру отношений БД. Этот инструмент - метод нормализации отношений.
Рассмотрим основные виды зависимостей между атрибутами отношений: функциональные, транзитивные и многозначные.
Понятие функциональной зависимости является базовым, так как на его основе формулируются определения всех остальных видов зависимостей.
Функциональная зависимость. Атрибут Вфункционально зависитот атрибута А, если каждому значению А соответствует в точности одно значение В.
Математически функциональная зависимость В от А обозначается записью А->В. Это означает, что во всех кортежах с одинаковым значением атрибута А атрибут В будет иметь также одно и то же значение. Отметим, что А и В могут быть составными - состоять из двух и более атрибутов.
Функциональная взаимозависимость.Если существует функциональная зависимость вида А->В и В->А, то между А и В имеется взаимно однозначное соответствие, или функциональная взаимозависимость. Наличие функциональной взаимозависимости между атрибутами А и В обозначим как А<->В или В<->А.
Частичной функциональной зависимостьюназывается зависимость не ключевого атрибута от части составного ключа. Альтернативным вариантом являетсяполная функциональная зависимостьне ключевого атрибута от всего составного ключа.
Атрибут С зависит от атрибута А транзитивно(существуеттранзитивная зависимость),если для атрибутов А, В, С выполняются условия А->В и В->С, но обратная зависимость отсутствует.
Между атрибутами может иметь место многозначная зависимость. В отношении RатрибутBмногозначно зависитот атрибута А, если каждому значениюAсоответствует множество значений В, не связанных с другими атрибутами изR. Например, пусть преподаватель ведет несколько предметов, а каждый предмет может вестись несколькими преподавателями, тогда имеет место зависимость ФИО<->Предмет.
Взаимно независимые атрибуты.Два или более атрибута называются взаимно независимыми, если ни один из этих атрибутов не является функционально зависимым от других атрибутов.
Выявление зависимостей между атрибутами необходимо для выполнения проектирования БД методом нормальных форм, рассматриваемого далее.
Основной способ определения наличия функциональных зависимостей – внимательный анализ семантики атрибутов. Для каждого отношения существует, но не всегда, определенное множество функциональных зависимостей между атрибутами. Причем если в некотором отношении существует одна или несколько функциональных зависимостей, можно вывести другие функциональные зависимости, существующие в этом отношении.
Нормализация реляционных таблиц-отношений определяется требованиями атомарности значений полей, а также требованием рациональности группировки полей- атрибутов по различным таблицам.
С формальной точки зрения нормализацию модно представить как последовательный процесс разбиения и преобразования некоторого небольшого исходного набора таблиц для построения набора взаимосвязанных таблиц в нормальных формах.
Процесс проектирования БД с использованием метода нормальных форм является итерационным и заключается в последовательном переводе отношений из первой нормальной формы в нормальные формы более высокого порядка по определенным правилам. Каждая следующая нормальная форма ограничивает определенный тип функциональных зависимостей, устраняет соответствующие аномалии при выполнении операций над отношениями БД и сохраняет свойства предшествующих нормальных форм.
Выделяют следующую последовательность нормальных форм:
первая нормальная форма (1 НФ);
вторая нормальная форма (2НФ);
третья нормальная форма (3НФ).
усиленная третья нормальная форма, или нормальная форма Бойса-Кодда (БКНФ);
четвертая нормальная форма (4НФ);
пятая нормальная форма (5НФ).
Первая нормальная форма.Отношение находится в 1НФ, если все его атрибуты являются простыми (имеют единственное значение).
Вторая нормальная формаосновывается на понятии полной функциональной зависимости. Отношение находится в 2НФ, если оно находится в 1НФ и все неключевые атрибуты функционально полно зависят от первичного ключа (составного). Для устранения частичной зависимости и перевода отношения в 2НФ необходимо, используя операцию проекции ( проекция - вертикальное подмножество), разложить его на несколько отношений следующим образом:
построить проекцию без атрибутов, находящихся в частичной функциональной зависимости от первичного ключа;
построить проекции на части составного первичного ключа и атрибуты, зависящие от этих частей. В результате получим два отношения R1 иR2 в 2НФ.
Третья нормальная форма.
Определение 1. Отношение находится в 3НФ, если оно находится в 2НФ и каждый не ключевой атрибут не транзитивно зависит от первичного ключа.
Определение 2. Отношение находится в 3НФ в том и только в том случае, если все не ключевые атрибуты отношения взаимно независимы и полностью зависят от первичного ключа.
Для преобразования из 2НФ в 3НФ таблицу-отношение разделяют на две или более проекции так, чтобы конечные поля-атрибуты в цепочках транзитивной зависимости вынести в отдельные таблицы, связав разделившиеся части таблицы внешними ключами по полям-атрибутам, находящимся внутри цепочек транзитивной зависимости.
На практике построение ЗНФ схем отношений в большинстве случаев является достаточным и приведением к ним процесс проектирования реляционной БД заканчивается.