Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
кожин / Лекции / лекция 03 FZ_MZ.DOC
Скачиваний:
30
Добавлен:
20.03.2016
Размер:
178.18 Кб
Скачать

3 Основы теории автоматизированного проектирования баз данных.

3.1 Основные концепции автоматизации логического проектирования баз данных

Процесс логического проектирования БД включает в себя проектирование схемы и подсхем БД.

Выбор теоретического базиса процессов автоматизированного проектирования должен основываться на определении его способности обеспечивать получение результатов (схем, подсхем), эффективных в смысле, некоторых критериев.

Охарактеризуем критерии качества проекта схемы БД:

1)способность схемы автоматически контролировать и поддерживать соответствие данных закономерностям (ограничения целостности), специфицированным в ИЛ. Излагаемая ниже схема проектирования, ориентированная на данный критерий, обеспечивает также качественность проекта в отношении таких традиционно сформулированных критериев, как неизбыточность (контролируемая избыточность) данных и подавление аномалий актуализации;

2) степень ориентации структуры БД на наиболее часто реализуемые критичные по времени выполнения и высокоприоритетные запросы: наличие в структуре БД путей для выполнения таких запросов;

3) обеспечиваемая схемой непроцедурность манипулирования данными: минимизация числа операторов ЯМД, которыми интерпретируется отдельный запрос к БД.

Порядок, в котором перечислены вышеуказанные критерии, отражает наиболее характерное их ранжирование по значимости. В частных случаях может использоваться другое ранжирование критериев. Так, например, в случае статичной БД (такой БД, состояние которой при каждом акте актуализации изменяется незначительно, а интенсивность процессов актуализации сравнительно невелика или же изменение состояния происходит достаточно редко и вместе с тем требуется высокая реактивность, т.е. производительность при выполнении запросов на выборку данных) наибольшая значимость может придаваться второму критерию.

Второй критерий отражает влияние, которое в графовых навигационных моделях данных логическая организация оказывает на физические, временные характеристики доступа к БД.

Третий критерий вводится в связи с ограниченными возможностями трансформации схемы в подсхемы, обеспечиваемыми существующими СУБД. В силу этого обстоятельства требования, выражаемые третьим критерием, должны быть реализованы на уровне схемы.

Второй и третий критерии в общем случае не являются независимыми: схема БД, эффективная в смысле второго критерия, в целом удовлетворяет также третьему критерию.

Наиболее эффективным в смысле первого, основного критерия качества проектирования схемы является аппарат проектирования, базирующийся на идеях нормализации введенных Э. Коддом применительно к задачам проектирования реляционных БД. Цель нормализации — получение нормальной формы (НФ) представления данных, которая, обеспечивая отражение необходимой информации, автоматически поддерживала бы в той или иной степени целостность данных в смысле определенных видов логико-семантических свойств (ограничений целостности). Обычно рассматриваются НФ, связанные с ограничениями целостности, выражаемыми структурами функциональных зависимостей (2НФ, ЗНФ, УТНФ — усиленная ЗНФ), многозначных зависимостей (4НФ), частными и общего вида зависимостями по соединению.

Проиллюстрируем идею нормализации представления данных, предположив для простоты, что ограничения целостности выражаются только структурой ФЗ. В этом случае конечная цель нормализации состоит в том, чтобы представить БД такой системой функциональных отношений, каждое из которых соответствует одной из ФЗ, входящих в неизбыточное покрытие заданной структуры Ф3. При условии, что СУБД контролирует функциональность каждого отношения, во многих случаях будет автоматически контролироваться и поддерживаться при выполнении любой операции актуализации весьма важная с точки зрения обеспечения достоверности данных совокупность свойств, выражаемых структурой ФЗ.

Заметим, что при данных предположениях функциональное отношение можно охарактеризовать как наименьшую единицу синтаксического разложения БД, т.е. разложения, при котором восстановление отношения, выражающего всю содержащуюся в БД информацию, по его нормальным проекциям возможно путем формального выполнения операции соединения проекций. Таким образом, нормальная форма представления обеспечивает подавление избыточности.

Идеи нормализации естественно распространить на проектирование БД, соответствующих нереляционных моделям данных, по следующим причинам. Во-первых, такие БД ориентированы на поддержку свойств данных синтаксическими (форма представления) средствами (это относится, по крайней мере, к упомянутым выше НФ); только такой способ поддержки ограничений доступен в синтаксических СУБД и не является привилегией частной (реляционной) синтаксической модели. Во-вторых, нормальная форма представления является формой выражения свойств данных моделируемой предметной области, а не свойств модели. Вместе с тем свойства структур, которые активно используются в НФ представлениях, характерны и для нереляционных моделей (см., например, табличные структуры в графовых моделях, где выделяются ключевые элементы, т. е. обеспечивается поддержка ФЗ). И, наконец, ассоциированная с НФ-представлением операция естественного соединения нормальных отношений интерпретируется в других моделях данных, причем в графовых моделях ее можно представить своим результатом — дугами-связями между вершинами, соответствующими НФ-отношениям.

Учитывая изложенное, процесс проектирования схем БД можно представить в виде последовательности двух этапов: синтеза системы отношений нормальной формы и отображения полученной системы в схему целевой модели данных.

В свою очередь этап отображения состоит из двух подэтапов. На первом подэтапе каждому отношению ставится в соответствие фрагмент целевой схемы, а на втором — производится связывание фрагментов в полную схему.

Поскольку результаты выполнения первого подэтапа в общем случае не инвариантны по отношению с исходной системе отношений, возможно решение задачи выбора рационального в смысле критерия 2 (и 3) варианта схемы БД. Однако, как будет показано далее, эта задача должна решаться совместно с задачей выбора рациональных параметров внутренней модели (этап физического проектирования).

Теоретический базис и алгоритмы реализации процедур, выполняемых на первом этапе проектирования схемы БД, практически не зависят от свойств синтаксической целевой модели данных, поддерживаемой той или иной СУБД. Поэтому такие процедуры в дальнейшем будем именовать обобщенными процедурами. Они составляют неизменяемое ядро подсистемы логического проектирования. Напротив, отображение реляционного представления в целевую схему БД существенно зависит от свойств целевой модели. Настройка процедур второго этапа в соответствии с особенностями целевой модели составляет важный момент адаптации САПР БД к конкретной СУБД.

Соседние файлы в папке Лекции