Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
POSOBIE_MORUGIN_AGPU_ch_2-osn.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
3.03 Mб
Скачать

6.1.8. Основные задачи и этапы проектирования баз данных

Проектирование баз данных - процесс решения класса задач, связанных с созданием баз данных.

6.1.8.1. Основные задачи:

  • обеспечение хранения в БД всей необходимой информации;

  • обеспечение возможности получения данных по всем необходимым запросам;

  • сокращение избыточности и дублирования данных;

  • обеспечение целостности данных (правильности их содержания): исключение противоречий в содержании данных, исключение их потери и т.д.

6.1.8.2.Основные этапы проектирования баз данных

Концептуальное (инфологическое) проектирование – построение формализованной модели предметной области. Такая модель строится с использованием стандартных языковых средств, обычно графических, например ER-диаграмм. Модель строится без ориентации на какую-либо конкретную СУБД.

Основные элементы данной модели:

  • описание объектов предметной области и связей между ними;

  • описание информационных потребностей пользователей (описание основных запросов к БД);

  • описание алгоритмических зависимостей между данными;

  • описание ограничений целостности, т.е. требований к допустимым значениям данных и к связям между ними.

На этапе инфологического проектирования в ходе сбора информации о предметной области требуется выяснить:

  • основные объекты предметной области (объекты, о которых должна храниться информация в БД);

  • атрибуты объектов;

  • связи между объектами;

  • основные запросы к БД.

Логическое (даталогическое) проектирование – отображение инфологической модели на модель данных, используемую в конкретной СУБД, например на реляционную модель данных. Для реляционных СУБД даталогическая модель – набор таблиц, обычно с указанием ключевых полей, связей между таблицами. Если инфологическая модель построена в виде ER-диаграмм (или других формализованных средств), то даталогическое проектирование представляет собой построение таблиц по определённым формализованным правилам, а также нормализацию этих таблиц. Этот этап может быть в значительной степени автоматизирован.

Физическое проектирование – реализация логической модели средствами конкретной СУБД, а также выбор решений, связанных с физической средой хранения данных: выбор методов управления дисковой памятью, методов доступа к данным, методов сжатия данных и т.д. – эти задачи решаются в основном средствами СУБД и скрыты от разработчика БД.

Нормализация. Нормализованные отношения (таблицы) обладают лучшими свойствами для хранения и обновления данных. Сначала БД проверяется на первую нормальную форму (1НФ), затем на вторую (2НФ), 3-ю (3НФ), нормальную форму Бойса-Кодда (НФБКД), чётвертую (4НФ) и др. Если таблица не соответствует какой-либо нормальной форме, то выполняется её приведение к нормальной форме путём вертикального разбиения (проекция) на две или более таблиц.

6.2. Концептуальные модели предметной области

Концептуальная модель предметной области ИС описывает организацию всех данных ИС (независимо от места их расположения) на уровне понятий предметной области. Иначе такую модель называют семантической.

6.2.1. ER-модель в нотации Чена

Рассмотрим семантическую модель Entity-Relationship (Сущность-Связь). Эта модель – одна из наиболее популярных.

Модель Сущность-Связь (ER-модель) (англ. entity-relationship model (ERM) или англ. entity-relationship diagram (ERD)) — модель данных, позволяющая описывать концептуальные схемы. Предоставляет собой графическую нотацию, основанную на блоках и соединяющих их линиях, с помощью которых можно описывать объекты и отношения между ними какой-либо другой модели данных. В этом смысле ER-модель является мета-моделью данных, то есть средством описания моделей данных.

ER-модель удобна при прототипировании (проектировании) информационных систем, баз данных, архитектур компьютерных приложений, и других систем (далее, моделей). С её помощью можно выделить ключевые сущности, присутствующие в модели, и обозначить отношения, которые могут устанавливаться между этими сущностями.

ER-модель является одной из самых простых визуальных моделей данных (графических нотаций). Она позволяет обозначить структуру «крупными мазками», в общих чертах. Это общее описание структуры называется ER-диаграммой или онтологией выбранной предметной области (area of interest).

На этапе перехода к реализации данной ER-диаграммы в виде реальной информационной системы или программы, происходит отображение ER-модели в более детальную модель данных реляционной (объектной, сетевой, логической, или др.) базы данных.

На основе ER-диаграммы можно построить логическую модель данных (например, в нотации IDEF1X) и далее более детальную физическую модель данных.

Пользовательские модели предметной области ИС описывают подмножества данных концептуальной модели, доступное и видимое тем или иным группам пользователей. Пользовательских моделей может быть несколько.

На использовании разных вариантов ER-модели основано большинство современных подходов к проектированию баз данных (главным образом, реляционных). Модель была предложена Питером Ченом (Peter Chen) в 1976 г. Моделирование предметной области базируется на использовании графических диаграмм, включающих небольшое число разнородных компонентов. Простота и наглядность представления концептуальных схем баз данных в ER-модели привели к ее широкому распространению в CASE-системах, поддерживающих автоматизированное проектирование реляционных баз данных.

Следует заметить, что в настоящее время разработано несколько различных графических методов представления диаграмм в модели «сущность - связь». Среди множества нотаций ER-моделей одна из наиболее развитых – Unified Modeling Language (Унифицированный язык моделирования), сокр. UML – применяется в CASE-средствах фирмы ORACLE.

Ниже рассмотрим один из возможных подходов, в основе которого лежат диаграммы Чена.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]