Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
материалы к БД по дисциплине.docx
Скачиваний:
19
Добавлен:
21.04.2019
Размер:
1.3 Mб
Скачать

Основные понятия модели Сущность-Связь.

Далее мы кратко рассмотрим некоторые черты одной из наиболее популярных семантических моделей данных - модель "Сущность-Связи" (часто ее называют кратко ER-моделью).

На использовании разновидностей ER-модели основано большинство современных подходов к проектированию баз данных (главным образом, реляционных). Модель была предложена Ченом (Chen) в 1976 г. Моделирование предметной области базируется на использовании графических диаграмм, включающих небольшое число разнородных компонентов. В связи с наглядностью представления концептуальных схем баз данных ER-модели получили широкое распространение в системах CASE, поддерживающих автоматизированное проектирование реляционных баз данных. Основными понятиями ER-модели являются сущность, свойство, связь.

Сущность - это реальный или представляемый объект, информация о котором должна сохраняться и быть доступна. В диаграммах ER-модели сущность представляется в виде прямоугольника, содержащего имя сущности. При этом имя сущности - это имя типа, а не некоторого конкретного экземпляра этого типа. Для большей выразительности и лучшего понимания имя сущности может сопровождаться примерами конкретных объектов этого типа.

Каждый экземпляр сущности должен быть отличим от любого другого экземпляра той же сущности (это требование в некотором роде аналогично требованию отсутствия кортежей-дубликатов в реляционных таблицах).

Свойством сущности является любая деталь, которая служит для уточнения, идентификации, классификации, числовой характеристики или выражения состояния сущности. Имена свойств заносятся в прямоугольник, изображающий сущность, под именем сущности и изображаются малыми буквами, возможно, с примерами.

Уникальным идентификатором сущности является свойство, комбинация свойств, уникально отличающая любой экземпляр сущности от других экземпляров сущности того же типа.

Связь - это графически изображаемая ассоциация, устанавливаемая между двумя сущностями. Эта ассоциация всегда является бинарной и может существовать между двумя разными сущностями или между сущностью и ей же самой (рекурсивная связь). В любой связи выделяются два конца (в соответствии с существующей парой связываемых сущностей), на каждом из которых указывается имя конца связи, степень конца связи (сколько экземпляров данной сущности связывается), обязательность связи (т.е. любой ли экземпляр данной сущности должен участвовать в данной связи).

Будем использовать для отображения объектов и их свойств следующие условные обозначения (рис.1).

Рис. 1 Изображение объектов и их свойств.

При описании предметной области надо отразить связи между объектом и характеризующими его свойствами. Эти связи изображаются в виде линии, соединяющих изображение объект и его свойств. Пусть, например, при описании сотрудника фиксируются его свойства.

Свойства объекта могут быть единичные и множественные. Единичные свойства (год рождения, образование, ученая степень, ученое звание) изображаются одинарной стрелкой. Множественные свойства, например иностранный язык, изображаются двойной стрелкой.

«СОТРУДНИК»

Рис.2

Изображение связи «ОБЪЕКТ-СВОЙСТВО».

В инфологической модели отображаются не отдельные экземпляры объектов, а объекты.

Кроме связи между объектом и его свойствами в ИЛМ фиксируются связи между объектами (сущностями).

Пример: Даны два объекта: «СТУДЕНТ» и «ПРЕПОДАВАТЕЛЬ», которые представляют собой предметную область – вуз.

Между объектом «СТУДЕНТ» и объектом «ПРЕПОДАВАТЕЛЬ» имеется связь – руководство дипломными проектами.

Связь между экземплярами объекта «СТУДЕНТ» и экземплярами объекта «ПРЕПОДАВАТЕЛЬ» отображается в виде диаграммы ER-экземпляров. представленной на рис. 3.

Рис. 3 Диаграмма ER – экземпляров.

На основе этой диаграммы построим диаграмму ER – типов, отражающую связь между объектами.

Из этой диаграммы видно, что каждый студент имеет только одного руководителя, но один и тот же преподаватель может руководить множеством студентов-дипломников, Такая связь называется «один – ко – многим» (1:М), один со стороны «ПРЕПОДАВАТЕЛЬ» и многие со стороны «СТУДЕНТЫ» (рис. 4).

Рис.4 Диаграмма ER – типов.

При связи 1 : М одному экземпляру объекта «ПРЕПОДАВАТЕЛЬ» соответствует 0;1 или более экземпляров объекта «СТУДЕНТ», но каждому экземпляру объекта «СТУДЕНТ» соответствует не более одного экземпляра объекта «ПРЕПОДАВАТЕЛЬ».

Если в качестве предметной области рассмотреть клинику, то между объектами «ПАЦИЕНТ» и «КОЙКА» существую связь 1 : 1 (один – к – одному). Одному экземпляру объекта «ПАЦИЕНТ» и «КОЙКА» соответствует не более одного экземпляра объекта «KOЙKA» и наоборот (рис. 5).

Рис. 5 Диаграмма ER – экземпляров.

Диаграмма ER-типов, отражающая связь между объектами «ПАЦИЕНТ» и «КОЙКА», представлена на рис. 6.

Рис. 6 Диаграмма ER – экземпляров.

Между двумя сущностями может быть задано сколь угодно связей с разными смысловыми значениями. Между сущностями «СТУДЕНТ» и «ПРЕПОДАВАТЕЛЬ» можно установить вторую связь, назвав ее условно «Лекции». Ясно, что эта связь типа «многие – ко – многим».

Связь «многие – ко – многим» (М : М) – одному экземпляру объекта «ПРЕПОДАВАТЕЛЬ» соответствует 0:1 или более экземпляров объекта «СТУДЕНТ» и наоборот.

Диаграммы ER – экземпляров и ER – типов изображены на рис. 2.7 и рис.8.

Рис.7 Диаграмма ER – экземпляров.

Рис.8 Диаграмма FR – типов.

Перечисленные выше типы связи (1 : 1), (1 : М), (М : М) называются степенью связи.

Как и в реляционных схемах баз данных, в ER-схемах вводится понятие нормальных форм, причем их смысл очень близко соответствует смыслу реляционных нормальных форм. Заметим, что формулировки нормальных форм ER-схем делают более понятным смысл нормализации реляционных схем. Мы приведем только очень краткие и неформальные определения трех первых нормальных форм.

В первой нормальной форме ER-схемы устраняются повторяющиеся атрибуты или группы атрибутов, т.е. производится выявление неявных сущностей, "замаскированных" под атрибуты.

Во второй нормальной форме устраняются атрибуты, зависящие только от части уникального идентификатора. Эта часть уникального идентификатора определяет отдельную сущность.

В третьей нормальной форме устраняются атрибуты, зависящие от атрибутов, не входящих в уникальный идентификатор. Эти атрибуты являются основой отдельной сущности.

Связи "many-to-many". Иногда бывает необходимо связывать сущности таким образом, что с обоих концов связи могут присутствовать несколько экземпляров сущности (например, все члены кооператива сообща владеют имуществом кооператива). Для этого вводится разновидность связи "многие-со-многими".

Уточняемые степени связи. Иногда бывает полезно определить возможное количество экземпляров сущности, участвующих в данной связи (например, служащему разрешается участвовать не более, чем в трех проектах одновременно). Для выражения этого семантического ограничения разрешается указывать на конце связи ее максимальную или обязательную степень.

Каскадные удаления экземпляров сущностей. Некоторые связи бывают настолько сильными (конечно, в случае связи "один-ко-многим"), что при удалении опорного экземпляра сущности (соответствующего концу связи "один") нужно удалить и все экземпляры сущности, соответствующие концу связи "многие". Соответствующее требование "каскадного удаления" можно сформулировать при определении сущности.

Домены. Как и в случае реляционной модели данных бывает полезна возможность определения потенциально допустимого множества значений атрибута сущности (домена).

Лекция 11. Этапы проектирования баз данных.

Прежде, чем рассмотреть особенности одной из распространенных семантических моделей, остановимся на их возможных применениях.

Наиболее часто на практике семантическое моделирование используется на первой стадии проектирования базы данных. При этом в терминах семантической модели производится концептуальная схема базы данных, которая затем вручную преобразуется к реляционной (или какой-либо другой) схеме. Этот процесс выполняется под управлением методик, в которых достаточно четко оговорены все этапы такого преобразования.

Процесс проектирования баз данных представляет собой последовательность переходов от неформального словесного описания информационной структуры исследуемой предметной области к формальному описанию объектов этой области в терминах некоторой модели. В общем случае можно выделить следующие этапы проектирования:

  1. Системный анализ и словесное описание информационных объектов предметной области.

  2. Формирование инфологической модели предметной области – частично формализованное описание объектов в терминах некоторой семантической модели, например, в терминах ER- модели.

  3. Выбор СУБД.

  4. Даталогическое или логическое представление базы данных, т.е. описание базы данных в терминах принятой даталогической модели данных

  5. Физическое проектирование базы данных. К числу работ, выполняемых на данном этапе относятся: выбор типа носителя, способа организации данных,, выбор эффективного размещения базы данных на внешних носителях и другие работы.

Системный анализ предметной области.

На первом этапе в рамках системного анализа необходимо осуществить подробное словесное описание объектов предметной области и реальных связей, которые присутствуют между объектами. Желательно, чтобы данное описание позволяло в дальнейшем корректно определить все взаимосвязи между объектами предметной области.

На практике при выборе состава и структуры предметной области ориентируются на конкретные задачи или функциональные потребности пользователей и в то же время учитывают возможность наращивания новых приложений.

Системный анализ должен заканчиваться подробным описанием информации об объектах предметной области, которая требуется для решения конкретных задач; формулировкой конкретных задач, решаемых с использованием данной БД с кратким описанием алгоритмов их решения; описанием входных и выходных документов.