
- •1 . Понятие базы данных, Бнд, бз, субд, классификация бд.
- •В процессе отображения ПрО в бд можно выделить 4 уровня представления данных:
- •4.Классификация моделей данных.
- •5. Основные понятия концептуального (инфологического) моделирования данных.
- •6.Модель «Сущность-связь». Базовые понятия.
- •7. Диаграмма «Сущность-связь» в нотациях Чена и Баркера
- •1. Метод Чена
- •8. Нотация idef1x.
- •10. Даталогические модели. Иерархический подход к моделированию данных.
- •2.2. Манипулирование данными
- •2.3. Ограничения целостности
- •10. Реляционный подход к моделированию данных. Формальное определение отношения. Базовые понятия реляционного подхода.
- •11. Реляционная модель данных.
- •12. Требования к реляционным системам или правила Кодда (дюжина Кодда)
- •Общие правила получения реляционной схемы из er-схемы
- •14. Корректность схем отношений. Понятие функциональной зависимости. Ключ отношения.
- •15. Общие принципы нормализации. Понятия декомпозиции без потерь и с сохранением зависимостей.
- •16. Понятие третьей нормальной формы (3нф). Алгоритм приведения к 3нф.
- •17. Язык sql. Команды sql. Обобщенный формат команды Select
8. Нотация idef1x.
Основан на подходе Чена. создана усовершенствованная разновидность IDEF1X. Используется в ряде Case-средств(ERWin, Design/IDEF и др.). Сущность в методе IDEF является независимой от идентификаторов, если каждый экземпляр сущности может быть однозначно идентифицирован без определения его отношений с другими сущностями. Сущность называется зависимой от идентификаторов, если однозначная идентификация экземпляра сущности зависит от его отношения к другой сущности. Каждой сущности присваивается уникальное имя и номер, разделенные косой чертой.
Связь - это ассоциация между сущностями, при которой, как правило, каждый экземпляр одной сущности, называемой родительской сущностью, ассоциирован с произвольным, количеством экземпляров второй сущности, называемой сущностью-потомком. В то же время, каждый экземпляр сущности - потомка, ассоциирован в точности с одним экземпляром сущности-родителя. Т.о, потомок - это слабая сущ. по Чену.
Связь изображается линией, проводимой между сущностью-родителем и сущностью - потомком, с точкой на конце линии у сущности - потомка. Связь может дополнительно определятся с помощью указания степени или мощности:
1) N - каждый экземпляр сущ.-родителя может иметь 0, 1 или > одного, связанного с ним экземпляра сущ-потомка;
2) P - каждый экземпляр сущности-родителя должен иметь не менее одного
3) Z - каждый экземпляр сущности-родителя должен иметь не более одного
4) M - каждый экземпляр сущности связан с некоторым фиксированным числом
Связь м/ду сущ-родителем и сущ-потомком может быть идентифицирующей и неид.
Идентиф. связь изображается сплошной линией. Сущность потомок в идентифицирующей связи является зависимой от идентификатора сущностью. Неидентифиц. связь изображается пунктирной линией, сущность-потомок в неидентиф. связи будет не зависимой от идентификатора, если она не является также сущность-потомком в какой-либо идентифицирующей связи.
Атрибуты изображаются в виде списка имен внутри блока сущности. Атрибуты, определяющие первичный ключ, размещаются наверху списка и отделяются от других атрибутов горизонтальной чертой. Сущности могут иметь внешние ключи.
10. Даталогические модели. Иерархический подход к моделированию данных.
Даталогическая модель является моделью логического уровня. Эта модель представляет собой отображение логических связей между элементами данных безотносительно к их содержанию и среде хранения. Эта модель соответствует концептуальному уровню представления данных в трехуровневой архитектуре СУБД.
Выделяют две группы даталогических моделей: документальные и фактографические.
Документальные модели данных соответствуют представлению о слабоструктурированной информации, ориентированной в основном на свободные формы документов, текстов на естественном языке. Документальные модели состоят из трех групп: моделей, ориентированных на формат документа, дескрипторные модели и тезаурусные модели.
Для описания моделей первой группы используются языки разметки документов. Язык SGML (Standart Generalised Murkup Language) был утвержден в качестве стандарта еще в 80 годах прошлого века. В настоящее время широкое распространение получил HTML. На смену ему приходит новый язык XML(Extensible Markup Language ). Этот язык используется в качестве средства для описания грамматики других языков и контроля за правильностью составления документов.
Дескрипторные модели являются самыми простыми среди документальных. Каждому документу соответствует дескриптор-описание в соответствии с характеристиками, которые требуются для работы с документами в БД.
Тезаурусные модели основаны на принципе организации словарей. Используются, например, в системах переводчиках.
Фактографические модели предназначены для представления структурированной информации в БД. Выделяют три группы фактографических моделей: теоретико-графовые, теоретико-множественные, многомерные и объектно-ориентированные.
Теоретико-графовые модели используют теорию графов для представлени объектов и связей между ними. К таким моделям относятся иерархическа и сетевая модели данных, которые широко применялись в начальный период разработки БД.
К теоретико-множественным относится реляционная модель данных, которая наиболее распространена в настоящее время. она основана на использовании раздела теории множеств и теоретико-множественного понятия отношения. К этой группе относятся также модели бинарных ассоциаций.
Многомерные модели основаны на понятии многомерного гиперкуба и используются в системах OLAP.
Объектные модели позволяют описывать объекты и методы их бработки. стандартизованная объектно-ориентированная модель описана в рекомендациях стандарта ODMG-93, стандарте IDEF. Разработан и начинает широко приеняться для моделирования объектных баз данных и информационных систем язык UML(unify modelling language).
Традиционно сравнивались три подхода к моделированию данных: сетевой, иерархический и реляционный. В настоящее время широко используется объектный подход и многомерные модели. Рассмотрим сначала традиционные подходы.
2.1. Иерархический подход
Первые СУБД поддерживали иерархическую модель данных. Наиболее известны были СУБД IMS, SYSTEM200, ADABAS, ОКА, ИНЭС. Широкое распространение иерархических систем связано с тем, что иерархические структуры часто встречаются в повседневной жизни, мы постоянно имеем с ними дело.
Пример 1: Иерархическая структура любой организации, например, университета.
------- ------------
IуниверситетI I кодIнаименIадрIректорI
------- ------------
I I
------- -----------
I факультеты I I код1 наимен1декан I
------- ----------
I I
------- -----------
I кафедра 1 1 код 1 наимен 1 зав 1
------- -----------
I I I I
----- ----- ------ ------
I преп 1 1 студ ! 1код1ФИО1...1 1код1 Nгруппы1
----- ----- ------- -------
Пример 2: Руководитель - подчиненные
Пример 3: Иерархическая система файлов DOS
Иерархическая модель данных строится по принципу иерархии типов объектов. Иерархия реализует отношения "целое - часть" , 1:M (главный-подчиненный, предок-потомок). Иерархическая модель - это частный случай графовой модели. Графическим представлением иерархии является дерево. Дерево представляет собой иерархию элементов, называемых узлами.
Иерархическая древовидная структура всегда удовлетворяет следующим требованиям:
иерархия начинается с одного корневого узла;
каждый узел состоит из одного или нескольких атрибутов, описывающих объекты в данном узле;
на низших уровнях могут находится зависимые или порожденные узлы;
узел на предыдущем уровне называется исходным для порожденного;
новые порожденные узлы могут добавляться как в горизонтальном, так и в вертикальном направлении без ограничений;
каждый порожденный имеет один исходный на предыдущем уровне;
каждый исходный имеет в качестве зависимого один или несколько порожденных узлов, т.е. реаализует связи 1:M;
доступ к каждому узлу, за исключением корневого, происходит через его исходный. Существует только один путь доступа к каждому узлу;
возможно существование любого количества экземпляров узлов (записей) каждого уровня.
Иерархическая БД состоит из упорядоченного набора деревьев; более точно, из упорядоченного набора нескольких экземпляров одного типа дерева. Тип дерева состоит из одного "корневого" типа записи и упорядоченного набора из нуля или более типов поддеревьев (каждое из которых является некоторым типом дерева). Тип дерева в целом представляет собой иерархически организованный набор типов записи. Для БД определен полный порядок обхода - сверху-вниз, слева-направо.