
2к4с Управление данными / 01.03.2015 КОНСПЕКТ ЛЕКЦИЙ УД_0
.pdf Датологическуюсистему представляющую информационную
систему с помощью данных.
ПОДХОДЫ И ЭТАПЫ ПРОЕКТИРОВАНИЯ БД
Процесс проектирования БД – это процесс проектирования отображения:
описание предметной области;
схема внутренней модели БД.
Описание предметной области<=>Схема внутренней модели БД
Процесс проектирования БД включает:
разработку схем моделей;
проверки возможности отображения объектов одной модели в объекты другой модели.
Прикладные БД
БД, спроектированные на основании подхода «от запросов
пользователей» называются прикладными БД.
Подход проектирования БД – «от реального мира»
Развитие АИС и наличие потока произвольных по содержанию запросов обуславливают необходимость прогноза смыслового содержания ожидаемой совокупности производящих запросов по тематической направленности АИС.
Поэтому целесообразно создание БД, которые объединяют данные,
относящиеся к какой-либо предметной области, и называются предметными
БД.
Этапы проектирования БД
Задачи инфологического моделирования БД: получение семантических
(смысловых) моделей, отражающих информационное содержание конкретной ПО.
Задачи логического этапа проектирования: организация данных,
выделенных на этапе инфологического проектирования, в форму, принятую в выбранной СУБД.
Задачи физического проектирования: выбор рациональной структуры хранения данных и метода доступа к ним, исходя из методов и средств,
который предоставляется разработчику СУБД.
Инфологическое (концептуальное) проектирование Процесс создания внешней (инфологической) модели данных о
предметной области, не зависящих от физических аспектов ее представления,
не зависит от типа выбранной СУБД, набора создаваемых прикладных программ, от используемых языков программирования от типа вычислительных систем.
Средства создания внешних моделей
семантические модели;
язык инфологического моделирования;
ER-диаграммы.
Модели «сущность-связь»
Разработана Ченом в 1976г для упрощения концептуального проектирования БД.
Основные элементы этой модели:
сущность;
атрибуты;
связи.
Сущность
Сущность – это различимое множество объектов (экземпляров сущности реального мира с одинаковым набором атрибутов).
Сущность идентифицируется именем и списком свойств (атрибутов).
БД содержит много сущностей.
На ЕR – диаграммах сущность представляется с именем сущности внутри.
Атрибут
Каждый экземпляр сущности обладает уникальным набором значений атрибутов.
Атрибут – неотъемлемое свойство сущности или связи.
По значениям атрибутов идентифицируют экземпляр сущности.
Значения атрибутов представляют основную часть сведений,
хранящихся в БД.
На ЕR – диаграммах атрибут представляется, соединенным с соответствующей сущностью линией и именем атрибута внутри.
Ключ
Ключ – минимальный набор атрибутов, по значениям которых можно идентифицировать экземпляр сущности.
Связь
Связь – ассоционирование двух или более сущностей.
ПРОЕКТИРОВАНИЕ БД
Понятие «данные»
Понятие «данные» в концепции баз данных — это набор конкретных значений, параметров, характеризующих объект, условие, ситуацию или любые другие факторы.
Данные не обладают определенной структурой, данные становятся информацией тогда, когда пользователь задает им определенную структуру,
то есть осознает их смысловое содержание. Поэтому центральным понятием в области баз данных является понятие модели.
Понятие «модель данных»
Модель данных – это некоторая абстракция, в которой отражаются аспекты функционирования выделенной предметной области, а второстепенные игнорируются.
Инфологическая модель
Инфологическими, или семантическими называются модели, которые отражаются в естественной и удобной для разработчиков и других пользователей форме информационно - логический уровень абстрагирования,
связанный с фиксацией и описанием объектов предметной области, их свойств и их взаимосвязей.
Модель Сущность-Связь (ER-модель) — модель данных, позволяющая описывать концептуальные схемы. Представляет собой графическое изображение, основанное на блоках и соединяющих их линиях, с помощью которых можно описывать объекты и отношения между ними какой-либо другой модели данных. В этом смысле ER-модель является мета-моделью данных, то есть средством описания моделей данных.
Датологическая модель
На этапе перехода к реализации данной ER-диаграммы в виде реальной информационной системы или программы, происходит отображение ER-
модели в более детальную модель данных базы данных, которая называется
даталогической моделью данныхпо отношению к исходной ER-диаграмме.
Документальная модель
Документальные модели данных соответствуют представлению о слабоструктурированной информации, ориентированной в основном на свободные форматы документов, текстов на естественном языке.
Иерархическая модель
Иерархическая модель, которая состоит из упорядоченного набора деревьев; более точно, из упорядоченного набора нескольких экземпляров одного типа дерева. Тип дерева состоит из одного «корневого» типа записи и упорядоченного набора из нуля или более типов поддеревьев (каждое из которых является некоторым типом дерева). Тип дерева в целом представляет собой иерархически организованный набор типов записи.
Иерархическая модель данных является наиболее простой среди всех даталогических моделей. Исторически она появилась первой среди всех даталогических моделей: именно эту модель поддерживает первая из зарегистрированных промышленных СУБД IMS фирмы IBM.
Схема иерархической БД представляет собой совокупность отдельных деревьев, каждое дерево в рамках модели называется физической базой
данных. Каждая физическая БД удовлетворяет следующим иерархическим
ограничениям:
в каждой физической БД существует один корневой сегмент, то есть сегмент, у которого нет логически исходного (родительского) типа сегмента;
каждый логически исходный сегмент может быть связан с произвольным числом логически подчиненных сегментов;
каждый логически подчиненный сегмент может быть связан только с одним логически исходным (родительским) сегментом.
РЕЛЯЦИОННАЯ МОДЕЛЬ ДАННЫХ
Создатель реляционной модели - сотрудник фирмы IBM доктор Кодд Э.Ф. предложил использовать для обработки данных аппарат теории множеств: «Любое представление данных сводится к совокупности двумерных таблиц особого вида - отношение».
Реляционное отношение
Реляционная модель данных – это конечный набор отношений.
Отношение используется для отношения объектов, а также для представления связей между объектами.
Отношение – это двумерная таблица, имеющая уникальное имя и состоящая из строк и столбцов, где строки соответствуют записям, а столбцы атрибутам.
Каждая строка в таблице представляет некоторый объект реального мира или соотношение между объектами.
Атрибут – это поименованный столбец отношения. Свойство объекта,
его характеристики определяются значением атрибутов. Порядок следования атрибутов не влияет на само отношение, оно имеет один и тот же смысл при любом порядке их следования.
Домен – это совокупность значений, из которой берутся значения соответствующих атрибутов определенного отношения.
Кортеж отношений отображает экземпляр объекта, а атрибут отношения отображает атрибут объекта. Кортежи могут располагаться в любом порядке, при этом отношение будет оставаться тем же самым, а
значит иметь тот же смысл.
Первичный ключ – это столбец или некоторое подмножество столбцов,
которые уникально, т.е. единственным образом определяют строки.
Первичный ключ, который включает более одного столбца, называется множественным, или комбинированным, или составным. Правило целостности объектов утверждает, что первичный ключ не может быть полностью или частично пустым.
Внешний ключ – это столбец или подмножество одной таблицы,
который может служить в качестве первичного ключа для другой таблицы.
Внешний ключ таблицы является ссылкой на первичный ключ другой таблицы. Правило ссылочной целостности гласит, что внешний ключ может быть либо пустым, либо соответствовать значению первичного ключа, на который он ссылается. Внешние ключи являются неотъемлемой частью реляционной модели, поскольку реализуют связи между таблицами базы данных.
Свойства и виды отношений
Отношением является не любая таблица, а таблица обладающая определенными свойствами:
Отношение имеет имя, которое отличается от имен всех других
отношений;
Отношение представляется в виде табличной структуры. Имя таблицы соответствует имени отношения, имени столбцов – именам атрибутов, а строки таблицы - кортежам;
Каждый атрибут имеет уникальное имя, его значение берутся из одного и того же домена;
Каждый компонент кортежа является простым, атомарным значением, не состоящим из группы значений. Это не позволяет заменить значение атрибута другим отношением, что привело бы к сетевому или иерархическому отношению;
Упорядочение атрибутов теоретически несущественно, однако оно может влиять на эффективность доступа к кортежам;
Все строки (кортежи) должны быть различны;
Теоретически порядок следования кортежей не имеет значения,
но этот порядок влияет на эффективность доступа к кортежам.
РАСПРЕДЕЛЕННАЯ ОБРАБОТКА ДАННЫХ
Параллельный доступ к одной БД нескольких пользователей, в том случае если БД расположена на одной машине, соответствует режиму распределенного доступа к централизованной БД.
Если же БД распределена по нескольким компьютерам,
расположенным в сети, и к ней возможен параллельный доступ нескольких пользователей, то имеется дело с параллельным доступом к распределенной БД. Подобная система называется системой распределенных баз данных.