Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Вопросы_к___экзамену___по_БД.docx
Скачиваний:
41
Добавлен:
14.04.2015
Размер:
824.86 Кб
Скачать

Краткие итоги

Рассмотрены вопросы классификации БД и СУБД.

По технологии обработки данных БД делятся на централизованные БД и распределённые БД. Централизованные БД могут быть с сетевым доступом. Архитектуры систем централизованных БД с сетевым доступом подразделяются на файл-сервер и клиент-сервер. Распределённая БД разделяется по способу доступа к данным БД с локальным и удаленным доступом.

СУБД - классифицируются по языкам общения и по выполняемым функциям.

Для системы управления базой данных сложились три языка: язык описания данных (ЯОД), язык манипулирования данными (ЯМД),язык запросов.

Основные функции СУБД: непосредственное управление данными во внешней памяти, управление буферами оперативной памяти,управление транзакциямижурнализацияподдержка языков БД.

По степени универсальности различают два класса СУБДсистемы общего назначения, специализированные системы.

  1. Модели данных. Классификация моделей данных.

Модели данных. Понятие и классификация.

Модель данных - это некоторая абстракция, которая будучи приложенной к конкретным данным позволяет пользователю и разработчику трактовать их, как информацию; т.е. сведения содержат не только набор каких-то данных, но и связи между ними.

Другими словами, модель данных (МД) описывает некоторый набор родовых понятий и признаков, которыми должны обладать все конкретные Систему Управления Базами Данных (СУБД) и управляемые ими Базы Данных (БД), если они основываются на этой модели. Наличие модели данных позволяет сравнивать конкретные реализации, используя один общий язык.

Выделяют 3 вида моделей:

1.Инфологические - описывает смысловые содержания, здесь происходит выделение сущности объекта и связи между сущностями.

2.Даталогические - строятся на основе инфологических. Это модели для создания конкретной СУБД.

3.Физические - характеризуют распределение информационных ресурсов БД на конкретных физических носителях.

Ориентированные на формат документа

1. Документальные.

2. Тезаурусные.

3. Дескрипторные.

Документальные - соответствуют представлению слабоструктурированной информации.

Тезаурусные - основаны на принципах организации словарей. Пример: гипертекстовый документ. В настоящее время эти модели широко используются в программных переводчиках.

Дескрипторные - используются для создания БД. В этих моделях каждому документу соответствует описание. Этот описатель (дескриптор) имеет жёсткий формат и является ссылкой на определённую в документах информацию, текстовая информация дескриптора часто заменялась некоторыми цифровыми кодами. Это обусловлено тем, что:

-объёмы носителей информации были слишком малы, сейчас – для экономии места.

-процедура анализа текстовой информации сложна по сравнению с числовой.

1. Теоретико-графовые.

2. Теоретико-множественные (фактографические).

3. Объектно-ориентированные.

В основе Теоретико-графовых моделей лежит теория графов. Граф - это способ описания какой-то области реального мира с помощью 2-ух элементов:

- Вершина.

- Дуга.

Рис.1.1. Пример теоретико-графовой модели данных.

Теоретико-множественные модели основаны на теории множеств, опираются на свойства множеств и операции, которые производятся над множествами. Эти модели наиболее перспективны для создания БД.

Теоретико-графовые модели делятся на:

-Иерархические.

-Сетевые.

Теоретико-множественные делятся на:

-Реляционные.

-Бинарных ассоциаций.

Теоретико-графовые модели.

Иерархическая модель.

1-ая версия СУБД появилась в 1968г. Именно в ней была использована модель, представляющая собой упорядоченные наборы деревьев. Иерархическая модель данных строится по принципу иерархии типов объектов, т.е. один тип объекта является главным, а остальные подчиненными.

Рис.1.2. Пример иерархической модели данных.

Узел дерева - это совокупность атрибутов, описывающих объект.

Между главными и подчиненными объектами установлено отношение "один ко многим". Для каждого подчиненного типа объекта может быть только один исходный тип объекта.

Основным недостатком этой модели является то, что поиск необходимой информации достаточно длителен.

Сетевая модель.

Понятие главного и подчиненного объекта несколько расширено. Любой объект может быть главным и подчиненным. Каждый объект может участвовать в любом числе взаимодействий. Т.е. любая информационная единица может иметь множество предков и множество потомков.

Рис.1.3. Пример сетевой модели данных.

В этих моделях связи заложены внутри описания каждого объекта.

Достоинство: гибкость - может увеличить быстродействие системы.

Недостаток: нагрузка на информационные ресурсы.

Достоинства и недостатки теоретико-графовых моделей.

Достоинства:

1. Развитое средство управления во внешней памяти на низком уровне.

2. Возможность построить вручную эффективные прикладные программы.

3. Возможность экономии памяти распределённой информации на объектах системы.

Недостатки:

1. Слишком сложно пользоваться.

2. Фактически необходимо знание о физической организации информации.

3. Логика СУБД перегружена деталями организации доступа к данным.

  1. Модель «сущность-связь». (E/R) Основные понятия. Область применения.

Модель сущность-связь (ER-модель) (англ. entity-relationship model, ERM) — модель данных, позволяющая описывать концептуальные схемы предметной области.

ER-модель используется при высокоуровневом (концептуальном) проектировании баз данных. С её помощью можно выделить ключевые сущности и обозначить связи, которые могут устанавливаться между этими сущностями.

Во время проектирования баз данных происходит преобразование ER-модели в конкретную схему базы данных на основе выбранной модели данных (реляционной, объектной, сетевой или др.).

ER-модель представляет собой формальную конструкцию, которая сама по себе не предписывает никаких графических средств её визуализации. В качестве стандартной графической нотации, с помощью которой можно визуализировать ER-модель, была предложена диаграмма сущность-связь (ER-диаграмма) (англ. entity-relationship diagram, ERD).

Понятия ER-модель и ER-диаграмма часто ошибочно не различают, хотя для визуализации ER-моделей предложены и другие графические нотации (см. ниже).

Модель «сущность-связь» была предложена в 1976 году Питером Пин-Шен Ченом (англ. Peter Pin-Shen Chen)[1], американским профессором компьютерных наук в университете штата Луизиана[2].

Нотации (графические диаграммы)[править | править вики-текст]

Нотация Питера Чена[править | править вики-текст]

Простая ER-модель MMORPG с использованием нотации Питера Чена

Множества сущностей изображаются в виде прямоугольников, множества отношений изображаются в виде ромбов. Если сущность участвует в отношении, они связаны линией. Если отношение не является обязательным, то линия пунктирная. Атрибуты изображаются в виде овалов и связываются линией с одним отношением или с одной сущностью.[3]

Crow's Foot[править | править вики-текст]

Пример отношения между сущностями согласно нотации Crow's Foot

Данная нотация была предложена Гордоном Эверестом (англ. Gordon Everest) под названием Inverted Arrow («перевёрнутая стрелка»), однако сейчас чаще называемая Crow's Foot («воронья лапка») или Fork («вилка»).[4]

Согласно данной нотации, сущность изображается в виде прямоугольника, содержащего её имя, выражаемое существительным.[5] Имя сущности должно быть уникальным в рамках одной модели. При этом, имя сущности — это имя типа, а не конкретного экземпляра данного типа. Экземпляром сущности называется конкретный представитель данной сущности.

Связь изображается линией, которая связывает две сущности, участвующие в отношении. Степень конца связи указывается графически, множественность связи изображается в виде «вилки» на конце связи. Модальность связи так же изображается графически — необязательность связи помечается кружком на конце связи. Именование обычно выражается одним глаголом[5] в изъявительном наклонении настоящего времени: «Имеет», «Принадлежит» и т. д.; или глаголом с поясняющими словами: «Включает в себя», и т.п. Наименование может быть одно для всей связи или два для каждого из концов связи. Во втором случае, название левого конца связи указывается над линией связи, а правого – под линией. Каждое из названий располагаются рядом с сущностью, к которой оно относится.

Атрибуты сущности записываются внутри прямоугольника, изображающего сущность и выражаются существительным в единственном числе (возможно, с уточняющими словами). Среди атрибутов выделяется ключ сущности — неизбыточный набор атрибутов, значения которых в совокупности являются уникальными для каждого экземпляра сущности.[5]

  1. Реляционная модель данных. Основные понятия. Область применения.

(Реляционная модель данных (РМД) — логическая модель данных, прикладная теория построения баз данных, которая является приложением к задачам обработки данных таких разделов математики как теории множеств и логика первого порядка.

На реляционной модели данных строятся реляционные базы данных.

Реляционная модель данных включает следующие компоненты:

Структурный аспект (составляющая) — данные в базе данных представляют собой набор отношений.

Аспект (составляющая) целостности — отношения (таблицы) отвечают определенным условиям целостности. РМД поддерживает декларативные ограничения целостности уровня домена (типа данных), уровня отношения и уровня базы данных.

Аспект (составляющая) обработки (манипулирования) — РМД поддерживает операторы манипулирования отношениями (реляционная алгебра, реляционное исчисление).

Кроме того, в состав реляционной модели данных включают теорию нормализации.

Термин «реляционный» означает, что теория основана на математическом понятии отношение (relation). В качестве неформального синонима термину «отношение» часто встречается слово таблица. Необходимо помнить, что «таблица» есть понятие нестрогое и неформальное и часто означает не «отношение» как абстрактное понятие, а визуальное представление отношения на бумаге или экране. Некорректное и нестрогое использование термина «таблица» вместо термина «отношение» нередко приводит к недопониманию. Наиболее частая ошибка состоит в рассуждениях о том, что РМД имеет дело с «плоскими», или «двумерными» таблицами, тогда как таковыми могут быть только визуальные представления таблиц. Отношения же являются абстракциями, и не могут быть ни «плоскими», ни «неплоскими».

Для лучшего понимания РМД следует отметить три важных обстоятельства:

модель является логической, то есть отношения являются логическими (абстрактными), а не физическими (хранимыми) структурами;

для реляционных баз данных верен информационный принцип: всё информационное наполнение базы данных представлено одним и только одним способом, а именно — явным заданием значений атрибутов в кортежах отношений; в частности, нет никаких указателей (адресов), связывающих одно значение с другим;

наличие реляционной алгебры позволяет реализовать декларативное программирование и декларативное описание ограничений целостности, в дополнение к навигационному (процедурному) программированию и процедурной проверке условий.

Принципы реляционной модели были сформулированы в 1969—1970 годах Э. Ф. Коддом (E. F. Codd). Идеи Кодда были впервые публично изложены в статье «A Relational Model of Data for Large Shared Data Banks»[1][2], ставшей классической.

Строгое изложение теории реляционных баз данных (реляционной модели данных) в современном понимании можно найти в книге К. Дж. Дейта. «C. J. Date. An Introduction to Database Systems» («Дейт, К. Дж. Введение в системы баз данных»).

Наиболее известными альтернативами реляционной модели являются иерархическая модель, и сетевая модель. Некоторые системы, использующие эти старые архитектуры, используются до сих пор. Кроме того, можно упомянуть об объектно-ориентированной модели, на которой строятся так называемые объектно-ориентированные СУБД, хотя однозначного и общепринятого определения такой модели нет.)

  1. Связь между таблицами в реляционной модели. Типы связи. Первичный и внешний ключи. Опишите процессы ограничения и каскадирования операции.