Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1-82

.pdf
Скачиваний:
14
Добавлен:
11.05.2015
Размер:
5.97 Mб
Скачать

34. Сетевая модель представления данных. Понятие сети. Основные принципы.

Отличие сетевой структуры от иерархической заключается в том, что каждый элемент в сетевой структуре может быть связан с любым другим элементом (см. рис. 2.3). Пример простой сетевой структуры показан на рис. 2.4.

Достоинством сетевой модели данных является возможность эффективной реализации по показателям затрат памяти и оперативности.

Недостатком сетевой модели данных являются высокая сложность и жесткость схемы БД, построенной на ее основе.

Воснове моделей этого типа лежит конструкция, названная семантической сетью. Семантический подход к построению систем искусственного интеллекта находит применение в системах понимания естественного языка, в вопросно-ответных системах, в различных предметно-ориентированных системах.

Термин семантическая означает смысловая, а сама семантика — это наука, устанавливающая отношения между символами и объектами, которые они обозначают, то есть наука, определяющая смысл знаков.

Всамом общем случае семантическая сеть представляет собой информационную модель предметной области и имеет вид графа, вершины которого соответствуют объектам предметной области, а дуги — отношениям между ними.

Дуги могут быть определены разными методами, зависящими от вида представляемых знаний. Обычно дуги, используемые для представления иерархии, включают дуги типа «множество», «подмножество», «элемент». Семантические сети, применяемые для описания естественных языков, используют дуги типа «агент», «объект», «реципиент». Понятиями обычно выступают абстрактные или конкретные объекты, а отношения — это связи типа: «это» («is»), «имеет частью» («has part»), «принадлежит», «любит». Характерной особенностью семантических сетей является обязательное наличие трех типов отношений:

· класс — элемент класса; · свойство — значение; · пример элемента класса.

Можно ввести несколько классификаций семантических сетей. Например, по количеству типов отношений:

· однородные (с единственным типом отношений); · неоднородные (с различными типами отношений). По типам отношений:

·бинарные (в которых отношения связывают два объекта);

·парные (в которых есть специальные отношения, связывающие более двух понятий). Наиболее часто в семантических сетях используются следующие отношения:

·связи типа «часть-целое» («класс-подкласс», «элемент-множество» и т.п.);

·функциональные связи (определяемые обычно глаголами «производит», «влияет»...);

·количественные (больше, меньше, равно...);

·пространственные (далеко от, близко от, за, под, над...);

·временные (раньше, позже, в течение...);

·атрибутивные связи (иметь свойство, иметь значение...);

·логические связи (и, или, не) и др.

35. Реляционная модель представления данных. Логическая схема реляционной БД. Основные принципы.

Реляционная база данных представляет собой хранилище данных, организованных в виде двумерных таблиц (см. рис. 2.5). Любая таблица реляционной базы данных состоит из строк (называемых также записями) и столбцов (называемых также полями).

Строки таблицы содержат сведения о представленных в ней фактах (или документах, или людях, одним словом, - об однотипных объектах). На пересечении столбца и строки находятся конкретные значения содержащихся в таблице данных. Данные в таблицах удовлетворяют следующим принципам:

1.Каждое значение, содержащееся на пересечении строки и столбца, должно быть атомарным.

2.Значения данных в одном и том же столбце должны принадлежать к одному и

тому же типу, доступному для использования в данной СУБД.

3. Каждая запись в таблице уникальна, то есть в таблице не существует двух записей с полностью совпадающим набором значений ее полей.

4.Каждое поле имеет уникальное имя.

5.Последовательность полей в таблице несущественна.

6.Последовательность записей в таблице несущественна.

Поле или комбинацию полей, значения которых однозначно идентифицируют каждую запись таблицы, называют возможным ключом (или просто ключом ).

Если таблица имеет более одного возможного ключа, тогда один ключ выделяют в качестве первичного . Первичный ключ любой таблицы обязан содержать уникальные непустые значения для каждой строки.

Поле, указывающее на запись в другой таблице, связанную с данной записью,

называется внешним ключом.

Подобное взаимоотношение между таблицами называется связью . Связь между двумя таблицами устанавливается путем присвоения значений внешнего ключа одной

таблицы значениям первичного ключа другой. Группа связанных таблиц называется схемой базы данных . Информация о таблицах, их полях, первичных и внешних ключах, а также иных объектах базы данных,

называется метаданными .

Достоинство реляционной модели данных заключается в простоте, понятности и удобстве физической реализации на ЭВМ. Именно простота и понятность для пользователя явились основной причиной ее широкого использования.

К основным недостаткам реляционной модели относятся отсутствие стандартных средств идентификации отдельных записей и сложность описан ия ие рархических и сетевых связей.

36. Диаграмма сущность-связь (ER-диаграмма). Типы узлов и рёбер.

Сущность (Entity) - любой объект, событие или концепция, имеющие существенное значение для предметной области, и информация о которых должна сохраняться. Каждая сущность является множеством подобных объектов, называемых экземплярами . Каждый экземпляр индивидуален и должен отличаться от остальных.

Атрибут (Attribute) - любая характеристика сущности, значимая для рассматриваемой предметной области. Атрибут предназначен для квалификации, идентификации, классификации, количественной характеристики или выражения состояния сущности. Каждая сущность может обладать любым количеством связей с другими

сущностями. Связь (Relationship) - поименованное логическое соотношение между двумя сущностями, значимое для рассматриваемой предметной области.

Сущность является независимой , если каждый экземпляр ее может быть однозначно идентифицирован без определения его отношений с другими сущностями. Независимая сущность изображается прямоугольником с четко выраженными углами.

Сущность является зависимой , если однозначная идентификация экземпляра сущности зависит от его отношения к другой сущности. Зависимая сущность изображается прямоугольником со скругленными углами.

Первичный ключ (Primary Key) - это атрибут или группа атрибутов, однозначно идентифицирующих экземпляр сущности. На диаграмме первичные ключи размещаются выше горизонтальной линии. Ключ может быть сложным, т.е. состоять из нескольких атрибутов.

Альтернативный ключ (Alternate Key) - потенциальный ключ, не ставший первичным. На диаграмме альтернативный ключ обозначается AK n . m , где n - порядковый номер ключа, m - порядковый номер атрибута в ключе.

Внешние ключи (Foreign Key) создаются автоматически, когда сущности соединяются связью (миграция ключа). Связи между таблицами реляционной БД представляются одинаковыми ключами в таблицах (внешними ключами).

Связи (логические отношения между сущностями) именуются глаголами или глагольными фразами. Имена связей выражают некоторые ограничения или бизнесправила и облегчают чтение диаграмм.

На логическом уровне можно установить:

идентифицирующую связь один-ко-многим;

неидентифицирующую связь один-ко-многим;

связь многие-ко-многим.

37. Реляционные СУБД. Типы хранимых данных.

Реляционная модель данных — логическая модель данных, строгая математическая теория, описывающая структурный аспект, аспект целостности и аспект обработки данных в реляционных базах данных.

Структурный аспект (составляющая) — данные в базе данных представляют собой набор отношений.

Аспект (составляющая) целостности — отношения (таблицы) отвечают определенным условиям целостности. РМД поддерживает декларативные ограничения целостности уровня домена (типа данных), уровня отношения и уровня базы данных.

Аспект (составляющая) обработки (манипулирования) — РМД поддерживает операторы манипулирования отношениями (реляционная алгебра, реляционное исчисление).

Кроме того, в состав реляционной модели данных обычно включают теорию нормализации.

Реляционная модель данных является приложением к задачам обработки данных таких разделов математики как теория множеств и формальная логика.

Термин «реляционный» означает, что теория основана на математическом понятии отношение (relation). В качестве неформального синонима термину «отношение» часто встречается слово таблица. Необходимо помнить, что «таблица» есть понятие

нестрогое и неформальное и часто означает не «отношение» как абстрактное понятие, а визуальное представление отношения на бумаге или экране.

Для лучшего понимания РМД следует отметить три важных обстоятельства:

модель является логической, т.е. отношения являются логическими (абстрактными), а не физическими (хранимыми) структурами;

для реляционных баз данных верен информационный принцип: все информационное наполнение базы данных представлено одним и только одним способом, а именно — явным заданием значений атрибутов в кортежах отношений; в частности, нет никаких указателей (адресов), связывающих одно значение с другим;

наличие реляционной алгебры позволяет реализовать декларативное программирование и декларативное описаний ограничений целостности, в дополнение к навигационному (процедурному) программированию и процедурной проверке условий.

38. Первая нормальная форма реляционной модели.

Переменная отношения находится в первой нормальной форме тогда и только тогда, когда в любом допустимом значении отношения каждый его кортеж содержит только одно значение для каждого из атрибутов.

В реляционной модели отношение всегда находится в первой нормальной форме по определению понятия отношение.

Что же касается различных таблиц, то они могут не быть правильными представлениями отношений и, соответственно, могут не находиться в 1NF. В соответствии с определением К. Дж. Дейта для такого случая, таблица нормализована (эквивалентно — находится в первой нормальной форме) тогда и только тогда, когда она является прямым и верным представлением некоторого отношения. Конкретнее, рассматриваемая таблица должна удовлетворять следующим пяти условиям:

1. Нет упорядочивания строк сверху-вниз (другими словами, порядок строк не несет в себе никакой информации).

2.Нет упорядочивания столбцов слева-направо (другими словами, порядок столбцов не несет в себе никакой информации).

3.Нет повторяющихся строк.

4.Каждое пересечение строки и столбца содержит ровно одно значение из соответствующего домена (и больше ничего).

5.Все столбцы являются обычными[1].

«Обычность» всех столбцов таблицы означает, что в таблице нет «скрытых» компонентов, которые могут быть доступны только в вызове некоторого специального оператора взамен ссылок на имена регулярных столбцов, или которые приводят к побочным эффектам для строк или таблиц при вызове стандартных операторов. Таким образом, например, строки не имеют идентификаторов кроме обычных значений потенциальных ключей (без скрытых «идентификаторов строк» или «идентификаторов объектов»). Они также не имеют скрытых временных меток[1].

[править]Пример

Исходная ненормализованная (то есть не являющаяся правильным представлением некоторого отношения) таблица:

Сотрудник Номер теле она

Иванов И. И.283-56-82 390-57-34

Петров П. П. 708-62-34

Таблица, приведённая к 1NF (являющаяся правильным представлением некоторого отношения):

39. Вторая нормальная форма реляционной модели.

Переменная отношения находится во второй нормальной форме тогда и только тогда, когда она находится в первой нормальной форме и каждый неключевой атрибут неприводимо зависит от ее потенциального ключа.[1]

Неприводимость означает, что в составе потенциального ключа отсутствует меньшее подмножество атрибутов, от которого можно также вывести данную функциональную зависимость.[1] Для неприводимой функциональной зависимости часто используется эквивалентое понятие «полная функциональная зависимость».[1]

Если потенциальный ключ является простым, то есть состоит из единственного атрибута, то любая функциональная зависимость от него является неприводимой (полной). Если потенциальный ключ является составным, то согласно определению второй нормальной формы в отношении не должно быть неключевых атрибутов, зависящих от части составного потенциального ключа.

Вторая нормальная форма по определению запрещает наличие неключевых атрибутов, которыевообще не зависят от потенциального ключа. Таким образом, вторая нормальная форма запрещает создавать отношения как несвязанные (хаотические, случайные) наборы атрибутов.

[править]Пример

Пример приведения отношения ко второй нормальной орме

Пусть в следующем отношении первичный ключ образует пара атрибутов

{Сотрудник,Должность}:

 

Сотрудник

 

Должность

 

арплата

 

Наличие

 

 

 

 

 

 

 

 

 

 

 

 

компьютера

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Гришин

 

Кладовщик

 

20000

 

Нет

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Васильев

 

Программист

 

40000

 

Есть

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Иванов

 

Кладовщик

 

25000

 

Нет

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Зарплату сотруднику каждый начальник устанавливает сам (хотя её границы зависят от должности). Наличие же компьютера у сотрудника зависит только от должности, то есть зависимость от первичного ключа неполная.

В результате приведения к 2NF получаются два отношения:

40. Третья нормальная форма реляционной модели.

Пример

Рассмотрим в качестве примера следующее отношение:

R1

 

Сотрудник

 

Отдел

 

еле он

 

 

 

 

 

 

 

 

 

 

Гришин

 

Бухгалтерия

 

11-22-33

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Васильев

 

Бухгалтерия

 

11-22-33

 

 

 

 

 

 

 

 

 

 

 

 

 

Петров

 

Снабжение

 

44-55-66

 

 

 

 

 

 

 

 

 

 

 

 

В отношении атрибут «Сотрудник» является первичным ключом. Личных телефонов у сотрудников нет, и телефон сотрудника зависит исключительно от отдела.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]