Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекция10.doc
Скачиваний:
14
Добавлен:
09.02.2015
Размер:
148.99 Кб
Скачать

Базы данных.

Лекция № 1.

1. Предметная область базы: данных (сварное соединение - стыковое, нахлесточное, и т.п.) Объекты предметной области. Логическая область базы данных (цифры, записи и т.п.).

2. Характеристика объекта предметной области называется атрибут, который принимает только определенные значения.

3. Совокупность параметров объекта (совокупность атрибутов) называется записью. Запись содержит поля, в которые помещаются конкретные значения атрибута.

  1. Семейство записей образует файл.

  2. Несколько файлов образуют библиотеку. Число объектов равно числу записей в файле. Число атрибутов равно числу полей в каждой записи.

Описание атрибутов - числовые величины, строки символов, значения проводимых измерений.

Проблема как ЭВМ интерпретировать записи атрибутов. В языках высокого уровня вводится понятие тип данных, которые бывают простые, структурные, ссылочные.

6. Простые типы данных - целые, плавающие (с плавающей запятой), символьные, логические.

данные любого простого типа характеризуются тем, что в любой момент времени каждому данному соответствует только одно значение.

7. Структурированные данные - каждому данному соответствует несколько значений (например, массив последовательности данных (файл, стек)).

Под массивом понимают группировку набора данных идентичного типа.

8. Ссылочный тип - предназначен для обеспечения ссылок на другие данные и называется указателем. Применяется для построения сложных структур данных.

Для структуризации данных (объединения их в однотипные массивы (группы)), используется абстракция, т.е. опускание несущественных деталей свойств объекта. Абстракция может быть многоуровневой, объект абстракции одного уровня может быть рассмотрен как предмет абстрагирования другого уровня.

9. Модели данных (одним набором данных пользуется несколько пользователей по различным назначениям).

База данных - массив данных, хранимых в ЭВМ и предназначенный для

совместного использования группой людей.

Использование баз данных позволяет:

- представлять в памяти ЭВМ сложные структуры информации, когда объектом хранения являются не только данные, но и структуры, в которые они организованы;

сокращать дублирование информации за счет структурирования

данных, что приводит к экономии памяти на носителях и повышает

надежность информации;

- повышать сохранность данных от несанкционированного доступа;

обеспечивать независимость прикладных программ от изменений данных;

повышать достоверность информации и сокращать затраты на обслуживание системы.

10. Проблема - для построения баз данных для многих пользователей необходимо правильно выбрать атрибуты (для этого нужно использовать процесс абстрагирования).

Процесс абстрагирования информации о предметной области, требуемой для создания базы данных, называют логическим проектированием базы: данных (проектирование данных). Логическое проектирование осуществляют в рамках некоторой заранее принятой модели абстрагирования, которую называют модель данных. Модель данных - основные понятия и способы, используемые при абстрагировании.

  1. Описание предметной области с помощью модели данных называют концептуальной схемой или моделью.

  2. Концептуальную модель, описанную и скорректированную с точки зрения представления данных в конкретной ЭВМ, называют внутренней моделью.

1З. Концептуальная модель, описанная с точки зрения конкретного пользователя (его запросов и интересов) называется внешней моделью. У одной внутренней модели может быть несколько внешних моделей.

Рисунок 1.1 Архитектура базы данных

На концептуальном уровне осуществляется формализованное описание информационной базы в терминах конкретной системы управления базой данных (СУБД).

14. База данных, описанная в терминах конкретной СУБД называется мифологической моделью и служит для формализации представления о предметной области до привязки к конкретным средствам реализации баз знании.

При моделировании данных возникает проблема многоуровневого представления данных. С этой целью вводятся датологические модели.

Датологические модели служат для реализации информационных баз

в определенной вычислительной среде.

Инфологические модели это семантическая смысловая модель, отражающая информационное содержание конкретной предметной области.

15. Целостность данных. При построении баз данных следует учитывать логические ограничения на значения данных и их соотношений.

Целостность данных - данные, хранимые в БД, не должны противоречить заданным логическим ограничения, которые называются ограничениями целостности.

Ограничения целостности бывают внутренние и явные. Внутренние ограничения вводятся исходя из концептуальной модели

БД и структуры принятой модели базы данных реляционная база данных не допускает дублирование информации.

К явным ограничения целостности можно отнести ограничения на значение атрибутов объекта. Ограничения в явном виде задаются не только на атрибуты, но и на типы объектов и связей между ними.

16. Ограничения на типы связей

Двусторонние связи:

Связь 1:1 - одному А соответствует один Б (студент - номер зачетной книжки).

- Связь 1:М - одному А соответствует М объектов (студент - фамилия, имя, отчество, пол, возраст, номер группы и т.п.)

- Связь M:l - обратный случай связи 1:М (глаза, цвет волос, нос, губы -внешность одного человека).

- Связь М:М - (абстрактное понятие - абстрактное понятие) (телевизор -резистор).

Односторонние связи - ассоциации

- Простая ассоциация (тип 1) - одному значению А соответствует только одно значение множества Б (данное сварное соединение – конкретный сварщик обратное для конкретного сварщика невозможно).

- Сложная ассоциация (тип М) - одному значению множества А

соответствует несколько значений множества В (узлы изделия -поставщик).

Условная ассоциация (тип С) связь между двумя нефизическими объектами (или одним нефизическим объектом) (изделие - дата изготовления).

17. Средства реляционного исчисления СУБД.

18. Операции над данными.

Селекция данных в БД (выбор данных из БД).

Каждое данное имеет логическую позицию в памяти системы (в БД). Например - первый элемент, последний элемент, текущий элемент, последующий элемент.

Относительно текущего элемента можно выделить предыдущий элемент и последующий элемент. Эта логическая позиция называется посредством текущего.

Для описания логической позиции элемента в БД можно использовать значение данных (максимальный, минимальный элемент, больше, меньше, равно, и, или).

Селекцию данных можно осуществлять и по логическим связям между данными.

По характеру производимых действий над данными различают

следующие виды операций:

1. Идентификация данного и определение его позиции в базе.

  1. Выборка (получение требуемых данных из базы).

  2. Включение (запись новых данных в базу).

  3. Удаление данных.

  4. Обновление данных (модификация).

Операции применимы как к атрибутам, так и к типам сущностей и связям.

Но характеру способа получения результата над данными различают навигационные и сертификационные операции.

Если результат представлен единичным объектом (значением атрибута, сущности или связи), полученным при прохождении по логической цепи (навигации) в структуре БД, то операцию называют навигационной.

Если в операции определены только требования к результату, но не задан способ его получения, то операции называются сертификационными (используется аппарат теории множеств объединение, пересечение, разность).

Обеднение нескольких разнородных операции над базами данных в одно действие (навигационной с операцией целостности базы данных) называется процедурами базы данных. Процедуры - это обобщенные операции изменения состояния базы данных (макрооперация).

Например, вычисление значений данных, которые в БД непосредственно не хранятся, но из значении БД можно получить данную сумму. Данные операции называются тразакциями. Пример функция агрегации - (поиск общего числа данных, поиск минимума, максимума).

Другой пример вычисление значения атрибута, не содержащееся в БД, по данным, имеющимся в БД (по дате рождения - возраст) - это вычисление виртуального атрибута.

1. Процедуры захватывают общинные области БД. 2. Процедуры реализуют широкий круг действий.

3. Вызов процедуры не выполняется пользователем.

4. Процедуры описывают в схеме данных, операции включают в пользовательскую программу.

19. СУБД - это специальный пакет программ, посредством которого реализуется централизованное управление БД и обеспечивается доступ к данным. БД вместе с СУБД - банк данных. В СУБД используется язык определения данных (ЯОД) и язык манипулирования данными (ЯМД).

ЯОД - это язык высокого уровня, предназначенный для схемы БД. С его помощью описываются типы данных в БД и их структура.

ЯМД используется для написания программ, обращающихся к данным в БД (основная операция ввод-вывод данных).

Модели данных - реляционная, сетевая, иерархическая.

Реляционная модель данных.

В основе реляционной модели данных лежит математичекая теория отношений (RELATION - отношение). Отношение служит средством структуризации данных.

Н- мерное отношение в виде таблицы определяет структуру данных. (Массив данных).

1. Ограничения модели.

a). Нет двух одинаковых записей. Это означает, что каждое отношение имеет запись из всех атрибутов'.

Б). Порядок столбцов в БД является значимым. Пренебрегать порядком столбцов в БД можно только в случае если он имеет собственное имя.

Универсальные отношения - каждый атрибут имеет свое имя.

Между атрибутами БД могут быть определенные отношения. Например один атрибут может зависеть от другого (Сила тока - Скорость подачи присадочной проволоки). Если все каждое значение одного атрибута определяет каждое значение другого атрибута, то говорят, что между атрибутами существует функциональная зависимость. Если от этой зависимость можно найти обратную функцию, то говорят, что существует однозначное соответствие.

РБД подчиняется правилам теории математических отношений:

1. Правило рефлекторности.

2. Правило пополнения.

3. Правило транзитивности.

4. Правило расширения.

5. Правило продолжения.

6. Правило аддитивности.

7. Правило декомпозиции.

2. Многозначные модели.

1. Правило дополнения.

2. Правило присоединения.

3. Правило транзитивности.

3. Нормальные схемы отношений.

4. Реляционная алгебра.

Операции:

- Первая группа: объединение, пересечение, разность, декартово произведение.

- Вторая группа: проекция, ограничение,

5. Реляционное исчисление.

Операции:

- Логическое сложение (дизъюнкция) "'ИЛИ".

- Логическое умножение (конъюнкция) "И".

- Логическое отрицание "НЕ".

При записи выражении в реляционном исчислении используется понятие свободных или связанных переменных.

Формулы в реляционном исчислении стоятся из атомов и совокупности арифметических и логических операторов.

Любой атом - это формула.

Сетевая модель данных.

В основе разработки сетевых моделей лежит возможность построения связей между данными в графической форме.

Сущность - это собирательное понятие, некоторая абстракция реально существующего объекта предметной области процесса или явления. Набор однородных объектов определяет тип сущности, а каждый конкретный объект в наборе представляется экземпляром' сущности. Связи между сущностями фиксируются с помощью множества отношений.

Элемент данных - это наименьшая единица данных, которой можно оперировать в БД и выполнять построение всех остальных структур (аналог поля в файловой записи). Элемент данных имеет имя, которое хранится в БД как часть описания базы (например - ИНДЕКС ИЗДЕЛИЯ, ДАТА ВЫПУСКА, СТОИМОСТЬ). Элементы данных используются для представления атрибутов сущности.

Агрегат данных - совокупность элементов данных, имеющих общее имя, которую можно рассматривать как единое целое (ДАТА - ЧИСЛО, МЕСЯЦ, ГОД).

Запись - совокупность элементов данных, которые описывают конкретный экземпляр объекта ( сущности) ( ТЕЛЕВИЗОР _ МАРКА, ИНДЕКС, ЦЕНА и т.п.)

Тип - это общее понятие,, представляющее собой собрание экземпляров записи.

Простейшая модель сетевой базы данных - ГРАФ без петель.

Для описания сетевых моделей используются специальные языки обработки данных (ЯЗЫК - КОДАСИЛ)

Проблема для всех языков - формализация описания элемента данных и связей между ними.

Ключ базы данных - это идентификатор, уникально определяющий запись, помешенную в БД.