Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
3.12 начало ОСНОВЫ БАЗ ДАННЫХ И ЗНАНИЙ.doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
532.99 Кб
Скачать

3.12 Основы баз данных и баз знаний.

База данных — это совокупность специальным образом организованных и взаимосвязанных данных (т.е. структурированных данных), отображающих состояние предметной области.

Объекты предметной области.

Любая информационная сис­тема должна отображать те или иные стороны окружающего нас реального мира или, как иногда говорят, проблемной или предметной области. Мы воспринимаем окружающий мир состоящим из объек­тов, которые человек, по совокупности определенных достаточно ус­тойчивых свойств, группирует в наборы (классы) объектов, которым он присваивает имя. Например, в реальном мире есть конкретные со­баки, но нет собаки «вообще». Понятие «собаки» описывает целый класс в каком-то смысле однородных реальных объектов.

Объекты имеют свойства. Следует подчеркнуть, что понятие объекта и свойства относи­тельны. Поэтому при информационном отображении предметной области можно (а иногда и нужно) говорить не об объектах и их свойствах, а об отношениях объектов. При информационном отображении реального мира весьма важ­но, каков характер отношений объектов, в каких количественных пропорциях могут осуществляться отно­шения.

Предметная область изменяется со временем, что выражается в из­менении свойств объектов, возникновении новых и исчезновении старых объектов, изменении отношений объектов. Эти изменения происходят в результате событий. Временная последовательность событий образует процесс.

Данные.

Информация об объекте или отношениях объектов, вы­раженная в знаковой форме, образует данные. Эти данные могут быть восприняты человеком или каким-либо техническим устройством и соответствующим образом интерпретированы.

Характерной особенностью данных является то, что их можно пе­реводить из одной знаковой системы в другую (перекодировка) без потери информации. Это существенное свойство знакового отобра­жения позволяет описывать реальную предметную ситуацию в раз­личных системах знаков, ориентированных на воспринимающего. При построении банков данных стало уже традиционным говорить о логическом отображении, ориентированном на человека, и о физиче­ском отображении, ориентированном на устройства долговременной памяти.

На рисунке показана схема ото­бражения некоторой предметной области в базе данных.

Данные в базе данных (БД) структурированы.Структурирование данных рассмотрим на примере студенческой группы. Каждый студент группы во многом индивидуален, и характе­ризовать его можно с разных сторон. Но деканат, скорее всего, за­интересуют следующие данные (предметная область): фамилия сту­дента, имя, отчество, курс, наименование группы, массив оценок по изучаемым дисциплинам. Таким образом, из всего многообразия дан­ных выбираются только некоторые, т.е. создается информационная модель объекта. Данные упорядочиваются по порядку следования, по применяемым типам (форматам) данных, после чего они могут быть обработаны автоматом, каковым является компьютер.

Совокупность взаимосвязанных данных называется структурой данных. Совокупность структурированных данных, относящихся к одной предметной области, называется базой данных (БД).

Модели данных.

Ядром любой БД является модель представления данных. Модель данных − это структурные элементы представления данных и связи между ними.

Используются следующие модели данных:

  • иерархическая;

  • сетевая;

  • реляционная.

Иерархическая модель данных организует данные в виде древовидной структуры, вершинами которой являются записи с описанием объектов, а дугами, связывающими вершины, − отношения (связи) между объектами. Связи между объектами жестко зафиксированы и направлены только по вертикали (см. рис.). Элемент данных, который не порождается (исходный) называется корневым.

Достоинства иерархической модели: высокая скорость манипулирования данными и низкие затраты на реализацию БД. Основные недостатки: отсутствие строгой математической основы построения модели, неполнота модели, неравнозначность данных, сложность обновления БД, возможность представления связей только 1:1 и 1: n.

С етевая модель похожа на иерархическую, но связи между вершинами имеются не только по вертикали, но и в некоторых горизонтальных направлениях (см. рис.).

Достоинства этой модели: более высокой уровень полноты модели и равнозначности данных, чем в иерархической модели и сравнительно невысокие расходы на реализацию. Недостатки сетевой модели: отсутствие строгой математической основы построения модели, представление связей представления связей только 1:1 и 1: n, связи типа m:n организуются только в некоторых группах элементов данных, сложность структуры данных.

Исторически иерархическая и сетевая модели появились раньше, но в настоящий момент они используются реже, чем более современная − реляционная модель данных. Она была разработана в конце 60-х годов XX века рядом исследователей, из которых наиболее значимых вклад внес сотрудник фирмы IBM доктор Эдгар Кодд.