
- •3.12 Основы баз данных и баз знаний.
- •Данные.
- •Реляционная модель представления данных.
- •Логические связи в реляционной модели.
- •Нормализация таблиц-отношений
- •Операции с данными в реляционной модели
- •Достоинства и недостатки реляционных моделей.
- •Базы знаний.
- •Если (список условий), то (следует выполнить перечень действий).
- •Экспертные системы.
3.12 Основы баз данных и баз знаний.
База данных — это совокупность специальным образом организованных и взаимосвязанных данных (т.е. структурированных данных), отображающих состояние предметной области.
Объекты предметной области.
Любая информационная система должна отображать те или иные стороны окружающего нас реального мира или, как иногда говорят, проблемной или предметной области. Мы воспринимаем окружающий мир состоящим из объектов, которые человек, по совокупности определенных достаточно устойчивых свойств, группирует в наборы (классы) объектов, которым он присваивает имя. Например, в реальном мире есть конкретные собаки, но нет собаки «вообще». Понятие «собаки» описывает целый класс в каком-то смысле однородных реальных объектов.
Объекты имеют свойства. Следует подчеркнуть, что понятие объекта и свойства относительны. Поэтому при информационном отображении предметной области можно (а иногда и нужно) говорить не об объектах и их свойствах, а об отношениях объектов. При информационном отображении реального мира весьма важно, каков характер отношений объектов, в каких количественных пропорциях могут осуществляться отношения.
Предметная область изменяется со временем, что выражается в изменении свойств объектов, возникновении новых и исчезновении старых объектов, изменении отношений объектов. Эти изменения происходят в результате событий. Временная последовательность событий образует процесс.
Данные.
Информация об объекте или отношениях объектов, выраженная в знаковой форме, образует данные. Эти данные могут быть восприняты человеком или каким-либо техническим устройством и соответствующим образом интерпретированы.
Характерной особенностью данных является то, что их можно переводить из одной знаковой системы в другую (перекодировка) без потери информации. Это существенное свойство знакового отображения позволяет описывать реальную предметную ситуацию в различных системах знаков, ориентированных на воспринимающего. При построении банков данных стало уже традиционным говорить о логическом отображении, ориентированном на человека, и о физическом отображении, ориентированном на устройства долговременной памяти.
На рисунке показана схема отображения некоторой предметной области в базе данных.
Данные в базе данных (БД) структурированы.Структурирование данных рассмотрим на примере студенческой группы. Каждый студент группы во многом индивидуален, и характеризовать его можно с разных сторон. Но деканат, скорее всего, заинтересуют следующие данные (предметная область): фамилия студента, имя, отчество, курс, наименование группы, массив оценок по изучаемым дисциплинам. Таким образом, из всего многообразия данных выбираются только некоторые, т.е. создается информационная модель объекта. Данные упорядочиваются по порядку следования, по применяемым типам (форматам) данных, после чего они могут быть обработаны автоматом, каковым является компьютер.
Совокупность взаимосвязанных данных называется структурой данных. Совокупность структурированных данных, относящихся к одной предметной области, называется базой данных (БД).
Модели данных.
Ядром любой БД является модель представления данных. Модель данных − это структурные элементы представления данных и связи между ними.
Используются следующие модели данных:
иерархическая;
сетевая;
реляционная.
Иерархическая модель данных организует данные в виде древовидной структуры, вершинами которой являются записи с описанием объектов, а дугами, связывающими вершины, − отношения (связи) между объектами. Связи между объектами жестко зафиксированы и направлены только по вертикали (см. рис.). Элемент данных, который не порождается (исходный) называется корневым.
Достоинства
иерархической модели: высокая скорость
манипулирования данными и низкие затраты
на реализацию БД. Основные недостатки:
отсутствие строгой математической
основы построения модели, неполнота
модели, неравнозначность данных,
сложность обновления БД, возможность
представления связей только 1:1 и 1: n.
С
етевая
модель
похожа на иерархическую, но связи между
вершинами имеются не только по вертикали,
но и в некоторых горизонтальных
направлениях (см. рис.).
Достоинства этой модели: более высокой уровень полноты модели и равнозначности данных, чем в иерархической модели и сравнительно невысокие расходы на реализацию. Недостатки сетевой модели: отсутствие строгой математической основы построения модели, представление связей представления связей только 1:1 и 1: n, связи типа m:n организуются только в некоторых группах элементов данных, сложность структуры данных.
Исторически иерархическая и сетевая модели появились раньше, но в настоящий момент они используются реже, чем более современная − реляционная модель данных. Она была разработана в конце 60-х годов XX века рядом исследователей, из которых наиболее значимых вклад внес сотрудник фирмы IBM доктор Эдгар Кодд.