
Лекция. Базы данных
1. Понятие о базе данных
Систематизация информации об объектах окружающей природы привело к созданию справочников по самым разнообразным областям человеческого знания. Современная вычислительная техника дает возможность организовать хранение такой информации во внешней памяти компьютера в электронной форме. Такого типа справочники получили название баз данных. Следовательно, под базой данных мы будем понимать упорядоченную совокупность взаимосвязанных сведений по свойствам определенной группы объектов. Также можно в учебной литературе найти следующее определение базы данных – поименованная совокупность хранимых структурированных данных.
С определением базы данных связаны следующие понятия:
Информационная система – совокупность содержащейся в базах данных информации и обеспечивающих ее обработку информационных технологий и технических средств.
Банк данных – разновидность информационной системы, в которой реализованы функции централизованого хранения и накопления обрабатываемой информации, организованной в одну или несколько баз данных.
База знаний – база данных, разработанная для управления знаниями (метаданными).
Базы данных могут включать в состав информационного массива различную статистическую, текстовую, графическую и иллюстративную информацию с обязательной ее формализацией (представлением, вводом и выводом определенной, характерной для данной системы форме – формате). Для целого ряда традиционно перерабатываемой информации существуют стандартные форматы ее представления, например: библиография, статистические данные, рефераты, обзоры и другие.
Базы данных можно классифицировать по способу установления связей между данными. В этом случае выделяются следующие модели баз данных:
- иерархические;
- сетевые;
- реляционные.
Иерархическая модель позволяет создавать базы данных, состоящие из упорядоченного набора информационных записей по свойствам отдельных объектов. Между записями в иерархии могут быть определены отношения «один к одному» или «один ко многим». Здесь запись, соответствующая элементу «один» указанной связи, определяется как исходная (предок), а соответствующая элементу «много» – как порожденная (потомок).
Рис.1. Структура иерархической базы данных
В иерархических базах данных автоматически поддерживается целостность ссылок между предками и потомками. Основное правило: никакой потомок не может существовать без своего родителя. Следует отметить, что аналогичное поддержание целостности по ссылкам между записями, не входящими в одну иерархию, не поддерживается. Ярким примером иерархической базы данных является файловая система диска внешней памяти персонального компьютера.
Сетевая модель организации данных является расширением иерархической модели базы данных. В иерархических структурах запись-потомок должна иметь в точности одного предка; в сетевой структуре данных потомок может иметь любое число предков. Такую связь принято называть «многие ко многим». Сетевая база данных состоит из набора записей и набора связей между этими записями.
Рис.2. Структура сетевой базы данных
Реляционная модель базы данных является наиболее удобной формой представления данных. В реляционной модели базы данных сведения об объектах представлены в виде совокупности взаимосвязанных таблиц. В математике этому соответствует термин «отношение» (англ. – relation), от которого и произошло название модели.
Рис. 3. Структура реляционной модели данных
При установлении связей нужно определить, какая таблица является главной, а какая – подчиненной. Отношение «один к одному» означает, что одной записи подчиненной таблицы соответствует только одна запись в главной таблице. Такие отношения встречаются очень редко, так как занимают неоправданно много места в базе данных. Вместо них можно просто добавить поля подчиненной таблицы к полям главной. Наиболее часто используются отношения «один ко многим». В этом случае одной записи в главной таблице соответствует несколько записей в подчиненной таблице. Для создания отношений необходимо указать поля в двух таблицах, которые содержат одни и те же данные. Имена связывающих полей могут отличаться друг от друга, но типы и свойства должны совпадать.
Одним из основных преимуществ реляционной модели является ее однородность. Все данные рассматриваются как хранимые в таблицах, в которых каждая строка имеет один и тот же формат. Каждая строка в таблице представляет некоторый объект реального мира или соотношение между объектами. В дальнейшем рассматриваются только реляционные базы данных.