
- •Часть I. Теория баз данных
- •Глава I. Системы файлов и базы данных
- •Оценка системы файлов
- •1.2. Понятие базы данных и системы управления базами данных.
- •1.3 Архитектура бд
- •Концептуальная модель
- •Внутренняя модель
- •Физическая модель
- •1.4 Модели баз данных
- •1.4.1 Иерархическая модель данных
- •1.4.2 Сетевая модель данных
- •1.4.3 Реляционная модель данных
- •Нормализация отношений
- •Первая нормальная форма
- •Вторая нормальная форма
- •Третья нормальная форма
- •Нормальная форма Бойса-Кодда
- •Четвертая нормальная форма
- •Пятая нормальная форма
- •Денормализация
- •Методы реализации денормализации
- •1.4.4. Объектно-ориентированная модель данных
- •1.4.4.1. Атрибуты
- •1.4.4.2. Состояние объекта. Сообщения и методы
- •1.4.4.3. Классы
- •1.4.4.4. Протокол
- •1.4.4.5. Суперклассы, подклассы, наследование
- •1.4.4.6. Единичное наследование. Множественное наследование.
- •1.4.4.7. Переопределение методов и полиморфизм
- •1.4.4.8. Абстрактные типы данных
- •1.4.4.9. Классификация объектов
- •1.4.4.10. Свойства объектно-ориентированных моделей данных
- •1.5.1 Сущности
- •1.5.2 Атрибуты
- •1.5.3. Связи
- •1.5.4. Сравнение обозначений в er-моделировании
- •1.5.5. Разработка er-диаграмм
Часть I. Теория баз данных
Глава I. Системы файлов и базы данных
Оценка системы файлов
Файловая обработка данных осуществлялась в течение двух десятков лет, что является достаточно большим отрезком времени. Осмысление недостатков файловой системы позволяет понять причины возникновения и развития баз данных (БД). Кроме того, недостатки, свойственные файловой системе, могут повторяться и в среде БД.
С точки зрения управления система файлов включает в себя следующие составные части:
Аппаратные средства – Компьютер.
Программное обеспечение (ПО) – Операционная система (ОС), утилиты, файлы, программы управления файлами и прикладные программы для создания отчетов на основе данных из этих файлов.
Сотрудники – Специалисты, программисты, конечные пользователи.
Процедуры – Инструкции и правила, в соответствии с которыми разрабатываются и используются программные компоненты.
Данные – Совокупность неупорядоченных сведений.
Алгоритмизация даже простейшей задачи поиска требует достаточно интенсивного использования языков программирования третьего поколения (third generation language -3GL), к числу которых относятся COBOL, BASIC, FORTRAN, PL/1.
Программирование на этих языках требует больших затрат времени.
По мере того, как система файлов становится более сложной, маршруты доступа все труднее поддаются контролю, и это может стать причиной системных сбоев.
Необходимость написания программ на языках 3GL для создания даже самых простых отчетов делает практически невозможной обработку нерегламентированных запросов.
По мере расширения системы файлов усложняется и системное администрирование. Для получения новых отчетов необходимо писать новые программы. Изменение в любой файловой структуре, например, удаление или добавление поля, требует переделки всех программ, использующих этот файл. Такая модификация необходима, потому что система файлов обладает структурной зависимостью. Изменение свойств данных файла, например, изменение типа поля данного с integer на decimal также потребует изменений во всех соответствующих программах, так как необходимо поменять все программы доступа к данным при любых изменениях характеристик данных файла, то говорят, что система файлов обладает зависимостью по данным. Зависимость по данным делает систему файлов чрезвычайно громоздкой и с точки зрения программирования и с точки зрения управления, так как практический смысл зависимости по данным состоит в разнице между логическим форматом данных – как «видит» данные человек – и физическим форматом данных – как «видит» данные компьютер.
Если одни и те же данные встречаются в разных местах, то имеет место избыточность данных. Неконтролируемая избыточность может стать причиной возникновения следующих проблем:
противоречивость данных (data inconsistency). В нескольких местах могут иметься различные противоречащие друг другу варианты одних и тех же данных. Противоречивость данных в свою очередь ведет к нарушению целостности данных (data integrity);
аномалия данных. В идеальном случае изменение значения поля должно выполняться только в одном месте. Избыточность данных приводит к необходимости производить изменения во многих местах, что, в свою очередь, приводит к аномалии модификации, аномалии удаления, аномалии добавления, записей.
Использовать систему базы данных намного удобнее, чем работать с системой файлов, где имеется столько проблем.
В отличие от систем файлов с большим количеством не связанных друг с другом файлов, БД состоит из логически взаимосвязанных данных, размещенных в одном хранилище. Поэтому БД предоставляет конечным пользователям другой способ управления данными.