- •Оглавление
- •Введение
- •Лекция 1. Основные понятия баз данных и стстем управления базами данных
- •Лекция 2. Схема базы данных и модели данных
- •Лекция 3. Технология проектирования баз данных
- •Лекция 4. Предпроектное обследование (системный анализ) предметной области
- •7. Нужно ли обновлять технические средства? и если нужно, то каким образом?
- •Лекция 5. Инфологичфеское проектирование баз данных
- •Лекция 6. Реляционная модель данных
- •Лекция 7. Даталогическое проектирование (на примере реляционных баз данных)
- •Лекция 8. Технологии манипулирования данными в базах данных. Основы sql
- •Лекция 9. Физическое проектирование базы данных
- •Список рекомендуемой литературы
Лекция 2. Схема базы данных и модели данных
Понятие схемы базы данных. Понятие модели данных. Соотношение схемы базы данных и модели данных. Компоненты модели данных.
Классификация модели данных. Архитектура систем управления базы данных как основа классификации моделей данных. Физические модели данных. Даталогические модели данных. Инфологические модели данных.
Вторая лекция курса «Схема базы данных и модели данных» посвящена знакомству с моделями данных. В данной лекции приводятся определение ключевых понятий, общие сведения о моделях данных и классификация моделей данных.
База данных включает в себя набор постоянных данных, определённых с помощью некой схемы; система управления данными использует определения данных в схеме для обеспечения доступа и управления доступом к данным в базе данных, – такой вывод был получен в ходе изложения теоретического материала первой лекции. Таким образом, схема данных является центральным понятием в области базы данных, наряду с базой данных и системой управления базой данных.
Схема базы данных включает в себя описания содержания, структуры и ограничений целостности, используемые для создания и поддержки базы данных. Таким образом, схема данных – это некоторая абстракция, которая, будучи приложена к конкретным данным, позволяет пользователям и разработчикам трактовать их уже как информацию, то есть сведения, содержащие не только данные, но и взаимосвязь между ними.
Особо следует отметить, что схема базы данных – термин, который применяется как синоним структуры данных в конкретной базе данных. Для описания структуры множества баз данных применяют термин «модель данных». Иными словами, модель данных – формальная теория представления и обработки данных в системе управления базами данных.
Модель данных определяется как комбинацию трёх компонентов: 1) коллекции типов объектов данных, образующих базовые строительные блоки для любой базы данных, соответствующей модели; 2) коллекции общих правил целостности, ограничивающих набор экземпляров тех типов объектов, которые законным образом могут появиться в любой такой базе данных; 3) коллекции операций, применимых к таким экземплярам объектов для выборки и других целей.
Таким образом, модель данных – это абстрактное, самодостаточное, логическое определение объектов, операторов и прочих элементов, в совокупности составляющих абстрактную машину доступа к данным, с которой взаимодействует пользователь. Эти объекты позволяют моделировать структуру данных, а операторы — поведение данных.
Каждая база данных и система управления базами данных строится на основе некоторой явной или неявной модели данных.
Классификация моделей данных осуществляется на основе представления архитектуры современных систем управления базами данных как системы, которая включает в себя три уровня: уровень внешних моделей, концептуальный уровень и физический уровень (см. рис. 2.1).
Рисунок 2.1 Трехуровневая архитектура систем управления базами данных
Каждому из трех уровней архитектуры базы данных можно поставить в соответствие понятие модели. Классификация моделей данных приведена на рисунке 2.2
Рисунок 2.2. Классификация моделей данных
Физические модели баз данных оперируют категориями, касающимися организации внешней памяти и структур хранения, используемых в данной операционной среде. В настоящий момент различают такие способы размещения данных, основанные на файловых структурах, как файлы прямого, последовательного доступа, индексные файлы и т.п. Кроме того, современные системы управления данных используют страничный принцип организации данных.
Даталогические модели представляют собой модели данных на концептуальном уровне. По отношению к ним внешние модели называются подсхемами и используют те же абстрактные категории, что и концептуальные модели данных.
Даталогические модели можно разделить на документальные и фактографические. Документальные модели соответствуют представлению о слабоструктурированной информации, ориентированной в основном на свободные форматы документов, текстов на естественном языке. В свою очередь, среди документальных моделей выделяют тезаурусные (основаны на принципе организации словарей), дескрипторные (описываются определенные характеристики документа) и модели, ориентированные на формат документа (определяют стандартный формат представления информации, оформление элементов документа).
Среди фактографических моделей выделяют теоретико-графовые, теоретико-множественные и объектно-ориентированные. Теоретико-графовые модели отражают совокупность объектов реального мира в виде графа взаимосвязанных информационных объектов. В зависимости от типа графа выделяют иерархическую и сетевую модели.
Реляционная модель данных - основная модель в классе теоретико-множественных моделей. Простота, наглядность и серьезное теоретическое обоснование определили большую популярность этой модели. Развитие формального аппарата представления и манипулирования данными в рамках реляционной модели сделали ее наиболее перспективной для использования. В настоящее время практически все базы данных являются реляционными.
Инфологические модели данных используются на ранних стадиях проектирования для описания структур данных в процессе разработки приложения, то есть инфологические модели предшествует физическому, концептуальному и уровню внешних моделей.
Модели этого уровня выражают информацию в виде, не зависящем от используемой системы управления базы данных, и называются инфологическими или семантическими. Они отражают в естественной форме информационно-логический уровень абстрагирования, связанный с описанием объектов, их свойств и взаимосвязей.
И так, модель данных включает, по меньшей мере, три аспекта: 1) аспект структуры; 2) аспект манипуляции; 3) аспект целостности.
Аспект структуры определяет, что из себя логически представляет база данных. В структурной части модели данных фиксируются основные логические структуры данных, которые могут применяться на уровне пользователя при организации базы данных, соответствующих данной модели (например, в реляционной модели данных основным видом структур базы данных являются отношения, а в объектной модели данных – объекты ранее определенных типов).
Аспект манипуляции определяет способы перехода между состояниями базы данных (то есть способы модификации данных) и способы извлечения данных из базы данных Манипуляционная часть модели данных содержит спецификацию одного или нескольких языков, предназначенных для написания запросов к базе данных.
Аспект целостности определяет средства описаний корректных состояний базы данных. В целостной части модели данных (которая явно выделяется не во всех известных моделях) специфицируются механизмы ограничений целостности (например, в целостной части реляционной модели данных категорически требуется поддержка ограничения первичного ключа в любой переменной отношения).
Таким образом, каждая база данных и система управления базами данных строится на основе некоторой явной или неявной модели данных. Все системы управления базами данных, построенные на одной и той же модели данных, относят к одному типу. Например, основой реляционных систем управления базами данных является реляционная модель данных, сетевых систем управления базами данных – сетевая модель данных, иерархических систем управления базами данных – иерархическая модель данных и т. д.
Подробное изложение теоретических вопросов, затронутых в первой лекции, можно найти в литературе [1,3,5,6]. Практические аспекты этих вопросов можно отыскать в работах [2,4].
Знания, полученные входе изучения материалов конспекта лекции, следует самостоятельно проверить путем ответов на контрольные вопросы (список контрольных вопросов приведен в Методических рекомендациях по самостоятельному изучению дисциплины «Базы данных», которые являются неотъемлемой частью учебно-методического комплекса дисциплины «Базы данных»).
