- •Оглавление
- •Введение
- •Лекция 1. Основные понятия баз данных и стстем управления базами данных
- •Лекция 2. Схема базы данных и модели данных
- •Лекция 3. Технология проектирования баз данных
- •Лекция 4. Предпроектное обследование (системный анализ) предметной области
- •7. Нужно ли обновлять технические средства? и если нужно, то каким образом?
- •Лекция 5. Инфологичфеское проектирование баз данных
- •Лекция 6. Реляционная модель данных
- •Лекция 7. Даталогическое проектирование (на примере реляционных баз данных)
- •Лекция 8. Технологии манипулирования данными в базах данных. Основы sql
- •Лекция 9. Физическое проектирование базы данных
- •Список рекомендуемой литературы
Лекция 3. Технология проектирования баз данных
Понятие проекта базы данных как комплекса взаимосвязанных моделей данных: инфологической, даталогической и физической. Понятие процесса проектирования баз данных. Цель процесса проектирования баз данных. Основные этапы процесса проектирования баз данных.
CASE-средства проектирования базы данных. Понятия CASE-средства. Классификация CASE-средств. Проблемы автоматизации проектирования баз данных.
Третья лекция курса «Технология проектирования баз данных» посвящена знакомству с технологией проектирования базы данных. В данной лекции приводятся определение ключевых понятий процесса проектирования базы данных, общие сведения об используемых при проектировании CASE-средств, а также об основных проблемах автоматизации проектирования баз данных.
Проект (от лат. projectus — брошенный вперёд, выступающий, выдающийся вперёд) – замысел, идея, образ, воплощённые в форму описания, обоснования расчётов, чертежей, раскрывающих сущность замысла и возможность его практической реализации.
Проект базы данных предполагает определение: 1) требований к базе данных, информационных потребностей со стороны разных категорий пользователей; 2) способа отображения в базе данных объектов предметной области и связи между ними, который не противоречил бы семантике предметной области; 3) способа структуризации данных; 4) способа расположения данных во внешней памяти. Иными Проект базы данных – комплекс взаимосвязанных моделей данных: инфологической, даталогической и физической. Цели построения отдельных моделей и их взаимосвязь приведены на рис. 3.1.
Рисунок 3.1 Уровни моделей данных
Соответственно, процесс проектирования баз данных представляет собой последовательность переходов от неформального словесного описания информационной структуры предметной области к формализованному описанию объектов предметной области в терминах некоторой модели данных.
Цель процесса проектирования баз данных состоит в получении проекта базы данных, который бы: 1) адекватно отображал предметную область; 2) удовлетворял информационным требованиям пользователей; 3) соответствовал правилу «Три НЕ» (неизбыточность, непротиворечивость, независимость от приложений).
В общем случае, можно выделить следующие этапы проектирования: 1) предпроектное обследование предметной области; 2) семантическая структуризация предметной области; 3) выбор правил структурирования данных и инструментария; 4) логическая структуризация данных; 5) физическая структуризация данных.
Содержание основных этапов проектирования баз данных приведено на рис. 3.1.
Рисунок 3.2. Этапы проектирования базы данных
Предпроектное обследование предметной области предполагает восприятие, изучение и описание информационных процессов предметной области, а также выявление информационных потребностей пользователей и формулирование требований к содержанию и обработке данных.
Семантическая структуризация предметной области предполагает: 1) неформализованное словесное описание предметной области с использованием таблиц, формул, схем; 2) описание связей между данными с использованием некоторой формализованной системы нотаций (системы условных обозначений, языка зависимостей). Указанные связи являются основой выбора модели данных и проектных решений относительно структуризации данных.
Выбор правил структурирования данных и инструментария предполагает выбор конкретной модели данных (сетевой, иерархической, реляционной и т.д.).
Логическая структуризация данных предполагает описание структуры базы данных в терминах выбранной модели данных. При этом построенная модель является машинно-независимой, а также независимой от конкретной системы управления базами данных.
Физическая структуризация данных предполагает: 1) выбор конкретной системы управления базы данных для построения базы данных; 2) описание структуры базы данных в терминах языка манипулирования данных выбранной системы управления базы данных. На данном этапе определяются носители, методы доступа и способы защиты данных и др.
Различие уровней представления данных на каждом этапе проектирования приведено в табл. 3.1
Таблица 3.1. Различие уровней представления данных на каждом этапе проектирования
Вид структуризации данных (тип проектирования) |
Основные элементы |
Действующее лицо |
Семантическая (инфологическое проектирование) |
Сущности, атрибуты, связи между сущностями |
Аналитик |
Логическая (даталогическое проектирование) |
Записи, элементы данных, связи между записями |
Программист |
Физическая (физическое проектирование) |
Группирование данных, индексы, методы доступа |
Администратор |
Следует учитывать, что проектирование базы данных с построением цепочки соответствующих моделей не является последовательным процессом. Это скорее итеративный процесс с постоянной обратной связью для проверки предыдущих этапов.
При проектировании баз данных используется широкий спектр CASE-средств. Термин CASE (Computer Aided Software Engineering) дословно переводится как разработка программного обеспечения с помощью компьютера. В настоящее время этот термин получил более широкий смысл, означающий автоматизацию разработки информационных систем
Это программные средства, автоматизирующие некоторые этапы разработки (инжиниринга) информационных систем. Они обеспечивают наглядное описание информационных процессов и инфологической модели предметной области, генерацию и анализ вариантов логических и физических моделей базы данных, создание приложений и т.п.
Современная CASE-индустрия объединяет сотни известных фирм и компаний. В настоящее время практически все серьезные проекты осуществляются с использованием CASE-средств. Общее число распространяемых на рынке программных продуктов CASE-средств составляет порядка 500 наименований.
Классификация CASE-средств осуществляется по нескольким признакам: 1) по ориентации на этапы проектирования; 2) по степени независимости от системы управления базами данных.
По ориентации на этапы проектирования выделяют следующие типы CASE-средств: инструменты анализа и моделирования предметной области; средства проектирования баз данных; средства разработки приложений.
По степени независимости от системы управления базами данных различают независимые и встроенные CASE-системы.
Автоматизация проектирования баз данных сопровождена с определёнными проблемами, несмотря на то, что при этом используется широкий спектр CASE-средств.
Этапы 1 и 3 полностью не формализуются. На этапе 2 только человек способен построить в своей голове инфологическую модель предметной области. А лишь потом для описания этой модели применить соответствующие CASE-средства (средства автоматизации проектирования).
Современные CASE-средства позволяют создавать синтаксические модели базы данных на этапах 4 и 5, исходя из инфологической модели предметной области, построенной человеком на этапе 2.
Таким образом, на всех этапах требуется участие человека, и как следствие комплексная автоматизация проектирования баз данных невозможна.
Подробное изложение теоретических вопросов, затронутых в первой лекции, можно найти в литературе [1,3,5,6]. Практические аспекты этих вопросов можно отыскать в работах [2,4].
Знания следует самостоятельно проверить путем ответов на контрольные вопросы (список контрольных вопросов приведен в Методических рекомендациях по самостоятельному изучению дисциплины «Базы данных», которые являются неотъемлемой частью учебно-методического комплекса дисциплины «Базы данных»).
