- •Головчинер м.Н.
- •Курс лекций Томск 2011
- •Введение
- •Понятие о данных как о ресурсе
- •Файловые системы и базы данных
- •Численные и информационные прикладные системы
- •Файловые системы
- •Файлы и информационные системы. Общее понятие о базе данных
- •Контрольные вопросы по первому разделу
- •База данных как модель предметной области
- •Понятие предметной области
- •Понятие системы
- •Понятие модели. Структурная модель
- •Модель предметной области и модель данных
- •Контрольные вопросы по второму разделу
- •Понятие о банке данных
- •Структура банка данных
- •Организационный аспект
- •Уровни представления базы данных
- •Модели предметной области:
- •Модели данных:
- •Контрольные вопросы по третьему разделу
- •Вопросы проектирования баз данных
- •Жизненный цикл информационной системы
- •Процесс проектирования
- •Организационный аспект
- •Задачи и структура процесса проектирования
- •Формулирование и анализ требований. Инфологическое проектирование
- •Общая схема логического (концептуального) проектирования
- •Контрольные вопросы по четвертому разделу
- •Модели данных
- •Реляционная модель данных
- •Базовые понятия
- •5.1.2. Принципы нормализации
- •5.1.3. Целостность сущности и ссылок
- •5.1.4. Манипулирование данными в реляционных моделях
- •5.1.4.1.Операции реляционной алгебры
- •5.1.4.2.Реляционное исчисление
- •Достоинства и недостатки реляционных моделей
- •Контрольные вопросы по разделу 5.1.
- •Навигационные модели данных
- •Иерархическая модель
- •Сетевые структуры
- •Особенности навигационных моделей. Достоинства и недостатки
- •Контрольные вопросы по разделу 5.2.
- •Система управления базой данных
- •Назначение и функции субд
- •Типовая организация субд и упрощенная схема работы
- •Контрольные вопросы по шестому разделу
- •Основы физического проектирования
- •Файловые и страничные системы хранения информации
- •Файловые структуры. Классификация методов доступа
- •Способы последовательной организации
- •Прямые методы доступа. Хеширование
- •Прямые методы доступа. Классификация методов индексирования
- •Доступ с полным (плотным) индексом
- •Доступ с неплотным индексом
- •Организация индексов в виде в-деревьев
- •Инвертированный файл (доступ по неключевым атрибутам)
- •Использование битовых шкал
- •Достоинства и недостатки основных методов доступа
- •Бесфайловая организация внешней памяти
- •Особенности реляционных субд
- •Базовые структуры памяти
- •5.1.4.3.Структура и типы страниц
- •5.1.4.4.Табличные пространства
- •5.1.4.5.Понятие экстента и буферизация
- •Проблемы и параметры управления внешней памятью
- •Контрольные вопросы по седьмому разделу
- •Особенности объектно-ориентированных субд
- •Основные понятия объектно-ориентированного подхода
- •Предпосылки появления объектно-ориентированных субд
- •Объектная модель данных. Оосубд
- •. Объектно-реляционные субд
- •5.2.Поддержка сложных объектов,
- •5.3.Поддержка динамических изменений определений классов,
- •5.4.Полная интеграция с объектно-ориентированными системами программирования.
- •Объектно-реляционное отображение
- •Select * from Предпочтительная акция
- •Управление ресурсами. Сервер объектов и сервер страниц
- •Контрольные вопросы по восьмому разделу
- •Вопросы распределенных баз данных
- •9.1. Централизованные и децентрализованные субд
- •Стратегии хранения данных. Достоинства и недостатки
- •Проблемы распределенных баз данных
- •Одновременная работа
- •Управление блокированием
- •Методы синхронизации распределенных обновлений
- •Завершение транзакции. Журнал транзакций
- •Свойства транзакций
- •Контрольные вопросы по девятому разделу
- •Заключение
- •Литература
Контрольные вопросы по третьему разделу
Приведите схему общей структуры банка данных.
Приведите общую схему коллектива специалистов. Перечислите основные функции аналитиков, системных программистов, прикладных программистов.
Перечислите функции администратора базы данных.
Перечислите функции словаря-справочника.
Приведите схему уровней представления (абстракций) информационной системы.
Дайте понятие инфологической модели. В чем отличие инфологической модели от концептуальной.
Опишите понятия, сформулированные в отчете ANSI/SPARC:
Модель предметной области (концептуальная, внешняя, внутренняя).
Модель данных (концептуальная, внешняя, внутренняя).
Схема (концептуальная, внешняя, внутренняя).
8. Сформулируйте отличие в определении ANSI/SPARC понятия модели предметной области от понятия модели данных (безотносительно уровня абстракции).
Вопросы проектирования баз данных
Жизненный цикл информационной системы
Как и любая другая, информационная система проходит во времени свой определенный жизненный цикл. В зависимости от целей исследования, в жизненном цикле БД можно определить различные последовательности этапов. С точки зрения проектировщика и пользователя согласно [2] выделим две фазы жизненного цикла базы данных:
анализ и проектирование – начальный (“бумажный”) этап жизни БД,
реализация и эксплуатация системы.
Анализ и проектирование. Этап выполняется посредством изучения предметной области и требований, предъявляемых к создаваемой БД. На “бумажной” стадии жизни системы производится выбор:
структур данных и стратегии их хранения в памяти ЭВМ,
технологии обслуживания БД и взаимодействия с ней конечных пользователей,
технических и стандартных программных средств, а также разработка оригинальных программных средств обслуживания системы.
Реализация и эксплуатация. Сущность реализации заключается в материализации проекта, в перенесении его в память ЭВМ. На этой стадии разрабатывается и отлаживается программное обеспечение информационной системы, создается отладочный вариант БД, разрабатываются многочисленные приложения. На стадии реализации тестируется и корректируется технология обслуживания информационной системы.
Эксплуатация начинается с наполнения системы реальной информацией. Эта стадия жизненного цикла охватывает весь комплекс действий по поддержанию функционирования информационной системы:
Очевидно, что стадия эксплуатации включает в себя разработку новых приложений, а также совершенствование и последующее развитие системы.
Методы построения моделей. Учитывая, что главной целью данного пособия является знакомство читателя с основными подходами к организации процесса проектирования базы данных как модели предметной области, а основными методами изучения реальности являются методы анализа и синтеза, согласно [1] определим аналитический (метод анализа) и синтетический (метод синтеза) следующим образом.
В процессе анализа определяется структура системы, т.е. то, как она устроена. Процедура анализа состоит в последовательном выполнении следующих трех операций:
Сложное целое расчленить на более мелкие части, предположительно более простые.
Дать полное объяснение полученным фрагментам.
Объединить объяснение частей в объяснение целого.
Если какая-то часть системы остается непонятной, шаги анализа осуществляются для этой части.
Первым продуктом анализа является перечень элементов системы, т.е. модель состава системы.
Объяснение целого – это установление его эмерджентных свойств; для этого необходимо установить связи между частями. Таким образом, вторым продуктом анализа является модель структуры системы.
В процессе синтеза определяется функционирование системы, т.е. ее взаимодействие со средой. Процедура синтеза включает последовательное выполнение трех операций:
Выделение большей системы (метасистемы), в которую моделируемая система входит как часть.
Рассмотрение состава и структуры метасистемы.
Объяснение роли, которую играет моделируемая система в метасистеме, через ее связи с другими частями метасистемы.
Конечным продуктом синтеза является знание связей моделируемой системы с другими частями метасистемы, т.е. модель черного ящика.
Очевидно, чтобы построить модель черного ящика, необходимо попутно создать модели состава и структуры метасистемы как побочные продукты.
Объединение трех моделей в единое целое позволяет сформировать модель белого (прозрачного) ящика, или структурную схему системы.
Применение описанных процедур будет рассмотрено ниже при обсуждении этапов проектирования базы данных.