
2к4с Управление данными / МУ УД СРС_0
.pdfМинистерство образования и науки Российской Федерации
Саратовский государственный технический университет
Балаковский институт техники, технологии и управления
ТРЕБОВАНИЯ И ПОДХОДЫ
К ПРОЕКТИРОВАНИЮ БАЗ ДАННЫХ
Методические указания к самостоятельной работе по дисциплине «Управление данными»
для студентов направления Информационные системы и технологии для всех форм обучения
Одобрено
редакционно-издательским советом
Балаковского института техники,
технологии и управления
Балаково 2015
Цель работы - изучение требований и подходов к проектированию баз данных.
ОСНОВНЫЕ ПОНЯТИЯ
Данные - совокупность объективных сведений.
Информация - сведения, неизвестные ранее получателю информации,
пополняющие его знания, подтверждающие или опровергающие положе-
ния и соответствующие убеждения. Информация носит субъективный ха-
рактер и определяется уровнем знаний субъекта и степенью его восприя-
тия. Информация извлекается субъектом из соответствующих данных.
Знания - совокупность фактов, закономерностей и эвристических правил, с помощью которых решается поставленная задача. Последова-
тельность операций обработки данных называют информационной техно-
логией (ИТ). В силу значительного количества информации в современных задачах она должна быть упорядочена. Существует два подхода к упоря-
дочению. Данные связаны с конкретной задачей (технология массивов) -
упорядочение по использованию. Вместе с тем алгоритмы более подвижны
(могут чаще меняться), чем данные. Это вызывает необходимость пере-
упорядочения данных, которые к тому же могут повторяться в различных задачах. В связи с этим предложена другая, широко используемая техноло-
гия баз данных, представляющая собой упорядочение по хранению.
Под базой данных (БД) понимают совокупность хранящихся вместе данных при наличии такой минимальной избыточности, которая допускает их использование оптимальным образом для одного или нескольких при-
ложений. Целью создания баз данных, как разновидности информацион-
ной технологии и формы хранения данных, является построение системы данных, не зависящих от принятых алгоритмов (программного обеспече-
ния), применяемых технических средств и физического расположения данных в ЭВМ; обеспечивающих непротиворечивую и целостную инфор-
2
мацию при нерегламентируемых запросах. БД предполагает многоцелевое ее использование (несколько пользователей, множество форм документов и запросов одного пользователя).
База знаний (БЗ) представляет собой совокупность БД и используе-
мых правил, полученных от лиц, принимающих решения (ЛПР).
Банк данных - база данных и система управления ею (СУБД). СУБД
(например, FoxPro) представляет собой приложение для создания баз дан-
ных как совокупности двумерных таблиц.
Предметная область - отражение в БД совокупности и объектов ре-
ального мира с их связями, относящимися к некоторой области знаний и имеющих практическую ценность для пользователя. Понятие «идентифи-
катор» используется и в физической базе данных.
Система управления базами данных (СУБД) — это комплекс языко-
вых и программных средств, предназначенный для создания, ведения и совместного использования БД многими пользователями.
ТРЕБОВАНИЯ К БнД ИНФОРМАЦИОННЫХ СИСТЕМ
Информационные системы, созданные средствами технологии БД,
называются банками данных (БнД).
Требования к БнД:
многократное использование данных: пользователи должны иметь возможность использовать данные различным образом;
простота: пользователи должны иметь возможность легко узнать и понять, какие данные имеются в распоряжении;
легкость использования: пользователи должны иметь возмож-
ность осуществлять (процедурно) простой доступ к данным, при этом все сложности доступа к данным должны быть скрыты в самой системе управ-
ления базами данных;
3
гибкость использования: обращение к данным или их поиск должны осуществляться с помощью различных методов доступа;
быстрая обработка запросов на данные: запросы на данные в том числе незапланированные, должны обрабатываться с помощью высо-
коуровневого языка запросов, а не только прикладными программами,
написанными с целью обработки конкретных запросов.
ЭВОЛЮЦИЯ КОНЦЕПЦИИ ОБРАБОТКИ ДАННЫХ
Обработка данных – это совокупность методов и средств, осуществ-
ляющих преобразование данных, которая включает в себя ввод данных в компьютер, преобразование и отбор данных по каким-либо критериям и вывод данных в удобном для пользователя виде.
Концепции обработки данных представлены в соответствии с разви-
тием вычислительной техники следующим образом [1]:
Обработка на мэйнфреймах в пакетном режиме. Для обработки данных в этом режиме пользователь составлял задания на выполнение определенных операций над исходной программой и/или счет по програм-
ме. Исходная программа – это программа, написанная на алгоритмическом языке. Задания, записанные на специальном языке описания заданий, а
также текст программы и исходные данные наносились на бумажный но-
ситель – перфокарты, которые формировались в пакет заданий. Пользова-
тели передавали свои пакеты заданий в вычислительный центр на обработ-
ку на мэйнфрейме. Распечатанные результаты пользователи получали только на следующий день. Отсутствие непосредственного контакта поль-
зователя с компьютером и использование перфокарт увеличивали время получения результата обработки.
Обработка в многотерминальных системах. Такие системы по-
явились по мере удешевления компьютеров в начале 1960-х гг. и позволи-
ли пользователям непосредственно общаться с компьютером. К мэйн-
4
фрейму, расположенному на вычислительном центре, были подключены терминалы, рассредоточенные по всему предприятию. Терминал – это устройство, предназначенное для взаимодействия с вычислительной си-
стемой или сетью ЭВМ. Первоначально терминалы были неинтеллекту-
альным, не имели собственных вычислительных ресурсов, а осуществляли только операции ввода-вывода. Пользователи с помощью терминалов пе-
редавали запросы к базе данных. Часть операционной системы, отвечаю-
щая за управление связью (ОСус), принимала их и передавала соответ-
ствующим прикладным программам (ПП), которые обращались к СУБД, а
она выполняла операции с базой данных, используя часть операционной системы, отвечающую за управление данными (ОСуд). Результаты запро-
сов возвращались пользователям, находящимся у терминалов, подсисте-
мой управления связью. Многотерминальные системы называют еще си-
стемами удаленной обработки данных. Пользовательские запросы обраба-
тывались в режиме разделения времени. Время обработки было достаточно мало.
Обработка на автономных персональных компьютерах. Она стала возможной в 1980-е гг. в связи с появлением этой техники. На персональ-
ном компьютере (ПК) устанавливалась СУБД, с помощью которой пользо-
ватель создавал на данном компьютере свою локальную базу данных и ра-
ботал с ней в однопользовательском режиме. Такая СУБД называлась настольной. Она была ответственна за выполнение запросов и поддержа-
ние целостности базы данных. К аппаратному обеспечению компьютера предъявлялись скромные требования. Данные передавались с компьютера на компьютер на внешних носителях – дискетах. Настольные СУБД были просты для освоения и использования, обладали понятным пользователь-
ским интерфейсом, ориентировались на самую широкую категорию поль-
зователей – непрофессионалов, обеспечивали хорошее быстродействие при работе с небольшими базами данных.
5
Обработка с использованием компьютерных сетей. Основная концепция такой обработки заключается в обмене данными между компь-
ютерами в автоматическом режиме посредством линий связи и специаль-
ного оборудования. В первых компьютерных сетях были реализованы службы обмена файлами, синхронизации файлов (устранение различий между файлом, хранящимся на одном компьютере, и версией того же фай-
ла на другом компьютере), электронной почты и другие сетевые службы,
ставшие теперь традиционными. ПК стали идеальными элементами для построения сетей. С одной стороны, они были достаточно мощными для работы сетевого программного обеспечения, а с другой – не очень дороги-
ми. При их объединении совокупная вычислительная мощность оказыва-
лась достаточной для решения сложных задач, и стало возможным сов-
местное использование периферийных устройств (например, принтеров) и
дисковых массивов (RAID-массивов). Поэтому ПК стали преобладать в локальных сетях, причем в качестве не только компьютеров пользовате-
лей, но и центров хранения и обработки данных, потеснив с этих привыч-
ных ролей мэйнфреймы. Обработка данных с использованием компьютер-
ных сетей является в настоящее время наиболее распространенной. При этом наблюдается тенденция к унификации технологий обработки данных в локальных сетях и в глобальной сети Интернет.
ТРЕБОВАНИЯ И ПОДХОДЫ
К ПРОЕКТИРОВАНИЮ БАЗ ДАННЫХ
Как отмечает Зиндер Е.З. сформировалось понимание интегрирован-
ной БД как общего информационного ресурса предприятия. Хранимые данные стали аналогичны большому компьютеру, который одновременно используется многими пользователями с различными целями и должен быть все время работоспособен [2].
6
Классическая методология проектирования базы (БД) включает мето-
ды выполнения проектных этапов [1]:
сбор сведений о предметной области (анализ потребностей и описа-
ние с использованием «процессного» или «непроцессного» подхода);
выбор языка представления семантической модели для фиксации сведений о предметной области, их последующего анализа и синтеза моде-
ли БД;
анализ собранных сведений о предметной областиО: классифика-
ция, формализация и интеграция структурных элементов описания пред-
метной области, формализация как структурных, так и процедурных огра-
ничений целостности элементов в будущей модели предметной области,
определение динамики экземпляров объектов предметной области;
синтез концептуальной модели БД: проектирование целостной кон-
цептуальной схемы БД на выбранном языке семантического моделирова-
ния;
выбор конкретной модели данных и СУБД для реализации БД;
проектирование логической схемы БД для выбранной СУБД;
разработка физической структуры БД;
разработка технологии и процедур начального создания и заполне-
ния БД;
разработка технологии и процедур сопровождения БД;
разработка универсальных программ доступа к БД и соответствую-
щих интерфейсов пользователей;
информационное обеспечение разработки конкретных программ обработки данных: обеспечение метаинформацией, данными контрольных примеров и др.;
получение обратной связи от разработчиков прикладных программ
ипользователей информационной системы (ИС) о полноте и эффективно-
сти организации БД;
7
тестирование БД, ее развитие и улучшение (настройка) ее структу-
ры.
Проектирование комплексной по предметной направленности, инте-
грированной и большой по размеру БД является сложной задачей. Нали-
чие целостной методологии проектирования, наличие технологического опыта в организации и компьютерной поддержке систем разработки про-
граммного обеспечения и, с другой стороны, использование активных ин-
тегрированных словарей-справочников данных способствовало возникно-
вению системы CASE (Computer Aided System Engineering) - системы для структурного проектирования БД и связанных с ними ИС, ориентирован-
ные на модели данных, реализованные в различных СУБД.
Наибольшую популярность получили CASE-системы для реляцион-
ных СУБД с SQL-моделями данных. Возникло два основных направления развития CASE-систем и технологий проектирования: CASE-системы для проектирования БД и интегрированные инструменты, позволяющие проек-
тировать БД и разрабатывать использующие их прикладные программы.
Мастерская проектировщика БД включает совокупность классических структурных методов проектирования, набор соответствующих инстру-
ментов моделирования, реализации, загрузки и сопровождения БД, а также
«каскадную» организационную схему выполнения этих работ по принципу
«сверху вниз».
Система баз данных должна стать органическим элементом системы управления организацией, поэтому необходимо, чтобы средства СУБД бы-
ли адекватны потребностям пользователей. Так как разным пользователям могут понадобиться разные модели данных, языки данных и схемы, надо,
чтобы СУБД поддерживала множество средств, а пользователь мог выби-
рать из них наиболее подходящие.
Из классических методов проектирования применяются в настоящее время [2]:
8
иерархическая «каскадная» схема структурного проектирования БД при подходе «сверху-вниз»;
CASE-системы для структурного проектирования баз данных, ИС в целом или, к тому же, прикладных программ ИС;
варианты ER-модели данных; табличная реляционная модель 1971
года, расширенная тем или иным дополнительным набором средств описа-
ний ограничений целостности (ссылочная целостность, бизнес-правила);
для анализа «процессного» источника сведений чаще всего предоставля-
ются модели потоков данных или SADT, возможно, расширенные допол-
нительными связями по управлению (эти связи нельзя смешивать с выде-
ленными потоками условий выполнения функций в нотации IDEF0);
Также используются утилиты динамического администрирования БД,
обеспечивающие следующие функции:
отслеживание динамики показателей эксплуатации БД: показатели доступны в любой момент на фоне работы приложений, эти показатели
(«статистика») могут использоваться для поддержки оптимального дина-
мического построения путей доступа к данным,
создание резервных копий БД, также как и ведение копий БД горя-
чего резерва на фоне работы приложений, восстановление и откат фраг-
ментов и полной БД,
возможна динамическая реорганизация БД (переразмещение БД и отдельных физических фрагментов, логическая и физическая реструктури-
зация данных), но эти возможности являются ограниченными.
ИС нельзя рассматривать в отрыве от ее пользователей, поэтому новое проектирование должно рассматриваться как интеграция трех составных частей: требований бизнес-реинжиниринга, человеческого фактора и мето-
дов новых ИТ. Реальное объединение этих трех составных частей, каждая из которых приобрела в 90-е годы качественно новое направление: си-
стемное проектирование(Н.С.П.).
9
Новые требования к корпоративным БД предполагают следующее
[4]: обеспечение максимальных возможностей для каждого работника, то есть поддержка выполнения всех бизнес-функций тем самым работником,
который и получает конечный результат.
Со стороны ИС, БД и СУБД для этого требуется:
обеспечение средств доступа ко всем необходимым данным с ис-
пользованием распределенных БД, средств репликаций данных, управле-
ния событиями в данных и процессах обработки транзакций;
использование архитектуры и программных средств хранилища данных, средств оперативной аналитической обработки данных (OLAP),
применение средств быстрой разработки приложений (RAD) для создания
«ИС руководителя» (EIS), средств поддержки принятия решений (DSS) на основе хранилища данных, OLAP и RAD/EIS;
применение средств DSS на основе анализа БД прецедентов, а
также методов логического вывода, нейронных сетей и нейрокомпьютеров,
идр.;
предложение единого интерфейса пользователя для работы с раз-
ными компонентами данных и приложений, использование в этом интер-
фейсе средств, повышающих простоту поиска информации и обращения к конкретным прикладным функциям, например, функции геоинформси-
стем, гипертекстовые, естественного языка, речевого ввода.
Разработка концепции и структуры корпоративной базы данных для новой ИС, реализация структуры БД, предполагающая снятие (существен-
ное уменьшение) ограничений на ее развитие, в том числе, при смене функций или функциональных компонентов обработки информации пред-
полагает [2]:
применение методов компонентного проектирования предметных БД как для операционных БД, так и для исторических БД хранилищ дан-
ных, архивов документов, гео-информационных и иных данных;
10