Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Базы данных, знаний и экспертные системы Калабухов ЕВ, БГУИР 2007 (Мет пособие)

.pdf
Скачиваний:
43
Добавлен:
15.06.2014
Размер:
1.77 Mб
Скачать

концептуальные схемы для определения тех концептуальных записей, которые необходимы для выполнения запроса, в него входят обычно следующие основные компоненты: контроль прав доступа, процессор команд, средства контроля целостности, оптимизатор запросов, контроллер транзакций, планировщик, контроллер восстановления, контроллер буферов (память-диск);

контроллер файлов – манипулирует файлами БД (создает и поддерживает список структур и индексов, определенных во внутренней схеме, но не управляет вводом-выводом данных непосредственно, а лишь передает запросы соответствующим методам доступа, которые обмениваются данными между системными буферами и диском);

препроцессор языка DML – преобразует внедренные в прикладные программы DML-операторы в вызовы стандартных функций базового языка (взаимодействуя с процессором запросов); DML (Data Manipulation Language) – язык, содержащий набор операторов для поддержки основных операций манипулирования содержащимися в базе данными (вставки, модификации, извлечения и удаления данных); DML может быть двух типов: процедурный – указывает, как можно получить результат оператора DML (обычно оперирует данными по одной записи), непроцедурный – описывает, какой результат будет получен (обычно оперирует наборами записей - SQL);

компилятор языка DDL – преобразует DDL-команды в набор таблиц, содержащих метаданные (сохраняются в системном каталоге и частично в заголовках файлов с данными); DDL (Data Definition Language) -

описательный язык, который позволяет описывать сущности (объекты), необходимые для работы некоторого приложения, а также связи, имеющиеся между различными сущностями (теоретически, в архитектуре ANSI-SPARC, можно выделить языки DDL для каждой схемы, но на практике есть один, позволяющий задавать спецификации как минимум для внешней и концептуальной схем);

21

контроллер словаря – управляет доступом к системному каталогу и обеспечивает работу с ним (почти все компоненты СУБД имеют доступ к системному каталогу).

2.4.Архитектура многопользовательских СУБД

Различают следующие архитектуры (по мере развития):

1) Телеобработка В данном случае используется один компьютер, соединенный с

терминалами пользователей (терминал – неинтеллектуальное устройство, предназначенное только для ввода-отображения информации), пользователь через терминал обращается к пользовательскому приложению, а то в свою очередь – к СУБД, затем результат идет в обратном порядке к пользователю. В последнее время наблюдается тенденция к децентрализации и замене дорогих мейнфреймов сетями персональных компьютеров (более эффективно).

2) Файловый сервер Обработка данных распределена в сети (обычно – в локальной

вычислительной сети (ЛВС)). Пользовательские приложения и сама СУБД размещены и функционируют на рабочих станциях и обращаются к файловому серверу только при необходимости доступа к данным (нужным файлам).

Недостатки:

большой объем сетевого трафика;

необходимость в наличии СУБД на каждой рабочей станции;

управление параллельностью, восстановлением и целостностью данных усложняется (доступ к данным от нескольких экземпляров СУБД).

3)Технология «клиент/сервер»

22

Существует единая двухуровневая система, состоящая из клиентского процесса (толстый (интеллектуальный) клиент) (запрос некоторого ресурса) и серверного процесса (предоставление некоторого ресурса). Процессы совсем необязательно должны быть размещены на одном компьютере (обычно сервер располагается на одном узле ЛВС, а клиенты – на других узлах).

Клиент управляет пользовательским интерфейсом и логикой приложения (рабочая станция с пользовательским приложением): принимает от пользователя запрос, проверяет синтаксис и генерирует запрос к базе данных, передает сообщение серверу, ожидает поступление ответа и форматирует полученные данные для показа пользователю.

Сервер принимает и обрабатывает запросы к базе данных (включая проверку полномочий клиента, обеспечение требований целостности, поддержку системного каталога, поддержку параллельного доступа, выполнение запроса и обновление данных), а затем передает полученные результаты обработки обратно клиенту.

Преимущества технологии «клиент/сервер»:

более широкий доступ к существующим базам данных;

повышение производительности системы (по сравнению с выше перечисленными подходами);

снижение стоимости аппаратного обеспечения (серверная машина – более мощная, чем клиентские);

снижение сетевого трафика (по сети идут только необходимые данные);

повышается уровень непротиворечивости данных (проверка целостности данных выполняется централизованно на сервере, а не у клиентов).

Расширение двухуровневой технологии «клиент/сервер» - переход к трехуровневой структуре (эффективна в Internet):

тонкий (неинтеллектуальный) клиент – управление только пользовательским интерфейсом (например, web browser);

средний уровень (клиент) – управление логикой пользовательского приложения;

23

сервер базы данных.

2.5.Преимущества и недостатки СУБД

Преимущества СУБД:

контроль за избыточностью данных (вводится контролируемая избыточность – хранятся только те данные, что необходимы для описания модели, теперь все данные хранятся централизованно);

непротиворечивость данных (легче отслеживать возникновение противоречивых состояний в БД, чем в файлах разбросанных по отделам, кроме того, меньше избыточность данных (см. выше));

больше полезной информации при том же объеме хранимых данных (т.к. в БД хранится вся информация, а не только данные одного отдела (как в файловых системах), то возможно использование совместных данных для анализа некоторых ситуаций и подготовке отчетов);

совместное использование данных (фактически учет и ведение данных на новом уровне – не для себя одного (отдела), а в многопользовательском режиме – вся организация (больший объем данных для сотрудника));

поддержка целостности данных (корректность и непротиворечивость хранимых данных – в одном месте легче настраивать, проверять и изменять);

повышенная безопасность (несмотря на то, что централизованные данные более уязвимы, чем распределенные, в интегрированной системе проще выработать систему безопасности (прав доступа к данным) и заставить ее работать);

применение стандартов (установка требуемых форматов данных для обмена, отчетов, обновления и правил доступа);

повышение эффективности с ростом масштабов системы (снижение затрат на создание прикладных программ (т.к. приложения работают с

24

одним источником данных (доступ упрощен), перенос бюджета в область обновления оборудования без потерь в обновлении прикладных программ);

возможность нахождения компромисса для противоречивых требований (потребности одних пользователей (отделов) могут противоречить потребностям другим пользователей (отделов), имея общий взгляд на всю структуру БД, администратор базы данных может контролировать такие противоречия и оперативно их устранять (обычно производительность отдается важным приложениям за счет менее важных));

повышение доступности данных и их готовности к работе (т.е. устраняется время на распространение общих данных по отделам, данные становятся доступными сразу по их внесении в БД);

улучшение показателей производительности (в СУБД программист освобожден от реализации стандартных действий (т.к. такие функции уже созданы и оптимизированы), поэтому его время используется более продуктивно);

упрощение сопровождения системы за счет независимости от данных (т.к. в СУБД описания данных отделены от приложений, поэтому приложения защищены от изменений в описании данных, что упрощает обслуживание и сопровождение приложений);

улучшенное управление параллельностью (в файловых системах при одновременной записи в файл возможна потеря данных или их целостности, СУБД позволяет вести параллельный доступ к БД);

развитые службы резервного копирования и восстановления (в файловых системах резервное копирование должен делать пользователь, в СУБД – данные лежат централизованно, и данные операции поддерживаются автоматически (программно и аппаратно)).

Недостатки СУБД:

сложность и размер (при проектировании БД, разработчики должны хорошо представлять функциональные возможности СУБД, непонимание

25

может приводить к неудачным результатам проектирования, более сложные СУБД занимают значительный объем дискового пространства (при равных качествах кода));

стоимость СУБД и дополнительные затраты на аппаратное обеспечение (чем больше возможностей у СУБД (и число пользователей БД при равной производительности), тем выше ее стоимость, стоимость ее сопровождения и аппаратных затрат);

затраты на преобразование (при переносе БД с одной СУБД на другую важную роль представляют не только затраты на аппаратные и программные средства, но и затраты на перенос данных, переучивание специалистов, запуск новой системы (т.е. правильный выбор СУБД – тонкая вещь));

производительность (т.к. приложения файловых систем оптимизируются каждое к конкретному случаю, то их производительность может быть очень высока, СУБД же предназначена для решения общих задач и соответственно «притормаживать»);

серьезные последствия при выходе системы из строя (централизация повышает уязвимость системы, выход из строя компонента СУБД – прекращение работы организации).

26

3. ПРОЕКТИРОВАНИЕ БД

Проектирование БД – процесс, который для заданного набора данных, относящихся к некоторой предметной области, позволяет выбрать и построить соответствующую оптимальную структуру БД.

Все вопросы и термины, связанные с ниже описанными задачами и общей методологией проектирования БД, будут раскрыты подробнее в последующих главах.

3.1. Задачи проектирования БД

При проектировании базы данных решаются три основные задачи:

1.«Как адекватно отразить предметную область и информационные потребности пользователей в семантическую модель БД?». Эту проблему называют проблемой инфологического (концептуального) проектирования баз данных.

2.«Каким образом отобразить объекты предметной области в абстрактные объекты модели данных, чтобы это отображение не противоречило семантике предметной области, и было по возможности эффективным?» Эту проблему называют проблемой логического проектирования баз данных.

3.«Как обеспечить эффективность выполнения запросов к базе данных, т.е. каким образом, имея в виду особенности конкретной СУБД, расположить данные во внешней памяти, создать дополнительные структуры данных (например, индексы)?» Эту проблему называют проблемой физического проектирования баз данных.

В процессе проектирования, первичным этапом является решение первых двух задач – создания логического макета (логической модели) БД, и только потом этот логический макет отображают на некоторые физические структуры,

27

поддерживаемые конкретной СУБД. Таким образом, физический макет (физическая модель) является специфическим для каждой СУБД, а логический макет наоборот совершенно независим от СУБД и для его реализации могут быть использованы строгие теоретические принципы. Данный вид проектирования и его методики называются нисходящими, т.к. они позволяют выполнять преобразование от общего к частному.

На практике реализация физического макета может оказывать существенное влияние на логический макет, поэтому конечная структура БД будет некоторым компромиссом в связке «логический макет – физический макет».

Следует учесть, что проектирование БД больше искусство, чем просто наука. Научные принципы составления БД будут изложены далее, но при проектировании возникает множество проблем, которые нельзя охватить этими принципами. В области проектирования БД разработано большое количество методик проектирования, но все они являются более или менее специализированными (т.е. позволяют построить такой логический макет, который был бы лучшим в некоторой конкретной ситуации). Кроме того, в большинстве случаев построение макета БД рассматривается независимо от приложений, которые будут работать с этими данными. Это происходит по причине невозможности учета на начальной стадии проектирования всех возможных способов использования данных, и соответственно полученный макет не будет отвечать требованиям повышенной производительности, т.к. не будет зависим от аппаратной платформы, операционной системы, СУБД, языка программирования и т.п.

3.2. Общая методология проектирования БД

Под методологией проектирования понимают структурированный подход, предусматривающий использование специализированных процедур,

28

технических приемов, инструментов, документации и нацеленный на поддержку и упрощение процесса проектирования. При этом процесс проектирования разбивается на фазы и этапы, которые предлагают к выполнению набор технических приемов и, следуя которым, разработчик может оптимально решать задачи проектирования, стоящие перед ним на данной стадии разработки. Методология проектирования фактически разбивает всю огромную проблему на ряд небольших формализованных подзадач, которые по отдельности решаются проще основной проблемы, однако, следуя путем, заданным конкретной методологией, разработчик может получить в ряде случаев неоптимальный или неадекватный макет (т.е. методология обычно является специализированной и подходит только для частных случаев). Ниже приведена общая методология проектирования БД, которая наименее специализирована.

Общая методология проектирования состоит из трех фаз: концептуальной, логической и физической.

Концептуальное проектирование БД – это процедура конструирования информационной модели, не зависящей от каких-либо физических условий реализации. Фаза концептуального проектирования БД начинается с создания локальных концептуальных моделей данных на основе представлений о предметной области каждого отдельного типа пользователей. Формально этот этап можно разделить на следующие подзадачи:

интервьюирование (опрос) будущих пользователей БД (уточнение задач решаемых пользователем и данных необходимых для решения этих задач, уточнение связей между пользователями (например, иерархия подчиненности) и т.п.);

идентификация объектов с учетом особенностей интервью (анализ названий объектов на синонимы и омонимы, с учетом разных вариантов описания и отнесения объекта к предметной области);

идентификация связей, исключая те, что не входят в рамки проекта;

идентификация атрибутов, кроме названий должны учитываться

29

особенности использования атрибутов (в частности, производные, необязательные, составные и т.п. атрибуты);

создание графического представления локальных концептуальных моделей;

проверка и обсуждение локальных концептуальных моделей с конечными пользователями (для понимания отражения моделью реального мира пользователя).

Особенность этапа концептуального проектирования для данной методологии является то, что число получаемых моделей на данном этапе зависит от числа опрошенных групп пользователей и на данном этапе модели для этих групп представлены обособленно друг от друга – это позволяет декомпозировать задачу опроса и упростить вхождение в проектирование БД.

Логическое проектирование БД – процесс конструирования информационной модели на основе выбора существующих логических моделей данных, но не зависимой от конкретной СУБД и прочих физических условий реализации. Фаза логического проектирования состоит из двух этапов. На первом этапе для каждой концептуальной модели данных, полученной на первой фазе проектирования, строится адекватная логическая модель, при этом выполняются следующие подзадачи:

преобразование локальной концептуальной модели данных в локальную логическую модель (что предусматривает преобразование сложных связей и атрибутов (например, связей типа M:N, рекурсивных и связей с атрибутами), перепроверка связей типа 1:1, удаление избыточных связей);

определение набора отношений исходя из структуры локальной логической модели;

проверка модели с помощью правил нормализации (актуально для реляционной модели данных, проверяет группировку атрибутов для описания объектов и связей, устранение неоднозначностей и избыточности в описании данных, повышение гибкости модели для

30