- •Р а з д е л 3. Технологии обработки данных, реализуемые системами управления базами данных
- •Логическая и физическая независимость данных:
- •Независимость Зависит от средств физического
- •Тема 4.2. Реляционный подход к построению предметной области
- •Например, отношение
- •Студент_группы Студент Группа
- •Успеваемость Студент Оценка_дисциплина
- •Типы связей. ИОб конкретной по обычно связаны между собой. При этом возможны связи следующих типов:
- •Студент Сессия,
- •Стипендия Сессия,
- •Студент Преподаватель,
- •Атрибут, Название цеха, в котором он работает
- •Завод-поставщик детали Страна-местонахождение завода-поставщика Служащий (из варианта 2).
- •Приведем пример таблицы Служащий:
- •Деталь*, Поставщик*, Цех*.
Р а з д е л 3. Технологии обработки данных, реализуемые системами управления базами данных
Существуют различные способы и средства организации данных. Одни из них обеспечивают операции хранения и обработки, другие – передачи данных по сетям связи, третьи – их отображения.
Если рассматривать хранение и обработку данных, можно выделить три этапа, в ходе которых сложилась современная технология организации данных больших объемов для их коллективного использования.
На первом этапе данные запоминались в обычных файлах отдельно для каждой задачи. Напомним, что файл это поименованная структура данных на внешнем запоминающем устройстве (ВЗУ: МД, Оптическом Диске, МЛ). В файл обычно объединяют однородные записи. Одна запись может состоять из одного поля данных, содержать несколько однородных полей, т.е. определять однородную структуру. Например, файл может содержать запись вида
Имя поля: FIO
Иванов В. Е.
Значение поля
123… 19 20
т.е. состоящую из одного поля фиксированной длины. Тип этого поля – символьный, а его длина – 20 знаков.
Другой пример дает файл STUDENT, структура записи которого содержит уже несколько полей:
FIO GOD_ROGD GRUPPA
1-е поле 2-е поле 3-е поле
символьное числовое символьное
запись
Это так называемая логическая структура записи файла с точки зрения пользователя.
Файл
При размещении файла на ВЗУ запись/чтение в/из него происходит физическими записями. Одна физическая запись может включать несколько логических. Способы хранения данных так же, как ведение файла и организация доступа к данным, осуществлялись на первом этапе самим приложением.
На втором этапе, после появления операционной системы (ОС), часть команд по организации файлов была передана файловой подсистеме (п/с) ОС (рис. 1). Таким образом, значительно упростилась разработка приложений.
ОС
ФФ ВЗУ
Рис. 1
Например, чтобы создать в MS DOS текстовый файл, надо было выдать ей команду копирования в формате:
copy con «имя файла», к примеру, сopy con llm.txt,
а затем построчно вводить посредством клавиатуры данные:
Enter
I----------------------------------I
Enter
I----------------------------------I
2-я строка данных
.
.
F6
Enter
I----------------------------------I +
последняя строка данных
После отклика MS DOS о правильном выполнении данной команды копирования, в текущем каталоге жесткого диска появится файл llm.txt.
Любая ОС имеет файловую п/с, которая отвечает за создание, как правило, иерархической структуры каталогов/папок и поддерживает управление файлами: их создание, переименование, копирование, перемещение, редактирование, просмотр, уничтожение.
Этот способ организации данных используется до сих пор и имеет то достоинство, что обычный файл связан с конкретным приложением, т.е. разрабатывается для конкретного приложения и с помощью него создается.
Однако при позадачном подходе к автоматизированной обработке этих данных и хранении больших объемов данных выявляется следующий недостаток. Например, в вузе данные о студентах имеются в конкретном деканате, на кафедрах других факультетов, в учетном столе, в студенческом столе, в профкоме, и каждое подразделение решает свою задачу учета сведений о студентах. Представьте ситуацию, что один студент выбыл, другой перевелся в другую группу, по третьему в одном подразделении напечатали ошибочные данные. Это приведет к противоречиям в данных, и ректор, получая, информацию из разных источников, будет в итоге иметь недостоверную информацию. Чтобы избежать таких и аналогичных ошибок, устранить дублирование данных в разных файлах, а значит, уменьшить объем занимаемой ими памяти и была разработана организация данных в виде БзД. Организацией данных для БзД занимается специальная программа, называемая системой управления БзД (СУБД), а общая схема работы приложения с БзД изображена на рис. 2а.
а
)
б)
ОС
ОС
Файл Файл
Рис. 2
Когда мы изучали классы ИС, то один из классов, а именно ИСУ, реализует более простой вариант данной схемы, изображенный на рис. 2б: управленческий персонал (Ч) может получать текущую информацию о состоянии объекта, которым он управляет(отчеты), на основе которой им принимаются решения.
Подытожем, когда же возникает необходимость организации данных в виде БзД:
объемы данных велики (Гб);
структуры данных сложны (иерархические, сетевые);
одни и те же данные используются в разных задачах (коллективное использование);
требования к достоверности и скорости доступа к данным высоки.
Т е м а 4.1.Уровни представления БзД: логический, концептуальный, физический
БзД можно определить, как совокупность взаимосвязанных, хранящихся вместе данных при наличии такой минимальной избыточности, которая допускает их использование оптимальным образом для одного или нескольких приложений; данные запоминаются так, чтобы они были независимы от использующих их приложений; для добавления новых или модификации существующих данных, а также для поиска данных в БзД применяется общий управляющий способ. Данные структурируются так, чтобы была обеспечена возможность дальнейшего наращивания приложений. Говорят, что система содержит совокупность баз данных, если эти базы данных структурно полностью самостоятельны.
В системах с позадачным подходом и автономной файловой организацией данных для каждого приложения создаются собственные файлы. В случае БзД одна и та же совокупность данных может использоваться различными приложениями, а целесообразно, чтобы ею пользовалось максимально возможное число приложений. БзД разрабатывают, как хранилище актуальной информации, т.е. изменяемой в реальном масштабе времени. Поэтому для поддержания достоверности, а значит, обновляемости, данных, сохранения целостности данных, секретности разграничения прав доступа к данным, безопасности данных вводится специальная должность администратора БзД.
Если же говорить о степени независимости организации данных от приложений от приложений, то она определяется тем, каким должно быть обращение к полю данных.
При большой независимости нужно знать имя поля, т.е. его логический формат. При меньшей независимости имя поля и имя набора, в котором такое поле содержится. В худшем случае надо знать физический формат записи. Аналогией этому может служить оператор «: =» в Бейсике или на машинном языке (МЯ).
Бейсик: 10 Let А = 20 или 10 А = 20
МЯ:
1011 0010 1010
адрес операция что записать
физической в память
памяти
ЗУ
(1011) 1010
Итак, логическая независимость данных означает, что общая логическая структура данных может быть изменена без изменения приложений (используемые приложениями элементы данных не могут быть удалены).
Физическая независимость данных означает, что физическое расположение и организация данных может изменяться, не вызывая при этом изменений ни общей логической структуры данных, ни приложений.
Концептуальная модель, или схема, данных должна быть разработана так, чтобы быть по возможности стабильной. В то время, как представления программистов и пользователей о данных меняются, меняются физическое хранение и организация данных, концептуальная модель (КМ) данных остается постоянной или увеличивается с целью включения дополнительных данных. КМ должна стать фундаментом, на котором будет построена обработка данных. Если КМ сконструирована плохо, то по мере расширения ее использования модель придется совершенствовать (а это приведет к перепрограммированию приложений).
На рис. 4 дана схема, обеспечивающая максимум свободы в изменении
