
- •1. Основы информационного обеспечения процессов и систем.
- •1.1 Понятие и содержание информационного обеспечения (ио).
- •1.2 Технологические и информационно-штатные воплошения информационного обеспечения.
- •1.3 Структура информационного обеспечения.
- •1.4 Структура и классификация ис.
- •1.5 Система представления и обработки данных фактографических аис.
- •2. Системы управления базами данных фактографических ис.
- •2.1 Функции, классификация и структура субд.
- •2.2 Модели организации данных.
- •3. Физическая организация данных.
- •3.1 Пространство памяти и размещение хранимых данных.
- •6. Введение в язык sql
- •7. Защита информации
3. Физическая организация данных.
Механизмы среды хранения БД служат для управления двумя группами ресурсов:
1) ресурсы хранимых данных.
2) ресурсы пространства памяти.
В задачу этого механизма входит отображение структуры хранимых данных пространства памяти, позволяющие эффективно использовать память и определить место размещения данных при запоминании и при поиске данных. Управление памятью выполняется операционной системой по запросам СУБД, либо непосредственно в самой СУБД.
3.1 Пространство памяти и размещение хранимых данных.
Ресурсам пространства памяти соответствуют объекты внешней памяти ЭВМ, управляемые средствами операционной системы или СУБД. Все пространство памяти БД делится на части, области, разделы. Область памяти используется для размещения хранимых записей одного или нескольких типов и разбивается на пронумерованные страницы фиксируемого размера. В большинстве систем обработку данных на уровне страниц ведет операционная система, а обработку записи внутри страницы – СУБД. Страницы представляются в среде ОС блоками внешней памяти, кластерами или секторами, доступ к которым осуществляется за одно обращение. В страницах имеется заголовок, содержащий служебную информацию, вслед за которым располагаются собственно данные. Как правило, на странице размещаются несколько записей, и есть свободный участок для размещения новых записей. Если запись не помещается на одной странице, она разбивается на фрагменты, которые хранятся на разных страницах и имеют ссылки друг на друга.
Управление свободным пространством памяти на странице.
Управление обеспечивается 2 способами: ведением списка свободных участков и динамическая реорганизация страницы.
При динамической организации страницы записи базы данных плотно размещаются вслед за заголовком и после них располагаются свободные участки. При удалении записи, оставшиеся участки записи переписываются, подряд в начало страницы и изменяется смещение свободного участка.
Списки свободных участков на страницах; здесь ссылка на первый свободный участок хранит ссылку на следующий участок или признак конца списка. Каждый освобожденный участок включается в список свободных участков на странице.
Списки свободных участков в виде отдельных структур. Здесь список ведется как стек, очередь или упорядоченный список. В последнем случае упорядочивание осуществляется по размеру свободного участка, что позволяет подобрать для новой записи подходящий по размеру участок. Для существенного ускорения поиска свободного пространства учет свободных участков в СУБД поддерживается с помощью индексных страниц, которые содержат информацию о свободных участках для области памяти или группы страниц.
Сущность.
При запоминании новой записи, система имеет свободный участок, достаточный для размещения этой записи. Если выбранный участок больше чем запись, то остаток оформляется в виде свободного участка. При динамической реорганизации страниц запись просто записывается вслед за последней на данной странице. Если формат записи фиксированный, то при изменении, она просто перезаписывается на прежнее место. При плавающем формате записи возможна реорганизация страницы или перемещение записи на другой участок памяти. Использование списков свободных участков ведет к фрагментации пространства памяти, для уменьшения которой предусмотрены процедуры, которые периодически проводят слияние смежных свободных участков в один.
Структура хранимых данных.
Служебная часть хранимой записи используется для идентификации записи, задания его типа, хранения признака логического удаления, для кодирования значений записи, для установления структурных ассоциаций между записями. Никакие пользовательские программы не имеют доступа к служебной части хранимых записей.Информационная часть содержит значения элементов данных. Каждой записи БД система присваивает внутренний идентификатор, который называется ключом БД. Его значение формируется системой при размещении записи и содержит информацию, позволяющую однозначно определить ее адрес.
Существует два основных типа адресации: прямая и косвенная. Прямая - предусматривает указание непосредственного местоположения записей в пространстве памяти.
Недостатки:
1) не позволяет перемещать записи в памяти без изменения ключа БД.
2) возникает явление фрагментации, то есть появление разрозненных незаполненных участков памяти.
Данные недостатки можно преодолеть, используя косвенную адресацию.
Один из способов состоит в том, что часть адресного пространства страницы выделяется под индексы страницы. Число статей (слотов) в нем одинаково для всех страниц. Ключом БД служит номер этой записи в области. С помощью простых арифметических действий можно получить по номеру записи, номер нужной страницы Nи номер требуемого слотаiв индексе странице. Найденный слот покажет месторасположение записи на этой странице.
Механизмы размещения данных и доступа к данным.
Простейшая стратегия размещения данных заключается в том, что новая запись размещается на первом свободном участке или вслед за последнем из ранее размещенных записей. Среди более сложных методов можно отметить хеширование и кластеризацию данных. Основные способы доступа к данным:
1) последовательная обработка области БД. Областью БД может быть файл или другое множество страниц. Последовательная обработка предполагает, что система последовательно просматривает страницы, пропускает пустые участки и выдает записи в физической последовательности их хранения.
2) доступ по ключу БД. Ключ БД определяет местоположение записи в памяти ЭВМ. Зная его, система может извлечь нужную запись за одно обращение к памяти.
3) доступ по структуре. Этот вид доступа применяют для групповых отношений.
4) доступ по первичному ключу. Он идентифицирует запись внутри типа. Ключ используется при запоминании записи и более того его значение используется при размещении записи в памяти. Наиболее распространенный механизм доступа по первичному ключу – это индексирование и хеширование.
Индексирование данных.
Для ускоренного доступа к записи по ключевому атрибуту создается специальная структура индексов, которая определяет соответствия значения атрибута и местоположение записи. Индекс обычно хранится в отдельном файле или области памяти. Значения индексируемого атрибута упорядочиваются, пустые значения не индексируются.
Хеширование.
Принцип хеширования заключается в том, что для поиска информации, область хранения данных разбивается на участки, каждому из которых ставится в соответствие некоторое значение (индекс). Для определения в какой участок будет помещена запись, к значению ключевого поля этой записи применяется так называемая хеш-функция h(k). Она преобразует значение ключаkв индекс произвольного участка памяти (свертка ключа). При поиске записи к известному значению ключа, хеш-функция выдает индекс, указывающий, где находится тот участок памяти, в который надо произвести считывание. Хеш-функция должна выдавать такие значения индексов, чтобы было равномерное распределение памяти. При этом для близких значений ключа, значения индексов должны сильно отличаться, чтобы избежать перекосов в размещении данных.