Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
17
Добавлен:
01.05.2014
Размер:
72.19 Кб
Скачать

Физическая организация данных.

- методы хранения данных и доступа к ним. Пользователи СУБД не производят физической организации данных.

Три основных режима работы приложений, связанных с использованием БД:

1. Получить все данный (последовательная обработка)

2. Требуется получить уникальные данные. В этом случае используют:

а. Произвольный доступ (метод)

- хемирование - использование специальных функций, на основе которых определяется место хранения данных - идентификаторы.

б. Индексный метод

- использование первичного ключа.

в. последовательный доступ

- бинарное В-дерево

3. Требуется получить некоторую группу записей. Для этого используют:

а. Вторичные ключи

б. Мультисписок

в. Инвертированный метод

г. Двухсвязное дерево

К физической модели предъявляются два противоречивых требования:

1. Высокая скорость доступа к данным

Требуется большое количество информации о место нахождении данных, для их быстрого поиска.

2. Простота обновления данных

Требуется пройти все процедуры поиска.

Для ускорения процесса поиска и упорядочения данных создается индексные файлы. В качестве индексов - поля или ключи. Индексный файл - меньше по размеру, а отсюда следует поиск быстрее, но появляется вторичная память. Индекс может быть многоуровневый, к нему относительно В+ дерева. В качестве индексов используется числа. Если одно и то же поле используется и для упорядочивания файла и для индексации, то индекс называется основным, а файл - индексопоследовательным. В противном случае индекс - вторичный.

Если используется хотя бы один вторичный индекс файл, то называется инвертированным. Полностью инвертированный файл означает наличие вторичных индексов для всех возможных полей.

Основные методы хранения и поиска данных:

1. Физически-последовательный

2. Прямой

3. Индексно-последовательный

4. Индексно-произвольный

Для выбора соответствующего метода используется два критерия:

1. Эффективность хранения - величина обратная среднему числу байт вторичной памяти необходимого для хранения одного байта исходной памяти.

2. Эффективность доступа - величина обратная среднему числу физических обращений, необходимых для реализации логического доступа.

Выделяют две группы методов доступа:

1. Первичные методы:

физически-последовательный, произвольный

2. Вторичные методы:

Мультисписковый, инвертированные файлы, двух связное дерево.

Рассмотрим иерархическую модель данных:

Рис #13

Хемирование - метод доступа; обеспечивающий прямую адресацию данных путем преобразования значений ключа в относительный или в абсолютный физический адрес.

Реализация метода хемирования:

Разработка специальных хем-функции, которые обеспечивают преобразование ключа в физический адрес. На их основе создается специальные хем-таблици, осуществляющие необходимые преобразования.

На основе хем-функций разработаны специальные алгоритмы, реализовывающие данный метод.

Распределенные БД

Первоначально все БД были централизованными.

Достоинства РБД.

1. Соответствие структуры РБД структуре организации.

2. Гибкое взаимодействие локальных БД.

3. Широкие возможности централизации узлов.

4. Непосредственный доступ к информации, снижение стоимости передачи.

5. Высокие системные характеристики (малое время отклика)

6. Модульная реализация взаимодействия

7. Возможность использования объектно-ориентированного подхода

8. Возможность распределения файлов в соответствии с их активностью. Независимая разработка БД через стандартный интерфейс.

Недостатки РБД:

1. Сложность структуры

2. избыточность

3. несогласованность данных по времени

4. сложность интеграции однородных локальных БД.

РБД - система логически - интегрированных и территориально-распределенных БД, языковых, программных, технических и организационных средств, предназначенных для создания, ведения и обработки информации.

Дополнительные специфические требования к РБД:

1. язык описания данных в рамках схемы должно быть одним для всех локальных БД.

2. Доступ должен быть коллективным в любой области РБД с соответствующей защитой информации.

3. Подсхемы должны быть определены в месте сосредоточения алгоритмов пользователя.

4. Степень централизации данных должно быть разумной.

5. Необходим сбор и обработка информации об эффективности функционирования РБД.

Теорию РБД сформулировал и определил К.Дейт. Он определил 12 правил для РБД:

1. Локальная автономность

2. Отсутствие опоры на центральный узел

3. Непрерывное функционирование РБД

4. Независимость РБД от расположения локальной БД

5. Независимость от фрагментации данных

6. Независимость от репликации (дублирования) данных

7. Обработка распределённых запросов

8. Обработка распределённых транзакций

9. Независимость от типа оборудования

10. Независимость от операционной системы

11. Независимость от сетевой архитектуры

12. Независимость от типа СУБД

Рассмотрим состав и работу РБД.

Схема РБД, демонстрирующая её организацию:

рисунок # 15

4 уровня данных:

1. Пользовательский

2. Глобальный

3. Фрагментальный

4. Распределённый

# 15

9

Соседние файлы в папке Набор конспектов по БД