- •Государственное образовательное учреждение высшего профессионального образования таганрогский государственный радиотехнический университет
- •Содержание Введение
- •Введение
- •1 Основы построения банков данных
- •1.1 Информация и ее свойства. Данные
- •Определение 2. Информация – это изменение степени незнания об объекте (по Шеннону).
- •1.2 Два аспекта рассмотрения банков данных
- •1.3 Терминология
- •1.4 Эволюция концепций баз данных
- •1.5 Требования к банкам данных
- •1.6 Структура банка данных
- •Инициализация передачи
- •1.7 Архитектура банка данных и этапы проектирования баз данных
- •2 Инфологическое проектирование баз данных
- •2.1 Сущность инфологического подхода к проектированию баз данных
- •2.2 Модель типа «сущность-связь»
- •2.3 Построение модели локальных представлений
- •2.4 Объединение моделей локальных представлений
- •3 Модели данных
- •3.1 Сетевая модель данных (смд)
- •3.2 Иерархическая модель данных (имд) (древовидная структура)
- •3.3 Реляционные модели данных
- •3.4 Нормализация реляционных отношений
- •4 Физическая организация баз данных
- •4.1 Способы физической организации и хранения данных
- •4.2 Последовательные структуры данных (псд)
- •4.3 Индексно-последовательный метод доступа
- •4.4 Индексно-произвольный метод доступа
- •4.5 Инвертированный метод доступа
- •4.6 Прямой метод доступа. Хеширование
- •5 Установление связей между объектами в информационной системе
- •5.1 Установление функциональных связей (фс) между объектами
- •5.2 Установление структурных связей (сс) между объектами
- •6 Сравнительный анализ современных субд
- •7 Распределенные базы данных
- •7.1 Проектирование распределенных баз данных
- •7.2 Обработка запросов в распределенной базе данных
- •8 Базы знаний
- •8.1 Модели представления знаний
- •Vху (Знакомы (х,у)→Приятели (х,у) V Сослуживцы (х,у))
- •Vху Обработана (х,у).
- •Модели специального типа 09.12.2009
- •8.2 Модели вывода решений
- •Заключение
- •Тесты для проверки полученных знаний по дисциплине
- •Глоссарий по дисциплине “Базы данных”
- •Библиографический список
4.4 Индексно-произвольный метод доступа
Записи исходного файла могут быть размещены в произвольном порядке. Для реализации метода используется индексный файл. Отметим, что объем индексного файла такой же, как и у исходного.
Возможны два варианта:
а) индекс упорядочен по возрастанию ключа.
бл.1
Индекс |
А дрес |
|
4 |
|
1 2 3 4 5 6 7 8 |
3 2 3 1 1 3 2 2 |
|
5 |
|
|
бл.2 |
|
||
|
2 |
|
||
|
7 |
|
||
|
8 |
|
б) Индекс не упорядочен. Значения ключа располагаются в произвольном порядке. В этом случае помимо исходного и индексного файлов необходимо осуществить программу рандомизации или перемешивания. Эта программа необходима для того, чтобы вычислить по значению индексного ключа адрес блока. На практике широко применяются различные алгоритмы рандомизации. При осуществлении программ рандомизации обычно стремятся к равномерному заполнению блоков.
Выводы. 1. В индексно-произвольном методе эффективность хранения очень низкая, т.к. объем индексного файла равен объему исходного.
2. Эффективность доступа выше. Если индексный файл полностью помещается в оперативной памяти, эффективность доступа равна единице.
4.5 Инвертированный метод доступа
Этот метод служит для обеспечения быстрого поиска данных с использованием вторичных ключей. В примере раздела 4.3 это может быть разбивка рабочих по цехам. Для реализации метода создается инвертированный файл. Такой подход позволяет избежать просмотра всех записей файла.
Рассмотрим пример. Допустим необходимо найти всех рабочих 6 цеха.
Исходные файлы
|
|
|
0311 |
|
|
|
|
Адрес блока |
|
0934 |
|
|
|
|
|
|
|
|
|
|
02 |
1 |
|
0802 |
|
|
|
04 |
2 |
|
|
|
|
|
06 |
3 |
|
0422 |
|
|
|
11 |
4 |
|
0422 |
|
|
|
|
|
|
0981 |
|
|
|
Инвертиро-ванный файл |
|
|
|
|
|
|
|
1016 |
|
|
|
Структура инвертированного файла сходна со структурой индексного файла, только здесь в качестве индексов берутся значения вторичного ключа. В блоках записываются значения первичных ключей, либо сразу адреса записей.
Выводы. 1. С увеличением объема исходного файл улучшается эффективность хранения.
2. Эффективность доступа уменьшается с ростом базы данных, т.к. информация в блоках просматривается последовательно.
Примечание. Если исходный файл инвертирован по всем вторичным ключам, то он называется полностью инвертированным, если не по всем ключам, то частично инвертированным.