Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Казахский национальный университет им. аль-Фараби

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

база данных.docx

Скачиваний:

167

Добавлен:

24.03.2015

Размер:

5.83 Mб

Скачать

☆

<<< < Предыдущая 4 5 6 7 8 9 10 11 12 13 14 1516 / 7816 17 18 19 20 21 22 23 24 25 26 27 28 > Следующая >>>

3.2. Индексирование

Как отмечалось выше, определение ключа для таблицы означает автоматическую сортировку записей, контроль отсутствия повторений значений в ключевых полях записей и повышение скорости выполнения опера ций поиска в таблице. Для реализации этих функций в СУБД применяют индексирование.

Термин «индекс» тесно связан с понятием «ключ», хотя между ними есть и некоторое от личие.

Под индексомпонимают средство ускоренииоперации поиска записей в таблице, а следовательно, и аругих операций, использующих поиск: извлечение, модификация, сортировка и т. д. Таблицу, для которой используется индекс, называют индексированной

Индекс выполняет роль оглавлениятаблицы,npot мотр которого предшествует обращению к записям таблицыR некоторых системах, например,Paradox, индексы хранятся в индексных файлах, хранимых отдельно от табличных файлов.

Ьариан гы решения проблемы организации физического доступа к информации зависят в основном от следующих факторов.

вида содержимого в поле ключа записей индексного фай ла;
типа используемых ссылок (указателей) на запись основной таблицы;
метода поиска нужных записей

В поле ключа индексного файламожно хранить значения ключевых полей индексируемой таблицы либо свертку ключа (так называемый хеш- код). Преимущество хранения хеш-кода вместо значения состоит в том, что длина свертки независимо от длины исходного значения ключевого поля всегда имеет некоторую постоянную и достаточно матую величину (например, 4 байта), что существенноснижав! время поисковых операций. Недостатком хеширования является необходимость выполнения операции свертки (требует определенного времени), а также борьба с возникновением коллизий (свертка различных значений может дать одинаковый хеш-код).

Для организации ссылкина запись таблицы могут использоваться три типа адресов: абсолютный (действительный), относительный и символический ( идентифика! ор).

На практике чаще всего используются два метода поиска: последовательный и бинарный (основан на делении интервала поиска пополам).

Проиллюс грируем организацию индексировяния таблиц двумясхемами: одноуровневой и двухуровневой. При этом примем ряд предположений, обычно выполняемых в современных вычислительны^ системах. Пусть ОС поддерживаетпрямую организацию данных на магнитных диска::, основныетаблицы и индексные файлы хранятся в отдельных файлах. Информация файлов хранится в виде совокупности блоков фиксированного размера, например целого числа кластеров.

При одноуровневой схемев индексном файле хрэнлтея короткие записи, имеющие два поля: поле содержимого старшего ключа (хеш-кода ключа) адресуемого блока и поле адреса начала этого блока (рис. 3.3).

ключ	адрес
ключ	адрес

ключ	адрес

Индексный файл

ключ заш сь

ключ

ключ запись

запись

ключ запись

II ч

запись

_ключ

запись

__ключ

запись

Блок — N

Блок — 2

Блок — 1

Рис. 3.3. Одноуровневая схема индексации

В каждом блоке записи располагаются в порядке возрастания значения ключа или свертки. Старшим ключом каждого блока является ключ его последней записи.

Если в индексном файле хранятся хеш-коды ключевых полей индекс иро ванной таблицы, то алгоритм поиска нужной записи (с указанным ключом) в таблице включает в себя следующие три этана

Образование сверл ки значе ния ключевого поля искомой запчеи.
Поиск в индексном файле записи о блоке, значение первого поля которою больше полученной свертки (это гарантирует нахождение искомой свертки в этом блоке).
Последовательный птюсмотр записей блока до совпадения сверток искомой "аписи и записи блока файла В случае ко. шизий сверюк ищетсязапись, значение ключа которой совпадает со значением ключа искомой записи

Основным недостаткомодноуровневой схемы является то, чю ключи (< вертки) запи< ей хранятся вмегте с записями. Это приводит к уве личению времени поиска записей из-за большой длины просмо гра (значения данньп в записях приходится пропускать).

Двухуровневая схемав ряде случаев оказывается более рациональной, в ней ключи (свертки) записей отделены от содержимого записей (рис. 3.4).

Блок ключей — 1

Рис. 3.4. Двухуровневая схемг индексации

В этой схеме индекс основной таблицы распределен но совокупности файлов: одному файлу главного индекса и множеству файлов с блоками ключей.

На практике для создан* я индекса для некоторой таблицы БД пользова тель указывает поле таблицы, которое требует индексации. Ключевые поля таблицы во многих СУБД как правило индексируются автоматически. Индексные файлы, создаваемые по ключевым полям таблицы, часто называются файлами перзичных индексов.

Индексы, создаваемые пользовате лем для не ключевых полей, иногда называют вторичными (пользовательскими) индексами.Введение таких индексов не изменяет физическою расположения записей таблицы, но влияет на последовательность просмотра записей. Индексные файлы, создаваемые для поддержаниг вторичных индексов таблицы, обычно назыгаютсяфайлами вторичных индексов.

С^язь вторичного индекса с элементами данных базы может быть уста новл^на различными способами. Один из них - использование вторичного индекса как входа для получения первичного ключа, по которому затем с использованием первичного индекса производится поиск необходимых записей (рис. 3.5).

Рис. 3.5. Способ использования вторичных индексов

Некоторыми СУБД, например Access, деление индексов на первичные и вторичные не производится. В этом случае используются автоматически со здава< мыс индексы и индексы, определяемые пользователем по любому из нг ключевых полей.

Главная причина повышения скорости ьыполнения различных операций в индексированных таблицах состоит в том, что основная часть рабо^пы про- изво П1тся с небольшими индексными файлами, а не с самими таблицами. Наибольший эффект повышения производительности работы с индексиро ванными таблицами достигается для значительных по объему таблиц. Индексирование требует небольшого дополнительного места на диске и незначительных затрат процессора на изменение индексов в процессе работы. Индексы в общем случае мо\ут изменяться перед выполнением запросов к ЬД, после выполнения запросов к БД, по специальным командам пользователя или программным вызовам приложений

<<< < Предыдущая 4 5 6 7 8 9 10 11 12 13 14 1516 / 7816 17 18 19 20 21 22 23 24 25 26 27 28 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
24.03.201572.7 Кб39АЫЛШЫН ТІЛІ.doc
#
23.08.2019713.58 Кб23Б. С. Ляпустин, И. Е. Суриков - Древняя Греция...docx
#
20.11.2018126.59 Кб7Біріккен Ұлттар Ұйымы.docx
#
24.03.201521.08 Кб12Бірін жне екін текті жасыту Лекция 9.docx
#
24.03.2015123.39 Кб18баа Перизат.doc
#
24.03.20155.83 Mб167база данных.docx
#
24.03.20154.96 Mб16бактерия.rtf
#
24.03.2015212.48 Кб14Бактын тили мен стили.doc
#
11.09.201957.78 Кб6Баллада,Светлана Жуковского.docx
#
24.03.201557.94 Кб18Банк терминологиясы.docx
#
31.08.2019214.02 Кб5банківське право - тема 4.doc