Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Проектирование.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
108.79 Кб
Скачать

Выбор файловой структуры

Одной из главных задач физического проектирования базы данных является обеспечение эффективного хранения данных. Задача состоит в использовании эффективной структуры хранения данных на внешнем устройстве, которая обеспечивает быструю загрузку базы данных, а затем ее преобразование в структуру, более подходящую для повседневной эксплуатации. Если целевая СУБД не позволяет выбрать определенную файловую организацию, этот этап может быть пропущен.

Последовательные (неупорядоченные) файлы

Последовательный файл является наиболее удобной структурой для хранения данных в следующих случаях.

  1. Данные загружаются в таблицу крупными блоками.

  2. Весь файл таблицы занимает всего несколько страниц.

  3. При каждом обращении к таблице выборке подлежат все ее строки (в любом порядке).

  4. Таблица имеет дополнительные структуры поиска, например индекс по ключу.

Файлы последовательной организации неэффективны, если доступ выполняется только к некоторым строкам таблицы.

Хешированные файлы

Применение хешированного файла в качестве структуры организации памяти для таблицы целесообразно в тех случаях, когда выбор строк осуществляется по точному значению поля, использованного для хеширования, особенно если доступ к строкам происходит случайный образом.

Хешированные файлы не рекомендуется использовать в следующих случаях.

  1. Выборка строк из таблицы осуществляется путем сопоставления с шаблоном ключа хешированного поля.

  2. Выборка строк из таблицы осуществляется по заданному диапазону значений поля, которое входит в значение поля хеширования.

  3. Выборка строк из таблицы осуществляется по значению поля, отличного от поля хеширования.

  4. Доступ к строкам необходимо выполнять только по части поля хеширования.

  5. Часто происходит обновление поля хеширования.

Индексно-последовательные файлы

По сравнению с хешированием метод ISAM представляет собой более гибкую структуру хранения данных. Он поддерживает выборку данных по точному совпадению значения ключа, по шаблону подстановки, по диапазону значений и по части основного ключа. Однако структура индекса файла ISAM остается неизменной после ее формирования при создании самого файла. Поэтому производительность доступа к данным файла ISAM снижается по мере обновления его данных.

Сбалансированные деревья

Индекс сбалансированных деревьев является динамическим, увеличивающимся по мере роста файла таблицы. Благодаря этому, в отличие от файлов ISAM, эффективность доступа в сбалансированных деревьях не снижается по мере обновления данных таблицы. Файлы структуры В+-Тгее постоянно сохраняют упорядоченность доступа по ключу, даже при обновлении их данных.

Кластеризованные таблицы

Необходимость использования кластеризованных таблиц обусловлена тем, как происходит доступ к таблицам, объединенным в кластер. Такая информация может быть получена на основе предварительного анализа транзакций. Но следует учитывать, что необоснованное решение по объединению таблиц в кластер может привести к снижению производительности. Кластеры представляют собой группы из одной или нескольких таблиц, которые физически хранятся вместе, поскольку имеют общие столбцы и часто используются одновременно. При совместном физическом хранении взаимосвязанных строк сокращается время доступа к диску.