Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
final шпоры КИТ.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
186.31 Кб
Скачать

81.Оптимизация работы базы данных (индексирование, хеширование, технологии сжатия данных базы).

Индексирование-ср-во ускорения операций поиска записей в таблицах,а также выполнения др. операций,использ. поиск, извлечение,модификация,сортировка и тд.

Индекс – упорядоченное множество значений, анадогичн предметному указателю в книге(упорядоч. множество слов с указателем страниц, где встречается дан слово)

Инд. файл – файл, в котором каждая запись состоит из 2 частей:данных и указателя номера записи.

Данные необходимые для инд. поля из индексир. файла, а указатель для связывания с соотв. Записью индекс. файла.

Индексы следует создавать для следующих типов атрибутов реляц. БД:

-первичн. ключи

-внешние ключи(для ускорения выполнения соединений)

-атрибуты, часто фигурирующие в запросах, отв. на кот. является небольшое множество записей.

Осн преимущ—значит ускорение процессавыборки или извлечен данн, осн недостат—замедлен процесса обновления дан, т.к. при кажд добавлен нов зап в индексир-ный файл потребуется добавить нов индуксн файл. Поэт при выб поля важно знать,кот-й из 2х показат важнее: скорость выборки или скор обработки

Хеширование – технология упорядочения записей и доступа к ним.

Хешированием, или хеш-индексированием называется технология,обеспечивающая быстрый прямой доступ к хранимой записи на основе задан. значения некоторого поля.

В файле может быть любое кол-во индексов.

Суть технологии хеширования состоит в следующем(особенности):

- каждая хранимая запись базы размещ. по адресу, который вычисляется с помощью спец. хеш-функции на основе значения некоторого поля данной записи,называется хеш-полем, а вычисл. адрес.

-для сохранен зап в СУБД снач вычисл-ся хеш-адрес нов зап, после чего прогр-ма управлен дисков пакмятью помещ эту запись по вычисляемому адресу.

-для извлечен нужн зап по задан значен хеш-поля в СУБД снач выч-ся хеш-адр, затем в прогр упр-я дисков памятью посыл-ся запрос на извлечен записи по вычислен адр.

Осн преимущ хеш-ия закл-ся в быстроте дост к данным. Минус—сложность выбора подходящ хеш-функции., возм-сть переполн, недост наполн страниц

Хеширование не лишено сложностей:

-необходимо определить необходимую хеш-функцию

-быстрый прямой доступ возможен только по тому ключу, по которому производиться хеширование

-не возможно сохранить записи с пом. 2-х размюхешир-ия

Основные проблемы хеширования по ключу – переполнение и недостаточное наполнения страниц. На страницу может попасть несколько больше записей, чем она может вместить.

Недостатки:

-физич. последовательность записей внутри хран. файла почти всегда отличается от последовательности ключевого поля.

Сжатие данных:

-сжатие на основе различий

-иерархическое сжатие

-кодирование Хоффмана.

С целью сокращения пространства, необходимого для хра­нения некоторого набора данных, часто используют технологии сжатия. При этом в результате экономится не только простран­ство на диске, но и количество БД и добавит ссылки на каждую таблицу внешней БД

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]