Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие 700363.doc
Скачиваний:
16
Добавлен:
01.05.2022
Размер:
3.69 Mб
Скачать

Хэширование, хэш-функции и хэш-очереди

Если в системе используется дисковый кэш, то при получении от программы запроса на дисковую операцию, операционная система в первую очередь должна проверить, не сопоставлен ли какой-либо блок дискового кэша с требуемым дисковым блоком.

Для этого необходимо последовательно просматривать список блоков дискового кэша, пока не будет найден нужный блок, или пока список не будет исчерпан. Очевидно, что если системный дисковый кэш содержит несколько десятков тысяч блоков, то такой просмотр кэша становится очень дорогостоящей операцией, существенно снижающей реальную эффективность дискового кэша.

Использование упорядоченного списка или бинарного дерева в данном случае то же нецелесообразно, т.к. хотя упорядоченный список и позволяет быстро найти нужный элемент, вставка нового элемента в такой список оказывается слишком сложной.

Наиболее простым и весьма эффективным решением в данной ситуации является использование хэш-очередей.

В первую очередь, для реализации хэширования необходимо определить хэш-функцию следующего вида (0).

( 0 )

где - идентификатор элемента, например, в нашем случае может быть номером дискового блока; - целое число, попадающее в непрерывный интервал .

К хэш-функции предъявляются следующие требования:

  1. функция должна быть легко вычислима на данном типе компьютера;

  2. при последовательном переборе всех возможных аргументов хэш-функции , возвращаемые значения должны примерно равномерно распределяться в диапазоне ;

  3. функция должна обеспечивать однозначное отображение , обратное же отображение может не быть однозначным.

Если - это номера дисковых блоков, то в качестве хорошей хэш-функции может быть использован остаток от деления на . Действительно, остаток от деления легко вычисляется практически на всех типах процессоров, и при этом обеспечивается требуемая равномерность распределения результата в диапазоне .

Сущность хэширования состоит в следующем1. Вместо одного линейного списка элементов, поддерживается независимых списков, которые называются хэш-очередями. Новый элемент с идентификатором включатся в хэш-очередь номер . При этом один и тот же элемент может попасть только в одну из хэш-очередей, т.к. отображение является однозначным, но в одну и ту же хэш-очередь могут быть отображены различные элементы.

Если хэш-функция обеспечивает равномерное распределение элементов по хэш-очередям, то при поиске элемента потребуется просмотреть в среднем в раз меньше элементов, чем при использовании линейной очереди. При достаточно большом числе , время поиска становится вполне приемлемым, а сложность реализации и расход памяти на хранение данных практически не возрастают.

На рис. 43 показан пример хэширования последовательности 1, 7, 12, 15, 38, 31, при и при использовании в качестве хэш-функции остатка от деления.

Как уже отмечалось, блок дискового кэша может одновременно включаться в две очереди: хэш-очередь и очередь свободных блоков кэша. Кроме того, для проверки соответствия дискового блока и блока дискового кэша, необходим идентификатор, в качестве которого наиболее удобно использовать номер дискового блока. Кроме того, необходимы битовые флаги для отслеживания состояния блока дискового кэша.

Рис.43. Пример структуры хэш-очередей