1.2.3Хэш-функции и хэш-адресация

1.2.3.1.Принципы работы хэш-функций

Логарифмическая зависимость времени поиска и времени заполнения таблицы идентификаторов — это самый хороший результат, которого можно достичь за счет применения различных методов организации таблиц. Однако в реальных исходных программах количество идентификаторов столь велико, что даже логарифмическую зависимость времени поиска от их числа нельзя признать удовлетворительной. Необходимы более эффективные методы поиска информации в таблице идентификаторов.

Лучших результатов можно достичь, если применить методы, связанные с использованием хэш-функций и хеш-адресации.

Хэш-функцией F называется некоторое отображение множества входных элементов R на множество целых неотрицательных чисел Z: F(r) = n, r R, n  Z. Сам термин «хэш-функция» происходит от английского термина «hash function» (hash — «мешать», «смешивать», «путать»). Вместо термина «хеширование» иногда используются термины «рандомизация», «переупорядочивание».

Множество допустимых входных элементов R называется областью определения хэш-функции. Множеством значений хэш-функций F называется подмножество М из множества целых неотрицательных чисел Z: MZ, содержащее все возможные значения, возвращаемые функцией F: rR: F(r) M. Процесс отображения области определения хэш-функции на множество значений называется «хешированием».

При работе с таблицей идентификаторов хэш-функция должна выполнять отображение имен идентификаторов на множество целых неотрицательных чисел.

Областью определения хэш-функции будет множество всех возможных имен идентификаторов.

Хеш-адресация заключается в использовании значения, возвращаемого хэш-функцией, в качестве адреса ячейки из некоторого массива данных. Тогда размер массива данных должен соответствовать области значений используемой хэш-функции. Следовательно, в реальном компиляторе область значений хэш-функции никак не должна превышать размер доступного адресного пространства компьютера.

Метод организации таблиц идентификаторов, основанный на использовании хеш-адресации, заключается в размещении каждого элемента таблицы в ячейке, адрес которой возвращает хэш-функция, вычисленная для этого элемента. Тогда в идеальном случае для размещения любого элемента в таблице идентификаторов достаточно только вычислить его хэш-функцию и обратиться к нужной ячейке массива данных. Для поиска элемента в таблице необходимо вычислить хэш-функцию для искомого элемента и проверить, не является ли заданная ею ячейка массива пустой (если она не пуста — элемент найден, если пуста — не найден).

На рис. 13.3 проиллюстрирован метод организации таблиц идентификаторов с использованием хеш-адресации. Трем различным идентификаторам А₁, А₂, А₃ соответствуют на рисунке три значения хэш-функции n₁, n₂, n₃. В ячейки, адресуемые n₁, n₂, n₃, помещается информация об идентификаторах А₁, А₂, А₃. При поиске идентификатора А₃ вычисляется значение адреса n₃ и выбираются данные из соответствующей ячейки таблицы.

Рис. 13.3. Организация таблицы идентификаторов с использованием хеш-адресации

Этот метод весьма эффективен — как время размещения элемента в таблице, так и время его поиска определяются только временем, затрачиваемым на вычисление хэш-функции, которое в общем случае несопоставимо меньше времени, необходимого на многократные сравнения элементов таблицы.

Метод имеет два очевидных недостатка. Первый из них — неэффективное использование объема памяти под таблицу идентификаторов: размер массива для ее хранения должен соответствовать области значений хэш-функции, в то время как реально хранимых в таблице идентификаторов может быть существенно меньше. Второй недостаток — необходимость соответствующего разумного выбора хэш-функции. Этому существенному вопросу посвящены следующие два подраздела.

<<< < Предыдущая 1 2 3 4 5 6 78 / 138 9 10 11 12 13 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
22.02.2015145.41 Кб15Основные подходы к управлению персоналом.doc
#
18.12.2018918.02 Кб20Основные понятия и определения БЖД.doc
#
11.07.201961.44 Кб6Основные права личности2.doc
#
01.07.2025100.35 Кб0Основные правила.doc
#
22.02.2015193.54 Кб65Основные приемы черчения.doc
#
01.05.2025255.49 Кб1Основные принципы построения трансляторов_лекци...doc
#
22.02.2015118.27 Кб35Основные трудности понимания речи на слух.doc
#
09.12.2018110.08 Кб11Основные условия развития творческого мышления.doc
#
22.02.201536.39 Кб35Основные учения философии.docx
#
01.07.2025122.88 Кб0Основные этапы разработки упр.решений.doc
#
01.07.2025289.79 Кб0Основой Новой Энерго-метрологической экономики...doc