Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Казанский национальный исследовательский технический университет им. А. Н. Туполева

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Структуры и алгоритмы обработки данных.doc

Скачиваний:

367

Добавлен:

12.03.2015

Размер:

1.81 Mб

Скачать

☆

<<< < Предыдущая 29 30 31 32 33 34 35 36 37 38 39 40 41 4243 / 5343 44 45 46 47 48 49 50 51 52 53 > Следующая >>>

4.2. Разрешение конфликтов: открытое хеширование

Пусть имеется n элементов а₁, а₂, а₃, . . ., а_n , на основе которых требуется построить хеш-таблицу, причем некоторые ключи могут конфликтовать между собой, претендуя на одну и ту же ячейку таблицы. Идея открытого хеширования совершенно прозрачна: связать все элементы с одним и тем же значением хеш-функции во вспомогательный линейный список. Данный метод иногда называют методом цепочек.

Обращаю внимание, что мы еще раз приходим к необходимости использования комбинированной структуры данных – массива указателей. Хеш-таблица как массив записей должна хранить не только ключи элементов, но и по два указателя на начало и конец вспомогательного списка.

индекс	ключ	у а_j,h(а_j)=1 а_t,h(а_t)=1 а_g,h(а_g)=1 казатели
1	а_i h(а_i)=1	начало
		конец
2		nil
		nil
3	а_s h(а_s)=3	nil
		nil
4	а_k h(а_k)=4	н а_r,h(а_r)=4 ачало
		конец
. . . . .	. . . .

m		nil
		nil

Алгоритм построения хеш-таблицы:

находим значение хеш-функции для очередного ключа и по этому значению как индексу входим в таблицу
если данная клетка таблицы пустая, то записываем в нее соответствующий ключ
если ячейка занята, то сравниваем хранящийся там ключ с заданным ключом:
- если ключи совпадают, то каким-то образом обрабатываем повторный ключ (например, просто ничего не выполняем)
- если ключи не совпадают, то добавляем новый ключ в конец списка

Алгоритм поиска в построенной таблице:

находим значение хеш-функции для искомого ключа и по этому значению как индексу входим в таблицу
если ячейка с найденным индексом пустая, то поиск заканчивается неудачей
если ячейка не пустая, то выполняем сравнение ключей:

если ключи совпадают, то поиск заканчивается за одно сравнение
если ключи не совпадают, то организуем просмотр линейного вспомогательного списка с положительным или отрицательным результатом

Пример. Задано 10 целочисленных ключей, на основе которых надо построить хеш-таблицу размерности 5, используя для разрешения конфликтов метод открытого хеширования. Поскольку число исходных элементов n=10 больше размерности таблицы (m=5), то без использования вспомогательных списков таблицу построить нельзя. Набор входных ключей с соответствующими значениями хеш-функции приведены в следующей таблице (использована простейшая хеш-функция):

ключ	33	17	09	04	22	19	42	53	64	25
значение хеш-функции	4	3	5	5	3	5	3	4	5	1

Тогда хеш-таблица будет иметь следующий вид:

индекс	ключ	указатели
1	25	nil
		nil
2		nil
		n 22 42 il
3	17	начало
		конец
4	33	н 53 ачало
		конец
5	09	н 04 19 64 ачало
		конец

Подсчитаем для данного примера среднее число сравнений, которые необходимо сделать для поиска любого из 10 исходных ключей:

ключ 33 – одно сравнение, т.к. он непосредственно находится в ячейке таблицы
ключи 17 и 09 – тоже по одному сравнению
ключ 04 – два сравнения (в ячейке 5 находится ключ 09, идем по списку, совпадение на первом элементе)
ключ 22 – 2 сравнения
ключи 19 и 42 – по 3 сравнения (вторые элементы в списках)
ключ 53 – 2 сравнения
ключ 64 – 4 сравнения
ключ 25 – 1 сравнение

Итого – 20 сравнений, т.е. в среднем 2 сравнения на один ключ.

Из примера видно, что для данного метода большое значение имеет равномерность распределения ключей по хеш-таблице, что гарантирует короткие вспомогательные списки и тем самым уменьшает число сравнений при поиске. Наихудшим является случай, когда для всех ключей хеш-функция дает одно и тоже значение, и все элементы выстраиваются в один длинный линейный список.

Другим фактором, влияющим на эффективность открытого хеширования, является размер хеш-таблицы по отношению к числу входных данных. Если эти величины равны, то теоретически можно обойтись без линейных списков, если между ключами нет конфликтов. На практике рекомендуют выбирать размер хеш-таблицы равным n/2.

<<< < Предыдущая 29 30 31 32 33 34 35 36 37 38 39 40 41 4243 / 5343 44 45 46 47 48 49 50 51 52 53 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.04.2025442.37 Кб0Страхование лекции.doc
#
22.03.2016605.49 Кб24Стрежнева.pdf
#
01.05.202528.02 Кб1СТРЕЛОЧНЫЙ ПЕРЕВОД.docx
#
27.09.201993.25 Кб5Структура философии.docx
#
01.07.20251.75 Mб2Структурный анализ осанки.docx
#
12.03.20151.81 Mб367Структуры и алгоритмы обработки данных.doc
#
12.03.2015835.7 Кб28Сттатистические методы управления качеством.pdf
#
01.05.2025113.17 Mб3СТУДЕНТЛАР ӨЧЕН ТАТАР ТЕЛЕ ӘСБАБЫ переделанная...docx
#
19.12.20186.64 Mб23СУсЧПУ_1201_Ведерников.doc
#
22.07.2019377.85 Кб10СУХТП_Венера.docx
#
01.07.2025137.73 Кб1Схема описания пород.doc