Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Российская таможенная академия

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Конспект лекций СиАОД.docx

Скачиваний:

Добавлен:

01.03.2025

Размер:

4.62 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 2010 11 12 13 14 15 16 17 18 19 20 > Следующая >>>

Словари, основанные на хеш-таблицах

Элемент с ключом k записывается в позицию номер h(k) в хеш-таблице (hash table) T[0..m-1],

где h:U  {0, 1, …, m-1} – хеш-функция.

Коллизия – совпадение хеш-значений двух разных ключей.

Разрешение коллизий:

с помощью цепочек (открытое хеширование);
открытая адресация (закрытое хеширование).

Анализ хеширования с цепочками

(открытое хеширование)

Пусть T – хеш-таблица с m позициями, в которую занесено n элементов/

Коэффициент заполнения таблицы α = n / m

Худший случай – θ (n)

Средняя стоимость поиска

Гипотеза равномерного хеширования – предполагаем, что каждый данный элемент может попасть в любую из позиций таблицы с равной вероятностью, независимо от того, куда попал другой элемент.

Теорема 1. Пусть T - хеш-таблица с цепочками, имеющая коэффициент заполнения α. Предположим, что хеширование равномерно. Тогда при поиске элемента, отсутствующего в таблице, будет просмотрено в среднем α элементов таблицы, а среднее время такого поиска (включая время на вычисление хеш-функции) будет равно θ (1+ α)

Теорема 2. При равномерном хешировании среднее время успешного поиска в хеш-таблице с цепочками есть θ (1+ α), где α - коэффициент заполнения.

Ключи как натуральные числа

Хеш – функции

Деление с остатком

h(k) = k mod m

Умножение

Универсальное хеширование

Открытая адресация

(Закрытое хеширование)

Все записи хранятся в самой хэш-таблице. Каждая ячейка таблицы содержит либо элемент динамического множества, либо NIL.

h:U × {0, 1, …, m-1}  {0, 1, …, m-1}

Последовательность испробованных мест для данного ключа k имеет вид

‹h(k,0), h(k,1), . . . , h(k,m-1)›

Функция h должна быть такой, чтобы каждое из чисел от 0 до m - 1 встретилось в этой последовательности ровно один раз.

Пусть h’:U  {0, 1, …, m-1} – обычная хеш-функция.

Линейная последовательность проб

h(k,i) = (h’(k) + i) mod m

Квадратичная последовательность проб

h(k,i) = (h’(k) +с₁i + c₂i² ) mod m

Двойное хеширование

h(k,i) = (h’₁(k) +i h’₂(k) ) mod m

Анализ хеширования с открытой адресацией

Теорема 3. Математическое ожидание числа проб при поиске в таблице с открытой адресацией отсутствующего в ней элемента не превосходит 1/(1- α ) (хеширование предполагается равномерным)

Теорема 4. Математическое ожидание числа проб при успешном поиске элемента в таблице с открытой адресацией 1/ α * ln (1/(1- α ) )

Поиск слова в тексте

Нечисленный алгоритм

Поиск слова в тексте

Текст хранится в виде последовательности литер. Необходимо отыскать в нем первое появление определенного «слова», которое можно определить как последовательность литер не длиннее самого текста.

текст: array[0..m-1] of character

слово: array[0..n-1] of character

i:=0; j:=0;

while (i < n) and (j < m – n) do

begin

i:=0;

while (i < n) and (слово[i]= текст[j+i]) do i:=i+1;

if i< n then j:= j+1;

end

Утверждения