Расщепление, использующее хеширование методом деления

Идея этого расщепления иллюстрируется рис. 1. Мы предполагаем, что F хешируется методом деления h0 : c -> R(c,N) , где R(c,N) означает остаток от деления c mod N , и N=100. На рисунке 1.а возникает коллизия в блоке 53. Чтобы решить ее, мы назначаем только для ключей c C53 = h0–1(53) прямой адрес через функцию h1 : c -> R(c,2N).

Рисунок 1.b иллюстрирует ситуацию после перевставок. Благодаря следующему свойству, создается только один новый прямой адрес:

Для каждого c, x , выполняется хотя бы одно из тождеств:

R(c,2x) = R(c,x

(P)

R(c,2x)=R(c,x)+x

Понятно (следуя из P), что для обычного C (N<< card C) и каждого m < N, h1 расщепляет Cm = h-1(m).

Рис.1 (а) – возникает коллизия в блоке m = 53.

(b) – расщепление функцией h₁ разрешает коллизию и избавляет от создания избыточной записи

Более того, всякий новый адрес (мы назовем его перераспределенный адрес) больше, чем N и, если m1 ≠ m2, m1,m2 < N , то соответствующие перераспределенные адреса будут различными. Это значит, что записи всегда переместятся в пустой блок. Если хеширование функцией h1 случайно и b >> 1, то схема Бернулли предполагает, что замена адреса записи нулем или изменение больше, чем (b+1) адресов записей, маловероятно. Большинство коллизий будет, таким образом, решено без создания переполнения, и поэтому разрешение коллизии будет стоить почти всегда только двух дисковых доступов.

Стоит обратить внимание на то, что с таким расщеплением до 2b записей могут иметь тот же самый прямой адрес для функции h0, и каждая из этих записей будет найдена за один доступ. Тогда решается проблема с замедлением доступа, соответствующая b переполнениям в случае классического хеширования. Это свойство – следствие использования пустых блоков, и, таким образом, нет ни одного алгоритма расщепления, предоставляющего единственный перераспределенный адрес, который бы делал это лучше.

Кроме того, пусть m2 будет перераспределенным адресом для m1 , и пусть r1, r2,…,rk будет последовательностью вставок таких, что

h₀(c_k) = m₁
r_k означает, что появилась первая коллизия в m₁ или m₂ после расщепления C_m₁

Если h₁ хеширует случайно, то нет ни одного алгоритма расщепления, создающего только один перераспределенный адрес, который бы давал большее значение k. Снова это оптимальное свойство является результатом использования пустых блоков.

Полное описание

Пусть h_j : c -> R(c,2^jN), j = 0, 1, 2, …

(А)

Пусть С_m_,_j = h_j^-1(m), m < 2^jN. Для расщепления С_m_,_j мы используем h_j₊₁ , которая ограничена С_m_,_j.

Понятно, что расщепление, описанное в (А), выполняет условие (Р). Поэтому все предыдущие свойства, обсуждавшиеся выше, остаются в силе для каждой пары j, j+1.

Описание vh1

Мы описыванием виртуальное хеширование VH1:

предоставляющееся с расщеплением (А)
соответствующее следующим предположениям:

для переполнений используется метод «отдельного формирования цепочки» (“separate chaining” method)
память для блоков m = 2^j^-1N, 2^j^-1N+1,…, 2^jN-1 выделяется при первом расщеплении h_j .
пусть α_max есть некоторый коэффициент загрузки и пусть α_j = x/b2^jN. Мы используем расщепление для разрешения коллизии в блоке, доступным через h_j , только если α_j> α_max . Иначе мы создаем переполнение.

Мы используем отдельное формирование цепочки (“separate chaining” method), потому что это один из лучших классических методов разрешения коллизий (CMR). (2) выбран для простоты такого способа распределения. (3) позволяет нагружать блоки более эффективно, чем если бы мы имели расщепление для любой коллизии. А именно, никакое распределение не выполняется до тех пор, пока коэффициент загрузки уже используемых блоков меньше либо равен α_max . Максимальный индекс j множества используемых h_j будем называть уровнем файла; j – уровень h_j.

<<< < Предыдущая 1 2 34 / 94 5 6 7 8 9 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.04.20252.03 Mб0РГР 2 по Электротехнике 2013 (АТП УИТС).doc
#
15.11.20191.13 Mб5РГР Крив. оконч вар.doc
#
01.03.20251.72 Mб1РГР теплотехника.docx
#
01.05.202533.37 Mб0РГР Тяга поездов НЕстеренко.doc
#
21.11.201880.41 Кб5РГР №1.docx
#
07.12.2018243.68 Кб11РГР №1.docx
#
02.12.20181.68 Mб24РГР1.doc
#
01.05.2025207.87 Кб0РГР_Windows.doc
#
01.03.2025177.03 Кб1реферат 12.4.docx
#
01.03.202561.24 Кб0реферат 17.docx
#
18.03.201669.84 Кб19Реферат История предпринимательства.docx