4. Технологія хеширування.

Є альтернативою технології B-дерева. Загальною ідеєю методів хеширування є застосування до значення ключа деякої функції згортки (хеш-функції), що генерує значення меншого розміру.

Формально під хеш-функцією розуміється результат перетворення даних довільної довжини в бітову послідовність з фіксованою довжиною, яку ще називають згорткою. В подальшому її використовують як для доступу до записів.

Основною вимогою до хеш-функції є:

- стійкість до колізій (два різні набори даних повинні мати різні результати перетворення);

- рівномірний розподіл значення згортки.

Її використання дозволяє на одній індексній сторінці розмістити більше інформації.

Разом з тим хеширування не гарантує відсутності колізій. Для подолання виникаючих конфліктів використовують наступні методи:

-відкритої адресації:

Запис нового рядка виконується не по адресу хеш-функції, а в перше вільне місце. Його недоліком є те, що при наступних записах може трапитись конфлікт з записом, адреса хеш-функції якого була зайнята конфліктним записом. При цьому методі конфлікт ніби відкладається, але насправді це інколи призводить до наростання конфліктності.

-використання зв’язаної області переповнення

При виникнені колізій для записів, що мають однакову функцію згортки створюється т.з. область переповнення, куди поміщаються конфліктуючі записи. При цьому вводиться додаткове поле – покажчик синоніму, що є адресою записів всередині області переповнення. Якщо він дорівнює 0, то це означає відсутність конфлікту.

-багатократного хеширування:

Спосіб вирішення конфліктів, що полягає в використані другої хеш-функції, якщо перша призводить до колізії. Її метою є отримання нової адреси хешируваня, яка б дозволила б уникнути конфлікту. Вона використовується для розміщення записів в області переповнення.

Переліченні вище методи хеширювавання є статичними – в них простір хеш-адрес задається при створені таблиці.

Головним їх обмеженням є фіксований розмір таблиці. Якщо таблиця заповнена занадто повно, то виникне багато послідовностей переповнення, що в свою чергу призводе до втрати головної переваги хешируваня - доступу до запису практично за одне звернення до таблиці.

Розширення таблиці вимагає її повного переоблаштування на основі нової хеш-функції із значенням згортки більшого розміру, що не завжди прийнятно у випадку баз даних.

Для подолання проблеми використовують метод динамічного хеширування:

Хэш-функція при цьому міняється динамічно, у залежності від глибини B-дерева.

Використання методів хеширування для вибірки записів основано на повністю відомому значені хеш-поля (поля, що проіндексовано з використанням індекса на основі алгоритму хеширування). Тому, как правило, хешируваня не підходить для операцій вибірки даних по заданому зразку або діапазону значень.

Більш того, хеширування не підходить для пошуку і вибірки даних по будь якому іншому полю, відмінному від поля хеширування.

Разом з тим, слід відмітити можливість поєднання кращих властивостей методів B-дерева та хеширування.

Основою методу динамічного хеширування є обробка числа, згенерованого хеш-функцією у вигляді послідовності біт, і розподілу записів по сегментам на основі так званої прогресуючої оцифровки (progressive digitization) цієї послідовності. Динамічна хеш-функція генерує значення в широкому діапазоні, а іменно n-бітові двійкові цілі числа, де n, як правило дорівнює 32

<<< < Предыдущая 17 18 19 20 21 22 23 24 25 26 27 28 29 30 3132 / 4132 33 34 35 36 37 38 39 40 41 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.202561.44 Кб0LECTURE 8-9.doc
#
01.04.202596.26 Кб0lecture_usa_2.doc
#
27.08.2019325.63 Кб15Lect_4_verb.doc
#
01.03.20252.38 Mб0Lekcia-Nevidkladna-BGD-4.doc
#
01.03.2025269.82 Кб1Lekcia-Osnovy-BGD-1.doc
#
01.07.20254.87 Mб0Lekcii_OBD.doc
#
30.08.201927.59 Кб1LEKCIJA_4.docx
#
02.05.201979.36 Кб3LEKCIJA_SP_1.doc
#
01.05.20251.82 Mб0Lekciji HISTORY.DOC
#
01.03.20256.07 Mб0Lekciy_SPZ1.doc
#
01.07.2025232.45 Кб0leks.doc