Опишите метод доступа – хеширование. В чем состоит проблема синонимов.

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Томский Государственный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Ответы Bd_Ekzamen.doc

Скачиваний:

Добавлен:

01.07.2025

Размер:

1.44 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1617 / 2417 18 19 20 21 22 23 24 > Следующая >>>

Опишите метод доступа – хеширование. В чем состоит проблема синонимов.

Общей идеей методов хэширования является применение к значению ключа некоторой

функции свертки (Хэш-функции), вырабатывающей значение меньшего размера. Свертка

значения ключа затем используется для доступа к записи. В самом простом случае свертка

ключа используется как адрес в таблице, содержащей ключи и записи.

В реальности записи файла разделяются между участками, каждый из которых

содержит один или несколько блоков памяти. В этом случае хеширование обеспечивает

прямую адресацию записи путем преобразования значения первичного ключа в абсолютный

или относительный адрес участка.

Пусть v есть значение ключа записи и h – Хеш-функция. Тогда h (v) - адрес участка, в котором должна находиться искомая запись (в том случае, если она присутствует вообще). Общая схема организации хешированного файла представлена на рис.26.

Проблема синонимов

при реализации Хеш-функции отношения 1:1 между значениями ключей и номерами участков размер справочника участков становиться неприемлемо большим, а величина самих участков неприемлемо малой=>к нерациональному расходу памяти.

Реальным выходом из этой ситуации является принятие соглашения, при котором в общем случае Хеш-функции осуществляет отображение типа 1:M; однако в этом случае фиксируется эффект возникновения синонимов, когда записи с различными значениями ключей направляются для хранения в один участок, что приводит, в конечном счете, к различной степени загруженности участков.

И, если при использовании связанной последовательной организации блоков внутри участков (именно такая организация представлена на рис.26.) наличие синонимов приводит, в основном, только к различию во времени поиска в пределах отдельных участков, то при использовании физически последовательной организации могут возникнуть дополнительные проблемы, связанные с необходимостью введения области переполнения (рис.27.).

Очевидно, что возникновение слишком большого количества цепочек переполнения ведет к потере главное преимущества хэширования - доступа к записи практически всегда за одно обращение. Переход на использование новой хэш-функции (со значением свертки большего размера) требует перестройки всех участков основного файла, что в случае баз данных являются абсолютно неприемлемым. Поэтому обычно вводят промежуточные таблицы-справочники, содержащие значения ключей и адреса записей, а сами записи хранятся отдельно. Тогда при переполнении справочника требуется только его переделка, что вызывает меньше накладных расходов.

Замечание. Конечно, структура самой области переполнения может быть связанной последовательной или физически последовательной.

Group 280

Опишите метод доступа с полным индексом и индексно-последовательный метод доступа. Сравните эти методы. В чем достоинства и недостатки каждого из них.

Метод доступа с полным (плотным) индексом (или индексно-произвольный метод)

представляет собой такую организацию файла, при которой для каждого экземпляра записи в

файле предусмотрен соответствующий элемент индекса (рис. 28.). Этот элемент включает

значение ключа записи и указатель на блок, содержащий искомую запись. Обычно для

ускорения поиска в индексе его элементы упорядочиваются.

Достоинством данного метода доступа является произвольное расположение записей

данных в основном файле, что обеспечивает их физическую независимость при хранении.

Основной недостаток проявляется в тех случаях, когда:

1. Выдается оператор выборки всех или большинства записей, и при этом требуется

упорядочивание полученных данных.

2. Сложность процесса обновления основного файла, особенно при добавлении в него

новых записей (требуется перестройка индекса).

Доступ с неплотным индексом (индексно-последовательный метод доступа) строится на

основе физически упорядоченного по возрастанию значения ключей последовательного файла

и совокупности пронумерованных индексных элементов (индексе), каждый из которых

содержит ключ подобно записям основного файла; элементы в индексе упорядочиваются по

возрастанию значений ключей. Значение ключа в индексном элементе представляет

наибольший (или наименьший) из значений ключей записей, входящих в блок основного

файла с номером, совпадающим с номером индексного элемента.

Алгоритм поиска при данной организации файла очевиден и включает два этапа:

Поиск в индексе элемента, указывающего на блок, в котором должна находиться искомая запись, используя максимальное (или минимальное) значение ключей записей, размещенных в блоках основного файла.
Последовательный просмотр записей найденного блока.

Таким образом, к записям индексно-последовательного файла с помощью индекса осуществляется прямой доступ к блоку (странице), включающему требуемую запись, и последовательный доступ в соответствии с упорядоченностью записей по этому ключу индексирования.

Использование индексно-последовательной организации наиболее эффективно, когда модификация исходного файла не предполагает его расширения. В противном случае, как праавило, необходимо введение области переполнения, существование которой принципиально ломает простоту алгоритм поиска, присущую индексно-последоватльному методу доступа

Сравнение метода полного индекса с индексно-последовательной организацией

В методе полного индекса не предусмотрена обработка переполнения; вместо этого всякий раз при включении новой записи в основной файл выполняется переупорядочивание индекса.
При отсутствии переполнения поиск всех записей в обоих методах имеют одинаковую производительность.
В обоих методах достаточно эффективно выполняется операция поиска записей с уникальными ключами.
Вследствие физически последовательного размещения записей операции типа ПОЛУЧИТЬ СЛЕДУЮЩУЮ и ПОЛУЧИТЬ ПРЕДЫДУЩУЮ выполняются гораздо эффективнее в методе неплотного индекса.
Добавление, а так же изменение значений первичных ключей в основном файле в обоих методах трудоемко, поскольку, как правило, влечет обновление индекса.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1617 / 2417 18 19 20 21 22 23 24 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.05.2025124.93 Кб2от Рюрика до Александра III.doc
#
01.03.2025176.64 Кб4от ФилФака Lektsii_po_lexikologii.doc
#
16.09.201961.22 Кб28Ответы (5).docx
#
01.07.2025153.05 Кб0Ответы - Международное право.docx
#
16.04.20191.06 Mб42ОТВЕТЫ 2003.doc
#
01.07.20251.44 Mб2Ответы Bd_Ekzamen.doc
#
16.04.201988.68 Кб22ответы введение в сп от 1203.docx
#
10.09.2019162.3 Кб30ответы гис.doc
#
02.05.2019220.67 Кб21Ответы госы 1-6.doc
#
01.07.2025186.75 Кб0Ответы Гражданское право часть 1 экзамен 2015.docx
#
03.09.201920.89 Кб23Ответы для экзамена.docx

Опишите метод доступа – хеширование. В чем состоит проблема синонимов.

Опишите метод доступа с полным индексом и индексно-последовательный метод доступа. Сравните эти методы. В чем достоинства и недостатки каждого из них.