Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1-50.docx
Скачиваний:
3
Добавлен:
23.09.2019
Размер:
1.82 Mб
Скачать

43. Древовидная организация данных.

Древовидной организацией данных (деревом) называется множество записей, расположенных по уровням следующим образом:

• на 1-м уровне расположена только одна запись (корень дерева),

• к любой записи i-ro уровня ведет адрес связи только от одной записи уровня i-1.

В данном определении понятия "дерево" и "уровень" вводятся одновременно. Если записи получат номера уровней, соответствующие определению, то они получат и древовидную

организацию. Количество уровней в дереве называется рангом. Записи дерева, которые адресуются от общей записи (i-l)-ro уровня, образуют группу. Максимальное число элементов в группе называется порядком дерева. Деревья обычно формируются

двунаправленными, адрес связи от записи уровня i+1 к записи i-ro уровня называется обратным. При размещении дерева в памяти ЭВМ каждая запись может занимать произвольное место. В упорядоченном бинарном дереве значение ключевого атрибута

каждой записи должно быть больше, чем значение ключа у любой записи на ее левой ветви, и не меньше, чем ключ любой записи на ее правой ветви. Это определение позволяет также различать левые и правые адреса (ветви). Упорядоченное бинарное дерево формируется из неупорядоченного массива записей по специальному алгоритму. Этот алгоритм создает дерево из первой записи массива, затем - дерево из первых двух записей, из первых трех записей и так далее до исчерпания всех записей массива.

44. Методы ускорения доступа к данным.

Ускорение доступа к данным достигается применением принципиально иных методов размещения информации и ее поиска либо путем создания массивов вспомогательной информации о хранимых данных. Эти же методы необходимы при организации доступа к информации по нескольким ключевым атрибутам одновременно. Доступ к требуемым записям может осуществляться не только путем сравнения искомого значения ключа с ключами записей, извлекаемых из массива по определенному алгоритму (как это было в рассмотренных методах обработки данных), но и в результате вычисления местоположения требуемой записи. Сами записи могут быть упорядочены алгоритмом сортировки либо используется специальная расстановка записей.

45. Адресная функция.

Расстановка записей происходит в соответствии с так называемой адресной функцией (другие общеупотребительные ее названия - "рандомизирующая функция" и "хэш-функция"). Применяемые при этом методы организации данных часто называются методами рандомизации. Адресной функцией называется зависимость i=f(p), где j - номер (адрес) записи; р - значение ключевого атрибута в записи. Адресная функция может вырабатывать одинаковое значение i для значений р, принадлежащих разным записям, которые в этом случае называются синонимами. К функции f предъявляются следующие требования:

• она должна быть задана аналитически и вычисляться достаточно быстро;

• ключевые атрибуты, подчиняющиеся произвольному распределению, функция должна переработать в равномерно распределенные номера записей; это условие обычно соблюдается приближенно;

• число записей-синонимов должно составлять 10-20% от общего числа записей.

Известно достаточно много адресных функций, хорошо соответствующих этим требованиям. Простейшая адресная функция имеет вид: i = p - a , где а - константа.