28. Структуры хранения и методы доступа к данным

Индекс – это файл, каждый элемент которого состоит точно из двух значений: значения данных и указателя.

Значением данных является значение некоторого поля индексированного файла, а указатель определяет запись в этом файле, имеющую такое же значение этого же поля. Соответствующее поле индексированного файла называют индексированным полем или ключом индекса.

Фундаментальное преимущество индекса: ускорение поиска. Недостатки: замедляют операции обновления.

Индексы могут использоваться двумя различными способами:1)-последовательный доступ (индекс позволяет упростить выполнение запросов и с применением диапазона значений) 2)-прямой доступ (индекс позволяет также упростить выполнение запросов с применением списка)

Существует также возможность сформировать индекс на основе значений двух или нескольких полей, составляющих единую комбинацию. Индекс на комбинации полей F1,F2,…,Fn может использоваться в качестве таких индексов:1)-на одном поле F1 2)-на комбинации полей F1F2 3)-на комбинации полей F1F2F3

Общее количество индексов, которые требуются для обеспечения полной индексации с помощью указанного способа, не так уж велико, как может показаться на первый взгляд.

Индекс принято называть неплотным – в том случае, если он не содержит по одному элементу для каждой записи индексированного файла. Преимущество неплотного индекса: занимает меньше места по сравнению с соответствующим плотным индексом, т.к. он содержит меньше элементов. Недостаток: нет возможности проводить проверки на наличие данных с применением лишь одного индекса. Любой файл может иметь не больше одного неплотного индекса.

Наиболее широко применяемым и важным типом индекса являются B-деревья. Любое B-дерево представляет собой один из конкретных типов древовидного индекса.

Индекс состоит из двух частей: 1)-последовательный набор представляет собой одноуровневый индекс к фактическим данным 2)-индексный набор, в свою очередь, дает возможность получить быстрый прямой доступ к последовательному набору

Хэширование - обеспечение быстрого прямого доступа к конкретной записи с учетом заданного значения определенного поля. Хэширование отличается от индексации по следующему важному признаку – файл может иметь любое количество индексированных полей, но только одно хэшированное поле. Недостатки: возможность коллизий, по мере увеличения размеров хэшированного файла – увеличивается количество коллизий.

Метод расширяемого хэширования представляет собой изящный вариант основного метода хэширования, позволяющий устранить проблемы хэшировани. В действительности, расширяемое хэширование гарантирует, что количество операций доступа к диску, необходимых для поиска определенной записи, никогда не превышает двух и обчно сводится только к одной операции, независимо от того, какого размера достигает сам файл.

Применение сжатия: 1)-для уменьшения объема памяти, необходимого для хранения определенной коллекции данных 2)-сокращение количества операций ввода-вывода на диске

В основе методов сжатия лежит тот факт, что значения данных почти никогда не бывают полностью случайными и характеризуются определенной степенью предсказуемости

Методы сжатия:1)-дифференциальное 2)-префиксное 3)-суффиксное

-иерархическое сжатие (хранимая иерархическая запись состоит из двух частей: постоянной и переменной.)

-кодирование по Хаффману (основная идея – кодирование отдельных символов битовыми строками различной длины, причем наиболее часто встречающиеся символы кодируются строками наименьшей длины.)

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1516 / 2016 17 18 19 20 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.05.2025180.74 Кб1otraslevaya_ekonomika.doc
#
25.04.2019194.56 Кб4otvety na ekzamenacionnye voprosy po discipline....doc
#
15.08.2019282.62 Кб16otvety-k-ekzamenu-po-tehnologiyam.doc
#
27.09.2019391.68 Кб3otvety.doc
#
18.02.20161.18 Mб85OTVETY.docx
#
01.07.2025101.25 Кб0otvety_DB.docx
#
01.05.2025606.72 Кб0OTVETY_ELEKTROTEKhNIKA.doc
#
18.02.2016379.49 Кб6OTVETY_K_EKZAMENU__33__33__33.pdf
#
01.07.2025190.59 Кб0Otvety_na_teoreticheskie_voprosy_po_Organizatsi...docx
#
01.05.2025450.56 Кб0Otvety_na_voprosy-757.doc
#
01.05.20251.44 Mб3otvety_na_voprosy_po_psikhologii_upravlenija_ww...doc