
- •1.1. Элементарные данные
- •1.1.1. Данные числовых типов
- •1.1.1.1. Данные целочисленного типа
- •1.1.1.2. Данные вещественного типа
- •1.1.2. Данные символьного типа
- •1.1.3. Данные логического типа
- •1.1.4. Данные типа указатель
- •1.2. Линейные структуры данных
- •1.2.1. Массив
- •1.2.2. Строка
- •1.2.3. Запись
- •1.2.4. Множество
- •1.2.5. Таблица
- •1.2.6. Линейные списки
- •1.2.6.2. Линейный двунаправленный список
- •1.2.7. Циклические списки
- •1.2.8. Разреженные матрицы
- •1.2.9. Стек
- •1.2.10. Очередь
- •1.3. Нелинейные структуры данных
- •1.3.1. Мультисписки
- •1.3.2. Слоеные списки
- •1.3.3. Графы
- •1.3.3.1. Спецификация
- •1.3.3.2. Реализация
- •1.3.4. Деревья 1.3.4.1. Общие понятия
- •1.3.4.2. Обходы деревьев
- •1.3.4.3. Спецификация двоичных деревьев
- •1.3.4.4. Реализация
- •1.3.4.5. Основные операции
- •1.4. Файлы
- •1.4.1. Организация
- •1.4.2.2. Основные операции
- •1.4.2.3. Общая оценка b-деревьев
1.4.2.3. Общая оценка b-деревьев
Итак, как говорилось ранее, у B-деревьев есть своя сфера применения: хранение настолько больших массивов информации, что их невозможно целиком разместить в выделяемой оперативной памяти, но требуется обеспечить быстрый доступ к ним. В таких случаях B-деревья являются хорошим средством программно ускорить доступ к данным.
Ярким примером практического применения B-деревьев является файловая система NTFS, где B-деревья применяются для ускорения поиска имен в каталогах. Если сравнить скорость поиска в этой файловой системе и в обычной FAT на примере поиска на жестком диске большого объема или в каталоге, содержащем очень много файлов, то можно
76
будет констатировать превосходство NTFS. Поиск файла в каталоге всегда предшествует запуску программы или открытию документа.
B-деревья обладают прекрасным качеством: во всех трех операциях над данными (поиск/удаление/добавление) они обеспечивают сложность порядка O(h), где h – глубина дерева. Это значит, что чем больше узлов в дереве и чем сильнее дерево ветвится, тем меньшую часть узлов надо будет просмотреть, чтобы найти нужный элемент. Попробуем оценить зависимость временной сложности операций T(h) от высоты дерева h.
Число элементов в вершине есть величина вероятностная с постоянным математическим ожиданием MK. Математическое ожидание числа вершин равно n/MK ~ n, где n – число элементов, хранимых в B-дереве. Это дает сложность T(h) ~ O(log n), а это очень хороший результат.
Поскольку вершины могут заполняться не полностью (иметь менее NumberOfItems элементов), то можно говорить о коэффициенте использования памяти. Существуют доказательства, что память будет использоваться в среднем на ln2·100% ≈ 69,3%.
В отличие от сбалансированных деревьев, которые рассматриваются далее, B-деревья растут не вниз, а вверх. Поэтому (и из-за разной структуры узлов) алгоритмы включения или удаления принципиально различны, хотя цель их в обоих случаях одна – поддерживать сбалансированность дерева.
Идея внешнего поиска с использованием техники B-деревьев была предложена в 1970 году Р. Бэйером и Э. Мак-Крэйтом и независимо от них примерно в то же время М. Кауфманом. Естественно, что за это время было предложено ряд усовершенствований B-деревьев, связанных с увеличением коэффициента использования памяти и уменьшением общего количества расщеплений.
Одно из таких усовершенствований было предложено Р. Бэйером и Э. Мак-Крэйтом и заключалось в следующем. Если вершина дерева переполнена, то прежде чем расщеплять эту вершину, следует посмотреть, нельзя ли «перелить» часть элементов соседям слева и справа. При использовании такой методики уменьшается общее количество расщеплений и увеличивается коэффициент использования памяти.
77