
- •Введение
- •Основные понятия и определения
- •Типы данных
- •1.1.1. Понятие типа данных
- •1.2.2. Внутреннее представление базовых типов в оперативной памяти
- •1.2.2. Внутреннее представление структурированных типов данных
- •1.2.3. Статическое и динамическое выделение памяти
- •Абстрактные типы данных (атд)
- •Понятие атд
- •1.2.2. Спецификация и реализация атд
- •Структуры данных
- •1.3.1. Понятие структуры данных
- •1.3.2. Структуры хранения — непрерывная и ссылочная
- •1.4.3. Классификация структур данных
- •Алгоритмы
- •1.4.1. Понятие алгоритма
- •1.4.2. Способы записи алгоритмов.
- •1.4.3. Введение в анализ алгоритмов Вычислительные модели
- •Задача анализа алгоритмов
- •Время работы алгоритма
- •Время выполнения в худшем и среднем случае
- •1.4.3. Введение в рекурсию
- •Первые примеры
- •1.5.1. Введение в «длинную» арифметику
- •1.5.2. Рекурсия
- •1.5.3. Поразрядные операции. Реализация атд «Множество»
- •2. Линейные структуры данных
- •2.1. Атд "Стек", "Очередь", "Дек"
- •2.2. Реализация стеков
- •2.2.1. Непрерывная реализация стека с помощью массива
- •2.2.2. Ссылочная реализация стека в динамической памяти
- •2.2.3. Примеры программ с использованием стеков
- •2.3. Реализация очередей
- •2.3.2. Непрерывная реализация очереди с помощью массива
- •2.3.2. Ссылочная реализация очереди в динамической памяти
- •2.3.3. Ссылочная реализация очереди с помощью циклического списка
- •2.3.4. Очереди с приоритетами
- •2.3.5. Пример программы с использованием очереди
- •2.4. Списки как абстрактные типы данных
- •2.4.1. Модель списка с выделенным текущим элементом
- •2.4.2. Однонаправленный список (список л1)
- •2.4.3. Двунаправленный список (список л2)
- •2.4.4. Циклический (кольцевой) список
- •2.5. Реализация списков с выделенным текущим элементом
- •2.5.1. Однонаправленные списки Ссылочная реализация в динамической памяти на основе указателей
- •2.5.2. Двусвязные списки
- •2.5.3. Кольцевые списки
- •2.5.4. Примеры программ, использующих списки Очередь с приоритетами на основе линейного списка
- •Задача Иосифа (удаление из кольцевого списка)
- •2.6. Рекурсивная обработка линейных списков
- •2.6.1. Модель списка при рекурсивном подходе
- •2.6.2. Реализация линейного списка при рекурсивном подходе
- •3. Иерархические структуры данных
- •3.1. Иерархические списки
- •3.1.1 Иерархические списки как атд
- •3.1.2. Реализация иерархических списков
- •3.2. Деревья и леса
- •3.2.1. Определения
- •3.2. Способы представления деревьев
- •3.2.3. Терминология деревьев
- •3.2.4. Упорядоченные деревья и леса. Связь с иерархическими списками
- •3.3. Бинарные деревья
- •3.3.1. Определение. Представления бинарных деревьев
- •3.3.2. Математические свойства бинарных деревьев
- •3.4. Соответствие между упорядоченным лесом и бинарным деревом
- •3.5. Бинарные деревья как атд
- •3.6. Ссылочная реализация бинарных деревьев
- •3.6.1. Ссылочная реализация бинарного дерева на основе указателей
- •3.6.2. Ссылочная реализация на основе массива
- •3.6.3. Пример — построение дерева турнира
- •3.7. Обходы бинарных деревьев и леса
- •3.7.1. Понятие обхода. Виды обходов
- •3.7.2. Рекурсивные функции обхода бинарных деревьев
- •3.7.3. Нерекурсивные функции обхода бинарных деревьев
- •3.7.4. Обходы леса
- •3.7.5. Прошитые деревья
- •3.8. Применения деревьев
- •3.8.1. Дерево-формула
- •3.8.2. Задача сжатия информации. Коды Хаффмана
- •4. Сортировка и родственные задачи
- •4.1. Общие сведения
- •4.1.1. Постановка задачи
- •4.1.2. Характеристики и классификация алгоритмов сортировки
- •4.2. Простые методы сортировки
- •4.2.1. Сортировка выбором
- •4.2.2. Сортировка алгоритмом пузырька
- •4.2.3.Сортировка простыми вставками.
- •4.3. Быстрые способы сортировки, основанные на сравнении
- •4.3.1. Сортировка упорядоченным бинарным деревом
- •Анализ алгоритма сортировки бинарным деревом поиска
- •4.3.2. Пирамидальная сортировка
- •Первая фаза сортировки пирамидой
- •Вторая фаза сортировки пирамидой
- •Анализ алгоритма сортировки пирамидой
- •Реализация очереди с приоритетами на базе пирамиды
- •4.3.2. Сортировка слиянием
- •Анализ алгоритма сортировки слиянием
- •4.3.3. Быстрая сортировка Хоара
- •Анализ алгоритма быстрой сортировки
- •4.3.4. Сортировка Шелла
- •4.3.5. Нижняя оценка для алгоритмов сортировки, основанных на сравнениях
- •4.4. Сортировка за линейное время
- •4.4.1. Сортировка подсчетом
- •4.4.2. Распределяющая сортировка от младшего разряда к старшему
- •4.4.3. Распределяющая сортировка от старшего разряда к младшему
- •5. Структуры и алгоритмы для поиска данных
- •5.1. Общие сведения
- •5.1.1. Постановка задачи поиска
- •5.1.2. Структуры для поддержки поиска
- •5.1.3. Соглашения по программному интерфейсу
- •5.2. Последовательный (линейный) поиск
- •5.3. Бинарный поиск в упорядоченном массиве
- •5.4. Бинарные деревья поиска
- •5.4.1. Анализ алгоритмов поиска, вставки и удаления Поиск
- •Вставка
- •Удаление
- •5.4.3. Реализация бинарного дерева поиска
- •5.5. Сбалансированные деревья
- •Определение и свойства авл-деревьев
- •Вращения
- •Алгоритмы вставки и удаления
- •Реализация рекурсивного алгоритма вставки в авл-дерево
- •5.5.2. Сильноветвящиеся деревья
- •Бинарные представления сильноветвящихся деревьев
- •5.5.3. Рандомизированные деревья поиска
- •5.6. Структуры данных, основанные на хеш-таблицах
- •5.6.2. Выбор хеш-функций и оценка их эффективности
- •Модульное хеширование (метод деления)
- •Мультипликативный метод
- •Метод середины квадрата
- •5.6.2. Метод цепочек
- •5.6.3. Хеширование с открытой адресацией
- •5.6.4. Пример решения задачи поиска с использованием хеш-таблицы
3.2.3. Терминология деревьев
В предыдущих разделах уже были введены основные термины, касающиеся деревьев. Учитывая важность темы, рассмотрим этот вопрос подробно.
Стандартная терминология деревьев происходит от генеалогических деревьев. Каждый узел (элемент дерева) является родителем (parent) корней его поддеревьев, а сами корни называются братьями, а также детьми (child) или сыновьями своего родителя. Узлы, которые или являются детьми данного узла, или являются детьми его детей, называются потомками данного узла. И наоборот, родитель узла, а также родители родителей называются предками узла. Корень является общим предком всех узлов дерева. Сыновья узла иногда называются его непосредственными (истинными) потомками, а родитель — истинным предком.
Узел, не имеющий детей, называется листом или внешним узлом (leaf, external node). Остальные узлы являются внутренними (internal). Количество детей (непосредственных потомков) узла называется его степенью. Листья имеют степень ноль. Если максимальная степень узлов дерева больше двух, то такие деревья называют сильно ветвящимися.
Путем (path) из узла n1 в узел nk называется последовательность узлов n1. n2, ..., nk, где для всех i ( 1 i< k) узел ni, является родителем узла ni+1. Длиной пути называется число, на единицу меньшее числа узлов, составляющих этот путь (или равное количеству линий связи). Например, на рис. 3.2 путем из узла d в узел k будет являться последовательность d f k. Длина такого пути равна двум (две связи).
Основное свойство корневых деревьев — путь от корня до любого узла всегда существует и является единственным. Это свойство вытекает из того факта, что в иерархических структурах каждый узел всегда имеет только одного родителя (одну линию связи с родительским узлом), а значит, и единственный путь до корня дерева.
Высотой (height) узла дерева называется длина самого длинного пути из этого узла до какого-либо листа. Высота дерева совпадает с высотой корня.
Уровень узла (level) определяется как длина пути от корня до этого узла. Корень имеет уровень ноль. Все братья имеют один и тот же уровень, который на единицу больше уровня их отца. Например, на рис. 3.2 братья a, b и c имеют уровень 1, а сыновья узла с (братья e,f и g) имеют уровень 2. Высота дерева на рис.3.2 равна трем.
3.2.4. Упорядоченные деревья и леса. Связь с иерархическими списками
Упорядоченное (ordered) дерево — дерево, у которого относительный порядок сыновей (поддеревьев) имеет значение. Обычно сыновья упорядочиваются слева направо. Поэтому два дерева на рисунке 3.4. различны, так как порядок сыновей узла а различен.
Рис. 3.4. Два различных упорядоченных дерева
Если порядок сыновей игнорируется, то такое дерево называется неупорядоченным. В большинстве алгоритмов используются упорядоченные деревья, очевидно, это объясняется тем, что расположение данных в памяти компьютера всегда имеет определенный порядок.
Если дерево является упорядоченным, то и каждый лес, являющийся частью этого дерева, также является упорядоченным. Упорядоченный лес можно рассматривать как линейный список деревьев, в котором можно четко выделить первое дерево (оно расположено слева от всех своих братьев), второе и т. д. Аналогично списку, в частном случае упорядоченный лес может не содержать ни одного дерева (быть пустым) или содержать одно единственное дерево.
Такое представление упорядоченного леса позволяет рассматривать упорядоченные леса (и деревья) как одну из разновидностей иерархических списков (вспомним определение иерархического списка). Однако иерархические списки считаются более универсальной структурой данных [8]:
несколько иерархических списков может пересекаться (т. е. иметь одинаковые подсписки);
иерархические списки могут даже быть рекурсивными (т. е. содержать ссылки на самих себя).
Такие возможности не противоречат определению иерархического списка, но не допустимы для деревьев исходя из их определения. Другими словами, для каждого дерева существует эквивалентная структура иерархического списка, однако есть иерархические списки, которые не соответствуют никакой древовидной структуре.
Примечание
Строго говоря, иерархические списки, которые пересекаются или содержат ссылку на самих себя, уже нельзя отнести к иерархическим структурам данных, правильнее назвать их многосвязными структурами. В фундаментальной работе [8] они рассматриваются именно как многосвязные структуры и называются Списками (с заглавной буквы). В реальных задачах такие нетривиальные случаи встречаются редко, поэтому термин «иерархические списки» — достаточно устоявшееся название подобных структур данных.
Далее рассмотрим еще один вид деревьев — бинарные.