- •Введение
- •Основные понятия и определения
- •Типы данных
- •1.1.1. Понятие типа данных
- •1.2.2. Внутреннее представление базовых типов в оперативной памяти
- •1.2.2. Внутреннее представление структурированных типов данных
- •1.2.3. Статическое и динамическое выделение памяти
- •Абстрактные типы данных (атд)
- •Понятие атд
- •1.2.2. Спецификация и реализация атд
- •Структуры данных
- •1.3.1. Понятие структуры данных
- •1.3.2. Структуры хранения — непрерывная и ссылочная
- •1.4.3. Классификация структур данных
- •Алгоритмы
- •1.4.1. Понятие алгоритма
- •1.4.2. Способы записи алгоритмов.
- •1.4.3. Введение в анализ алгоритмов Вычислительные модели
- •Задача анализа алгоритмов
- •Время работы алгоритма
- •Время выполнения в худшем и среднем случае
- •1.4.3. Введение в рекурсию
- •Первые примеры
- •1.5.1. Введение в «длинную» арифметику
- •1.5.2. Рекурсия
- •1.5.3. Поразрядные операции. Реализация атд «Множество»
- •2. Линейные структуры данных
- •2.1. Атд "Стек", "Очередь", "Дек"
- •2.2. Реализация стеков
- •2.2.1. Непрерывная реализация стека с помощью массива
- •2.2.2. Ссылочная реализация стека в динамической памяти
- •2.2.3. Примеры программ с использованием стеков
- •2.3. Реализация очередей
- •2.3.2. Непрерывная реализация очереди с помощью массива
- •2.3.2. Ссылочная реализация очереди в динамической памяти
- •2.3.3. Ссылочная реализация очереди с помощью циклического списка
- •2.3.4. Очереди с приоритетами
- •2.3.5. Пример программы с использованием очереди
- •2.4. Списки как абстрактные типы данных
- •2.4.1. Модель списка с выделенным текущим элементом
- •2.4.2. Однонаправленный список (список л1)
- •2.4.3. Двунаправленный список (список л2)
- •2.4.4. Циклический (кольцевой) список
- •2.5. Реализация списков с выделенным текущим элементом
- •2.5.1. Однонаправленные списки Ссылочная реализация в динамической памяти на основе указателей
- •2.5.2. Двусвязные списки
- •2.5.3. Кольцевые списки
- •2.5.4. Примеры программ, использующих списки Очередь с приоритетами на основе линейного списка
- •Задача Иосифа (удаление из кольцевого списка)
- •2.6. Рекурсивная обработка линейных списков
- •2.6.1. Модель списка при рекурсивном подходе
- •2.6.2. Реализация линейного списка при рекурсивном подходе
- •3. Иерархические структуры данных
- •3.1. Иерархические списки
- •3.1.1 Иерархические списки как атд
- •3.1.2. Реализация иерархических списков
- •3.2. Деревья и леса
- •3.2.1. Определения
- •3.2. Способы представления деревьев
- •3.2.3. Терминология деревьев
- •3.2.4. Упорядоченные деревья и леса. Связь с иерархическими списками
- •3.3. Бинарные деревья
- •3.3.1. Определение. Представления бинарных деревьев
- •3.3.2. Математические свойства бинарных деревьев
- •3.4. Соответствие между упорядоченным лесом и бинарным деревом
- •3.5. Бинарные деревья как атд
- •3.6. Ссылочная реализация бинарных деревьев
- •3.6.1. Ссылочная реализация бинарного дерева на основе указателей
- •3.6.2. Ссылочная реализация на основе массива
- •3.6.3. Пример — построение дерева турнира
- •3.7. Обходы бинарных деревьев и леса
- •3.7.1. Понятие обхода. Виды обходов
- •3.7.2. Рекурсивные функции обхода бинарных деревьев
- •3.7.3. Нерекурсивные функции обхода бинарных деревьев
- •3.7.4. Обходы леса
- •3.7.5. Прошитые деревья
- •3.8. Применения деревьев
- •3.8.1. Дерево-формула
- •3.8.2. Задача сжатия информации. Коды Хаффмана
- •4. Сортировка и родственные задачи
- •4.1. Общие сведения
- •4.1.1. Постановка задачи
- •4.1.2. Характеристики и классификация алгоритмов сортировки
- •4.2. Простые методы сортировки
- •4.2.1. Сортировка выбором
- •4.2.2. Сортировка алгоритмом пузырька
- •4.2.3.Сортировка простыми вставками.
- •4.3. Быстрые способы сортировки, основанные на сравнении
- •4.3.1. Сортировка упорядоченным бинарным деревом
- •Анализ алгоритма сортировки бинарным деревом поиска
- •4.3.2. Пирамидальная сортировка
- •Первая фаза сортировки пирамидой
- •Вторая фаза сортировки пирамидой
- •Анализ алгоритма сортировки пирамидой
- •Реализация очереди с приоритетами на базе пирамиды
- •4.3.2. Сортировка слиянием
- •Анализ алгоритма сортировки слиянием
- •4.3.3. Быстрая сортировка Хоара
- •Анализ алгоритма быстрой сортировки
- •4.3.4. Сортировка Шелла
- •4.3.5. Нижняя оценка для алгоритмов сортировки, основанных на сравнениях
- •4.4. Сортировка за линейное время
- •4.4.1. Сортировка подсчетом
- •4.4.2. Распределяющая сортировка от младшего разряда к старшему
- •4.4.3. Распределяющая сортировка от старшего разряда к младшему
- •5. Структуры и алгоритмы для поиска данных
- •5.1. Общие сведения
- •5.1.1. Постановка задачи поиска
- •5.1.2. Структуры для поддержки поиска
- •5.1.3. Соглашения по программному интерфейсу
- •5.2. Последовательный (линейный) поиск
- •5.3. Бинарный поиск в упорядоченном массиве
- •5.4. Бинарные деревья поиска
- •5.4.1. Анализ алгоритмов поиска, вставки и удаления Поиск
- •Вставка
- •Удаление
- •5.4.3. Реализация бинарного дерева поиска
- •5.5. Сбалансированные деревья
- •Определение и свойства авл-деревьев
- •Вращения
- •Алгоритмы вставки и удаления
- •Реализация рекурсивного алгоритма вставки в авл-дерево
- •5.5.2. Сильноветвящиеся деревья
- •Бинарные представления сильноветвящихся деревьев
- •5.5.3. Рандомизированные деревья поиска
- •5.6. Структуры данных, основанные на хеш-таблицах
- •5.6.2. Выбор хеш-функций и оценка их эффективности
- •Модульное хеширование (метод деления)
- •Мультипликативный метод
- •Метод середины квадрата
- •5.6.2. Метод цепочек
- •5.6.3. Хеширование с открытой адресацией
- •5.6.4. Пример решения задачи поиска с использованием хеш-таблицы
3. Иерархические структуры данных
В жизни отношения иерархии (иначе, ветвления) встречаются не менее часто, чем линейные отношения соседства. Допустим, в университете несколько факультетов, на каждом факультете несколько специальностей, для каждой специальности имеется несколько студенческих групп, в каждой из них учится не один студент. При этом каждый студент учится только в одной группе, каждая группа принадлежит только одной специальности и т. д. Следовательно, каждого студента можно отыскать, двигаясь от самого верхнего уровня, только одним единственным путем.
Другие примеры — оглавление книги, структура каталогов любого диска и т. д..
Структуры данных, между элементами которых существуют отношения иерархии (ветвления), называются иерархическими. К наиболее распространенным иерархическим структурам относятся:
иерархические списки;
деревья и леса;
бинарные деревья.
Между этими структурами имеется много общего. Однако они имеют различное происхождение и использование, поэтому рассмотрим данные структуры по порядку, начиная с иерархических списков.
3.1. Иерархические списки
3.1.1 Иерархические списки как атд
В предыдущей главе обсуждался рекурсивный подход к определению и обработке линейных списков. В продолжение темы расширим данный подход, введя понятие «иерархический список». Иерархические списки имеют и другие названия. Так, в классической работе Кнута [8] они называются Списками (с заглавной буквы) и рассматриваются как одна из наиболее универсальных структур данных.
Основная область использования иерархических списков — функциональное программирование, где они называются S-выражениями (Symbolic Expression).
Чтобы быстрее понять суть дела, сначала дадим неформальное определение понятия «иерархический список». Представим себе, что содержательная часть любого элемента линейного связного списка может содержать или данные (значения базового типа, которые в этом случае называются атомами), или указатель (ссылку) на другой список. Элементы этого вложенного списка также могут содержать указатели на другие списки. Так образуется иерархическая структура. Пример такой структуры изображен на рис. 3.1
Рис.3.1. Пример иерархического списка
Здесь a,b,c,d,e — значения базового типа. Первый и последний элементы списка содержат атомы a и e (значения базового типа), второй элемент — указатель на список. Первый элемент этого вложенного списка — указатель на пустой список (это допустимо в иерархических списках), второй содержит указатель на линейный список, содержащий два атома b и c. Последний элемент вложенного списка содержит атом d.
Обратим внимание, что графическое изображение иерархического списка — двухмерное, в отличие от линейного, где все элементы располагаются на одной линии.
Используя аналогию с разделом 2.6, данный иерархический список можно компактно представить в виде скобочного выражения (a.(().(b.c).d).e). Здесь конструкция () обозначает пустой список.
Перейдем к формальному рекурсивному определению иерархического списка ( S-выражения) [2].
S-выражение представляет собой или элемент базового типа, называемый в этом случае атомом ( атомарным S–выражением ), или линейный список из S–выражений (возможно пустой).
Непустой линейный список из S–выражений представим как точечную пару "голова"–"хвост" по аналогии с разделом 2.6, с той разницей, что голова является S-выражениям, а хвост — линейный список S-выражений (в линейном списке голова — всегда атом , хвост — линейный список атомов).
Таким образом, линейные списки можно рассматривать как частный случай иерархических списков, а рекурсивный подход к обработке линейных списков можно расширить и на случай иерархических списков, немного дополнив функциональную спецификацию. Для пустого списка по-прежнему используем обозначение nil.
В таблице 3.1 показаны примеры иерархических списков, представляющие списки в полной и сокращенной скобочной записи. Переход к сокращенной записи произведен по правилам, изложенным в 2.6.
Таблица 3.1.
Примеры иерархических списков
Полная запись |
Сокращенная запись |
Комментарий |
A nil ( a . ( b . ( c . nil ) ) )
( a.((b.(c.nil)).(d.(e. nil)))) |
a ( ) ( a.b.c )
( a.( b.c ).d.e ) |
Атомарное S-выражение Пустое S-выражение Частный случай — линейный список S-выражение иерархической структуры |
Зададим функциональную спецификацию иерархических списков, воспользовавшись теми же базовыми функциями в тех же обозначениях, как принято при определении линейных списков в разделе 2.6. В дополнение к четырем ранее уже встречавшимся базовым функциям IsNull, Head, Tail, Cons введем еще одну логическуюфункцию (предикат) Atom, проверяющий S–выражение на атомарность. Несмотря на одинаковые обозначения функций, спецификация будет отличаться от спецификации линейного списка типами входных и выходных данных. Введем следующие обозначения. Пусть
S_expr ( α ) — произвольное S-выражение, где α — базовый тип данных;
List ( S_expr ( α ) ) — линейный список из S-выражений (т. е. неатомарное S-выражение);
Non_null_list ( S_expr ( α ) ) — непустое неатомарное S-выражение.
Формальная спецификация функций будет иметь вид:
0) nil : Null_list( α );
1) IsNull : List ( S_expr ( α ) ) Boolean;
2) Head : Non_null_list ( S_expr ( α ) ) S_expr ( α );
3) Tail : Non_null_list ( S_expr ( α ) ) List ( S_expr ( α ) );
4) Cons : S_expr( α ) List( S_expr( α ) ) Non_null_list( S_expr( α ) );
5) Atom : S_expr( α ) Boolean;
Зададим систему правил (аксиом) А1–А7, справедливых для всех t типа α, всех u типа List( S_expr ( α ) ), всех v типа Non_null_list ( S_expr ( α ) ), всех w типа S_expr (α ):
A1) IsNull ( тil ) = true;
A2) IsNull ( Cons ( w, u ) ) = false;
A3) Head ( Cons ( w, u ) ) = w;
A4) Tail ( Cons ( w, u ) ) = u;
A5) Cons ( Head( v ), Tail( v ) ) = v.
A6) Atom ( t ) = true;
A7) Atom ( u ) = false;
Как и в случае линейных списков, для создания пустого списка в функциональной спецификации введена функция без параметров nil, при этом пустой список не является атомом. При реализации функций придется отдельно отслеживать ситуацию, когда список пуст.
Доступ к компонентам S–выражения, которыми могут быть как атомы, так и списки, осуществляется с помощью селекторов Head и Tail. Так, например, если u = ( a ( b c ) d e ), то
Head ( Tail ( u ) ) = ( b c );
Head ( Tail ( Head ( Tail ( u ) ) ) ) = c.
Формирование списков выполняется только с помощью функции Cons. Например:
( a (b c) d e ) = ( a . ( ( b . ( c . nil ) ) . ( d . ( e .nil ) ) ) )=
Cons ( a, Cons ( Cons ( b, Cons ( c, nil ) ) , Cons ( d, Cons ( e, nil ) ) ) );
(a (( ) (b c) d) e) = (a.( (nil . ( ( b . (c . nil) ) . (d . nil) ) ) . (e . nil) ) ) =
Cons(a, Cons(Cons(nil, Cons( Cons(b, Cons(c,nil)), Cons(d,nil))), Cons(e,nil))).
Нетрудно заметить, что построение каждой точечной пары в скобочной записи списка требует, как и в случае линейного списка, однократного применения конструктора Cons. Таким образом, любые действия с иерархическими списками будут состоять в последовательности рекурсивных вызовов базовых функций, причем, в отличие от линейных списков, рекурсивный подход здесь является основным.