
- •Введение
- •Основные понятия и определения
- •Типы данных
- •1.1.1. Понятие типа данных
- •1.2.2. Внутреннее представление базовых типов в оперативной памяти
- •1.2.2. Внутреннее представление структурированных типов данных
- •1.2.3. Статическое и динамическое выделение памяти
- •Абстрактные типы данных (атд)
- •Понятие атд
- •1.2.2. Спецификация и реализация атд
- •Структуры данных
- •1.3.1. Понятие структуры данных
- •1.3.2. Структуры хранения — непрерывная и ссылочная
- •1.4.3. Классификация структур данных
- •Алгоритмы
- •1.4.1. Понятие алгоритма
- •1.4.2. Способы записи алгоритмов.
- •1.4.3. Введение в анализ алгоритмов Вычислительные модели
- •Задача анализа алгоритмов
- •Время работы алгоритма
- •Время выполнения в худшем и среднем случае
- •1.4.3. Введение в рекурсию
- •Первые примеры
- •1.5.1. Введение в «длинную» арифметику
- •1.5.2. Рекурсия
- •1.5.3. Поразрядные операции. Реализация атд «Множество»
- •2. Линейные структуры данных
- •2.1. Атд "Стек", "Очередь", "Дек"
- •2.2. Реализация стеков
- •2.2.1. Непрерывная реализация стека с помощью массива
- •2.2.2. Ссылочная реализация стека в динамической памяти
- •2.2.3. Примеры программ с использованием стеков
- •2.3. Реализация очередей
- •2.3.2. Непрерывная реализация очереди с помощью массива
- •2.3.2. Ссылочная реализация очереди в динамической памяти
- •2.3.3. Ссылочная реализация очереди с помощью циклического списка
- •2.3.4. Очереди с приоритетами
- •2.3.5. Пример программы с использованием очереди
- •2.4. Списки как абстрактные типы данных
- •2.4.1. Модель списка с выделенным текущим элементом
- •2.4.2. Однонаправленный список (список л1)
- •2.4.3. Двунаправленный список (список л2)
- •2.4.4. Циклический (кольцевой) список
- •2.5. Реализация списков с выделенным текущим элементом
- •2.5.1. Однонаправленные списки Ссылочная реализация в динамической памяти на основе указателей
- •2.5.2. Двусвязные списки
- •2.5.3. Кольцевые списки
- •2.5.4. Примеры программ, использующих списки Очередь с приоритетами на основе линейного списка
- •Задача Иосифа (удаление из кольцевого списка)
- •2.6. Рекурсивная обработка линейных списков
- •2.6.1. Модель списка при рекурсивном подходе
- •2.6.2. Реализация линейного списка при рекурсивном подходе
- •3. Иерархические структуры данных
- •3.1. Иерархические списки
- •3.1.1 Иерархические списки как атд
- •3.1.2. Реализация иерархических списков
- •3.2. Деревья и леса
- •3.2.1. Определения
- •3.2. Способы представления деревьев
- •3.2.3. Терминология деревьев
- •3.2.4. Упорядоченные деревья и леса. Связь с иерархическими списками
- •3.3. Бинарные деревья
- •3.3.1. Определение. Представления бинарных деревьев
- •3.3.2. Математические свойства бинарных деревьев
- •3.4. Соответствие между упорядоченным лесом и бинарным деревом
- •3.5. Бинарные деревья как атд
- •3.6. Ссылочная реализация бинарных деревьев
- •3.6.1. Ссылочная реализация бинарного дерева на основе указателей
- •3.6.2. Ссылочная реализация на основе массива
- •3.6.3. Пример — построение дерева турнира
- •3.7. Обходы бинарных деревьев и леса
- •3.7.1. Понятие обхода. Виды обходов
- •3.7.2. Рекурсивные функции обхода бинарных деревьев
- •3.7.3. Нерекурсивные функции обхода бинарных деревьев
- •3.7.4. Обходы леса
- •3.7.5. Прошитые деревья
- •3.8. Применения деревьев
- •3.8.1. Дерево-формула
- •3.8.2. Задача сжатия информации. Коды Хаффмана
- •4. Сортировка и родственные задачи
- •4.1. Общие сведения
- •4.1.1. Постановка задачи
- •4.1.2. Характеристики и классификация алгоритмов сортировки
- •4.2. Простые методы сортировки
- •4.2.1. Сортировка выбором
- •4.2.2. Сортировка алгоритмом пузырька
- •4.2.3.Сортировка простыми вставками.
- •4.3. Быстрые способы сортировки, основанные на сравнении
- •4.3.1. Сортировка упорядоченным бинарным деревом
- •Анализ алгоритма сортировки бинарным деревом поиска
- •4.3.2. Пирамидальная сортировка
- •Первая фаза сортировки пирамидой
- •Вторая фаза сортировки пирамидой
- •Анализ алгоритма сортировки пирамидой
- •Реализация очереди с приоритетами на базе пирамиды
- •4.3.2. Сортировка слиянием
- •Анализ алгоритма сортировки слиянием
- •4.3.3. Быстрая сортировка Хоара
- •Анализ алгоритма быстрой сортировки
- •4.3.4. Сортировка Шелла
- •4.3.5. Нижняя оценка для алгоритмов сортировки, основанных на сравнениях
- •4.4. Сортировка за линейное время
- •4.4.1. Сортировка подсчетом
- •4.4.2. Распределяющая сортировка от младшего разряда к старшему
- •4.4.3. Распределяющая сортировка от старшего разряда к младшему
- •5. Структуры и алгоритмы для поиска данных
- •5.1. Общие сведения
- •5.1.1. Постановка задачи поиска
- •5.1.2. Структуры для поддержки поиска
- •5.1.3. Соглашения по программному интерфейсу
- •5.2. Последовательный (линейный) поиск
- •5.3. Бинарный поиск в упорядоченном массиве
- •5.4. Бинарные деревья поиска
- •5.4.1. Анализ алгоритмов поиска, вставки и удаления Поиск
- •Вставка
- •Удаление
- •5.4.3. Реализация бинарного дерева поиска
- •5.5. Сбалансированные деревья
- •Определение и свойства авл-деревьев
- •Вращения
- •Алгоритмы вставки и удаления
- •Реализация рекурсивного алгоритма вставки в авл-дерево
- •5.5.2. Сильноветвящиеся деревья
- •Бинарные представления сильноветвящихся деревьев
- •5.5.3. Рандомизированные деревья поиска
- •5.6. Структуры данных, основанные на хеш-таблицах
- •5.6.2. Выбор хеш-функций и оценка их эффективности
- •Модульное хеширование (метод деления)
- •Мультипликативный метод
- •Метод середины квадрата
- •5.6.2. Метод цепочек
- •5.6.3. Хеширование с открытой адресацией
- •5.6.4. Пример решения задачи поиска с использованием хеш-таблицы
5.2. Последовательный (линейный) поиск
Самая простая реализация поиска — использование обычного неупорядоченного массива или связного списка для хранения данных. Однако при небольших размерах совокупности данных (до нескольких тысяч записей) этот метод обеспечивает приемлемую скорость поиска, поэтому находит применение (в базах данных такой случай называют полным просмотром таблицы).
Алгоритм линейного поиска предельно прост — необходимо просматривать все элементы по порядку (в прямом или обратном направлении) до тех пор, пока не будет найден искомый элемент или массив (список) не будет исчерпан. Данный алгоритм реализуется при помощи цикла, на каждом шаге которого выполняются два сравнения. Если массив уже исчерпан, а искомый элемент так и не найден, это является признаком промаха при поиске.
Казалось бы, этот алгоритм без изменения структуры данных улучшить уже нельзя, но, оказывается, можно сократить число сравнений в цикле до одного, если использовать немного усовершенствованный алгоритм линейного поиска, который называется поиском с барьером (порогом, заграждающим элементом). Идея проста — искомый элемент записывается в конец массива (для этого должна быть зарезервирована лишняя служебная ячейка), тогда в цикле можно убрать проверку на исчерпание массива, поскольку элемент гарантированно будет найден и программа не зациклится. После цикла осталось только проверить, является ли найденный элемент последним. Этот случай соответствует промаху, в противном случае поиск был успешен.
В любом случае, при успешном поиске требуется в среднем n/2 повторений цикла, при неуспешном — n (или n+1) повторений. Следовательно, алгоритм имеет линейную сложность O(n).
Алгоритм вставки имеет константную сложность, т.к. новый элемент всегда вставляется в конец массива или списка. Алгоритм удаления несколько сложнее, и его сложность O(n) даже при реализации с помощью списка, поскольку в этом случае надо сначала найти тот элемент, который удаляется. Заметим, что сам процесс удаления не требует перемещения элементов даже при реализации на массиве, поскольку в этом случае достаточно поставить последний элемент массива на место удаляемого и уменьшить размер массива на единицу.
В листинге 5.1 приведена реализация линейного поиска с использованием массива, подобную реализацию на основе связного списка рекомендуется выполнить самостоятельно. Обратим внимание, что в число параметров функций добавили еще один — количество элементов массива. И еще одно замечание — в данном случае функция поиска могла бы возвращать индекс найденного элемента, а в случае промаха — несуществующий индекс. Для этого требуется совсем незначительная модификация функции seach.
Листинг 5.1. Линейный поиск в несортированном массиве
#include <iostream.h>
#include <stdlib.h>
typedef int T_key; //тип ключа, может быть любым
typedef char T_data;//тип связанных данных, любой
struct item //структура элемента массива
{ T_key key; //ключ
T_data data; //связанные данные
};
const item nullitem={-1};//пустой элемент возвращается при промахе поиска
const int maxsize=1000; //максимальный размер массива
item a[maxsize]; // данные, в которых выполняется поиск
// функции поиска, вставки, удаления
// линейный поиск
item seach(item a[], int n, T_key k)
{ int i=0; // в цикле - два сравнения
while (a[i].key!=k&&i<n) i++;
if(i==n) return nullitem;
else return a[i];
}
// линейный поиск с барьером
item seach_bar(item a[], int n, T_key k)
{ int i=0;
a[n+1].key=k; // в цикле - одно сравнение
while (a[i].key!=k) i++;
if(i==n+1) return nullitem;
else return a[i];
}
// вставка элемента в неупорядоченный массив
bool insert(item a[], int &n, item x)
{ if (n>=maxsize) return false; // массив исчерпан
else {n++; a[n]=x; return true;}
}
// удаление элемента
bool remove(item a[], int &n, T_key k)
{int i=0;
while (a[i].key!=k&&i<n) i++;
if(i==n) return false; // элемент не найден
else {a[i]=a[n-1]; n--; return true;}
}
Линейный поиск можно выполнять и в предварительно упорядоченном массиве при небольшом количестве элементов, при этом несколько сокращается количество повторений цикла для обнаружения промаха, поскольку можно гарантированно выходить из цикла, как только встретится первое значение ключа, большее искомого значения (дальше искать бесполезно). Однако порядок сложности линейного поиска и для отсортированных массивов составляет O(n).
Для больших упорядоченных массивов применяется алгоритм бинарного (дихотомического) поиска, который позволяет кардинально сократить время поиска.