- •Министерство образования Российской Федерации
- •Содержание
- •1.2 Скорость роста функций
- •1.3 Анализ алгоритмов; время работы в лучшем, худшем случаях и в среднем
- •1.4 Типы данных, структуры данных и абстрактные типы данных
- •1.5 Динамические множества
- •2 Алгоритмы сортировок
- •2.1 Понятие внутренней и внешней сортировки
- •2.2 Сортировка вставками
- •2.3 Сортировка слиянием
- •2.3.1 Описание алгоритма
- •2.3.2 Анализ времени работы алгоритмов «разделяй и властвуй»
- •2.3.2 Анализ времени работы сортировки слиянием через рекуррентное соотношение
- •2.3.3 Анализ времени работы сортировки слиянием через геометрическую интерпретацию
- •2.4 Пирамидальная сортировка
- •2.4.1 Введение в алгоритм
- •2.4.2 Сохранение основного свойства кучи
- •2.4.3 Построение кучи
- •2.5 Быстрая сортировка
- •2.5.1 Введение в алгоритм
- •2.5.2 Описание
- •2.5.3 Разбиение массива
- •2.5.4 Особенности работы быстрой сортировки
- •2.6 Особенности реализации алгоритмов сортировки; сортировка за линейное время
- •2.6.1 Введение
- •2.6.2 Разрешающее дерево сортировки сравнениями
- •2.7 Цифровая сортировка
- •2.8 Сортировка вычерпыванием
- •2.8.1 Описание алгоритма
- •2.8.2 Вероятностный анализ времени работы сортировки вычерпыванием
- •2.8.3 Анализ времени работы сортировки вычерпыванием через геометрическую интерпретацию
- •2.9 Сортировка подсчетом
- •2.9.1 Описание алгоритма
- •2.9.2 Анализ времени работы
- •3 Элементарные и нелинейные структуры данных
- •3.1 Элементарные структуры: список, стек, очередь, дек
- •3.1.1 Список Линейный однонаправленный список
- •Линейный двунаправленный список
- •Двунаправленный список с фиктивными элементами
- •Циклические списки
- •Циклический однонаправленный список
- •Циклический двунаправленный список
- •3.1.2 Стек
- •3.1.3 Очередь
- •3.1.3 Дек
- •3.2 Нелинейные структуры данных
- •3.2.1 Представление корневых деревьев в эвм
- •Обходы деревьев
- •3.2.2 Двоичные деревья Спецификация двоичных деревьев
- •Реализация
- •Обходы двоичных деревьев
- •3.2.3 Двоичные деревья поиска Основные операции
- •Минимум и максимум
- •Следующий и предыдущий элементы
- •Добавление и удаление
- •Случайные деревья поиска
- •Оптимальные деревья поиска
- •4 Хеширование
- •4.1 Введение
- •4.2 Прямая адресация; таблицы с прямой адресацией
- •4.3 Хеш – таблицы; возникновение коллизий и их разрешение
- •Разрешение коллизий с помощью цепочек
- •Анализ хеширования с цепочками
- •4.4 Способы построения хеш – функций Выбор хорошей хеш-функции
- •Ключи как натуральные числа
- •Деление с остатком
- •Умножение
- •Универсальное хеширование
- •4.5 Открытая адресация; способы вычисления последовательности испробованных мест: линейная последовательность проб, квадратичная последовательность проб, двойное хеширование
- •Линейная последовательность проб
- •1 / (1 – )
- •5 Основные принципы разработки алгоритмов
- •5.1 Введение в теорию графов
- •5.1.1 Графы
- •5.1.2 Представление графов
- •5.2 Алгоритмы на графах: поиск в ширину, поиск в глубину
- •5.2.1 Поиск в ширину (волновой алгоритм)
- •5.2.2 Анализ поиска в ширину
- •5.2.3 Деревья поиска в ширину
- •5.2.4 Поиск в глубину
- •5.2.5 Анализ поиска в глубину
- •5.2.6 Свойства поиска в глубину
- •5.2.7 Классификация рёбер
- •5.3 Топологическая сортировка, задача о разбиении графа на сильно связанные компоненты
- •5.3.1 Топологическая сортировка
- •5.3.2 Сильно связные компоненты
- •5.4 Алгоритм построения минимального остовного дерева
- •5.4.1 Остовные деревья минимальной стоимости
- •5.4.2 Построение минимального покрывающего дерева
- •5.4.3 Алгоритмы Крускала и Пpимa
- •5.4.4 Алгоритм Крускала
- •5.4.5 Алгоритм Прима
- •5.5 Задача нахождения кратчайших путей на графах; алгоритм Флойда; алгоритм Дейкстры
- •5.5.1 Нахождение кратчайшего пути
- •5.5.2 Алгоритм Дейкстры
- •5.5.3 Алгоритм Флойда
- •5.6 Поиск с возвратом
- •5.6.1 Введение
- •5.6.2 Переборные алгоритмы
- •5.6.3 Метод ветвей и границ
- •5.6.4 Метод альфа-бета отсечения
- •5.6.5 Локальные и глобальные оптимальные решения
- •5.7 Метод декомпозиции ( «Разделяй и властвуй»)
- •5.7.1 «Ханойские башни»
- •5.8 Жадные алгоритмы и динамическое программирование
- •5.8.1 Задача о выборе заявок
- •5.8.2 Дискретная задача о рюкзаке
- •5.8.3 Непрерывная задача о рюкзаке
- •5.8.4 Числа Фибоначчи
- •5.8.5 Задача триангуляции многоугольника
- •5.8.6 Дп, жадный алгоритм или что-то другое?
5.2.2 Анализ поиска в ширину
Оценим время работы описанной процедуры. В процессе работы вершины только темнеют, так что каждая вершина кладётся в очередь не более одного раза (благодаря проверке в строке 12). Следовательно, и вынуть её можно только один раз. Каждая операция с очередью требует O (1) шагов, так что всего на операции с очередью уходит время O(V). Теперь заметим, что список смежных вершин просматривается, лишь когда вершина извлекается из очереди, то есть не более одного раза. Сумма длин всех этих списков равна |Е| (2|Е| для неориентированного графа) и всего на их обработку уйдёт время O(Е). Инициализация требует O(V) шагов, так что всего полу- чается O(V + Е). Тем самым время работы процедуры BFS пропорционально размеру представления графа G в виде списков смежных вершин.
Поиск в ширину для полного обхода графа с n вершинами и m дугами требует столько же времени, как и поиск в глубину, то есть времени порядка O(max(n, m)). Поскольку обычно m n, то получается O(m).
5.2.3 Деревья поиска в ширину
В ходе работы процедуры BFS выделяется некоторый подграф – дерево поиска в ширину, задаваемое полями [v]. Более формально, применим процеду- ру BFS к графу G = (V, Е) с начальной вершиной s. Рассмотрим подграф, вершинами которого являются достижимые из s вершины, а рёбрами являются рёбра ([v], v) для всех достижимых v, кроме s.
Лемма 5.1. Построенный таким образом подграф графа G представляет собой дерево, в котором для каждой вершины v имеется единственный простой путь из s в v. Этот путь будет кратчайшим путём из s в v в графе G.
Доказательство. Существование пути из s в и (как и то, что он будет крат- чайшим) следует из теоремы 5.1. (индукция по расстоянию от s до v). Поэтому граф связен. Поскольку число рёбер в нём на единицу меньше числа вершин, то он является деревом.
Дерево называется подграфом предшествования (predecessor subgraph), а также деревом поиска в ширину (breadth-first tree) для данного графа и данной начальной вершины. (Заметим, что построенное дерево зависит от того, в каком порядке просматриваются вершины в списках смежных вершин.)
Если значения полей уже вычислены с помощью процедуры BFS, то крат- чайшие пути из s легко найти: их печатает процедура PRINT-PATH.
Листинг 5.3 – Поиск в глубину
Время выполнения пропорционально длине печатаемого пути (каждый рекурсивный вызов уменьшает расстояние от s на единицу).
5.2.4 Поиск в глубину
Поиск в глубину является обобщением метода обхода дерева в прямом порядке. Предположим, что есть ориентированный граф G, в котором первоначально все вершины помечены как непосещенные. Поиск в глубину начинается с выбора начальной вершины v графа G, и эта вершина помечается как посещенная. Затем для каждой вершины, смежной с вершиной v и которая не посещалась ранее, рекурсивно применяется поиск в глубину. Когда все вершины, которые можно достичь из вершины v, будут «удостоены» посещения, поиск заканчивается. Если некоторые вершины остались не посещенными, то выбирается одна из них и поиск повторяется. Этот процесс продолжается до тех пор, пока обходом не будут охвачены все вершины орграфа G.
Этот метод обхода вершин орграфа называется поиском в глубину, поскольку поиск непосещенных вершин идет в направлении вперед (вглубь) до тех пор, пока это возможно. Например, пусть x – последняя посещенная вершина. Для продолжения процесса выбирается какая-либо нерассмотренная дуга x y, выходящая из вершины x. Если вершина y уже посещалась, то ищется другая вершина, смежная с вершиной x. Если вершина y ранее не посещалась, то она помечается как посещенная и поиск начинается заново от вершины y. Пройдя все пути, которые начинаются в вершине y, возвращаемся в вершину x, то есть в ту вершину, из которой впервые была достигнута вершина y. Затем продолжается выбор нерассмотренных дуг, исходящих из вершины x, и так до тех пор, пока не будут исчерпаны все эти дуги.
Для представления вершин, смежных с вершиной v, можно использовать список смежных, а для определения вершин, которые ранее посещались, – массив Visited:
Graph: TAdjacencyList;
Visited: array[1..n] of boolean;
Чтобы применить эту процедуру к графу, состоящему из n вершин, надо сначала присвоить всем элементам массива Visited значение false, затем начать поиск в глубину для каждой вершины, помеченной как false.
procedure DepthSearch(v: integer);
begin
Visited[v] := true;
for каждой вершины y, смежной с v do
if not Visited[y] then
DepthSearch(y);
end;
begin
while есть непомеченные вершины do begin
v := любая непомеченная вершина;
DepthSearch(v);
end;
end.
Листинг 5.4 – Поиск в глубину
Листинг 5.5 – Поиск в глубину
Как и при поиске в ширину, обнаружив (впервые) вершину v, смежную с и, мы отмечаем это событие, помещая в поле [v] значение и. Получается дерево - или несколько деревьев, если поиск повторяется из нескольких вершин. Говоря дальше о поиске в глубину, мы всегда будем предполагать, что так и дела- ется (поиск повторяется). Мы получаем подграф предшествования (predecessor subgraph), определённый так: , где
Подграф предшествования представляет собой лес поиска в глубину (depth-first forest), состоящий из деревьев поиска в глубину (deep-first trees).
Алгоритм поиска в глубину также использует цвета вершин. Каждая из вершин вначале белая. Будучи обнаруженной (discovered), она становится серой; она станет чёрной, когда будет полностью обработана (finished), то есть когда список смежных с ней вершин будет просмотрен. Каждая вершина попадает ровно в одно дерево поиска в глубину, так что эти деревья не пересекаются.
Помимо этого, поиск в глубину ставит на вершинах метки времени (times- tamps). Каждая вершина имеет две метки: в d[v] записано, когда эта вершина была обнаружена (и сделана серой), а в f [v] – когда была закончена обработка списка смежных с v вершин (и v стала чёрной).
Эти метки времени используются во многих алгоритмах на графах и по- лезны для анализа свойств поиска в глубину.
В приводимой далее процедуре DFS (Depth-First Search – поиск в глубину) метки времени d[v] и f[v] являются целыми числами от 1 до 2|V|; для любой вершины и выполнено неравенство
d[u] < f[u]
Вершина и будет БЕЛОЙ до момента d[u], СЕРОЙ между d[u] и f[u] и ЧЁРНОЙ после f[u].
Исходный граф может быть ориентированным или неориентированным. Пе- ременная time – глобальная переменная текущего времени, используемого для пометок.
Рисунок 5.2 – Поиск в глубину
На рис. 5.2 показано исполнение алгоритма DFS для ориентированного графа. После просмотра каждое ребро становится либо серым (если оно включается в дерево поиска) или пунктирным (обратные рёбра помечены буквой В (back), перекрёстные – буквой С (cross) прямые – буквой F (forward)). У каждой вершины показаны времена начала и конца обработки.
В строках 1 – 3 (листинг 5.5) все вершины красятся в белый цвет; в поле помещается NIL. В строке 4 устанавливается начальное (нулевое) время. В строках 5-7 вызывается процедура DFS-VISIT для всех вершин (которые остались белыми к моменту вызова – предыдущие вызовы процедуры могли сделать их чёрными). Эти вершины становятся корнями деревьев поиска в глубину.
В момент вызова DFS-VISIT(u) вершина и белая. В строке 1 она ста- новится серой. В строке 2 время её обнаружения заносится в d[u] (до этого счётчик времени увеличивается на 1). В строках 3 – 6 просматриваются смеж- ные с и вершины; процедура DFS-VISIT вызывается для тех из них, которые оказываются белыми к моменту вызова. После просмотра всех смежных с и вершин мы делаем вершину и чёрной и записываем в f [u] время этого события.