Добавил:

Studfiles2 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Уфимский Государственный Авиационный Технический Университет

Предмет:

Системы искусственного интеллекта

Файл:

Лекции по СИИ.doc

Скачиваний:

175

Добавлен:

02.05.2014

Размер:

3.54 Mб

Скачать

☆

<<< < Предыдущая 43 44 45 46 47 48 49 50 51 52 53 54 55 56 5758 / 6758 59 60 61 62 63 64 65 66 67 > Следующая >>>

3.4.2.2. Стратегии поиска на основе эвристической функции оценки

Оценочная функция позволяет упорядочить вершины в списке ОТКРЫТ таким образом, чтобы первые позиции в нем занимали вершины с минимальной величиной оценки. Обозначим черезf(n) значение оценочной функции на вершинеn. Функцияf(n) определяет оценку стоимости наилучшего (т.е. имеющего минимальную суммарную стоимость) пути, соединяющего вершинуnс начальной вершиной и целевой вершиной.

Теперь алгоритм поиска решения - как маршрута в графе состояний задачи, связывающего начальную и целевую вершины, на основе функции f(n)принимает следующий вид:

Занести начальную вершину s в список ОТКРЫТ и вычислить f(s).
Если список ОТКРЫТ пуст, то алгоритм завершается общей неудачей; иначе - следующий шаг.
В списке ОТКРЫТ выбирается вершина х с минимальным значением f(s).
Если х - целевая вершина - то конец; иначе построить множество Г(x). Для каждой вершины y  Г(x) найти f(y). Если вершина у отсутствует в списке ОТКРЫТ, то поместить ее туда с найденным значением f(у). Если у уже входит в список ОТКРЫТ, то установить для у то из значений f(у), которое минимально.
Перейти к п. (2).

Приведенный алгоритм известен в литературе как алгоритмА*. Нетрудно догадаться, что выбор оценочной функции является решающим для эффективности алгоритма поиска. Определим оценочную функциюf(n)в виде суммы

f(n) = g(n) + h(n), (3.12)

гдеg(n)- стоимость наилучшего пути, найденного для вершиныn, который связывает ее с начальной вершиной;h(n) - стоимость оптимального пути от вершиныnдо целевой вершины.

Кроме того, пусть- оценка дляg(n), - оценка дляh(n) и - оценка дляf(n), т.е.

(3.13)

Из определения g(n) имеем, чтоg(n).

Отметим, что определение g(n) в общем случае не вызывает затруднений. Для функции дело обстоит иначе. Однако еслипредставляет нижнюю границу дляh, то алгоритмА*находит маршрут с минимальной общей стоимостью. Теореме, устанавливающей это свойство алгоритмаА*, предпочтем следующую лемму.

Лемма. Если для всехnвыполняется условие, то в любой момент времени до того, как алгоритмА*закончит свою работу, на любом оптимальном путиРот начальной вершиныsк цели существует открытая вершинаn', для которойf(n')  f(s).

Доказательство.По определению.

Так как n'лежит на оптимальном пути, то и, следовательно,, ибо мы приняли, что.

Далее имеем, что для любых двух вершинх₁их₂, лежащих на оптимальном путиf(x₁) = f(x₂) = f(s). В самом деле, пустьх₁расположена дох₂в оптимальном пути. Тогда

f(x₁) = g(x₁) + j(x₁, x₂), (2.14)

где j(x₁, x₂) - стоимость оптимального пути от х₁ к х₂.

но, очевидно, j(x₁, x₂) + h(x₂) = h(x₁) и g(x₁) + j(x₁, x₂) = g(x₂).

Отсюда следует, что .

Теорема 2.1. Если для всех вершинnвыполняется условие и если стоимости всех дуг превосходят некоторое малое положительное число, то алгоритмА*оканчивает свою работу построением оптимального пути к цели.

Доказательство.Возможны три различных исхода.

Исход 1: Работа алгоритма заканчивается, но целевая вершина не найдена. Это значит, что список ОТКРЫТ пуст, но цель не достигнута. Такая ситуация возможна, если и только если не существует пути, связывающего начальную и целевую вершины.

Исход 2: Алгоритм не оканчивает работу. Эта ситуация невозможна если множество всех состояний задачи конечно. Допустим противное: граф конечен, но алгоритм не завершает работу. Это значит, что список ОТКРЫТ никогда не опустеет, т.е. в него будут попадать одни и те же вершины, для которых значениеf(х)все время уменьшается. Каждый такой случай соответствует обнаружению нового, более лучшего пути изsвх. Но число всех таких путей в конечном графе ограничено, из чего следует противоречие.

Исход 3: Алгоритм завершает работу на целевой вершине, но найденный маршрут не оптимален. Допустим, что работа алгоритмаА*оканчивается на некоторой вершинеtс. Однако по лемме выше как раз перед окончанием работы на оптимальном пути существует такая вершинаn', чтоf(n')  f(), поэтому была бы выбрана для раскрытия не вершинаt, а вершинаn'.

Говорят, что эвристическая функция hудовлетворяет монотонному ограничению, если для любых вершин х и у, таких чтоу  Г(х)имеет местоh(x)  h(y) + c(x, y), гдес(x, у)- стоимость дуги, связывающей вершиныхиу.

Теорема 2.2. Если функцияhудовлетворяет монотонному ограничению, тоА*оптимален.

Доказательство.Найдем

. (3.15)

Тогда примем для каждой вершины х . (3.16)

Ясно, что для всехх. В силу теоремы 2А*оптимален.

Несмотря на то, что алгоритм А*находит маршрут минимальной стоимости, он имеет экспоненциальный характер. Поэтому естественны попытки ускорить сходимость процедуры поиска ценой потери оптимальности. В этой связи рассмотрим подход Галлаба и Алларда, предложивших эвристический алгоритмА_, ускоряющий сходимость процесса.

Алгоритм А_придерживается стратегии поиска в глубину, раскрывая вершины, принадлежащие одному и тому же пути, пока это возможно. Считается, что вершинаnдопустима, еслиf(n) не превосходит величины(1 + )max {f(n')}, гдеn'принадлежит множеству вершин, бывших первыми в списке ОТКРЫТ.

Другое отличие между А*иА_заключается в том, что если для раскрываемой вершиныn Г(n) не содержит допустимой вершины, тоА_пытается раскрыть вершины изГ(n), затем вершины изГ(Г(n)) и т.д. несколько раз, предполагая, что в силу монотонностиhс увеличениемf(n') некоторые вершины перейдут из разряда недопустимых в разряд допустимых.

Алгоритм А_:

Список ОТКРЫТ = {s}.

Список ЗАКРЫТ = 

g(s) = 0; f(s) = h(s)

верхняя граница = (1 + ) f(s)

РАСКРЫТЬ (s)

АХ = {x  Г(s)¦ x допустима}

x допустима, если x  ОТКРЫТ и f(x)  верхняя_граница

2. Если АХ  , то n = выбрать (АХ) иначе n = выбрать (ОТКРЫТ)

3. РАСКРЫТЬ (n).

4. Если Г(n) не содержит допустимых вершин, то строить Г(Г(n)), Г(Г(Г(n)))... и т.д. до тех пор, пока не будет получена вершина t, являющаяся допустимой или список ОТКРЫТ не станет пустым; или число последовательных применений операции раскрытия Г...Г не станет больше некоторого порогового значения N

РАСКРЫТЬ (t)

5. АХ = {x  Г(n)¦ x допустима}

6. Если целевая вершина найдена и допустима, то конец.

Если ОТКРЫТ = , то общая неудача,

иначе

вычислить_новую_верхнюю_границу и повторить с п. 2.

Процедура выбрать (АХ) выбирает в множестве АХ вершину хс минимальным значениемf(х);

Процедура выбрать (Открыть)более сложная, поскольку она должна определить допустимую вершинуnв списке ОТКРЫТ, которая не лежит на пути, связывающем последнюю раскрытую вершину с целевой вершиной.

При этом такой выбор должен минимизировать функцию

₁  f(x) + ₂  h(x) (3.17)

Выбор ₁и₂определяется из следующих соображений. Минимизацияh(х)"ориентирована" на скорейшее приближение к целевой вершине, однако увеличивает риск возврата с выбранного пути к вершинам на более высоком уровне в графе решения. Минимизацияf(х) максимально увеличивает верхнюю границу(1 + ) f(x), т.е. увеличивает перебор. Практически рекомендовано устанавливать значение₁>₂. Следующие результаты получены для задачи о коммивояжере дляN = 9городов (табл. 3.1).

Из табл. 2.1 видно, что при  = Орезультирующий путь имеет минимальную стоимость (100), но и максимальное число раскрытых вершин (100). С увеличением происходит сокращение числа раскрытых вершин. При = 0.25было раскрыто всего 23 вершины и сделано 3 возврата, что практически на порядок меньше, чем при = О. При этом относительная потеря точности результата составляет 3%.

Таблица 3. 1

	0	0,01	0,05	0,1	0,15	0,25	
Стоимость результирующего пути	100	100.1	100.4	101.1	101.9	103.0	107.0
число раскрытых вершин	100	92	77	54	42	23	15
число возвратов	100	83	48	21	13	3	0

3.4.2.3. (-)-процедура

Рассмотрим граф состояний, в котором все множество состояний делится на два непересекающихся классаU_иU_. Будем считать, что в каждом состоянииаизU_игроквыбирает допустимый переход в некоторое состояние изU_, причемГ(а)U_; наоборот, в каждом состоянииbизU_игроквыбирает некоторый допустимый переход в одно из состоянийГ(b)U_. Считается, что выигрывает тот игрок, который своим последним ходом исключает возможность сделать очередной ход противнику, т.е. у противника отсутствует допустимый ход в заключительном состоянии.

Стратегия называется выигрышной для игрока, если независимо от ответного хода противника игра заканчивается в ситуации, выигрышной для.

Как и ранее, с каждым состоянием хсвязывается оценка, приписываемая этому состоянию игроком, который делает ход.

Будем полагать, что игроки иоценивают ситуации таким образом, что для любой ситуациихоценка(х) = 1 - (х), (х) + (х) = 1.

Из этого допущения следует, что стремление каждого игрока добиться лучшей для себя ситуации означает адекватное ухудшение соответствующей оценки противника. Очевидно, разумная тактика у игрока заключается в стремлении получить гарантированный минимальный выигрыш на каждом шаге, т.е. строить игру, исходя из допущения, что игрокпридерживается каждый раз своей наилучшей стратегии.

Пустьх- текущая ситуация, в которой ход делает игрок. Тогда он может выбрать любую вершину из множестваГ(х). Допустим, он выбрал вершинуу*Г(х). Теперь, в свою очередь, игрокможет выбрать любую вершину изГ(у*). Очевидно, игроквыберет изГ(у*)ту вершинуz*, которая доставляет максимальное значение величине(z*). Следовательно, игрокдолжен выбором вершиныу*гарантировать

(3.18)

С другой стороны, игрок а стремится максимизировать минимальный выигрыш независимо от выбора игрока, т.е.

(3.19)

Убеждаемся, что (2.19) вытекает из (2.18) в силу того, что (х)  min(x). Теперь ясно, что оптимальная стратегия игрокадолжна гарантировать соблюдение для каждого состоянияхусловия

W^(x)  U^(x) (3.20)

Стратегия со свойством (2.20) называется оптимальной для игрока. Оценка (2.20) позволяет отсечь те направления, для которых с учетом возвращаемого игрокомзначенияU^(х), соотношение (2.20) не выполняется.

Первоначальный граф представлен на рис. 3.5.

Удалим дуги x₆ x₅, x₃ x₅, согласно операции О₂ (рис. 3.6,а).

Согласно операции О₃ удаляем вершину x₈ вместе с инцидентными ей дугами. (рис. 3.6,б).

Согласно операции О₆ удаляем альтернативную вершину x₂ вместе с инцидентными ей дугами.

По О₅ пометка 4 снимается со всех дуг, входящих вx₆ и x₄ и пометка 5. Следовательно, удаляются дугиx₅ x₆, x₅ x₄ и x₇ x₄ (рис. 3.6,в).

Согласно операции О₆ удаляем альтернативную вершину x₄ вместе с инцидентными ей дугами.

По О₅ пометка 6 снимается со всех дуг, входящих вx₆. Следовательно, из дуг x₁ x₆ и x₃ x₆ (рис. 3.6,г).

<<< < Предыдущая 43 44 45 46 47 48 49 50 51 52 53 54 55 56 5758 / 6758 59 60 61 62 63 64 65 66 67 > Следующая >>>

Соседние файлы в предмете Системы искусственного интеллекта

#
02.05.20141.11 Mб36Курсовой проект - Интеллектуальный анализ рынка услуг платного хостинга.doc
#
02.05.2014171.52 Кб73Курсовой проект - Написание программ на языке Prolog.doc
#
02.05.2014265.22 Кб31Лабораторная работа №1.doc
#
02.05.201489.6 Кб28Лабораторные работы.doc
#
02.05.20145.23 Mб31Лачинов В.М., Поляков А.О. Інформодинаміка [укр.язык].doc
#
02.05.20143.54 Mб175Лекции по СИИ.doc
#
02.05.2014925.18 Кб85Лекции по СИИ1.doc
#
02.05.20143.93 Mб162Ответы по СИИ за 2008.doc
#
02.05.2014165.38 Кб39Ответы по СИИ.doc
#
02.05.2014641.02 Кб301Сергей А. Терехов - Лекции по теории и приложениям искусственных нейронных сетей.doc
#
02.05.20143.95 Mб90Шпоры по СИИ.doc