Добавил:

Tushkan Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский университет «МЭИ»

Предмет:

Теория игр

Файл:

Лекции.doc

Скачиваний:

262

Добавлен:

28.06.2014

Размер:

1.25 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1617 / 1817 18 > Следующая >>>

Критерий эффективности алгоритма поиска.

Стоимость решающего пути. S -> min. (допустимый алгоритм)
К
_
f₂(s)
оличество раскрываемых при поиске вершин. (оптимальный алгоритм)
Объём вычислений, требуемых для получения оценки V -> min.
Интегральная оценочная функция.

_S + _N + _V -> min

Критерии оценки эффективности эвристических алгоритмов.

Критерий направленности. P

L – длина найденного пути в числе раскрываемых вершин.

T – общее число раскрываемых вершин.

P = 1 => минимальное число вершин.

Критерий эффективности ветвлений. B

Оценка качества приближённого решения. K

K = 0 => оптимальное решение.

Базовые эвристики сокращения поискового пространства.

Перебор этапами (метод maxmin).
Ограничение числа дочерних вершин ( отсечение)
Упорядочение преобразований P_i ()

Пример:

Полный перебор

_ _

f(s) = f₁(s) + W(s)

_ _

f(s) = f₁(s) + (P(s) + 3Q(s))

0.108

0.385

0.419

1.86

1.31

1.08

P(s) – сумма расстояний каждой фишки от своего места.

Q(s) – Если фишка нецентральная, то за неё даётся 2 очка, когда за ней следует целевая (фишка на своём месте);

Если фишка центральная, то за неё даётся 1 очка, когда за ней следует целевая (фишка на своём месте);

Задача эвристического поиска

, где

S – множество состояний;

- множество допустимых состояний;

- множество начальных состояний;

- множество конечных состояний;

- множество преобразований.

Правила преобразований (P: SS) могут быть заданы в виде продукционных правил:

Пусть на вход поступает . Возможны следующиеситуации:

1). P не применимо к (). Возможны два случая:

a). Нет применимых правил (база правил P не полна).

b). Процесс поиска бесконечен.

2). P применимо к (). Возможны два случая:

a). Результат конечен:

- единственный;

- неединственный (можно говорить о поиске оптимального (наилучшего)

решения относительно критерия Q).

b). Результат бесконечен.

Допускается бесконечное ветвление, при том условии, что

если был выбран какой-то путь, то до конца добираемся

за конечное число шагов.

Типы задач

1. Задача планирования.

известны: и.

найти: последовательность преобразований

2. Задача прогнозирования.

известно:

найти:

3. Задача диагностики.

известно:

найти:

Поиск в системе продукций

PS=<БП(БЗ), РП(БД),I> , где

БП – база правил

РП – рабочая память (база данных)

I - интерпретатор, реализующий стратегии поиска.

Продукционный цикл

1 этап. Сопоставление и множества продукций изP.

Получаем конфликтное множество CS=;CS- множество тех правил, левые части которых сопоставимы с.

2 этап. Разрешение конфликтов.

Выбирается процедура(стратегия) разрешения конфликта. В результате получаем

AS=;AS-активное множество.

3 этап. Выполнение правил из AS.

В результате получаем множество .Если ,то STOP. Иначе – goto 1.( )

Реализация выбора правил

Детерминированный выбор Параллельное выполнение

Недетерминированный выбор

Детерминированный выбор

Нужно применить одно из правил того множества, из которого выбираются правила.

Могут быть использованы:

1. НАМ (нормальные алгоритмы Маркова).

2. Приоритет (частного перед общим).

3. Рейтинги.

Условия корректности детерминированного выбора

1). Условие коммутативности

2).

Недетерминированный выбор

Возможны два случая:

- мягкий недетерминизм (потом, на каком-то этапе узнаем, какой был сделан выбор)

- жесткий приоритет (не узнаем, что было выбрано)

Условия корректности недетерминированного выбора

1). Условие коммутативности

2). Условие идемпотентности

3). Условие ассоциативности

4). Условие дистрибутивности

5).

Параллельное выполнение

Условия корректности параллельного выполнения

1). Условие коммутативности

2). Условие ассоциативности

3). Условие дистрибутивности

4). Условие останова

5).

(6). Условие идемпотентности

Эффект интерференции

Это означает, что результат параллельного выполнения правил

Пример

Правила

, где {0,0} и {1,1} – не ожидаемые состояния

- если в универсум входит подструктура , то она заменяется на

Зависимости и :

1). По входу:

2). По выходу:

3). По входу / выходу:

В каких случаях параллельное выполнение будет корректно или возможно?

Есть P={}

1). Матрица параллелизма

Q=|| ||

= =

2). После нахождения активного множества AS=для каждого правила определяем || множество.

Поиск решений в пространстве целей.

Цель редуцируется до тех пор, пока не получим решение тривиальной задачи. Поиск решений в пространстве целей отображается деревом целей.

Z1 Z2

И ИЛИ

Z3 Z4 Z5 Z6

Существует два типа вершин: вершина И, вершина ИЛИ.

Корень дерева – главная цель.

Вершина типа И: чтобьы решить задачу, надо решить все её подзадачи.

Вершина типа ИЛИ: чтобьы решить задачу, надо решить одну из её подзадач.

Вершина разрешима, если существует путь, связывающий целевую вершину с подзадачами.

Решающий подграф – это подграф исходного графа, показывающий, что начальная вершина разрешима.

Если в дереве есть вершины типа ИЛИ, то решающий подграф может быть не единственным.

Просмотр вершин от листьев к корню даёт план решения задачи.

В пример это могут быть: Z3 Z4 Z5

Z1 Z2

Или Z3 Z4 Z6

Одним из универсальных методов редукции является метод уменьшения различий. (Generel Problem Solver. Nowell, Show, Simon).

В этом методе редукция ведётся по принципу отщепления от главной задачи элементарных подзадач.

Sн => Sк

Три шага:

Задача: преобразоватьsнSн в sкSк, уменьшить различие.

Если D(sн,Sн)=0, то задача решениа.

Найти преобразование p_iP, устраняющее D(sн,Sн).

Sк = s'Sp_i

слиsн

Sp_i, то останов.

Применитьp_i.

Sн => Sк

p_i

Sн => Sp_i

s’Sp_i => Sк

Выводы:

Может существовать неединственный оператор, устраняющий различия.
Ветвь может оказаться тупиковой.

Если различия можно упорядочить по важности, то строится следующая матрица.

D_j \ P_j	P₁	P₂	…	P_n
V
K

В первую очередь применяются операторы, устраняющие главное различие.

Эффективность данного метода низкая.

Пример:

Обезьяна и банан.

s = (w, x, y ,z)

О – обезьяна, Б – банан, Я – ящик. Система координат одномерная.

w – координата О.

y – координата ящика.

x = 1, если О на Я

0, иначе.

z = 1, если О схватила Б

0, иначе.

s_н = (a, 0, b, 0)

s_к = (c, 1, c, 1)

Операторы (преобразования):

P1(v) подойти в точку v.

P1(v) = ((x, 0, y, z) (v, 0, y, z)

P2(t) передвинуть ящик в точку t.

P2(t) = ((x, 0, x, z) (t, 0, t, z))

P3 взобраться на ящик.

P3 = ((x, 0, x, z) (x, 1, x, z))

P4 схватить банан.

P4 = ((c, 1, c, 0) (c, 1, c, 1))

(a, 0, b, 0) (c, 1, c, 1)

Главное различие

(a, 0, b, 0) Sp₄

s’Sp₄ (c, 1, c, 1)

p₄

Различия: D(a, 0, b, 0) Sp₄

Я не в точке сP2(c)
О не в точке сP1(c)
О не на Я P3

P2(c) P1(c) P3

(a, 0, b, 0) Sp₄

P2(s’’Sp₄)Sp₄

Различия: D(c, 0, c, 0) Sp₄

О не на Я P3

P1(b)

Элементарная подзадача

Обход снизу даёт решение: P1(b), P2(c), P3, P4.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1617 / 1817 18 > Следующая >>>

Соседние файлы в предмете Теория игр

#
28.06.2014111.28 Кб24Counterterrorism, a game-theoretic analysis (Daniel G.).pdf
#
28.06.2014136.06 Кб26Terrorism and Game Theory (Todd Sandler).pdf
#
28.06.201420.36 Mб52Имитационное моделирование. Классика CS (Кельтон В., Лоу А.).djvu
#
28.06.201429.18 Кб9Информация к консультации.doc
#
28.06.20141.25 Mб262Лекции.doc
#
28.06.2014289.49 Кб87Моделирование процессов принятия решений на основе системы интеллектуального имитационного моделирования РДО (Еремеев А., Шутова П.).docx
#
28.06.2014288.2 Кб45Моделирование процессов принятия решений на основе системы интеллектуального имитационного моделирования РДО (Еремеев А., Шутова П.).docx
#
28.06.20147.7 Mб67Ответы к экзамену.pdf
#
28.06.20141.24 Mб416Теоретико-игровые методы принятия решений (Еремеев А. П.).doc
#
28.06.201446.59 Кб8Требования к отчетам.doc