Добавил:

student_tipo Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Балаковский институт техники, технологии и управления

Предмет:

Математические основы теории систем

Файл:

лекции по МОТС / Лекции по Теории Систем.doc

Скачиваний:

178

Добавлен:

15.02.2014

Размер:

1.05 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1516 / 1716 17 > Следующая >>>

5.9. Игровые методы принятия решений

Игровые методы принятия решений рассматривают вопросы принятия решений в условиях:

1) конфликтного взаимодействия элементов системы,

2) неопределенности,

3) сложности задачи принятия решений, вызванной многообъектностью системы.

Существует пять принципов конфликтного взаимодействия:

1) антагонизм,

2) бескоалиционное взаимодействие,

3) коалиционное взаимодействие,

4) кооперативное взаимодействие,

5) иерархическое взаимодействие с правом первого хода сверху.

Теория игр– математическая теория конфликтных ситуаций. Ее цель – дать инструмент для выработки разумного поведения участников конфликта.

Наиболее простой случай ситуаций, для которых имеется неопределенность – это случай конфликтных ситуаций, когда сталкиваются противоположные интересы двух или более групп. Выигрыш каждой стороны зависит от поведения соперника, а оно неизвестно.

Игра ведется по правилам, т.е. должны быть указаны права и обязанности участников. Игра может быть парнойимножественной.

Каждый участник делает ходы, которые могут быть личные и случайные. Некоторые игры (часто азартные) не являются предметом теории игр. Если ходы число случайные, то это предмет для теории вероятности.

Если существуют правила вида «если ситуация А, то я поступлю В», значит принята стратегияигры. В зависимости от числа стратегий могут бытьконечныеибесконечныеигры.

Оптимальной называется стратегия, которая обеспечивает максимальный выигрыш. Если есть случайные ходы, то говорят о максимизации выигрыша в среднем.

Игра называется игрой с нулевой суммой, если алгебраическая сумма выигрыша всех участников равна нулю. Самая простая игра с нулевой суммой называется антагонистической (игра со строгим соперником). Теория таких игр наиболее развита и строга.

Рассмотрим игру Gс игроками А и В. Будем считать, что «мы» - это А, а противник – В. Пусть у нас имеютсяmвозможных стратегий А_i, а у противника –nстратегийB_j, то есть игра будет (mn).

Обозначим выигрыш А через a_ij, гдеi- стратегия А,j– стратегия В. Предполагается, что для всех пар стратегий А_iи В_jвыигрышa_ijизвестен (а значит, проигрыш В также известенa_ij= -b_ij). Представим информацию в виде таблицы 5.6.

Таблица 5.6

	В₁	В₂	…	В_n
А₁	a₁₁	a₁₂	…	a_1n
А₂	a₂₁	a₂₂	…	a_2n
…	…	…	…	…
А_m	a_m1	a_m2	…	a_mn

Игра приведена к матричной форме. Обозначим эту матрицу как  = {a_ij}.

Если цифры в строках одинаковые – стратегии называются дублирующими. Можно упростить матрицу, если в ней имеются дублирующие и доминирующие стратегии как по строкам, так и по столбцам путем отбрасывания таких стратегий.

Рассмотрим пример G(45) (см. табл. 5.7). Если мы выберем максимально выигрышную стратегию А₃(до 10), то противник выберет В₃и выигрыш будет всего 1. Отсюда типичный принцип игры: минимальный выигрыш должен быть максимальным (принципминимакса).

Добавим к табл. 5.7 столбец _iи строку_j, в которые выпишем минимальные выигрыши для столбца и максимальные для строки.

Таблица 5.7

	В₁	В₂	В₃	В₄	В₅	_i
А₁	3	4	5	2	3	2
А₂	1	8	4	3	4	1
А₃	10	3	1	7	6	1
А₄	4	5	3	4	8	3
_j	10	8	5	7	8

Противник выбирает стратегию, где его проигрыш минимален. Таким образом, исходя из принципа осторожности мы будем выбирать А₄, а противник В₃.

Теперь предположим, что мы узнали о том, что противник выбрал В₃, тогда мы выбираем А₁и получаем выигрыш 5. Но если противник узнал, что у нас А₁, он выберет В₄и наш выигрыш будет 2. Мы и противник начали метаться. Это очень важно: минимаксные стратегии неустойчивы по отношению к информации о поведении другой стороны.

Иногда минимаксные стратегии дают устойчивое решение, когда =. В этом случае говорят, что совпадают верхняя и нижняя цена игры. Стратегии А_iи В_j, дающие на пересечении=, называютсячистыми, а квадрат матрицы, соответствующий таким стратегиям –седловой точкой матрицы.

Можно показать, что решение игры сводится к задаче линейного программирования:

L_A=x₁+x₂+ … +x_mmin

при ограничениях вида

a₁₁^.x₁ + a₂₁^.x₂ + … + a_m1^.x_m  1,

a₁₂^.x₁ + a₂₂^.x₂ + … + a_m2^.x_m  1,

a_1n^.x₁ + a_2n^.x₂ + … +a_mn^.x_m1

при выборе стратегии А^*.

Выбор стратегии В аналогичен, но L_Bmaxпри выборе стратегии В^*.

Пара задач линейного программирования, по которой находится решение (А^*, В^*), называется двойственной. Показано, что минимум одной линейной функции соответствует максимуму другой.

Стабильно зависимое решение в зависимости от постановки задачи бывает:

1) скалярным Нэш-равновесием,

2) векторными равновесиями,

3) угрозы – контругрозы (УКУ),

4) векторно-оптимальное решение,

5) дележ по Шекли.

Для решения всех этих задач имеются соответствующие алгоритмы.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1516 / 1716 17 > Следующая >>>

Соседние файлы в папке лекции по МОТС

#
15.02.20142.71 Mб178КОНСПЕКТ ЛЕКЦИЙ.doc
#
15.02.20144.35 Mб308КОНСПЕКТ ЛЕКЦИЙ ДЛЯ СТУДЕНТОВ.doc
#
15.02.2014915.46 Кб230Лекции 1 семестр.doc
#
15.02.20141.14 Mб113Лекции 2 семестр.doc
#
15.02.20141.94 Mб126лекции по МОТС.doc
#
15.02.20141.05 Mб178Лекции по Теории Систем.doc
#
15.02.201457.86 Кб96Решетчатые функции.doc