Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Веревкин А.П., Кирюшин О.В. Теория систем.doc
Скачиваний:
53
Добавлен:
02.05.2014
Размер:
1.05 Mб
Скачать

5.9. Игровые методы принятия решений

Игровые методы принятия решений рассматривают вопросы принятия решений в условиях:

1) конфликтного взаимодействия элементов системы,

2) неопределенности,

3) сложности задачи принятия решений, вызванной многообъектностью системы.

Существует пять принципов конфликтного взаимодействия:

1) антагонизм,

2) бескоалиционное взаимодействие,

3) коалиционное взаимодействие,

4) кооперативное взаимодействие,

5) иерархическое взаимодействие с правом первого хода сверху.

Теория игр– математическая теория конфликтных ситуаций. Ее цель – дать инструмент для выработки разумного поведения участников конфликта.

Наиболее простой случай ситуаций, для которых имеется неопределенность – это случай конфликтных ситуаций, когда сталкиваются противоположные интересы двух или более групп. Выигрыш каждой стороны зависит от поведения соперника, а оно неизвестно.

Игра ведется по правилам, т.е. должны быть указаны права и обязанности участников. Игра может быть парнойимножественной.

Каждый участник делает ходы, которые могут быть личные и случайные. Некоторые игры (часто азартные) не являются предметом теории игр. Если ходы число случайные, то это предмет для теории вероятности.

Если существуют правила вида «если ситуация А, то я поступлю В», значит принята стратегияигры. В зависимости от числа стратегий могут бытьконечныеибесконечныеигры.

Оптимальной называется стратегия, которая обеспечивает максимальный выигрыш. Если есть случайные ходы, то говорят о максимизации выигрыша в среднем.

Игра называется игрой с нулевой суммой, если алгебраическая сумма выигрыша всех участников равна нулю. Самая простая игра с нулевой суммой называется антагонистической (игра со строгим соперником). Теория таких игр наиболее развита и строга.

Рассмотрим игру Gс игроками А и В. Будем считать, что «мы» - это А, а противник – В. Пусть у нас имеютсяmвозможных стратегий Аi, а у противника –nстратегийBj, то есть игра будет (mn).

Обозначим выигрыш А через aij, гдеi- стратегия А,j– стратегия В. Предполагается, что для всех пар стратегий Аiи Вjвыигрышaijизвестен (а значит, проигрыш В также известенaij= -bij). Представим информацию в виде таблицы 5.6.

Таблица 5.6

В1

В2

Вn

А1

a11

a12

a1n

А2

a21

a22

a2n

Аm

am1

am2

amn

Игра приведена к матричной форме. Обозначим эту матрицу как  = {aij}.

Если цифры в строках одинаковые – стратегии называются дублирующими. Можно упростить матрицу, если в ней имеются дублирующие и доминирующие стратегии как по строкам, так и по столбцам путем отбрасывания таких стратегий.

Рассмотрим пример G(45) (см. табл. 5.7). Если мы выберем максимально выигрышную стратегию А3(до 10), то противник выберет В3и выигрыш будет всего 1. Отсюда типичный принцип игры: минимальный выигрыш должен быть максимальным (принципминимакса).

Добавим к табл. 5.7 столбец iи строкуj, в которые выпишем минимальные выигрыши для столбца и максимальные для строки.

Таблица 5.7

В1

В2

В3

В4

В5

i

А1

3

4

5

2

3

2

А2

1

8

4

3

4

1

А3

10

3

1

7

6

1

А4

4

5

3

4

8

3

j

10

8

5

7

8

Противник выбирает стратегию, где его проигрыш минимален. Таким образом, исходя из принципа осторожности мы будем выбирать А4, а противник В3.

Теперь предположим, что мы узнали о том, что противник выбрал В3, тогда мы выбираем А1и получаем выигрыш 5. Но если противник узнал, что у нас А1, он выберет В4и наш выигрыш будет 2. Мы и противник начали метаться. Это очень важно: минимаксные стратегии неустойчивы по отношению к информации о поведении другой стороны.

Иногда минимаксные стратегии дают устойчивое решение, когда =. В этом случае говорят, что совпадают верхняя и нижняя цена игры. Стратегии Аiи Вj, дающие на пересечении=, называютсячистыми, а квадрат матрицы, соответствующий таким стратегиям –седловой точкой матрицы.

Можно показать, что решение игры сводится к задаче линейного программирования:

LA=x1+x2+ … +xmmin

при ограничениях вида

a11.x1 + a21.x2 + … + am1.xm  1,

a12.x1 + a22.x2 + … + am2.xm  1,

a1n.x1 + a2n.x2 + … +amn.xm1

при выборе стратегии А*.

Выбор стратегии В аналогичен, но LB maxпри выборе стратегии В*.

Пара задач линейного программирования, по которой находится решение (А*, В*), называется двойственной. Показано, что минимум одной линейной функции соответствует максимуму другой.

Стабильно зависимое решение в зависимости от постановки задачи бывает:

1) скалярным Нэш-равновесием,

2) векторными равновесиями,

3) угрозы – контругрозы (УКУ),

4) векторно-оптимальное решение,

5) дележ по Шекли.

Для решения всех этих задач имеются соответствующие алгоритмы.