Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие по Теории Систем.doc
Скачиваний:
3
Добавлен:
01.07.2025
Размер:
950.27 Кб
Скачать

5.9. Игровые методы принятия решений

Игровые методы принятия решений рассматривают вопросы принятия решений в условиях:

1) конфликтного взаимодействия элементов системы,

2) неопределенности,

3) сложности задачи принятия решений, вызванной многообъектностью системы.

Существует пять принципов конфликтного взаимодействия:

1) антагонизм,

2) бескоалиционное взаимодействие,

3) коалиционное взаимодействие,

4) кооперативное взаимодействие,

5) иерархическое взаимодействие с правом первого хода сверху.

Теория игр – математическая теория конфликтных ситуаций. Ее цель – дать инструмент для выработки разумного поведения участников конфликта.

Наиболее простой случай ситуаций, для которых имеется неопределенность – это случай конфликтных ситуаций, когда сталкиваются противоположные интересы двух или более групп. Выигрыш каждой стороны зависит от поведения соперника, а оно неизвестно.

Игра ведется по правилам, т.е. должны быть указаны права и обязанности участников. Игра может быть парной и множественной.

Каждый участник делает ходы, которые могут быть личные и случайные. Некоторые игры (часто азартные) не являются предметом теории игр. Если ходы число случайные, то это предмет для теории вероятности.

Если существуют правила вида «если ситуация А, то я поступлю В», значит принята стратегия игры. В зависимости от числа стратегий могут быть конечные и бесконечные игры.

Оптимальной называется стратегия, которая обеспечивает максимальный выигрыш. Если есть случайные ходы, то говорят о максимизации выигрыша в среднем.

Игра называется игрой с нулевой суммой, если алгебраическая сумма выигрыша всех участников равна нулю. Самая простая игра с нулевой суммой называется антагонистической (игра со строгим соперником). Теория таких игр наиболее развита и строга.

Рассмотрим игру G с игроками А и В. Будем считать, что «мы» - это А, а противник – В. Пусть у нас имеются m возможных стратегий Аi, а у противника – n стратегий Bj, то есть игра будет (mn).

Обозначим выигрыш А через aij, где i - стратегия А, j – стратегия В. Предполагается, что для всех пар стратегий Аi и Вj выигрыш aij известен (а значит, проигрыш В также известен aij = - bij). Представим информацию в виде таблицы 5.6.

Таблица 5.6

В1

В2

Вn

А1

a11

a12

a1n

А2

a21

a22

a2n

Аm

am1

am2

amn

Игра приведена к матричной форме. Обозначим эту матрицу как  = {aij}.

Если цифры в строках одинаковые – стратегии называются дублирующими. Можно упростить матрицу, если в ней имеются дублирующие и доминирующие стратегии как по строкам, так и по столбцам путем отбрасывания таких стратегий.

Рассмотрим пример G(45) (см. табл. 5.7). Если мы выберем максимально выигрышную стратегию А3 (до 10), то противник выберет В3 и выигрыш будет всего 1. Отсюда типичный принцип игры: минимальный выигрыш должен быть максимальным (принцип минимакса).

Добавим к табл. 5.7 столбец i и строку j, в которые выпишем минимальные выигрыши для столбца и максимальные для строки.

Таблица 5.7

В1

В2

В3

В4

В5

i

А1

3

4

5

2

3

2

А2

1

8

4

3

4

1

А3

10

3

1

7

6

1

А4

4

5

3

4

8

3

j

10

8

5

7

8

Противник выбирает стратегию, где его проигрыш минимален. Таким образом, исходя из принципа осторожности мы будем выбирать А4, а противник В3.

Теперь предположим, что мы узнали о том, что противник выбрал В3, тогда мы выбираем А1 и получаем выигрыш 5. Но если противник узнал, что у нас А1, он выберет В4 и наш выигрыш будет 2. Мы и противник начали метаться. Это очень важно: минимаксные стратегии неустойчивы по отношению к информации о поведении другой стороны.

Иногда минимаксные стратегии дают устойчивое решение, когда  = . В этом случае говорят, что совпадают верхняя и нижняя цена игры. Стратегии Аi и Вj, дающие на пересечении  = , называются чистыми, а квадрат матрицы, соответствующий таким стратегиям – седловой точкой матрицы.

Можно показать, что решение игры сводится к задаче линейного программирования:

LA = x1 + x2 + … + xm  min

при ограничениях вида

a11.x1 + a21.x2 + … + am1.xm  1,

a12.x1 + a22.x2 + … + am2.xm  1,

a1n.x1 + a2n.x2 + … + amn.xm  1

при выборе стратегии А*.

Выбор стратегии В аналогичен, но LB  max при выборе стратегии В*.

Пара задач линейного программирования, по которой находится решение (А*, В*), называется двойственной. Показано, что минимум одной линейной функции соответствует максимуму другой.

Стабильно зависимое решение в зависимости от постановки задачи бывает:

1) скалярным Нэш-равновесием,

2) векторными равновесиями,

3) угрозы – контругрозы (УКУ),

4) векторно-оптимальное решение,

5) дележ по Шекли.

Для решения всех этих задач имеются соответствующие алгоритмы.