Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТеорИгр Челяб.doc
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
720.9 Кб
Скачать

3.5. Приближенные методы решения игр

Часто на практике встречаются ситуации, когда нет необходи­мости в определении точного решения игры; достаточно найти при­ближенное решение, дающее средний выигрыш, близкий к цене игры. Ориентировочное знание цены игры v может дать уже простой анализ матрицы и определение нижней (а) и верхней (в) цен игры. Если а и в близки, практически нет надобности заниматься поисками точного решения, а достаточно будет выбрать чистые минимаксные стратегии.

В случаях, когда а и в не близки, можно получить приемлемое для практики решение с помощью численных методов решения игр, из которых мы вкратце рассмотрим метод итераций.

Идея метода итераций сводится к следующему. Разыгрывается «мысленный эксперимент», в котором противники А и В применяют друг против друга свои стратегии. Эксперимент состоит из последова­тельности элементарных игр, каждая из которых имеет матрицу задан­ной игры. Начинается с того, что мы (игрок А) выбираем произвольно одну из своих стратегий, например Ai. Противник на это отвечает той своей стратегией Bj, которая наименее выгодна для нас, т.е. обращает выигрыш при стратегии А; в минимум. На этот ход мы отвечаем той своей стратегией Ак, которая дает максимальный средний выигрыш при применении противником стратегии Bj. Далее снова очередь про­тивника. Он отвечает на нашу пару ходов Л; и Ak той своей стратегией Bs, которая дает нам наименьший средний выигрыш при этих двух стратегиях (Аь Ак), и так далее. На каждом шаге итерационного про­цесса каждый игрок отвечает на любой ход другого игрока той страте­гией, которая является оптимальной относительно всех его предыду­щих ходов, рассматриваемых как некоторая смешанная стратегия.

Если такой процесс продолжать достаточно долго, то средний выигрыш, приходящийся на одну пару ходов (элементарную игру), будет стремиться к цене игры, а частоты рь pn; qb qm, с которыми встречаются стратегии игроков в этом розыгрыше, будут приближать­ся к частотам, определяющим оптимальные стратегии.

Расчеты показывают, что сходимость метода очень медленная, однако для быстродействующих счетных машин это не является пре­пятствием.

Проиллюстрируем применение метода на примере игры 3x3 с матрицей:

В

А ^\

Вх

В2

Вз

Ах

8 2 4 4 5 6 17 3

А2

Аз

В табл. 3.5 приведены первые 18 шагов итерационного процес­са.

В первом столбце дан номер элементарной игры (пары ходов) n; во втором - номер i выбранной стратегии игрока A; в последующих трех - «накопленный выигрыш» за первые n игр при стратегиях про­тивника Вх, В23. Минимальное из этих значений отмечено значком *.

Далее идет номер j стратегии, выбранной противником, и, соот­ветственно, накопленный выигрыш за n игр при стратегиях А1, А2, А3; из этих значений отмечено максимальное. Отмеченные значения опре­деляют выбор ответной стратегии другого игрока. В следующих гра­фах последовательно приведены: минимальный средний выигрыш V', равный минимальному накопленному выигрышу, деленному на число игр n; максимальный средний выигрыш V'', равный максимальному накопленному выигрышу, деленному на n, и их среднее арифметиче­ское V* = (V' + V'')/2. При увеличении n все три величины V', V'' и V* будут приближаться к цене игры v, но величина V*, естественно, будет приближаться к ней сравнительно быстрее.

Преимущество итерационного метода решения игр в том, что объем и сложность вычислений сравнительно слабо возрастают по мере увеличения числа стратегий n и m.

3.6. Примеры решения конечных игр в смешанных стратегиях Пример 3.1. Найдем решение игры 2x2, рассмотренной ранее в примере 2.2 раздела 2 (выкладывание монет) с матрицей

В

А

В1

В2

ai

А1

1-1 -11

-1 -1

А4

3i

11

Проверим наличие седловой точки a=max (-1; -1)=-1

в =min (1; 1)=1

№pa не имеет седловой точки и, следовательно, решение долж­но лежать в области смешанных стратегий:

А1 А2 В1 В2

p1 p2 q1 q2

Нужно найти р1, р2, q1, q2.

Для определения р1 и p2 имеем уравнения:

1Pl + (-l)P2 = V , (-l)Pi + 1'P2 = V , Pl + P2 = 1 ,

т.е. p1 - (1-p1) = -p1 + (1-p1) или 4-p1 = 2 , откуда p1 = 1/2; p2 = 1/2; V = 0. Аналогично найдем: q1 = 1/2; q2 = 1/2.

Следовательно, оптимальная стратегия для каждого из игроков состоит в том, чтобы случайным образом чередовать обе свои чистые стратегии, пользуясь одинаково часто каждой из них; при этом сред­ний выигрыш будет равен нулю.

Полученный вывод был достаточно ясен заранее. В следующем примере мы рассмотрим более сложную игру, решение которой не яв­ляется столь очевидным.

Пример 3.2. Найти геометрическим и аналитическим методами в смешанных стратегиях решение конечной игры, заданной следую­щей матрицей:

В1

В2

Вз

В4

В5

2-101 3 -3 4 2 2 -1

А2

Решение. Прежде всего, исключим «лишние» стратегии игрока В.

Как видно из матрицы, дублирующих стратегий у игрока В нет, стратегия В4 уступает стратегии В3, стратегия В5 уступает стратегии В1. То есть можем исключить стратегии В4 и В5. Получили игру 2x3. Теперь убедимся в том, что в игровой матрице нет седловых точек. Для этого вычислим нижнюю и верхнюю цены игры а= max (-1, -3) = -1, в = min (2, 4, 2) = 2 и приходим к выводу: а^р.

4

3

2 1

-1 -2 -3

P

Рис. 3.9

42

Следовательно, решение игры необходимо искать в области смешанных стратегий.

Рассмотрим стратегию В1: она дает на осях I-I и две точки с ординатами а11=2 и а21=-3 (рис. 3.9). Соединим эти точки прямой B1. Стратегия В2 дает точки с ординатами а12=-1 , а22 = 4. Соединим пря­мой В2. Аналогично, строим графики стратегий В3, В4, В5. Нижняя граница выигрыша - минимальный выигрыш - ломаная МОТ. Точка N, в которой этот минимальный выигрыш достигает максимума, опреде­ляет решение и цену игры.

Активными стратегиями являются В1 и В2. Для этих стратегий составим уравнения: 2-р1 - 3-р2 = v ,

-P1 + 4-P2 = V ,

P1 + P2 = 1 .

Решаем эту систему: из (3) p1 = 1-P2

из (1) 2-2-p2-3-P2=v, 5-P2=2-v, v=2-5-P2

из (2) -1+p2+4p2= v, 5-p2=v+1, v=5-p2-1.

То есть 2-5-p2 =5p2-1. Отсюда p2 = 0,3, p1 = 0,7, v = 0,5 . То есть оптимальной стратегией игрока А является

А1 А2

^ 0,7 0,3 J , средний выигрыш v = 0,5. Теперь определим оптимальную стратегию игрока В. Для активных стратегий В1 и В2 имеем 2-q1 - q2 = 0,5;

q1 + q2 = 1.

Из 1-го уравнения 2-(1-q2) - q2 = 0,5. Отсюда q2 = 0,5, q1 = 0,5.

То есть оптимальной стратегией игрока В является

В1 В2

S*b = \

0,5 0,5