Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Готовая методичка по ТПР13.02.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
2.35 Mб
Скачать

1.2 Матричные игры

Матричной игрой называется конечная игра двух лиц с нулевой суммой.

Так как число стратегий каждого игрока в матричной игре конечно, то их можно пронумеровать. Будем считать, что игрок I имеет стратегии i=1,…,m, а игрок II – стратегии j=1,…,n. В дальнейшем будем называть их чистыми стратегиями (ч.с.).

Функции выигрыша игроков в матричной игре могут быть заданы в виде платежной матрицы A=( ) размера m×n, где – выигрыш игрока I (и, соответственно, проигрыш игрока II) в ситуации (i,j).

Пример 1.2. Игра «Два числа».

Играют двое. Каждый из игроков втайне от другого записывает одно из двух чисел: 1 или 2. Затем числа предъявляются и подводится итог. Если оба записали 1, то II выигрывает 1 очко, а если оба записали 2, то I выигрывает 2 очка. Если I записал меньшее число, то I выигрывает 1 очко; в противном случае II выигрывает 2 очка. В любой ситуации выигрыш игрока равен проигрышу соперника.

Здесь у каждого из игроков имеется по две ч.с.: записать 1 или записать 2. Платежная матрица игры изображена на рис. 2, строки соответствуют стратегиям игрока I, столбцы – стратегиям игрока II.

1

2

1

-1

1

2

-2

2

Рис. 2

Пример 1.3. Игра в орлянку.

Игрок I кладет монету, игрок II, не видя, пытается угадать, какой стороной положил монету игрок I – «орлом» (О) или «решкой» (Р). Угадал – выиграл 1 очко (а I в этом случае проиграл 1 очко), не угадал – проиграл 1 очко (а I выиграл 1 очко).

Платежная матрица игры изображена на рис. 3.

О

Р

О

-1

1

Р

1

-1

Рис. 3

В этой игре у каждого из игроков имеется по две ч.с.: у игрока I – положить монету «орлом» или «решкой», у игрока II – назвать «орел» или «решку».

1.3 Принцип минимакса. Седловые точки

Будем предполагать, что игроки ведут себя разумно и каждый из них стремится максимизировать свой выигрыш. Попытаемся выяснить, как следовало бы действовать игрокам в матричной игре, чтобы добиться поставленной цели.

Предположим, что игроки I и II участвуют в матричной игре с платежной матрицей A=( ) размера m×n. Выбирая чистую стратегию, игрок I выбирает строку i, а игрок II – столбец j. Выигрыш I или, что то же, проигрыш II в этой ситуации равен . Ясно, что игрок I будет стараться увеличить , в то время как II будет пытаться его уменьшить.

Если игрок I выбрал ч.с. i, то II должен ответить такой стратегией j, чтобы выигрыш был наименьшим среди чисел , обозначим его через :

.

Величина есть наименьший, то есть гарантированный, выигрыш игрока I при выборе им ч.с. i. Значит, игроку I выгодно выбрать ту стратегию, которая даст наибольшее значение :

.

Стратегия p, для которой , является максиминной стратегией игрока I.

Аналогично рассуждая, получаем, что величина

есть наибольший, то есть гарантированный, проигрыш игрока II при выборе им ч.с. j. Игроку II из всех стратегий выгодно выбрать минимаксную ч.с., при которой его гарантированный проигрыш минимален:

.

Величины a и b называются соответственно нижней и верхней ценой игры в ч.с.

Еще раз подчеркнем, что, выбрав максиминную ч.с., игрок I гарантированно получит выигрыш, не меньший a, а игрок II, выбрав минимаксную ч.с., не проиграет больше b.

Описанные рассуждения носят название принципа минимакса (или принципа гарантированного результата). Кратко этот принцип может быть сформулирован следующим образом: каждый игрок должен стремиться максимально увеличить свой гарантированный выигрыш.

Легко показать, что в любой матричной игре ab. Например, в игре «Два числа» (пример 1.2) a=b=-1, а в игре в орлянку (пример 1.3) a=-1, b=1.

Хорошо известно [2], что равенство a=b имеет место тогда и только тогда, когда платежная матрица A имеет седловую точку, то есть существует такая пара номеров (p, q), что для любых i=1,…,m, j=1,…,n.

Седловая точка платежной матрицы дает ситуацию равновесия (p, q) в матричной игре, когда игроку I невыгодно отступать от своей максиминной ч.с. p, а игроку II – от минимаксной ч.с. q, поскольку, отклоняясь от этих стратегий, игроки могут разве что уменьшить свой выигрыш. Если (p, q) – седловая точка, то стратегии p, q называются оптимальными ч.с. Пара (p, q) оптимальных ч.с. называется решением игры в ч.с., а сама матричная игра – разрешимой в ч.с. Величина a=b называется в этом случае ценой игры в ч.с.

Если же a < b, то матрица A не имеет седловой точки. В такой игре ситуации равновесия нет, и она не разрешима в ч.с.

Между играми с седловой точкой и без нее существует огромная разница, которая проявляется особенно ярко при многократном повторении игры. Поясним эту разницу на примерах 1.2 и 1.3.

Рассмотрим игру «Два числа» (пример 1.2) и подумаем, как поведут себя в ней разумные игроки. Если I выберет ч.с. 1, то есть запишет 1, он может выиграть 1 очко (если II запишет 2), но может и проиграть 1 очко (если II запишет 1). Если же I выберет ч.с. 2, то он может выиграть 2 очка (если II запишет 2), но может и проиграть 2 очка (если II запишет 1). А поскольку игрок II разумен, то он наверняка выберет ч.с. 1 (при этом он вообще не проигрывает). И тогда игроку I ничего другого не остается, как выбрать меньшее из зол и записать число 1.

Итак, в этой игре есть ситуация равновесия (1,1), когда игрокам невыгодно отступать от своих оптимальных ч.с. i=1, j=1, сколько бы ни продолжалась игра. Правда, при этом I каждый раз будет проигрывать 1 очко, но, выбирая число 2, он проиграет еще больше. Игроку II тем более невыгодно отступать от избранной стратегии, так как, записав число 2, он вместо выигрыша проиграет 1 очко. Оба даже могут заранее объявить о своих намерениях, секретность в играх с седловой точкой не имеет никакого значения.

Иное дело в игре в орлянку (пример 1.3). В этой игре седловой точки нет, и игрокам имеет смысл скрывать свои намерения от соперника. Если при многократном повторении игры один из игроков будет все время придерживаться какой-либо одной ч.с. или даже выбирать свои ч.с. по некоторой заранее определенной схеме, то его разумный соперник может понять это и принять контрмеры. Единственный разумный выход видится в следующем: в такой игре игроки должны выбирать свои ч.с. случайно, но сама схема рандомизации должна выбираться разумно. В этом и состоит идея использования смешанных стратегий.