Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции (ММЭ).doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
4.29 Mб
Скачать

Платежная матрица игры «поиск»

-1

1

-1

1

-1

-1

1

1

В выше рассмотренной задаче верхняя и нижняя цена игры различны, т.е. . Если нижняя и верхняя цена игры совпадают, то общее их значение называют чистой ценой игры (ценой игры): .

Минимаксные стратегии, соответствующие цене игры, являются оптимальными стратегиями, а их совокупность – оптимальным решением или решением игры.

Пара чистых стратегий Ai и Bj дает оптимальное решение игры тогда и только тогда, когда соответствующий ей элемент aij является одновременно наибольшим в своем столбце и наименьшим в своей строке. Такая ситуация, если она существует, называется седловой точкой.

Обозначим A* и B* – пару чистых стратегий, на которых достигается решение игры в задаче с седловой точкой. Введем функцию выигрыша первого игрока на каждой паре стратегий:

. (7.7)

Тогда из условия оптимальности в седловой точке выполняется следующее двойное неравенство:

. (7.8)

Пример 7.1. Определить нижнюю и верхнюю цену игры.

.

Решение. Рассмотрим имеет ли игра седловую точку.

Таблица 7.3

Платежная матрица игры

0,5

0,6

0,8

0,5

0,9

0,7

0,8

0,7

0,7

0,6

0,6

0,6

0,9

0,7

0,8

достигается при паре стратегий (A2, B2), следовательно, игра имеет седловую точку (A2, B2) и цена игры .

7.3. Решение игр в смешанных стратегиях

Если игра не имеет седловой точки, то применение чистых стратегий не дает оптимального решения игры.

К примеру, в задаче игры «поиск» , т.е. седловая точка отсутствует. В данном случае можно получить оптимальное решение, случайным образом чередуя чистые стратегии.

Смешанной стратегией SA игрока A будем называть применение чистых стратегий A1, A2, …, Am с вероятностями p1, p2, …, pm, причем:

. (7.9)

Смешанные стратегии можно записывать в матричной форме:

, (7.10)

или в векторной:

. (7.11)

Чистые стратегии можно считать частным случаем смешанных и задавать строкой, в которой 1 соответствует чистой стратегии.

На основе принципа минимакса определяется оптимальное решение игры: это пара оптимальных стратегий (в общем случае смешанных), обладающих следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то другому должно быть не выгодно отступать от своей.

Выигрыш, соответствующий оптимальному решению – цена игры, удовлетворяет следующему неравенству:

, (7.12)

где – соответственно нижняя и верхняя цена игры.

Справедлива следующая теорема (основная теорема теории игр – теорема Неймана): каждая конечная игра имеет, по крайней мере, одно оптимальное решение, возможно, среди смешанных стратегий.

Пусть и – пара оптимальных стратегий. Если чистая стратегия входит в оптимальную смешанную стратегию с отличной от нуля вероятностью, то она называется активной.

Теорема об активных стратегиях: если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остается неизменным и равным цене игры ν, если второй игрок не выходит за пределы своих активных стратегий.

Рассмотрим игру 2×2. Если такая игра имеет седловую точку, то оптимальное решение – это пара чистых стратегий, соответствующих этой точке.

Игра, в которой отсутствует седловая точка, в соответствии с основной теоремой теории игр имеет оптимальное решение в смешанных стратегиях и .

Для их определения воспользуемся теоремой об активных стратегиях.

Если игрок А придерживается своей оптимальной стратегии , то его средний выигрыш будет равен цене игры ν, какой бы активной стратегией ни пользовался игрок В. Для игры 2×2 любая чистая стратегия противника является активной, если отсутствует седловая точка.

Выигрыш игрока А (проигрыш игрока В) – случайная величина, математическое ожидание которой является ценой игры. Поэтому средний выигрыш игрока А при использовании оптимальной смешанной стратегии будет равен ν и для первой, и для второй стратегии противника.

Пусть игра задана следующей платежной матрицей:

.

Средний выигрыш игрока А, если он использует оптимальную смешанную стратегию , а игрок В – чистую стратегию В1, равен цене игры ν:

. (7.13)

Тот же средний выигрыш получает игрок А, если второй игрок применяет стратегию B2:

. (7.14)

Учитывая, что , получаем следующую систему уравнений для определения оптимальной стратегии и цены игры ν:

(7.15)

Решая ее получим:

(7.16)

Аналогично для игрока В:

(7.17)

Оптимальная стратегия :

(7.18)

Пример 7.2. Найти оптимальные стратегии игры «поиск».

Решение

Игра «поиск» задана платежной матрицей без седловой точки:

, , .

Следовательно, ищем решение в смешанных стратегиях.

Согласно теореме об активных стратегиях, для игрока А средний выигрыш равен цене игры ν (при В1 и В2); для игрока В средний проигрыш равен цене игры ν (при А1 и А2).

Тогда согласно формулам (7.15) и (7.17) получим:

и

Решая получим: , ν = 0. Это означает, что оптимальная стратегия каждого игрока состоит в том, чтобы чередовать свои чистые стратегии случайным образом, выбирая каждую из стратегий с вероятностью ½, при этом средний выигрыш равен нулю.