Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
все темы 12.doc
Скачиваний:
127
Добавлен:
04.07.2015
Размер:
4.5 Mб
Скачать

Платежная матрица. Верхняя и нижняя цена игры.

Рассмотрим парную конечную игру:

Игрок А имеет mстратегийA1,A2,…,Am.

Игрок В имеет nстратегийB1,B2,…,Bn.

Размерность игры mn.

В результате выбора игроками любой пары стратегий AiиBj(i=1,2,…m;j=1,2,…n) однозначно определяется исход игры, то есть выигрыш игрока Аaijи проигрыш игрока В -aij.

Матрица P=(aij) (i=1,2,…m; j=1,2,…n), элементами которой являются выигрыши, соответствующие стратегиям Aiи Bj, называется платежной матрицей или матрицей игры. Общий вид матрицы:

Таблица 15

B1

B2

Bn

A1

a11

a12

a1n

A2

a21

a22

a2n

Am

am1

am2

amn

Строки этой таблицы соответствуют стратегиям игрока А, столбцы - стратегиям игрока В.

Пример 17. Игра "Поиск"

Игрок А может спрятаться в одном из убежишь I или II. Игрок В ищет игрока А. Если найдет, то получает от А штраф $1, если не найдет, то платит игроку А $1.

Стратегии игрока А:

А1- игрок А прячется в убежищеI;

А2- игрок А прячется в убежищеII.

Стратегии игрока В:

В1- игрок В ищет в убежищеI;

В2- игрок В ищет в убежищеII.

Если игрок А в убежище Iи В его обнаружил (стратегияA1B1), то игрок А платит штраф $1 (а11=-1). Аналогично для стратегииA2B2а22=-1.

Если А в убежище I, а В его не обнаружил (стратегияA1B2), то игрок А получает $1 (а12=1). Аналогично для стратегииA2B1а21=1.

Размерность игры 22.

Платежная матрица игра, матрица размером 22:

-1

1

1

-1

Рассмотрим игру mn с матрицей Р=(аij) размеромmn.

Определим наилучшую стратегию игрока А среди стратегий A1,A2,…,Am.

Выбирая стратегию Аi, игрок А рассчитывает, что В выберет стратегию Вj, для которой выигрыш А минимален (игрок В вредит А).

Обозначим - минимальный выигрыш игрока А, при выборе им стратегии Ai, для всех возможных стратегиях В.

- минимальное число в i-ой строке платежной матрицы.

Среди всех возможных выберем максимальное:

-нижняя цена игры (максимин)- максимальный гарантированный выигрыш игрока А.

Стратегия, соответствующая максимину называется максиминной стратегией.

Игрок В заинтересован в том, чтобы уменьшить выигрыш игрока А. Выбирая стратегию Вj, игрок В максимально возможный при этом выигрыш игрока А. Обозначим- самый большой элемент в столбцеj. Тогда

- верхняя цена игры (минимакс)- минимальный гарантированный проигрыш игрока В.

Стратегия, соответствующая минимаксу называется минимаксной стратегией.

Принцип, диктующий игрокам выбор "осторожных" минимаксных или максиминных стратегий называется принципом минимакса.

Найдем верхнюю и нижнюю цену игры "Поиск".

Следовательно, игрок А может выбирать любую стратегию А1или А2, они обе масиминны. Нижняя цена игры равна -1.

Любая стратегия игрока В минимаксна и верхняя цена игры равна 1.

Если верхняя цена игры равна нижней цене игры, то - чистая цена игры. Минимаксные стратегии, соответствующие чистой цене игры, называются оптимальными, а их совокупность - оптимальным решением или решением игры. Игрок А получает гарантированный, не зависящей от стратегии игрока В выигрыш, а игрок В добивается минимального гарантированного, не зависящего от выбора А, проигрыша.

Решение игры устойчиво,если один из игроков придерживается оптимальной стратегии, то для другого не может быть выгодным отклоняться от своей оптимальной стратегии.

Пара чистых стратегий AiBjдает оптимальное решение игры тогда и только тогда, когдаaij- максимум в своем столбце и минимум в своей строке. Такая ситуация, если она существует, называетсяседловой точкой.

Пусть А*В*- пара чистых стратегий при которых достигается решение игры в задаче с седловой точкой. Введем функцию выигрыша игрока.P(Ai,Bj)=aij. Тогда, из условия оптимальности в седловой точке выполняется неравенствоP(Ai,B*)P(A*,B*)P(A*,Bj), которое справедливо для всех i=1,2,…m; j=1,2,…n.

Пример.

Найти верхнюю и нижнюю цену игры.

0,5

0,6

0,8

0,9

0,7

0,8

0,7

0,6

0,6

Имеет ли игра седловую точку?

Решение:

Найдем минимумы по строкам и максимумы по столбцам. Среди минимумов найдем максимум max(0,5;0,7;0,6)=0,7 Минимксная стратегия А2. Среди максимумов найдем минимумmin(0,9;0,7;0,8)=0,7 Максиминная стратегия В2.

В1

В2

В3

А1

0,5

0,6

0,8

0,5

А2

0,9

0,7

0,8

0,7

А3

0,7

0,6

0,6

0,6

0,9

0,7

0,8

Таким образом , следовательно игра имеет седловую точку а22, соответствующую стратегии А2В2(решение игры) и чистая цена игры.