Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
theoriya_igr.pdf
Скачиваний:
129
Добавлен:
03.05.2015
Размер:
667.17 Кб
Скачать

Определим минимаксную стратегию второго игрока, выбрав наибольшие значения проигрышей для второго игрока в каждом столбце матрицы выигрышей:

b = 8, b

2

= 5, b

3

=12, b = 7, b = 1, b = min b=

5 Þ B .

1

 

4

5

j

2

Здесь уже нет седловой точки, так как a < b .

Допустим, что первому игроку стало известно, что второй игрок принял минимаксную стратегию B2 , тогда оптимальной для первого игрока будет не максиминная стратегия A2 , а стратегия A1 , дающая ему выигрыш 5 > a .

Это означает, что бывают ситуации, когда первый игрок может получить выигрыш, превосходящий максиминный, если ему известны намерения второго игрока(при многократном повторении игры в сходных условиях).

2.3. Смешанные стратегии

Рассмотрим теперь подробнее случай отсутствия седловой точки, то есть случай, когда a < b . Это означает, что первый игрок может обеспечить себе выигрыш, не меньший a , а второй — проигрыш, не больший b . Возникает вопрос, как «справедливо» разделить разность b -a между игроками.

Оказывается, что компромиссного распределения разности b -a между игроками можно добиться путем случайного чередования игроками чистых стратегий. При этом можно получить выигрыш «в среднем» больший, чем a , но меньший, чем b .

Для этого применяют так называемые смешанные стратегии, которые можно представить в виде случайных величин, возможными значениями которых являются чистые стратегии.

Для первого игрока имеем смешанную стратегию

S1

æ

A

A

...

A

ö

,

(2.7)

= ç

1

2

...

m

÷

 

è p1

p2

pm ø

 

 

23

где pi ³ 0 — вероятность того, что первый игрок применит

m

чистую стратегию Ai , å pi =1 .

i=1

Адля второго игрока имеем смешанную стратегию:

S2

æ B

B

...

B

ö

,

(2.7')

= ç 1

2

...

n

÷

 

è q1

q2

qn

ø

 

 

где qj ³ 0 — вероятность того, что второй игрок применит чистую

n

стратегию Bj , åq j =1 .

j =1

Отметим, что каждая чистая стратегия является частным случаем смешанной стратегии.

Если мы окажемся в ситуации {Ai , Bj }, то она будет реализо-

вана с вероятностью pi × q j , а выигрыш составит величинуaij .

И средний выигрыш первого игрока можно определить как математическое ожидание:

m n

 

H (A, p, q) = ååaij pi q j ,

(2.8)

i =1 j =1

 

где p, q — вектора с компонентами pi и qj соответственно.

Стратегии p0 = ( p10 ,..., pm0 ) и q0 = (q10 ,..., qm0 )

называются оп-

тимальными смешанными стратегиями игроков, если выполнены следующие соотношения:

H (A, p, q0 ) £ H (A, p0 , q0 ) £ H (A, p0 , q) .

 

(2.9)

Поясним последнее соотношение. Левая часть этого неравен-

ства H (A, p, q0 ) £ H (A, p0 , q0 )

означает, что

если

первый игрок

отклоняется от оптимальной

стратегииp0 ,

то

его выигрыш

24

может только уменьшиться, при условии, что второй игрок придерживается оптимальной стратегии q0 . Аналогично: неравенст-

во H (A, p0 , q0 ) £ H (A, p0 , q) означает, что если второй игрок от-

клоняется от оптимальной стратегии q0 , то его проигрыш может только увеличиться.

Условие оптимальности (2.9) аналогично условию

max min H (A, p, q) = H (A, p0 , q0 ) = min max H (A, p, q) . (2.10)

p q q p

И величина

 

H (A, p0 , q0 ) =n

(2.11)

будет называться ценой игры, а «набор» ( p0 , q0 ,n )

называется

решением матричной игры.

Естественно, что возникают следующие вопросы: какие матричные игры имеют решение в смешанных стратегиях и как найти это решение, если оно существует. Ответ на этот вопрос дает

основная теорема теории матричных игр.

Теорема 2.1. (Неймана). Для матричной игры с любой матрицей A величины

max min H (A, p, q ) , min max H (A, p, q )

p

q

q

p

существуют и равны между собой:

max min H (A, p, q ) = min max H (A, p, q ) .

p q q p

Более того, существует, по крайней мере, одна ситуация

( p0 , q0 ), для которой выполняется соотношение:

25

max min H (A, p, q ) = min max H (A, p, q ) =

p q

q p

(2.12)

= H (A, p0 ,q0 ) =n .

 

 

 

Другими словами,

любая матричная игра имеет решение

всмешанных стратегиях.

Всостав оптимальных смешанных стратегий игроков могут

входить не все чистые стратегии Ai , Bj , то есть вероятности не-

которых из них будут равны нулю ( pi0 = 0, q0j = 0). Тогда те чис-

тые стратегии Ai , Bj , которые входят в оптимальные смешанные

стратегии, будут называться активными чистыми стратегиями.

На этот счет справедлива следующая теорема:

Теорема 2.2. Оптимальная смешанная стратегия p0

первого

игрока смешивается только из тех чистых стратегий Ai ,

( pi

¹ 0),

для которых выполнены равенства

 

 

n

 

 

åaij q0j =n ;

 

 

j =1

 

 

А в оптимальной смешанной стратегииq0 второго

игрока

смешиваются только те стратегииBj , для которых выполнены равенства

m

 

 

 

 

 

 

åaij pi0

=n .

 

 

 

 

i =1

 

 

 

 

 

 

Кроме того, справедливы равенства:

 

 

m

 

 

m

 

 

n = min åaij pi0

max= min åaij pi

 

 

j

i =1

 

p j

i=1

.

(2.13)

 

 

 

 

 

n

 

n

= min max

åaij q j

= max

åaij q0j

 

 

q

i

j =1

i

j =1

 

 

 

 

 

 

 

26

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]