Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1danilovtseva_e_r_farafonov_i_g_d_yakova_g_n_teoriya_igr_osno

.pdf
Скачиваний:
2
Добавлен:
29.10.2019
Размер:
323.91 Кб
Скачать

Пусть первый игрок выбрал свою максиминную стратегию i = 2 , тогда второму выгодно выбрать свою стратегию j = 2 и проиграть 20. Но в этом случае первому выгоднее отклониться от своей максиминной стратегии и выбрать i = 1, выигрывая при этом 30. Тогда второму выгодно выбрать j = 1 и проиграть всего 10. Но в этом случае первый выберет i = 2 и выиграет 40, на что второй ответит выбором j = 2 и проигрышем 20 и т.д. Видно, что ни одна из ситуаций не является приемлемой одновременно для обоих игроков.

12. Смешанные стратегии

Если в игре с матрицей максимин и минимакс не равны друг другу,

A

то по теореме 4, игра с такой матрицей не имеет ситуации равновесия.

В этом случае игрок 1 может обеспечить себе выигрыш max min aij

i j

(имеет гарантированный выигрыш), а игрок 2 может не дать ему боль-

ше, чем min max aij (имеет гарантированный проигрыш). Вопрос о разде-

j i

ле между игроками разности (эта разность всегда неотрицательна) остается открытым. Поэтому естественно желание игроков получить дополнительные стратегические возможности для уверенного получения в свою пользу возможно большей доли этой разности.

Оказывается, игрокам целесообразно выбирать свои стратегии случайно, т. е. определять распределение вероятностей на множестве чистых (первоначальных) стратегий, а затем предоставить выбор конкретной чистой стратегии случайному механизму.

Выбор игроками своих чистых стратегий с некоторыми наперед заданными вероятностями – по существу один из планов проведения игры и, таким образом, тоже является некоторой стратегией. В отличие от первоначально заданных (чистых) стратегий, такие стратегии называются смешанными.

Определение 15. Распределение вероятностей на множестве чистых стратегий игрока называется его смешанной стратегией.

Смешанную стратегию игрока можно представить в виде вектора

X = (x1, x2 , ..., xn ),

(12.1)

где x1 0, x2 0, ..., xn 0,

(12.2)

n

 

∑ xi = 1,

(12.3)

i=1

 

21

здесь xi – вероятность выбора игроком его i-й стратегии.

Таким образом, задание смешанной стратегии игрока состоит в указании тех вероятностей, с которыми выбираются его первоначальные стратегии. Выбор игроком одной первоначальной (чистой) стратегии равносилен заданию смешанной стратегии, в которой выбранная чистая стратегия имеет вероятность 1, а все остальные – 0. Поэтому каждая первоначальная стратегия также может рассматриваться как смешанная. Все чистые стратегии игрока являются ортами в n -мерном евклидовом пространстве векторов вида (12.1):

l1 = (1, 0, ..., 0), l2 = (0, 1, ..., 0),

.....................

ln = (0, 0, ..., 1). (12.4)

Множество всех векторов (12.1), подчиненных условиям (12.2) и (12.3), составляет (n −1)-мерный симплекс, натянутый на орты l1, l2, …, ln чистых стратегий.

Этот симплекс будем называть фундаментальным и обозначать через Sn . В случае n = 2 симплекс является отрезком, в случае n = 3 – треуголь-

ником, в случае n = 4 – тетраэдром. (рис. 1).

x

 

x3

 

2

 

 

 

n = 2

 

e3

 

e2

 

n =3

 

 

 

 

S2

 

 

 

 

 

S3

 

e1

x1

e2

x2

e1

x1

Рис. 1

22

i=1 j=1

13. Смешанное расширение матричной игры

Пусть в игре с матрицей выигрышей

 

a

a

...

a

 

 

11

12

...

1n

 

 

a21

a22

a2n

A =

 

...

...

...

 

 

...

 

 

am1

am2

...

amn

игроки 1 и 2 независимо выбирают свои смешанные стратегии

X = (x1, ..., xm ), Y = (y1, ..., yn ).

Определение 16. Пара (X, Y) смешанных стратегий игроков в матричной игре называется ситуацией в смешанных стратегиях в этой игре.

В условиях ситуации в смешанных стратегиях каждая обычная ситуация (i, j) (в чистых стратегиях) реализуется с вероятностью xi yj.

Таким образом, первый игрок получает выигрыш aij с вероятностью xiyj, а математическое ожидание его выигрыша равно

m n

∑ ∑ aij xi y j .

Это число принимается за выигрыш игрока 1 в ситуации (X, Y) в смешанных стратегиях и обозначается через H (X , Y ).

Определение 17. Смешанным расширением матричной игры называется антагонистическая игра < Sm , Sn , Н >, в которой стратегиями игроков являются их смешанные стратегии в исходной игре, а функция выигрыша игрока 1 определяется как

 

 

 

H (X,

m n

 

 

 

 

 

 

 

 

 

Y) = ∑ ∑ aij xi y j .

 

 

 

(13.1)

 

 

 

 

 

 

i=1 j=1

 

 

 

 

 

 

В обозначениях скалярных произведений (13.1) можно переписать

 

 

 

m

 

n

m

T

=

 

T

,

 

 

H (X , Y ) = ∑ xi

aij y j = ∑ xi Ai Y

 

XAY

 

(13.2)

 

 

 

i=1

 

j=1

i=1

 

 

 

 

 

 

где использованы обозначения:

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

W T = (w ,

 

 

1

 

 

 

 

 

 

 

 

 

w

,..., w )T = w2

 

– вектор-столбец,

 

 

 

 

1

2

n

...

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

wn

 

 

 

 

 

 

 

 

23

 

 

 

 

 

 

 

 

 

 

 

 

ров Z и W. Таким образом,

Z W T = (z , ...,

 

 

w1

 

 

z

n

) ...

 

=

1

 

 

 

 

 

 

 

 

 

 

 

 

 

wn

 

n

ziwi – скалярное произведение векто-

i=1

 

T

.

(13.3)

H (X , Y ) = X AY

 

Вспоминая определение седловой точки антагонистической игры, получаем, что в смешанном расширении матричной игры ситуация

(X *, Y * ) является седловой точкой (ситуацией равновесия), если выполняется двойное неравенство

 

*T

X

* *T

X

*

T

X Sm ,

Y

Sn ,

X AY

 

AY

AY

 

 

H (X , Y * )H (X *,

Y * )H (X *, Y ).

(13.4)

Лемма 1 (о переходе к смешанным стратегиям).

Пусть Y – произвольная стратегия игрока 2, a – некоторое число:

 

 

AY T a, i = 1,

..., m,

(13.5)

 

 

i

 

 

тогда для любой смешанной стратегии

X = (x1, ..., xn ),

X Sm верно

 

T

a .

 

 

XAY

 

 

 

Д о к а з а т е л ь с т в о. Умножим каждое из неравенств (13.5) на xi

(знак неравенства не изменится, так как

xi ≥ 0 ). Получим

 

x AY T

x a,

i = 1, ..., m.

 

 

i i

 

i

 

 

 

 

Сложим все полученные неравенства:

 

 

T

m

T

m

 

m

= a,

XAY

= ∑ x AY

 

x a = a x = a 1

 

i=1 i i

 

i=1

i

i=1 i

 

что и требовалось доказать.

Замечание. Точно так же осуществляются переходы к смешанным стратегиям в неравенствах вида

AY

T

a

i = 1,

..., m

 

 

 

T

a

X S

 

,

 

XAY

 

m

i

 

 

 

 

 

 

 

 

 

 

 

XAj

a

j = 1,

..., n

 

 

T

a

Y Sn ,

 

XAY

 

 

 

XAj a

j = 1,

..., n

 

XAY T

a

Y Sn.

 

24

Теорема 5. Для того чтобы ситуация

 

(X *, Y * )

была равновесной,

необходимо и достаточно, чтобы при всех i = 1, ...,

m и j = 1,

...,

n

выполнялись неравенства

 

 

 

 

 

 

 

 

 

 

 

AY

*T

X

*

*T

X

*

A

.

 

(13.6)

 

AY

 

 

 

i

 

 

 

 

 

 

 

j

 

 

 

 

Д о к а з а т е л ь с т в о.

1. Необходимость. Пусть (X *,

Y * )

ситуация равновесия. верны неравенства (13.4) при всех X Sn

и

Y Sn верны неравенства (13.6), так как они получаются из нера-

венств (13.4) как частный случай при X = l ,

Y T = l

T .

i

 

j

2. Достаточность. Пусть верны неравенства (13.6) при всех i = 1, ..., m и j = 1, ..., n. Применим к обеим сторонам неравенств (13.6) лемму о переходе к смешанным стратегиям. Это даст нам неравенства (13.4).

Теорема 6. Если ситуация (i*, j* ) в чистых стратегиях является рав-

 

 

 

 

 

 

 

 

 

новесной для матричной игры с матрицей A, то она является равновес-

ной и для ее смешанного расширения.

 

Д о к а з а т е л ь с т в о.

(i*,

j* ) – равновесная ситуация в матрич-

ной игре с матрицей

 

 

 

 

 

 

 

 

A,

 

 

 

 

 

 

a * a

*

* a

*

j

i = 1, ..., m, i = 1, ..., n.

(13.7)

ij

i

j

 

i

 

 

 

Но неравенства (13.6) превращаются в (13.7), если подставить X * = i*, Y * = j*. Значит, неравенства (13.6) справедливы для таких

X *, Y * и ситуация ( X * = i*, Y * = j* ) – равновесная ситуация для сме-

шанного расширения игры. Оказывается, что ситуации равновесия в смешанном расширении существуют для любой матричной игры.

Замечание. Далее удобно обозначать смешанную стратегию, соответствующую чистой стратегии i , тем же символом i. Тогда,

 

 

T

= A j .

(13.8)

i A = Ai ,

A j

 

25

14.Существование минимаксов

всмешанных стратегиях. Равенство минимаксов

Лемма 2. 1. При любом Y0 Sn

 

существует максимум max

 

 

T

 

 

XAY0 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

2. При любом X0 Sm

 

существует минимум

 

 

 

T

.

 

 

 

 

 

min X0 AY

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Y

 

 

 

 

 

 

 

 

 

Д

о к

 

а

 

з

а т

е л ь

с

т

 

в о.

 

1.

Рассмотрим функцию

F(x ,

...,

x

 

) =

 

T

= ∑ x AY

T

. Эта функция линейна по x ,

...,

x

 

,

m

XAY

 

 

 

m

1

 

 

 

 

0

 

 

i

i

i 0

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а потому является непрерывной функцией от x1,

..., xm.

 

 

 

 

 

 

 

 

Множество Sm – замкнутое, ограниченное.

 

Функция F(x1,

...,

xm )

 

достигает на Sm (в силу непрерывности) своего максимума.

 

 

 

 

 

 

 

 

2. Второе утверждение леммы доказывается аналогично.

 

 

 

 

 

 

Лемма 3. 1. max

 

 

T

– непрерывная функция Y.

 

 

 

 

 

 

 

 

XAY

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.

min

 

 

 

T

– непрерывная функция X.

 

 

 

 

 

 

 

 

 

 

 

XAY

 

 

 

 

 

 

 

 

 

 

 

 

 

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Данная лемма приводится без доказательств.

 

 

 

 

 

 

 

 

 

 

Теорема 7. Минимаксы

 

 

 

 

 

 

 

T

 

 

 

 

T

 

существуют.

max min XAY

и min max XAY

 

 

 

 

 

 

 

 

 

 

 

X

Y

 

 

 

 

 

 

Y

 

X

 

 

 

 

 

 

 

 

 

Д о к а з а т е л ь с т в о. 1. Sn

 

 

– замкнутое ограниченное множество

функция

 

 

 

 

T

достигает на Sn

(в силу непрерывности) сво-

max XAY

 

 

 

 

 

 

X

 

 

 

 

 

 

 

T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

существует.

 

 

 

 

 

 

 

 

 

 

его минимума, т. е. min max XAY

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Y

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T

.

 

 

 

 

 

Аналогично доказывается существование max min XAY

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

Y

 

 

 

 

 

 

 

 

 

Теорема 8. (теорема о минимаксах)

 

 

 

 

 

 

 

 

 

 

 

 

 

Какова бы ни была матрица A :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T

 

 

 

 

T

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

max min XAY

 

= min max XAY

 

 

 

 

(14.1)

 

 

 

 

 

 

 

 

X

 

Y

 

 

 

 

 

Y

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Или, другими словами, равновесные смешанные стратегии игроков существуют.

Без доказательства.

26

Определение 18. Общее значение минимаксов (14.1) называется зна-

чением матричной игры с матрицей выигрышей Это значение игры

A.

( )

обозначается V A .

Соответствие между матричной игрой и ее значением можно понимать как функцию, заданную на множестве всех матричных игр (или, что то же самое, на множестве всех матриц).

Выбор игроком 1 стратегии X0, по которой достигается внешний максимум в (14.1) – наилучшее из всего того, что он может предпринять, так как этот максимум будет получен им, как бы ни складывались обстоятельства.

Выбор игроком 2 стратегии Y0 , по которой достигается внешний минимум в (14.1) – наиболее целесообразное из его действий, так как при этом он не даст игроку 1 больше этого минимакса, как бы ни складывались обстоятельства.

Таким образом, игроки 1 и 2 должны выбирать такие свои стратегии, которые в игре составляют седловую точку.

Определение 19. Равновесные стратегии игроков в антагонистической игре называются их оптимальными стратегиями.

Определениеседловойточки (X *, Y * ) можнопереписатьтеперьввиде

*T

V X

*

T

при всех X Sm , Y Sn .

(14.2)

XAY

AY

 

Мы видим, что выбор игроком 1 оптимальной стратегии дает ему выигрыш не меньший, чем значение игры, что бы ни делал при этом игрок 2. Выбор игроком 2 его оптимальной стратегии всегда причиняет ему ущерб не больший, чем значение игры, что бы ни делал при этом игрок 1. Следовательно, выбор каждым из игроков своей оптимальной стратегии не имеет смысла скрывать от противника. Это дает основание называть матричную игру вполне определенной. Определенность игры понимается в том смысле, что в условиях применения игроками смешанных стратегий однозначно устанавливается математическое ожидание выигрыша игрока 1. Фактические же значения выигрыша игрока 1 в отдельных партиях могут быть различными.

27

15. Три свойства значения игры

Теорема 9. В матричной игре с матрицей выигрышей

 

A

 

= max min XA j = min max Ai Y

T

,

(15.1)

V (A)

 

 

 

X j

Y i

 

 

 

причем внешние экстремумы достигаются на оптимальных стратегиях игроков.

Приводится без доказательства.

 

 

 

 

верно

 

Теорема 10. Для любой матрицы A

 

 

 

 

 

 

(15.2)

 

max min aij ≤ V (A)min max aij ,

 

i j

 

j i

 

Д о к а з а т е л ь с т в о.

1. Докажем левое неравенство.

 

 

 

 

 

 

 

Из выражения (15.1) следует, что V (A) = max min XA j .

 

 

 

 

 

X j

 

Но max min XA j max miniA j

= max min aij , так как переход от про-

X j

i

j

i

j

 

извольных смешанных стратегий к частным лишь сужает область максимизации и может лишь уменьшить внешний максимум.

 

что и требовалось доказать.

V (A)max min aij ,

i j

 

2. Правая часть неравенства доказывается аналогично.

Теорема 11. 1. Если игрок 1 имеет чистую оптимальную стратегию i0, то

 

 

V = max min aij = min a i j .

(15.3)

 

 

i

j

 

j

0

 

 

 

 

 

 

2. Если игрок 2 имеет чистую оптимальную стратегию j0, то

 

 

 

V = min max aij = max aij .

(15.4)

 

 

j

i

i

 

0

 

 

 

 

 

 

Д о к а з а т е л ь с т в о.

1. Согласно (15.1) V = max min XA j . Из

 

 

 

 

 

 

X j

 

условия

теоремы

максимум

достигается на X = i0 ,

т. е.

max min XA j = mini0 A j = min a i j ,

что и требовалось доказать.

 

X j

j

j

0

 

 

 

 

 

 

 

 

 

2. Доказывается аналогично.

28

16. Доминирование стратегий

Определение 20. 1. Стратегия X ′ игрока 1 строго доминирует стра-

тегию X ′′, ( X ′′

– строго доминируется

X ′ ), если

X A j > X ′′A j при

любом j = 1, ...,

n.

 

 

 

 

 

 

 

2. Стратегия Y ′ игрока 2 строго доминирует стратегию Y ′′ , ( Y ′′

строго доминируется стратегией

Y ′ ), если A Y T <

A Y ′′T

при любом

i = 1,

...,

m.

 

 

 

 

 

i

i

 

 

 

X

 

 

 

 

 

Определение 21. 1. Стратегия

игрока 1 доминирует стратегию

X ′′,

( X ′′

доминируется

X ′ ), если

 

X A j X ′′A j

при любом

j = 1,

...,

n. 2. Стратегия Y

игрока 2 доминирует стратегию Y ′′, (Y ′′

доминируется Y ′ ), если Ai Y T

Ai Y ′′T при любом i = 1,

..., m.

В частности: 1. Чистая стратегия i

игрока 1 строго доминирует (до-

минирует) чистую стратегию i′′ , если aij

> ai′′j при всех

j, ( aij ai′′j

при всех j ). 2. Чистая стратегия

j′ игрока 2 строго доминирует (доми-

нирует) чистую стратегию j′′,

если a

< a

 

при всех i, ( aijaij′′ при

 

 

 

 

 

ij

ij′′

 

 

 

всех i ).

Определение 22. Спектром смешанной стратегии игрока называется множество всех его чистых стратегий, вероятность применения которых согласно этой стратегии положительна.

Чистые стратегии, входящие в спектр данной смешанной стратегии, называются существенными для нее.

Теорема 12. Если чистая стратегия одного из игроков содержится в спектре некоторой его оптимальной стратегии, то выигрыш этого игрока в ситуации, образованной данной чистой стратегией и любой оптимальной стратегией другого игрока, равен значению

игры.

 

 

 

 

 

 

 

 

Д о к а з а т е л ь с т в о.

Пусть i

содержится в спектре X *

 

 

 

 

 

0

 

 

 

оптимальной стратегии игрока 1. Тогда вероятность применения i0

в

смешанной стратегии X *

положительна

x * > 0 .

(X * ,Y * ) – ситуация

 

 

 

 

 

 

i0

Пусть Y * – оптимальная стратегия игрока 2.

равновесия, а значит

 

 

 

 

 

 

 

 

X

*

 

*T

 

 

 

(16.1)

AY

 

= V (A)

 

29

Тогда по теореме 5 для любого i верно

 

A Y *T

< V .

(16.2)

i0

 

 

Предположим, что утверждение теоремы 12 неверно. Это значит, что

A Y *T < V .

(16.3)

i0

 

Суммируя по i неравенства (16.2), умноженные каждое на x *

, и

 

 

 

 

 

 

 

 

i

 

учитывая неравенство (16.3), получим

 

 

 

 

X

* *T

*

Ai Y

*T

<xi

*

*

= V .

 

AY

= xi

 

V = V xi

 

 

 

i

 

 

i

 

i

 

 

Таким образом, получено

X

* *T

< V ,

что противоречит ра-

AY

венству (16.1).

Значит, наше предположение неверно и утверждение теоремы 12 справедливо, т. е. Ai0 Y *T = V . Что и требовалось доказать.

Утверждение теоремы 12 можно записать следующим образом: если X *, Y * – оптимальные стратегии игроков 1 и 2, то

 

n

 

 

 

 

 

 

 

 

 

Ai0 Y *T = ai0 j y j* = V ,

для i

 

 

таких, что

x

*

> 0,

(16.4)

 

j=1

 

 

0

 

 

i0

 

 

 

m

 

 

 

 

 

 

 

 

 

X * A j

= aij

xi* = V ,

для j

0

таких, что

 

y

* > 0.

(16.5)

0

0

 

 

 

 

 

j0

 

 

i=1

 

 

 

 

 

 

 

 

 

Теорема 13. Ни одна строго доминируемая чистая стратегия игрока

не содержится в спектре его оптимальной стратегии.

 

 

 

Д о к а з а т е л ь с т в о. Пусть Y 0 строго доминирует чистую j

,

 

 

0

 

а X* – некоторая оптимальная стратегия игрока 1. Тогда

A j

> A Y 0

 

 

i 0

i

 

при всех i. Домножая эти неравенства на x

*

каждое и суммируя по

 

 

 

 

 

 

 

i

 

i, получим

 

 

 

 

 

 

 

 

X

*

Ai j0

> X

*

0

.

 

(16.6)

 

AY

 

Предположим, j0 содержится в спектре некоторой оптимальной стратегии игрока 2. Тогда по теореме 12

X * A j = X * A

= V .

 

 

(16.7)

i 0

j

 

 

 

 

 

0

 

 

 

 

Сравнивая выражения (16.6) и (16.7), имеем X

*

0

< V , а это про-

AY

 

тиворечит оптимальности стратегии

X * (см. (14.2)).

 

 

30