Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
sadovin_h_c_sadovina_t_n_osnovy_teorii_igr.pdf
Скачиваний:
34
Добавлен:
01.01.2020
Размер:
667.17 Кб
Скачать

Последние равенства и представляют собой основу для разработки различных методов решения матричных игр.

Таким образом, можно привести следующие условия приме-

нения смешанных стратегий:

 

 

 

1.

Игра без седловой точки.

 

 

2.

Игроки используют

случайную

смесь

чистых стратегий

с заданными вероятностями.

 

 

 

3.

Игра повторяется многократно в сходных условиях.

4.

При любом ходе ни

один из

игроков

не информирован

остратегии второго игрока.

5.Допускается усреднение результатов игр.

Перейдем теперь к изучению методов решения матричных игр в смешанных стратегиях.

2.4. Решение матричной игры 2×2

Начнем рассмотрение методов нахождения оптимальных смешанных стратегий с простейшей игры, описываемой платежной матрицей

æ a

a

ö

A = ç 11

12

÷ .

è a21

a22

ø

Пусть смешанные стратегии игроков имеют вид:

S1 =

æ

A

A

ö

 

, S2

æ B

B

ö

 

 

 

 

ç

1

p

2

÷

 

= ç

1

q

2

÷ .

 

 

 

 

 

è

p

2

ø

 

 

è

q

2

ø

 

 

 

 

 

1

 

 

 

1

 

 

 

 

 

Оптимальные

стратегии p0

и

p0

=1 - p0

и цена игрыn

 

 

 

 

 

 

 

 

 

 

 

 

1

 

2

1

 

должны удовлетворять условиям:

 

 

 

 

ìa

p

+ a

p

 

=n ,

 

 

 

 

 

 

 

 

(2.14)

í 11

1

 

21

 

2

 

 

 

 

 

 

 

 

 

 

îa12 p1 + a22 p2 =n ,

 

 

 

 

 

 

 

 

 

или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a11 p1 + a21 (1 - p1 )

=a12 p1 + a22 (1 - p1 ) .

 

27

Откуда получаем следующее решение матричной игры:

ì

 

 

 

a22 - a21

 

 

 

 

 

ï p10 =

 

 

 

 

 

,

 

 

 

a11 + a22 - (a12 + a21 )

 

 

ï

 

 

 

 

ï

 

 

 

 

 

 

 

a

- a

 

 

ï

 

 

 

 

 

 

 

 

 

í p20 =

1 - p10 =

 

 

11

 

12

,

(2.15)

a11 + a22 - (a12 + a21 )

ï

 

 

 

 

 

 

 

ï

 

 

=p0

 

 

 

p0 =

 

a11a22 - a12 a21

 

ïn a

+ a

 

 

 

.

 

 

a11 + a22 - (a12 + a21 )

ï

11

1

 

21

2

 

î

 

 

 

 

 

 

 

 

 

 

 

 

Вычислив оптимальное значение n , можем вычислить и оптимальную смешанную стратегию второго игрока из условия a11q1 + a12 q2 = v , или a11q1 + a12 (1- q1 ) = v . А именно:

q0

 

v - a

q0

1- q0

a

- v

,

(2.15')

=

 

= 12

,

=

11

 

 

 

 

1

 

a11

- a12

2

1

a11 - a12

 

 

 

 

 

 

 

 

при a11 ¹ a12 .

Эту задачу можно решить и графически, учитывая, что решение системы (2.14) представляет собой геометрически точку пересечения двух прямых на плоскости ( p1 , n ) или (1 - p1 , n ).

Приведем алгоритм геометрического способа решения игры

2×2:

1. На оси абсцисс откладываем отрезок единичной длины p1 = p Î[0, 1].

2.

На оси ординат

откладываем выигрышы при

стратегии

A2 , а на прямой p =1 — выигрыши при стратегии A1 .

 

3.

Строим стратегии, проходящие через точки:

 

а) (0, a21 ) и (1, a11 );

 

 

б) (0, a22 ) и (1, a12 ) .

 

 

4.

Находим точку

пересечения прямых, которая

и дает

решение матричной игры ( p10 , v).

28

Проиллюстрируем данный алгоритм на рисунке:

n

a21

a12

 

n

 

 

 

 

a22

 

 

 

 

 

 

 

a11

 

0

 

p10

1

p

 

 

Рис. 2.1

 

 

№ 2.5. Решите матричную игру 2 ´ 2 ,

заданную

платежной

матрицей:

 

 

 

 

æ 3

8 ö

 

 

A = ç

4

÷ .

 

 

è7

ø

 

 

Решение. Определим сначала верхнюю и нижнюю цену игры:

a1

= 3,

a2

4, =a

max {3, =4}

4 ,

b1

= 7,

b2

8, =b

min {7, =8}

7 .

Так как a < b , то имеем игру без седловой точки, что при-

водит к необходимости рассмотрения смешанной стратегии. По формулам (2.15) найдем:

p0

=

4

- 7

 

= 0,375 ,

 

 

 

1

 

3 + 4

- 7

- 8

 

 

 

 

p0

=1 - p0 1=- 0,375 = 0,625 ,

2

 

1

 

 

 

n = 3 ×0,375 + 7 ×0,625 = 5,5 .

29

По формулам (2.15´) определим смешанную стратегию второго игрока:

q0

=

5,5=-8

= 0,5, q0

1- q0

= 0,5 .

1

3 - 8

2

1

 

 

 

 

 

Ответ: p0

= (0,375; 0,625=),

q0 (0,5; 0,5=), v 5,5 .

Проиллюстрируем это решение графически согласно приве-

денному выше алгоритму.

 

 

 

n

 

 

 

 

 

 

 

 

8

 

7

 

 

 

 

 

5,5

 

 

 

 

4

 

 

 

 

 

 

 

 

 

3

0

0,375

1

p

Рис. 2.2

2.5. Матричные игры 2×n

Пусть платежная матрица игры имеет вид:

æ a

a

...

a

ö

A = ç 11

12

...

1n

÷ .

è a21

a22

a2n ø

30

Тогда, согласно теореме 2.2, решение игры находится из уравнения:

n = min a

p0 + a 1

- p0

))

=max min

(

a

p + a

(1 - p)

)

, j=

1, n

.

j

( 1 j

2 j (

 

0£ p£1 j

1 j

2 j

 

 

 

 

Для нахождения максимума (по p ) функции

 

 

 

 

 

min (a1 j

p + a2 j (1- p)),

 

 

 

 

 

 

 

(2.16)

j

 

 

 

 

 

 

 

 

 

 

 

 

 

построим ее график. Для этого надо построить n прямых вида:

wj = a1 j p + a2 j (1 - p ) ,

(2.16´)

на плоскости ( p, w), p Î[0, 1]

и путем визуального сравнения

выбрать ломанную, огибающую их снизу. Верхняя точка этой ломанной и дает решение игры.

Геометрически это можно проиллюстрировать следующим образом:

w

n

0

p0

p0

1

p

 

 

1

2

 

 

Рис. 2.3

Здесь нижняя огибающая выделена жирной линией.

31

№ 2.6. Найти оптимальную стратегию первого игрока в матричной игре, заданной матрицей 2×3:

æ1

3

5

ö

A = ç

4

2

1

÷ .

è

ø

Решение. 1. Сначала проанализируем игру на наличие седловой точки:

a1

= 1,

a2

1, =a

max{1;=1} 1 ,

b1

= 4,

b2

3, b3=

5, b min{=4; 3; 5} 3 .

Так как a < b , то седловой точки нет и надо искать решение

всмешанных стратегиях.

2.Вычислим средние выигрыши первого игрока, при условии, что второй игрок выбирает только чистые стратегии, при помощи таблицы:

 

 

p

 

1

3

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 – p

 

4

2

 

1

 

 

 

 

 

 

 

 

 

 

То есть, получаем следующие прямые:

 

 

 

w1 = p + 4(1 - p)= 4 - 3 p ,

 

 

 

 

 

 

w2 = 3 p + 2(1 - p)= p + 2 ,

 

 

 

 

 

 

w3 = 5 p + (1- p) = 4 p -1 .

 

 

 

 

 

 

3.

Построим нижнюю

огибающую

данных

трех прямых

(рис. 2.4).

 

 

 

 

 

 

4.

Видно, что максимальное значение огибающей определя-

ется

точкой пересечения

прямойw1 с прямой w2 .

Поэтому

решаем систему уравнений:

32

w

 

 

5

4

 

 

 

 

 

 

3

2,5

 

 

 

2

 

 

 

1

 

 

1

 

 

 

0

0,5

1

p

 

Рис. 2.4

 

 

ì4 - 3 p = w,

 

 

 

í

 

 

 

î p + 2 = w,

 

 

 

а именно:

 

 

 

4 p = 2, p = 0,5 .

 

 

 

Следовательно, получили следующее решение:

 

 

n = 0,5 + 2 = 2,5,

p0 = (0,5; 0,5).

 

 

Найдем теперь оптимальную стратегию для второго игрока. Здесь в зависимости от формы нижней огибающей может представиться несколько случаев.

А. Нижняя огибающая имеет единственную точку максимума

( p0 ,n 0 ).

1. Если p0 = (0;1), то есть оптимальной стратегией первого игрока является стратегия A2 , то второму игроку выгодно применять чистую стратегию, соответствующую номеру прямой

33

( k 0 ), проходящей через точку( 0, n ) и имеющей наибольший отрицательный наклон.

w

n

(k0 )

0

1

p

Рис. 2.5

2. Если p0 = (1; 0) , то оптимальной для второго игрока яв-

ляется стратегия, соответствующая номеру ( k 0 ) соответствующей прямой, имеющей наименьший положительный наклон.

w

n

(k0 )

0

1

p

Рис. 2.6

34

3. Если 0 < pi0 <1 , то в оптимальной точке пересекаются, как минимум, две прямые:

w

n

(k0 )

(l

0

)

 

 

0

p0

1

p

Рис. 2.7

одна из которых ( k 0 ) имеет положительный наклон, а другая ( l 0 ) отрицательный. И оптимальная смешанная стратегия второго игрока получается при

q0 = q , 1- q0

=q , q= 0, j ¹ k,l,

k

l j

где q0 является решением уравнения

a1k q + a1l (1 - q) a=2k q + a2l (1- q ) .

B. Нижняя огибающая имеет горизонтальный участок.

35

w

(k0 )

0

1

p

Рис. 2.8

Тогда оптимальной для второго игрока является чистая стратегия Bk0 .

Найдем теперь оптимальную стратегию второго игрока в нашей задаче.

1. Так как в оптимальной точке пересекаются первые две прямые, то

q1 = q, q2 = 1 - q, q3 = 0,

то есть из трех стратегий применяются первые две(активными являются B1 и B2 ).

2. Приравняем соответствующие средние выигрыши второго игрока с использованием таблицы:

q

1 – q

0

 

 

 

1

3

5

 

 

 

4

2

1

 

 

 

36

а именно:

1× q + 3×(1- q ) + 0 ×5 = 4 × q + (1 - q )× 2 + 0 ×1 .

3. Решим последнее уравнение:

q + 3 - 3q 4q +=2 - 2q, 4q =1 ,

0

 

1

 

 

0

æ

 

1

 

3

 

ö

q1

=

 

 

,

q

 

= ç

 

 

;

 

;0

÷ .

4

 

4

4

 

 

 

 

 

è

 

 

 

ø

4.

Вычислим цену игры:

 

 

 

1

 

æ

 

 

1 ö

 

 

 

n =1×

 

 

+ 3

ç1 -

 

 

÷

= 2,5.

4

 

4

 

 

 

 

è

 

 

ø

 

 

 

Следовательно, полное решение игры имеет вид:

p

0

= (0,5; 0,5),

q

0

æ 1

;

3

; 0

ö

,

n = 2,5.

 

 

= ç

 

 

÷

 

 

4

4

 

 

 

 

 

è

 

 

ø

 

 

2.6.Матричные игры m×2

Вэтом случае платежная матрица игры имеет вид:

æ a11

a12

ö

ç a

a

 

÷

А = ç 21

 

22

÷ .

ç ...

...

÷

ç

am2

÷

è am1

ø

Решение этой игры аналогично решению игры2 ´ n , только

в этом случае на плоскости(q,w) ищется минимум верхней огибающей прямых

37

wi = ai1q + ai 2 (1 - q), i =1, m .

Рассмотрим конкретный пример игры 3 ´ 2 .

№ 2.7. Найти решение игры 3 ´ 2 :

 

æ1

4

ö

A =

ç

3

-2

÷

ç

÷ .

 

ç

0

5

÷

 

è

ø

Решение. 1. Проанализируем игру на наличие седловой точки:

a1 =1, a2 = -2, a3 = 0, a = 1, b1 = 3, b2= 5, b= 3.

То есть a < b и необходимо применить смешанную страте-

гию.

2. Вычислим средние выигрыши второго игрока(при условии, что первый игрок выбирает только чистые стратегии). Из таблицы

q

1 – q

 

 

1

4

 

 

3

-2

 

 

0

5

 

 

получаем следующие прямые:

w = q

+ 4 1- q =

4 - 3q;

1

 

 

(

)

 

w

2

= 3q -

(

)

 

 

2 1

- q= -2 + 5q;

w = 0 + 5 1 - q = 5 - 5q.

3

 

 

(

)

 

38

3. Построим верхнюю огибающую.

w

5

4

3

n

1

0

3

1

q

4

-2

Рис. 2.9

4. Так как наименьшее значение верхней огибающей получается как решение системы уравнений:

ìw =q + 4(1 - q ),

ï

í

ïîw = 3q - 2(1 - q ),

то получаем:

3q - 2(1 - q) =q + 4 (1 - q);

3q - 2 + 2q= q + 4 - 4q ;

39