Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
sadovin_h_c_sadovina_t_n_osnovy_teorii_igr.pdf
Скачиваний:
34
Добавлен:
01.01.2020
Размер:
667.17 Кб
Скачать

2.МАТРИЧНЫЕ ИГРЫ

2.1.Примеры матричных игр

Для того, чтобы составить экономико-математическую модель конфликтной ситуации в виде матричной игры, необходимо построить матрицу выигрышей. Это весьма нетривиальная задача, особенно для игр большой размерности. В общем виде матрица игры (платежная матрица) строится следующим образом:

1) перечисляем все возможные чистые стратегииAi и Bj

игроков;

2)формализуем правила, по которым развивается конфликт

ввиде функции выигрышей f (i, j ) = aij .

Рассмотрим несколько примеров построения платежных матриц.

№ 2.1. Поставка товаров. На каждой из двух баз ассортиментный минимум составляет один и тот же набор изn видов товаров. Каждая база должна поставить в свой магазин только один из этих видов товара. Магазины, обозначим их через A и B, конкурируют между собой. Один и тот же вид товара в обоих магазинах продается по одной и той же цене. Однако товар, поставляемый в магазинB, более высокого качества. Если магазин A

завезет с базы товар i-го вида ( i =1, n ), а магазин B-товар j-го ви-

да ( i =1, n ), отличной от товараi-го вида ( i ¹ j ), то товар i-го вида будет пользоваться спросом и магазин A получит прибыль ci у.е. Если же в магазины A и B завезены товары одинакового вида ( i = j ), то товар i-го вида в магазине A не будет пользо-

ваться спросом, так как такой же товар, но более высокого качества продается в магазинеB, по такой же цене. Поэтому магазин B понесет убытки по транспортировке, хранению и, возможно, порче товара i-го вида в размере d j у.е.

Требуется составить платежную матрицу игры при n = 3 .

14

Решение. Формализуем данную конфликтную ситуацию. Пусть в качестве первого игрока выступает магазин A, а в качестве 2-го — магазин B. Игрок A с целью достижения прибыли имеет возможность выбрать одну изn следующих стратегий Ai

завезти со своей базы товар i-го вида.

Игрок B

также

обладает

n стратегиями Bj

— завезти ее со своей базы j-й товар. Пусть

игроки

выбрали

стратегии{Ai, Bj } .

Тогда можно

составить

следующую функцию выигрышей игрока A:

 

 

 

 

ìc ,если i ¹ j,

 

 

 

f (i,

j )=

íïdi

j

,если i = j, ,

 

 

 

 

 

ï

 

 

 

 

 

 

 

 

 

 

î

 

 

 

 

 

 

 

 

 

а платежная матрица (матрица игры), например,

при n = 3 будет

выглядеть следующим образом:

 

 

 

æ -d1

 

c1

 

c1

 

ö

 

 

 

A = ç

c

-d

2

c

 

÷ .

 

 

 

ç

2

 

 

 

2

 

÷

 

 

 

ç

c

 

c

 

-d

3

÷

 

 

 

è

3

 

 

3

 

 

ø

 

 

 

№ 2.2. Антагонистическая конкуренция. Фирма A производит некоторый сезонный товар, имеющий спрос в течениеT единиц времени, и который она может поставить на рынок в один из моментов времени i =1, 2, .., T . Для конкурентной борьбы с фирмой A дочерняя фирма B концерна D, не заботясь о собственных доходах, производит аналогичный товар, который поступает на рынок в один из моментов времени j =1, 2, .., T . Пусть технология

выпуска товара такова, что чем дольше он находится в производстве, тем выше его качество, а реализуется только товар более высокого качества (так как цена на товары разного качества одна и та же). Доход от продажи товара в единицу времени равен c у.е.

Требуется построить функцию выигрышей фирмыA, где под выигрышем понимается доход фирмы A. При этом единственным законным средством фирмы B в конкурентной борьбе является

15

выбор момента поставки товара на рынок, так как понижение цены на поставляемый товар запрещено определенными соглашениями.

Решение. Формализуем данную конфликтную ситуацию. В качестве игроков выступают фирмыA и B, которые преследуют прямо противоположные интересы: фирма A стремится максимизировать свой доход, а фирма B — минимизировать его. Для

достижения

своей

цели фирмаA обладает T стратегиями:

A1 , A2 , K, AT ,

где Ai ,

( i =

1,T

) — стратегия, состоящая в том,

что фирма A поставляет товар на рынок в момент времени i . Фирма B обладает аналогичными стратегиямиBj , j =1,T . Рас-

смотрим три возможных варианта результатов сравнения моментов поставки товаров фирмами A и B.

1. Если i < j , то в течение ( j - i ) ед. времени фирма A не будет иметь конкурента и ее доход составит величинуc ( j - i ) у.е. В момент времени t = j на рынке появляется товар фирмы

B, который имеет более высокое качество, так как он поступает на рынок позже. Поэтому, начиная с момента времениj, фирма A теряет рынок и дохода в дальнейшем не получает.

2. Если i = j , то обе фирмы поставляют свой товар на рынок одновременно, поэтому фирма A (так же как и фирма B ) в оставшиеся (n - i +1) ед. времени получит ровно половину дохода

вразмере c (n - i +1)/ 2 у.е.

3.Если i > j , то товар фирмы A более качественный, поэто-

му в течение оставшихся (n - i +1) ед. времени фирма A получит доход в размере c (n - i +1) у.е.

Таким образом, функция выигрышей игрокаA может быть записана в виде:

 

(

 

)

ìc

( j - i ),при i < j,

f

i, j

í

(

n +1

- i

)

/2, при i = j,

 

=

ïc

 

 

 

 

 

 

îïc

(n +1

- i),при i > j.

16

Если предположить, например, что T = 4 , то можно составить следующую платежную матрицу игры:

æ 2c

c

2c

3c

ö

ç

3c

1,5c c

2c

÷

A = ç

÷ .

ç 2c

2c

c

c

÷

ç

c

c

c

 

÷

è

0,5c ø

2.2. Равновесная ситуация

Как уже отмечалось выше, одной из основных задач теории игр является выработка принципов оптимальности, то есть правил, которые позволяют установить, какое поведение игроков следует считать разумным(целесообразным) с точки зрения самих игроков.

Поскольку все возможные действия игроков в матричной игре описываются множеством стратегий Ai и Bj , то задача заклю-

чается в выборе такой стратегии, которая способствует достижению поставленной цели — максимизации выигрыша для игрока A или минимизации проигрыша для игрока B.

Рассмотрим методику поиска решения на следующем примере матричной игры, повторяемой многократно:

№ 2.3. Найти решение матричной игры 3 ´3 :

 

æ -2

2

-1ö

A =

ç

2

1

1

÷

ç

÷ .

 

ç

3

-3

1

÷

 

è

ø

Решение. Попробуем определить оптимальные стратегии игроков. Начнем со стратегии первого игрока, который стремится максимизировать свой выигрыш, учитывая то, что второй игрок будет пытаться свести выигрыш первого игрока к минимуму. Если первый игрок выберет стратегию A1 , то второй ответит стра-

тегией B1 , при которой выигрыш первого равен наименьшему

17

значению -2. На стратегию A2 будет ответом B2 или B3 с минимальным выигрышем 1, а на стратегию A3 B2 с минимальным

выигрышем -3.

Запишем эти минимальные выигрыши в правый столбец:

 

 

 

 

 

 

Т а б л и ц а 2 . 1

 

 

 

 

 

 

 

 

 

 

 

 

B1

B2

B3

 

 

 

 

 

 

 

 

 

 

 

 

 

A1

-2

2

-1

-2

 

 

 

 

 

 

 

 

 

 

 

 

 

2

1

1

 

 

 

 

A2

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A3

3

-3

1

-3

 

Естественно, что первый игрок выбирает стратегию A2 , при которой его минимальный выигрыш максимален:

max min =1 .

Таким образом, если первый игрок выберет стратегиюA2 ,

ему гарантирован выигрыш не меньший, чем 1, при любом поведении второго игрока.

Рассмотрим теперь поведение второго игрока. Если он выберет стратегию B1 , то первый может ответить стратегией A3 , при которой он получит максимальный выигрыш 3, на B2 ответит A1 ,

и на B3 A2 или A3 .

Запишем эти максимальные выигрыши в нижней строке.

 

 

 

 

 

 

 

 

Та блица 2 . 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

B1

B2

 

B3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A1

-2

2

-1

 

-2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

1

1

 

 

 

 

 

A2

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A3

3

-3

1

 

-3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

2

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

18

Естественно, что второй игрок выбирает стратегиюB3 , при которой максимальный выигрыш первого игрока минимален:

min max =1 .

То есть, если второй игрок будет придерживаться стратегии B3 , то при любом поведении первого игрока он не проиграет больше, чем 1.

В этом примере числа max min и min max совпали:

max min = min max =1 .

Это означает, что стратегии A2 и B3 являются оптимальными стратегиями игроков в том смысле, что при многократном повторении игры отказ от выбранной стратегии любым из игроков уменьшает его шансы на выигрыш(увеличивает его шансы на проигрыш).

И в самом деле. Если первый игрок будет придерживаться, например, стратегии A1 , то не стоит думать, что второй этого не заметит. Конечно же, заметит и тут же ответит стратегией B1

и выигрыш первого игрока уменьшится.

Таким образом, мы получили так называемуюравновесную ситуацию {A2 , B3 } .

Рассмотрим теперь произвольную матричную игру:

æ a

a

...

a

ö

 

 

ç 11

12

 

1n

÷

 

 

A = ç a21

a22

...

a2n ÷

,

(2.1)

ç ...

...

...

...

÷

 

 

ç

am2

...

 

÷

 

 

è am1

amn ø

 

 

и опишем общий алгоритм, с помощью которого можно определить, есть ли в этой игре ситуация равновесия. При этом мы предполагаем, что оба игрока действуют разумно, то есть стремятся к получению максимального выигрыша, считая, что соперник действует наилучшим для себя образом.

19

Рассмотрим действия первого игрока:

1. В каждой строке матрицыA находится минимальный элемент:

ai

= min ai , j ,i =1, m ,

 

j =1,n

и полученные числаai запишем в виде добавочного правого столбца к матрице A:

æ a11

a12

...

a1n

a1

ö

ç a

 

a

...

a

 

a

 

÷

ç

21

22

 

 

2n

 

2

÷ .

ç ... ...

... ...

K

÷

ç

 

a

...

a

 

a

 

÷

ç a

m1

 

 

÷

è

m 2

 

mn

 

m ø

То есть, выбирая некоторую стратегию Ai , первый игрок рассчитывает выиграть не меньше ai при любых действиях второго игрока.

2. Среди чисел a1 ,a2 ,K,am выбирается наибольшее число:

a = maxai

= max min aij .

(2.2)

i

i j

 

То есть, выбрав описанную стратегию (2.2), первый игрок гарантирует себе выигрыш не меньшийa . Число a называют

нижней ценой игры.

Таким образом, действуя наиболее осторожно и рассчитывая на наиболее разумное поведение соперника, первый игрок должен остановиться на той стратегии, при которой число ai будет максимальным.

Принцип построения стратегии игрока, основанный на формуле (2.2), называется принципом максимина, а выбранная стратегия A* максиминной стратегией первого игрока.

Рассмотрим теперь поведение второго игрока.

1. В каждом столбце матрицы A находится максимальный элемент:

20

b = max a , j =1, n ,

jij

i =1,m

иполученные числа запишем в виде нижней добавочной строки:

æ

a12

K a1n

a

 

ö

ç a11

 

1

÷

ç a21

a22

K a2n a2 ÷

ç

K

K K K K ÷ .

(2.3)

ç

 

am 2

 

 

÷

 

ç am1

K amn am ÷

 

ç

 

 

 

 

 

÷

 

 

b

 

K b

 

 

ç b

2

n

÷

 

è

1

 

 

ø

 

То есть, выбрав некоторую стратегию Bj , второй игрок рас-

считывает на то, что в результате любых действий первого игрока он проиграет не больше b j .

Среди чисел b1 , b2 ,..., bn выбирается наименьшее число

b = min b j = min max aij .

(2.4)

j

j

i

 

То есть,

выбрав

стратегию (2.4), второй

игрок гарантирует

себе проигрыш, не превышающий b . Число b

называется верхней

ценой игры.

Таким образом, действуя наиболее осторожно и рассчитывая на наиболее разумное поведение соперника, второй игрок должен остановиться на стратегии, при которой b j будет минимальным.

Принцип построения стратегии второго игрока, основанный на правиле (2.4), называется принципом минимакса, а выбранная стратегия B* называется минимаксной стратегией второго игрока.

Отметим, что нижняя и верхняя цены игры всегда связаны

соотношением:

 

a £ b .

(2.5)

21

Если a = b , то ситуация {A* , B*} называется равновесной,

ини один из игроков не заинтересован в том, чтобы ее нарушить.

Вслучае, если a = b , то их общее значение называют ценой

игры n :

n =a

b

max=min aij

min max aij .

(2.6)

 

 

i

j

j

i

 

В этом случае цена игры n

совпадет

с соответствующим

элементом

a*

матрицы A, который называется точкой равнове-

 

ij

 

 

 

 

 

сия или седловой точкой матрицы A. Или седловой точкой является элемент матрицы A, максимальный в своем столбце и минимальный в своей строке.

Стратегии A* и B* , соответствующие седловой точке, называются оптимальными, а совокупность пары оптимальных реше-

ний {A* , B*} и цены игрыn называется решением матричной

игры с седловой точкой.

Если a < b , то речь пойдет уже об игре без седловой точки. В этом случае предложенный выбор стратегий к равновесной ситуации не приводит, и при многократном повторении игры у игроков могут возникнуть мотивы к нарушению рекомендаций, приведенных выше.

№ 2.4. Найти нижнюю и верхнюю цены игры для следующей матричной игры:

æ3

5

8

6

11ö

A = ç

8

4

12

7

9

÷ .

è

ø

Решение. Определим максиминную стратегию первого игрока, выбрав наименьшие значения выигрышей в каждой строке:

a1 = 3,=a2= 4,= a maxai 4 Þ A2 .

22