- •Введение
- •1.1. Задачи теории игр в экономике
- •1.2. Конфликты и теория игр
- •1.3. Основные понятия и классификация видов игр
- •2.1. Примеры матричных игр
- •2.2. Равновесная ситуация
- •2.3. Смешанные стратегии
- •2.4. Решение матричной игры 2×2
- •2.5. Матричные игры 2×n
- •2.7. Матричные игры m×n
- •2.7.1. Доминирование стратегий
- •2.7.2. Аффинное правило
- •2.7.3. Итерационный метод решения матричных игр
- •3.1. Основные понятия и ситуация равновесия
- •3.2. Биматричные игры 2×2
- •3.3. Поиск равновесных ситуаций
- •3.4. Кооперативные игры
- •4. Игры с природой
- •4.3. Принятие решений в условиях риска
- •Критерий Байеса относительно выигрышей
- •Критерий Байеса относительно рисков
- •Критерий Лапласа относительно выигрышей
- •Критерий Байеса относительных значений вероятностей состояний природы с учетом выигрышей
- •4.4. О планировании эксперимента в играх с природой
- •4.5. Выбор решений с помощью дерева решений
- •Литература
2.МАТРИЧНЫЕ ИГРЫ
2.1.Примеры матричных игр
Для того, чтобы составить экономико-математическую модель конфликтной ситуации в виде матричной игры, необходимо построить матрицу выигрышей. Это весьма нетривиальная задача, особенно для игр большой размерности. В общем виде матрица игры (платежная матрица) строится следующим образом:
1) перечисляем все возможные чистые стратегииAi и Bj
игроков;
2)формализуем правила, по которым развивается конфликт
ввиде функции выигрышей f (i, j ) = aij .
Рассмотрим несколько примеров построения платежных матриц.
№ 2.1. Поставка товаров. На каждой из двух баз ассортиментный минимум составляет один и тот же набор изn видов товаров. Каждая база должна поставить в свой магазин только один из этих видов товара. Магазины, обозначим их через A и B, конкурируют между собой. Один и тот же вид товара в обоих магазинах продается по одной и той же цене. Однако товар, поставляемый в магазинB, более высокого качества. Если магазин A
завезет с базы товар i-го вида ( i =1, n ), а магазин B-товар j-го ви-
да ( i =1, n ), отличной от товараi-го вида ( i ¹ j ), то товар i-го вида будет пользоваться спросом и магазин A получит прибыль ci у.е. Если же в магазины A и B завезены товары одинакового вида ( i = j ), то товар i-го вида в магазине A не будет пользо-
ваться спросом, так как такой же товар, но более высокого качества продается в магазинеB, по такой же цене. Поэтому магазин B понесет убытки по транспортировке, хранению и, возможно, порче товара i-го вида в размере d j у.е.
Требуется составить платежную матрицу игры при n = 3 .
14
Решение. Формализуем данную конфликтную ситуацию. Пусть в качестве первого игрока выступает магазин A, а в качестве 2-го — магазин B. Игрок A с целью достижения прибыли имеет возможность выбрать одну изn следующих стратегий Ai —
завезти со своей базы товар i-го вида. |
Игрок B |
также |
обладает |
||||||||
n стратегиями Bj |
— завезти ее со своей базы j-й товар. Пусть |
||||||||||
игроки |
выбрали |
стратегии{Ai, Bj } . |
Тогда можно |
составить |
|||||||
следующую функцию выигрышей игрока A: |
|
|
|||||||||
|
|
ìc ,если i ¹ j, |
|
|
|
||||||
f (i, |
j )= |
íïdi |
j |
,если i = j, , |
|
|
|
||||
|
|
ï |
|
|
|
|
|
|
|
|
|
|
|
î |
|
|
|
|
|
|
|
|
|
а платежная матрица (матрица игры), например, |
при n = 3 будет |
||||||||||
выглядеть следующим образом: |
|
|
|
||||||||
æ -d1 |
|
c1 |
|
c1 |
|
ö |
|
|
|
||
A = ç |
c |
-d |
2 |
c |
|
÷ . |
|
|
|
||
ç |
2 |
|
|
|
2 |
|
÷ |
|
|
|
|
ç |
c |
|
c |
|
-d |
3 |
÷ |
|
|
|
|
è |
3 |
|
|
3 |
|
|
ø |
|
|
|
№ 2.2. Антагонистическая конкуренция. Фирма A производит некоторый сезонный товар, имеющий спрос в течениеT единиц времени, и который она может поставить на рынок в один из моментов времени i =1, 2, .., T . Для конкурентной борьбы с фирмой A дочерняя фирма B концерна D, не заботясь о собственных доходах, производит аналогичный товар, который поступает на рынок в один из моментов времени j =1, 2, .., T . Пусть технология
выпуска товара такова, что чем дольше он находится в производстве, тем выше его качество, а реализуется только товар более высокого качества (так как цена на товары разного качества одна и та же). Доход от продажи товара в единицу времени равен c у.е.
Требуется построить функцию выигрышей фирмыA, где под выигрышем понимается доход фирмы A. При этом единственным законным средством фирмы B в конкурентной борьбе является
15
выбор момента поставки товара на рынок, так как понижение цены на поставляемый товар запрещено определенными соглашениями.
Решение. Формализуем данную конфликтную ситуацию. В качестве игроков выступают фирмыA и B, которые преследуют прямо противоположные интересы: фирма A стремится максимизировать свой доход, а фирма B — минимизировать его. Для
достижения |
своей |
цели фирмаA обладает T стратегиями: |
||
A1 , A2 , K, AT , |
где Ai , |
( i = |
1,T |
) — стратегия, состоящая в том, |
что фирма A поставляет товар на рынок в момент времени i . Фирма B обладает аналогичными стратегиямиBj , j =1,T . Рас-
смотрим три возможных варианта результатов сравнения моментов поставки товаров фирмами A и B.
1. Если i < j , то в течение ( j - i ) ед. времени фирма A не будет иметь конкурента и ее доход составит величинуc ( j - i ) у.е. В момент времени t = j на рынке появляется товар фирмы
B, который имеет более высокое качество, так как он поступает на рынок позже. Поэтому, начиная с момента времениj, фирма A теряет рынок и дохода в дальнейшем не получает.
2. Если i = j , то обе фирмы поставляют свой товар на рынок одновременно, поэтому фирма A (так же как и фирма B ) в оставшиеся (n - i +1) ед. времени получит ровно половину дохода
вразмере c (n - i +1)/ 2 у.е.
3.Если i > j , то товар фирмы A более качественный, поэто-
му в течение оставшихся (n - i +1) ед. времени фирма A получит доход в размере c (n - i +1) у.е.
Таким образом, функция выигрышей игрокаA может быть записана в виде:
|
( |
|
) |
ìc |
( j - i ),при i < j, |
||||
f |
i, j |
í |
( |
n +1 |
- i |
) |
/2, при i = j, |
||
|
= |
ïc |
|
|
|||||
|
|
|
|
îïc |
(n +1 |
- i),при i > j. |
16
Если предположить, например, что T = 4 , то можно составить следующую платежную матрицу игры:
æ 2c |
c |
2c |
3c |
ö |
|
ç |
3c |
1,5c c |
2c |
÷ |
|
A = ç |
÷ . |
||||
ç 2c |
2c |
c |
c |
÷ |
|
ç |
c |
c |
c |
|
÷ |
è |
0,5c ø |
2.2. Равновесная ситуация
Как уже отмечалось выше, одной из основных задач теории игр является выработка принципов оптимальности, то есть правил, которые позволяют установить, какое поведение игроков следует считать разумным(целесообразным) с точки зрения самих игроков.
Поскольку все возможные действия игроков в матричной игре описываются множеством стратегий Ai и Bj , то задача заклю-
чается в выборе такой стратегии, которая способствует достижению поставленной цели — максимизации выигрыша для игрока A или минимизации проигрыша для игрока B.
Рассмотрим методику поиска решения на следующем примере матричной игры, повторяемой многократно:
№ 2.3. Найти решение матричной игры 3 ´3 :
|
æ -2 |
2 |
-1ö |
||
A = |
ç |
2 |
1 |
1 |
÷ |
ç |
÷ . |
||||
|
ç |
3 |
-3 |
1 |
÷ |
|
è |
ø |
Решение. Попробуем определить оптимальные стратегии игроков. Начнем со стратегии первого игрока, который стремится максимизировать свой выигрыш, учитывая то, что второй игрок будет пытаться свести выигрыш первого игрока к минимуму. Если первый игрок выберет стратегию A1 , то второй ответит стра-
тегией B1 , при которой выигрыш первого равен наименьшему
17
значению -2. На стратегию A2 будет ответом B2 или B3 с минимальным выигрышем 1, а на стратегию A3 – B2 с минимальным
выигрышем -3.
Запишем эти минимальные выигрыши в правый столбец:
|
|
|
|
|
|
Т а б л и ц а 2 . 1 |
||
|
|
|
|
|
|
|
|
|
|
|
|
B1 |
B2 |
B3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
A1 |
-2 |
2 |
-1 |
-2 |
|
||
|
|
|
|
|
|
|
|
|
|
|
|
2 |
1 |
1 |
|
|
|
|
A2 |
|
|
1 |
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
A3 |
3 |
-3 |
1 |
-3 |
|
Естественно, что первый игрок выбирает стратегию A2 , при которой его минимальный выигрыш максимален:
max min =1 .
Таким образом, если первый игрок выберет стратегиюA2 ,
ему гарантирован выигрыш не меньший, чем 1, при любом поведении второго игрока.
Рассмотрим теперь поведение второго игрока. Если он выберет стратегию B1 , то первый может ответить стратегией A3 , при которой он получит максимальный выигрыш 3, на B2 ответит A1 ,
и на B3 – A2 или A3 .
Запишем эти максимальные выигрыши в нижней строке.
|
|
|
|
|
|
|
|
Та блица 2 . 2 |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
B1 |
B2 |
|
B3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
A1 |
-2 |
2 |
-1 |
|
-2 |
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
1 |
1 |
|
|
|
|
|
|
A2 |
|
|
|
1 |
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
A3 |
3 |
-3 |
1 |
|
-3 |
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
2 |
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
18
Естественно, что второй игрок выбирает стратегиюB3 , при которой максимальный выигрыш первого игрока минимален:
min max =1 .
То есть, если второй игрок будет придерживаться стратегии B3 , то при любом поведении первого игрока он не проиграет больше, чем 1.
В этом примере числа max min и min max совпали:
max min = min max =1 .
Это означает, что стратегии A2 и B3 являются оптимальными стратегиями игроков в том смысле, что при многократном повторении игры отказ от выбранной стратегии любым из игроков уменьшает его шансы на выигрыш(увеличивает его шансы на проигрыш).
И в самом деле. Если первый игрок будет придерживаться, например, стратегии A1 , то не стоит думать, что второй этого не заметит. Конечно же, заметит и тут же ответит стратегией B1
и выигрыш первого игрока уменьшится.
Таким образом, мы получили так называемуюравновесную ситуацию {A2 , B3 } .
Рассмотрим теперь произвольную матричную игру:
æ a |
a |
... |
a |
ö |
|
|
ç 11 |
12 |
|
1n |
÷ |
|
|
A = ç a21 |
a22 |
... |
a2n ÷ |
, |
(2.1) |
|
ç ... |
... |
... |
... |
÷ |
|
|
ç |
am2 |
... |
|
÷ |
|
|
è am1 |
amn ø |
|
|
и опишем общий алгоритм, с помощью которого можно определить, есть ли в этой игре ситуация равновесия. При этом мы предполагаем, что оба игрока действуют разумно, то есть стремятся к получению максимального выигрыша, считая, что соперник действует наилучшим для себя образом.
19
Рассмотрим действия первого игрока:
1. В каждой строке матрицыA находится минимальный элемент:
ai |
= min ai , j ,i =1, m , |
|
j =1,n |
и полученные числаai запишем в виде добавочного правого столбца к матрице A:
æ a11 |
a12 |
... |
a1n |
a1 |
ö |
|||
ç a |
|
a |
... |
a |
|
a |
|
÷ |
ç |
21 |
22 |
|
|
2n |
|
2 |
÷ . |
ç ... ... |
... ... |
K |
÷ |
|||||
ç |
|
a |
... |
a |
|
a |
|
÷ |
ç a |
m1 |
|
|
÷ |
||||
è |
m 2 |
|
mn |
|
m ø |
То есть, выбирая некоторую стратегию Ai , первый игрок рассчитывает выиграть не меньше ai при любых действиях второго игрока.
2. Среди чисел a1 ,a2 ,K,am выбирается наибольшее число:
a = maxai |
= max min aij . |
(2.2) |
i |
i j |
|
То есть, выбрав описанную стратегию (2.2), первый игрок гарантирует себе выигрыш не меньшийa . Число a называют
нижней ценой игры.
Таким образом, действуя наиболее осторожно и рассчитывая на наиболее разумное поведение соперника, первый игрок должен остановиться на той стратегии, при которой число ai будет максимальным.
Принцип построения стратегии игрока, основанный на формуле (2.2), называется принципом максимина, а выбранная стратегия A* — максиминной стратегией первого игрока.
Рассмотрим теперь поведение второго игрока.
1. В каждом столбце матрицы A находится максимальный элемент:
20
b = max a , j =1, n ,
jij
i =1,m
иполученные числа запишем в виде нижней добавочной строки:
æ |
a12 |
K a1n |
a |
|
ö |
ç a11 |
|
1 |
÷ |
||
ç a21 |
a22 |
K a2n a2 ÷ |
ç |
K |
K K K K ÷ . |
(2.3) |
||||
ç |
|
am 2 |
|
|
÷ |
|
|
ç am1 |
K amn am ÷ |
|
|||||
ç |
|
|
|
|
|
÷ |
|
|
b |
|
K b |
|
|
||
ç b |
2 |
n |
÷ |
|
|||
è |
1 |
|
|
ø |
|
То есть, выбрав некоторую стратегию Bj , второй игрок рас-
считывает на то, что в результате любых действий первого игрока он проиграет не больше b j .
Среди чисел b1 , b2 ,..., bn выбирается наименьшее число
b = min b j = min max aij . |
(2.4) |
||
j |
j |
i |
|
То есть, |
выбрав |
стратегию (2.4), второй |
игрок гарантирует |
себе проигрыш, не превышающий b . Число b |
называется верхней |
ценой игры.
Таким образом, действуя наиболее осторожно и рассчитывая на наиболее разумное поведение соперника, второй игрок должен остановиться на стратегии, при которой b j будет минимальным.
Принцип построения стратегии второго игрока, основанный на правиле (2.4), называется принципом минимакса, а выбранная стратегия B* называется минимаксной стратегией второго игрока.
Отметим, что нижняя и верхняя цены игры всегда связаны
соотношением: |
|
a £ b . |
(2.5) |
21
Если a = b , то ситуация {A* , B*} называется равновесной,
ини один из игроков не заинтересован в том, чтобы ее нарушить.
Вслучае, если a = b , то их общее значение называют ценой
игры n :
n =a |
b |
max=min aij |
min max aij . |
(2.6) |
||
|
|
i |
j |
j |
i |
|
В этом случае цена игры n |
совпадет |
с соответствующим |
||||
элементом |
a* |
матрицы A, который называется точкой равнове- |
||||
|
ij |
|
|
|
|
|
сия или седловой точкой матрицы A. Или седловой точкой является элемент матрицы A, максимальный в своем столбце и минимальный в своей строке.
Стратегии A* и B* , соответствующие седловой точке, называются оптимальными, а совокупность пары оптимальных реше-
ний {A* , B*} и цены игрыn называется решением матричной
игры с седловой точкой.
Если a < b , то речь пойдет уже об игре без седловой точки. В этом случае предложенный выбор стратегий к равновесной ситуации не приводит, и при многократном повторении игры у игроков могут возникнуть мотивы к нарушению рекомендаций, приведенных выше.
№ 2.4. Найти нижнюю и верхнюю цены игры для следующей матричной игры:
æ3 |
5 |
8 |
6 |
11ö |
||
A = ç |
8 |
4 |
12 |
7 |
9 |
÷ . |
è |
ø |
Решение. Определим максиминную стратегию первого игрока, выбрав наименьшие значения выигрышей в каждой строке:
a1 = 3,=a2= 4,= a maxai 4 Þ A2 .
22