- •Введение
- •1.1. Задачи теории игр в экономике
- •1.2. Конфликты и теория игр
- •1.3. Основные понятия и классификация видов игр
- •2.1. Примеры матричных игр
- •2.2. Равновесная ситуация
- •2.3. Смешанные стратегии
- •2.4. Решение матричной игры 2×2
- •2.5. Матричные игры 2×n
- •2.7. Матричные игры m×n
- •2.7.1. Доминирование стратегий
- •2.7.2. Аффинное правило
- •2.7.3. Итерационный метод решения матричных игр
- •3.1. Основные понятия и ситуация равновесия
- •3.2. Биматричные игры 2×2
- •3.3. Поиск равновесных ситуаций
- •3.4. Кооперативные игры
- •4. Игры с природой
- •4.3. Принятие решений в условиях риска
- •Критерий Байеса относительно выигрышей
- •Критерий Байеса относительно рисков
- •Критерий Лапласа относительно выигрышей
- •Критерий Байеса относительных значений вероятностей состояний природы с учетом выигрышей
- •4.4. О планировании эксперимента в играх с природой
- •4.5. Выбор решений с помощью дерева решений
- •Литература
Определим минимаксную стратегию второго игрока, выбрав наибольшие значения проигрышей для второго игрока в каждом столбце матрицы выигрышей:
b = 8, b |
2 |
= 5, b |
3 |
=12, b = 7, b = 1, b = min b= |
5 Þ B . |
||
1 |
|
4 |
5 |
j |
2 |
||
Здесь уже нет седловой точки, так как a < b .
Допустим, что первому игроку стало известно, что второй игрок принял минимаксную стратегию B2 , тогда оптимальной для первого игрока будет не максиминная стратегия A2 , а стратегия A1 , дающая ему выигрыш 5 > a .
Это означает, что бывают ситуации, когда первый игрок может получить выигрыш, превосходящий максиминный, если ему известны намерения второго игрока(при многократном повторении игры в сходных условиях).
2.3. Смешанные стратегии
Рассмотрим теперь подробнее случай отсутствия седловой точки, то есть случай, когда a < b . Это означает, что первый игрок может обеспечить себе выигрыш, не меньший a , а второй — проигрыш, не больший b . Возникает вопрос, как «справедливо» разделить разность b -a между игроками.
Оказывается, что компромиссного распределения разности b -a между игроками можно добиться путем случайного чередования игроками чистых стратегий. При этом можно получить выигрыш «в среднем» больший, чем a , но меньший, чем b .
Для этого применяют так называемые смешанные стратегии, которые можно представить в виде случайных величин, возможными значениями которых являются чистые стратегии.
Для первого игрока имеем смешанную стратегию
S1 |
æ |
A |
A |
... |
A |
ö |
, |
(2.7) |
= ç |
1 |
2 |
... |
m |
÷ |
|||
|
è p1 |
p2 |
pm ø |
|
|
|||
23
где pi ³ 0 — вероятность того, что первый игрок применит
m
чистую стратегию Ai , å pi =1 .
i=1
Адля второго игрока имеем смешанную стратегию:
S2 |
æ B |
B |
... |
B |
ö |
, |
(2.7') |
= ç 1 |
2 |
... |
n |
÷ |
|||
|
è q1 |
q2 |
qn |
ø |
|
|
где qj ³ 0 — вероятность того, что второй игрок применит чистую
n
стратегию Bj , åq j =1 .
j =1
Отметим, что каждая чистая стратегия является частным случаем смешанной стратегии.
Если мы окажемся в ситуации {Ai , Bj }, то она будет реализо-
вана с вероятностью pi × q j , а выигрыш составит величинуaij .
И средний выигрыш первого игрока можно определить как математическое ожидание:
m n |
|
H (A, p, q) = ååaij pi q j , |
(2.8) |
i =1 j =1 |
|
где p, q — вектора с компонентами pi и qj соответственно. |
|
Стратегии p0 = ( p10 ,..., pm0 ) и q0 = (q10 ,..., qm0 ) |
называются оп- |
тимальными смешанными стратегиями игроков, если выполнены следующие соотношения:
H (A, p, q0 ) £ H (A, p0 , q0 ) £ H (A, p0 , q) . |
|
(2.9) |
|
Поясним последнее соотношение. Левая часть этого неравен- |
|||
ства H (A, p, q0 ) £ H (A, p0 , q0 ) |
означает, что |
если |
первый игрок |
отклоняется от оптимальной |
стратегииp0 , |
то |
его выигрыш |
24
может только уменьшиться, при условии, что второй игрок придерживается оптимальной стратегии q0 . Аналогично: неравенст-
во H (A, p0 , q0 ) £ H (A, p0 , q) означает, что если второй игрок от-
клоняется от оптимальной стратегии q0 , то его проигрыш может только увеличиться.
Условие оптимальности (2.9) аналогично условию
max min H (A, p, q) = H (A, p0 , q0 ) = min max H (A, p, q) . (2.10)
p q q p
И величина |
|
H (A, p0 , q0 ) =n |
(2.11) |
будет называться ценой игры, а «набор» ( p0 , q0 ,n ) |
называется |
решением матричной игры.
Естественно, что возникают следующие вопросы: какие матричные игры имеют решение в смешанных стратегиях и как найти это решение, если оно существует. Ответ на этот вопрос дает
основная теорема теории матричных игр.
Теорема 2.1. (Неймана). Для матричной игры с любой матрицей A величины
max min H (A, p, q ) , min max H (A, p, q )
p |
q |
q |
p |
существуют и равны между собой:
max min H (A, p, q ) = min max H (A, p, q ) .
p q q p
Более того, существует, по крайней мере, одна ситуация
( p0 , q0 ), для которой выполняется соотношение:
25
max min H (A, p, q ) = min max H (A, p, q ) =
p q |
q p |
(2.12) |
= H (A, p0 ,q0 ) =n . |
|
|
|
|
|
Другими словами, |
любая матричная игра имеет решение |
|
всмешанных стратегиях.
Всостав оптимальных смешанных стратегий игроков могут
входить не все чистые стратегии Ai , Bj , то есть вероятности не-
которых из них будут равны нулю ( pi0 = 0, q0j = 0). Тогда те чис-
тые стратегии Ai , Bj , которые входят в оптимальные смешанные
стратегии, будут называться активными чистыми стратегиями.
На этот счет справедлива следующая теорема:
Теорема 2.2. Оптимальная смешанная стратегия p0 |
первого |
|
игрока смешивается только из тех чистых стратегий Ai , |
( pi |
¹ 0), |
для которых выполнены равенства |
|
|
n |
|
|
åaij q0j =n ; |
|
|
j =1 |
|
|
А в оптимальной смешанной стратегииq0 второго |
игрока |
|
смешиваются только те стратегииBj , для которых выполнены равенства
m |
|
|
|
|
|
|
åaij pi0 |
=n . |
|
|
|
|
|
i =1 |
|
|
|
|
|
|
Кроме того, справедливы равенства: |
|
|||||
|
m |
|
|
m |
|
|
n = min åaij pi0 |
max= min åaij pi |
|
|
|||
j |
i =1 |
|
p j |
i=1 |
. |
(2.13) |
|
|
|
||||
|
|
n |
|
n |
||
= min max |
åaij q j |
= max |
åaij q0j |
|
|
|
q |
i |
j =1 |
i |
j =1 |
|
|
|
|
|
|
|
||
26
