Елтаренко Исследование операцыи 2007
.pdfSa . Таким образом, для любой смешанной стратегии Sb можно определить приемлемую стратегию Sa .
Можно условно графически представить зависимость приемлемой стратегии Sa как функцию от Sb , представленной на рис. 2.5.
Смешанная стратегия Sb игрока B является приемлемой, если при любой другой смешанной стратегии Sb и фиксированной сме-
шанной стратегии Sa выполняется: |
|
b Sa , Sb |
b Sa , Sb . |
Sb |
Sb |
Fa
Gb
Sa |
|
Sa |
Рис. 2.5. Множество приемлемых |
Рис. 2.6. Множество приемлемых |
|
стратегий для участника А |
|
стратегий для участника B |
Зависимость приемлемой стратегии Sb |
от Sa также можно услов- |
|
но представить в виде функции Gb |
(рис. 2.6). |
|
Пересечение двух множеств Fa |
и Gb |
дает решение биматричной |
игры (рис. 2.7): |
|
|
110
Sb
Fa
Gb
S*b
S*a Sa
Рис. 2.7. Определение оптимальных смешанных стратегий
Проиллюстрируем принцип решения биматричных игр на задаче размерности 2 2.
2.4.2.Решение биматричных игр 2 2
Вкачестве исходных данных заданы две матрицы:
|
|
|
|
|
|
|
S1b |
S2b |
|
|
|
|
|
|
|
|
|
|
|
|
a |
|
a11 |
a12 |
S1a , |
|
|
|
|
||
|
|
|
|
|
ij |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a21 |
a22 |
S2a |
|
|
|
|
||
|
|
|
|
|
|
|
S1b |
S2b |
|
|
|
|
|
|
|
|
|
|
|
|
b |
|
b11 |
b12 |
|
S1a . |
|
|
|
|
|
|
|
|
|
|
ij |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
b21 |
b22 |
|
S2a |
|
|
|
|
|
|
|
Смешанные стратегии |
для |
A: |
S |
a |
P |
, P |
, для |
B : |
|||||
|
|
|
|
|
|
|
|
|
|
|
1a |
2a |
|
|
|
S |
b |
P |
, P |
. |
|
|
|
|
|
|
|
|
|
|
|
|
1b |
2b |
|
|
|
|
|
|
|
|
|
|
|
|
Выигрыш участника A равен:
111
|
|
a S |
a |
, S |
b |
|
|
a P P |
|
|
a P P |
|
a P P |
|
a P P |
. |
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
11 1a 1b |
|
|
|
12 1a 2b |
|
21 2a 1b |
|
|
22 2a 2b |
|
||||||||||||||||||||||
С учетом |
P |
|
|
1 |
|
|
|
P |
и P |
|
|
|
1 |
|
P |
|
: |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
2a |
|
|
|
|
|
|
|
1a |
|
|
|
|
2b |
|
|
|
|
|
|
|
1b |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
a S |
a |
, S |
b |
|
|
|
a P P |
|
|
a P |
1 P |
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
11 1a 1b |
|
|
|
12 1a |
|
|
1b |
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
a |
21 |
1 |
|
P |
|
|
P |
|
|
a |
22 |
1 |
|
P |
|
|
1 |
P |
. |
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1a |
|
1b |
|
|
|
|
|
|
|
1a |
|
|
1b |
|
|
|
|
|
|
|||||||||
После упрощения получим: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
a S |
a |
, S |
b |
|
|
|
|
P P |
|
a a |
22 |
|
|
a a |
21 |
a a |
22 |
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
1a |
|
1b |
|
|
11 |
|
|
|
|
|
12 |
|
|
12 |
|
|
|
|||||||||||||
|
|
P |
|
a |
21 |
|
|
|
a |
22 |
|
|
a |
22 |
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
1b |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
Так как в нашем случае смешанная стратегия |
Sa |
определяется |
||||||||||||||||||||||||||||||||||||||||
одной вероятностью |
|
|
P |
, |
а S |
b |
|
P |
|
, то условие приемлемой страте- |
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1a |
|
|
|
|
|
|
|
1b |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
гии для Sa запишется в виде: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a P |
|
, P |
|
|
|
|
a P |
, P |
|
. |
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1a |
|
|
1b |
|
|
|
|
|
|
1a |
|
1b |
|
|
|
|
|
|
|
|
|
|||
Чистая стратегия |
|
S |
|
будет приемлемой (лучшей), когда |
P |
1 |
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
1a |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1a |
|
|
или когда |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
P |
|
a |
|
|
a |
|
|
|
a |
|
|
|
a |
|
|
|
a |
|
|
a |
0 . |
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
1b |
|
|
11 |
|
22 |
|
|
|
12 |
|
|
|
|
21 |
|
12 |
|
|
22 |
|
|
|
|
|
|
|||||||||
Из данного неравенства можем сделать вывод, что чистая страте- |
||||||||||||||||||||||||||||||||||||||||||
гия S |
ia |
– приемлемая, если P |
|
|
|
P* |
|
: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1b |
|
|
1b |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
P |
|
|
|
|
|
|
|
a22 |
|
|
|
a12 |
|
|
|
|
|
P* |
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
1b |
|
|
a11 |
|
|
a22 |
|
|
|
a12 |
|
a21 |
|
|
1b |
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
при знаменателе C |
|
|
|
a11 |
|
|
a22 |
|
|
a12 |
|
|
|
a21 |
0 . |
|
|
|
|
|
|
|
|
|
||||||||||||||||||
Если же C |
|
|
0 , |
то тогда P |
|
|
|
|
|
|
|
|
a22 |
a12 |
|
|
, |
и |
S |
– прием- |
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1b |
|
|
a11 |
|
|
a22 |
a12 |
a21 |
|
1a |
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
лемая при P |
|
|
|
|
P* . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
1b |
|
|
|
1b |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Напротив, стратегия S |
2a |
приемлема при |
P |
|
0, т.е. при условии, |
|||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1a |
|
|
|
|
|
|
|
что
112
|
|
|
|
|
|
|
|
P |
a |
|
|
a |
a |
a |
|
a |
|
|
a |
|
0 . |
|
|
|
||
|
|
|
|
|
|
|
|
1b |
11 |
|
22 |
|
12 |
21 |
|
12 |
|
21 |
|
|
|
|
|
|||
|
Таким |
образом, |
при |
C |
0 |
стратегия |
|
S2a |
|
приемлема, |
если |
|||||||||||||||
P |
P |
* |
|
|
|
|
a22 |
a12 |
|
|
, а при C |
|
0 |
|
|
|
|
|
* |
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
– если P |
P |
. |
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
1b |
|
1b |
|
a11 |
a22 |
a12 |
a21 |
|
|
|
|
|
|
|
|
1b |
1b |
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
На рис. 2.8 приведены зависимости при C |
|
0 и C |
|
0 . |
|
|
|
|||||||||||||||||||
|
P1b |
|
|
|
|
C>0 |
|
|
|
|
|
|
|
P1b |
|
|
C<0 |
|
|
|
|
|||||
|
1 |
|
|
|
|
|
|
|
|
|
|
Fa |
|
1 |
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
P*1b |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P*1b |
|
|
|
|
|
|
|
|
Fa |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
1 |
P1a |
|
0 |
|
|
|
|
|
|
|
1 P1a |
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
Рис. 2.8. Множество приемлемых стратегий для участника А |
|
|||||||||||||||||||
|
Для построения Gb |
|
S1a , S1b |
запишем выражение для выигрыша |
||||||||||||||||||||||
участника B : |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
b S |
a |
, S b P P |
|
b P P |
b P P |
b P P |
; |
|
|
|
|||||||||||||||
|
|
b |
|
|
|
11 1a 1b |
|
12 1a 2b |
|
21 2a 1b |
|
22 2a 2b |
|
|
|
|
||||||||||
|
P |
|
1 |
|
|
P |
; P |
1 |
|
P |
; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2a |
|
|
|
|
1a |
|
2b |
|
|
1b |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
b S |
a |
, S |
|
P P |
b b b b |
b b |
|
P b b |
|
b . |
|||||||||||||||
|
|
b |
|
|
|
1b 1a |
11 |
|
|
22 12 |
21 |
21 |
22 |
|
1a 12 |
22 |
22 |
|||||||||
|
Чистая стратегия |
S |
|
– приемлемая P |
|
1 , если |
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
1b |
|
|
|
|
|
|
1b |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P |
b |
|
|
b |
b |
b |
|
b |
|
|
b |
|
0 |
|
|
|
||
|
|
|
|
|
|
|
|
1a |
11 |
22 |
|
12 |
21 |
|
21 |
|
22 |
|
|
|
|
|
||||
или P |
|
|
|
|
|
|
b22 |
b21 |
|
|
|
|
P* |
, |
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
1a |
|
b11 |
|
b22 |
b12 |
|
|
b21 |
1a |
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
при условии, что знаменатель |
D |
b11 |
b22 |
b12 |
b21 |
0. |
|
|
||||||||||||||||||
|
Если D |
|
0, то чистая стратегия S1b |
приемлема при |
|
|
|
113
|
|
P |
|
b22 |
b21 |
|
P* . |
|
|
|
|
|
|
1a |
b11 |
b22 |
b12 |
b21 |
|
1a |
|
|
|
|
|
|
|
|
|
|
|
||||
|
На рис. |
2.9 приведены зависимости |
G P |
, P |
при D |
0 |
и |
||||
|
|
|
|
|
|
b |
1a |
1b |
|
|
|
D |
0. |
|
|
|
|
|
|
|
|
|
|
|
P1b |
D<0 |
|
|
P1b |
D>0 |
|
|
|
||
|
1 |
|
|
|
1 |
|
|
|
|
|
|
|
|
Gb |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Gb |
|
|
|
|
0 |
P*1a |
|
|
0 |
|
|
P*1a |
|
|
|
|
|
1 P1a |
|
|
|
1 P1a |
|
||||
|
|
Рис. 2.9. Множество приемлемых стратегий для участника B |
|
|
|||||||
|
Решением биматричной игры будет пересечение Fa |
и Gb . |
|
|
|||||||
|
Возможны четыре варианта пересечения Fa |
и Gb |
(в зависимости |
||||||||
от знаков C и D). |
|
|
|
|
|
|
|
|
|
||
|
Первый вариант |
|
|
|
|
|
|
|
|
|
|
|
P |
|
|
|
|
|
|
|
|
|
|
|
1b |
|
|
|
|
|
C 0, D 0 . |
|
|
||
|
|
|
|
|
|
|
Реше- |
||||
|
1 |
|
|
|
|
ние |
единственное |
– |
|||
|
|
Gb |
|
Fa |
|
P* , P* . |
|
|
|
||
|
P* |
|
|
|
|
1a |
1b |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1b |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P |
|
|
|
|
|
|
|
|
|
|
|
1a |
|
|
|
|
|
|
|
0 |
P* |
|
1 |
|
|
|
|
|
|
|
|
|
1a |
|
|
|
|
|
|
|
|
|
|
|
|
|
114 |
|
|
|
|
|
|
|
Второй вариант |
|
|
|
|
|
|
|
|
P |
|
|
|
|
|
|
|
|
1b |
|
|
|
|
C 0, D 0 . |
|
||
|
|
|
|
|
Ре- |
|||
1 |
|
|
(1,1) |
|
шением будет P* , |
P* , |
||
|
|
Gb |
|
|
|
|
1a |
1b |
|
|
|
|
точки |
пересечения |
|||
P* |
|
|
F |
|
||||
|
|
|
(1,1) и (0,0) – неустой- |
|||||
1b |
|
|
a |
|
||||
|
|
|
|
|
|
|
||
чи- |
|
|
|
|
вы. |
|
|
|
|
|
|
P |
|
|
|
|
|
|
|
|
1a |
|
|
|
|
|
0 |
P* |
|
1 |
|
|
|
|
|
|
1a |
|
|
|
|
|
|
|
Третий вариант |
|
|
|
|
|
|
|
|
|
|
|
|
C |
0, D |
0. Решением бу- |
||
P1b |
|
|
дет P* |
, P* . Точки (1, 0) и (0, |
||||
|
|
|
|
1a |
1b |
|
|
|
1 |
|
|
1) |
дают неустойчивые реше- |
||||
|
|
ния. |
|
|
|
|
||
|
Gb |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
P1*b |
|
|
|
|
|
|
|
|
|
|
|
Fa |
|
|
|
|
|
|
|
|
P1a |
|
|
|
|
|
0 |
P1*a |
|
1 |
|
|
|
|
|
Четвертый вариант |
|
|
|
|
|
|
||
|
|
|
C |
0, D |
0 . Решение единст- |
|||
P1b |
|
|
венное – P* , |
P* . |
|
|
||
|
|
|
|
|
1a |
1b |
|
|
1 |
|
|
|
|
|
|
|
|
|
Gb |
|
|
|
|
|
|
|
P1*b |
|
|
|
|
|
|
|
|
|
|
Fa |
|
|
|
|
|
|
|
|
|
P1a |
|
|
|
|
|
0 |
P1*a |
1 |
115 |
|
|
|
|
|
Пример решения биматричной игры. Для каждого участника за-
дана матрица выигрышей:
|
|
|
|
|
a |
|
3 |
1 |
, |
|
|
|
|
b |
|
|
|
6 |
|
0 |
. |
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
ij |
|
1 |
6 |
|
|
|
|
|
|
ij |
|
|
1 |
|
3 |
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
Находим оптимальные смешанные стратегии: |
|
|
|
|
|
|
|
|||||||||||||||||||||
|
* |
|
|
|
a22 |
a12 |
|
|
|
|
|
|
|
|
6 |
1 |
|
|
7 |
|
|
|
|
|||||
|
P |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
, C 0; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
1b |
|
|
a11 |
a22 |
a12 |
|
|
a21 |
3 6 1 1 9 |
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
* |
|
|
|
b22 |
b21 |
|
|
|
|
3 |
1 |
2 |
|
|
|
|
|
|
|
||||||||
|
P |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
, |
|
D |
0. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
1a |
|
|
b11 |
b22 |
b12 |
|
b21 |
6 |
3 |
1 5 |
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
Рассчитываем выигрыши участников игры: |
|
|
|
|
|
|
|
|||||||||||||||||||||
a |
a(S* , S* ) a P* P* |
|
a P* P* |
a P* |
P* |
|
a P* |
P* |
; |
|||||||||||||||||||
|
|
a b |
|
11 1a 1b |
|
12 1a 2b |
|
|
21 2a 1b |
|
22 2a 2b |
|
||||||||||||||||
|
|
|
a |
3 2 |
7 |
1 2 |
2 |
|
1 3 |
7 |
6 3 |
|
2 |
|
|
103 ; |
|
|
||||||||||
|
|
|
|
5 |
9 |
5 |
9 |
|
5 |
9 |
5 |
|
9 |
|
|
45 |
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
b |
|
6 2 |
7 |
3 2 |
2 |
|
1 3 |
7 |
3 3 |
|
2 |
|
123. |
|
|
|||||||||||
|
|
|
|
5 |
9 |
|
5 |
9 |
|
5 |
9 |
5 |
|
9 |
|
45 |
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
Отметим, что принцип нахождения оптимальной смешанной стратегии для игрока А – минимизация выигрыша противника, и для участника В – тоже минимизация выигрыша противника. Этот принцип
распространим для решения игр размерности n m.
2.4.3. Решение биматричных игр n m |
|
|||||||||
Даны две матрицы выигрышей |
|
и |
|
bij |
|
|
размерности n m. |
|||
aij |
|
|
|
|||||||
Необходимо найти оптимальные смешанные стратегии: |
|
|||||||||
S* |
{P*} и |
S* |
{P* |
}. |
|
|||||
a |
ia |
b |
|
|
|
jb |
|
|
||
Оптимальную смешанную стратегию {P*} находим из условия |
||||||||||
|
|
|
|
|
|
ia |
|
|
||
минимизации выигрыша противника |
min |
b |
, |
а {P* } |
– из условия |
|||||
|
|
|
|
|
|
|
jb |
|
||
минимизации выигрыша противника min |
a . |
|
|
|
116
Для нахождения {P*} ставим задачу линейного программирова- |
||||||
|
ia |
|
|
|
|
|
ния: |
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
max xi |
, |
|
|
|
|
|
|
i 1 |
|
|
|
|
n |
|
|
|
|
|
при ограничениях |
bij xi |
1 ( j |
1, 2,...,m), xi |
0. |
||
i |
1 |
|
|
|
|
|
На основе найденных |
x* вычисляем |
{P*} (см. п. 2.3, решение |
||||
|
|
i |
|
ia |
|
|
матричных игр n m). |
|
|
|
|
|
|
Для нахождения |
{P* } |
ставим задачу линейного программирова- |
||||
|
jb |
|
|
|
|
|
|
|
|
m |
|
|
|
ния: |
|
max |
y j |
|
|
|
|
|
|
j 1 |
|
|
|
|
m |
|
|
|
|
|
при ограничениях: |
aij yj |
1 (i |
1, 2, ...,n) , |
yj |
0. |
|
j 1 |
|
|
|
|
|
|
На основе найденных |
y* вычисляем |
{P* |
} |
(см. п. 2.3. решение |
||
|
|
j |
|
jb |
|
|
матричных игр n m).
Выигрыши участников определяются с использованием их матриц выигрышей:
n |
m |
|
|
n |
m |
a |
a P*P* |
, |
b |
|
b P*P* . |
ij ia jb |
|
|
ij ia jb |
||
i 1 |
j 1 |
|
|
i 1 |
j 1 |
Следует сказать, что матричные (антагонистические) игры являются частным случаем биматричных игр, поэтому для их решения можно использовать принцип решения биматричных игр.
Следует также отметить, что принцип решения биматричных игр может использоваться для решения игр с тремя и более участниками. Чтобы это продемонстрировать, рассмотрим решение диадических игр с тремя участниками.
117
2.5. Диадические игры
Игры, в которых каждому участнику предоставляется только две чистые стратегии, называются диадическими. Участник A: S1a, S2a ,
участник B : S1b, S2b , участник C : S1c, S2c .
В диадических играх смешанная стратегия участника A описыва-
ется вероятностью |
P |
, так как |
P |
1 P |
. Поэтому решить диади- |
||
|
1a |
|
2b |
1a |
|
|
|
ческую игру – значит найти оптимальные P* |
, P* |
, P* . |
|||||
|
|
|
|
1a |
1b |
1c |
Продемонстрируем метод решения диадических игр на примере из [2]. Имеются предприятия: A, B и C , осуществляющие сброс воды в один водоем. Каждый из них имеет две чистые стратегии:
S1a , S1b , S1c – используют очистные сооружения; S2a , S2b , S2c – не используют очистные сооружения.
Водоем такой, что если два или более предприятий сбрасывают неочищенную воду, то вода загрязняется выше нормы, и все предприятия платят штраф (-3). Использование очистных средств обходится предприятию в (-1).
Для каждого из участников должны быть заданы матрицы полез-
ности: aijk , bijk , cijk .
Удобно представить эти матрицы графически на кубе (рис. 2.10). Углы куба – возможные исходы (в скобках указаны расходы трех
предприятий при соответствующем исходе aijk ,bijk , cijk ).
Зафиксируем стратегии участников B и C |
|
|
|
||||
|
S |
P , P |
S |
P |
, P |
. |
|
|
b |
1b 2b |
c |
1c |
2c |
|
|
Приемлемая смешанная стратегия Sa |
– это лучшая стратегия для |
||||||
участника A при фиксированных Sb , Sc . |
|
|
|
|
|||
Fa Sb , Sc |
– зависимость приемлемой стратегии Sa |
от Sb , Sc , |
|||||
Gb Sa , Sc |
– зависимость приемлемой стратегии Sb |
от Sa , Sc , |
118
Hc Sa , Sb |
– зависимость приемлемой стратегии Sc от Sa , Sb . |
|||
|
|
P2c |
|
|
|
1 |
(-1,-1,0) |
(-3,-4,-3) |
|
(-4,-3,-3) |
(-3,-3,-3) |
|
||
|
(-1,-1,-1) |
|
(0,-1,-1) |
|
|
|
|
1 |
P2a |
1 |
|
|
|
|
P2b |
(-1,0,-1) |
(-3,-3,-4) |
|
Рис. 2.10. Графическое представление матриц полезностей для участников
Найдем оптимальные стратегии для всех участников на пересечении этих функций. Построим эти функции для нашего примера. Так как у нас в примере игра симметричная, то достаточно построить од-
ну зависимость Fa Sb , Sc . |
|
|
|
|
|
|
При первой чистой стратегии P |
1 выигрыш будет: |
|
||||
|
|
|
1a |
|
|
|
a P P a P P |
a P P a P P |
, |
||||
111 1b 1c |
112 1b |
2c |
|
121 2b 1c |
122 2b 2c |
|
а при второй чистой стратегии |
P2a |
|
1 : |
|
|
|
a P P a P P |
a P P a P P |
. |
||||
211 1b 1c |
212 1b |
2c |
|
221 2b 1c |
222 2b 2c |
|
Чтобы первая стратегия была приемлемой, она должна быть лучше второй, поэтому первый выигрыш должен быть не хуже второго.
Сгруппируем слагаемые:
a |
a P P a |
a P P a |
a P P |
111 |
211 1b 1c 112 |
212 1b 2c 121 |
221 2b 1c |
a122 a222 P2b P2c 0.
119