Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Елтаренко Исследование операцыи 2007

.pdf
Скачиваний:
95
Добавлен:
16.08.2013
Размер:
2.72 Mб
Скачать

Sa . Таким образом, для любой смешанной стратегии Sb можно определить приемлемую стратегию Sa .

Можно условно графически представить зависимость приемлемой стратегии Sa как функцию от Sb , представленной на рис. 2.5.

Смешанная стратегия Sb игрока B является приемлемой, если при любой другой смешанной стратегии Sb и фиксированной сме-

шанной стратегии Sa выполняется:

 

b Sa , Sb

b Sa , Sb .

Sb

Sb

Fa

Gb

Sa

 

Sa

Рис. 2.5. Множество приемлемых

Рис. 2.6. Множество приемлемых

стратегий для участника А

 

стратегий для участника B

Зависимость приемлемой стратегии Sb

от Sa также можно услов-

но представить в виде функции Gb

(рис. 2.6).

Пересечение двух множеств Fa

и Gb

дает решение биматричной

игры (рис. 2.7):

 

 

110

Sb

Fa

Gb

S*b

S*a Sa

Рис. 2.7. Определение оптимальных смешанных стратегий

Проиллюстрируем принцип решения биматричных игр на задаче размерности 2 2.

2.4.2.Решение биматричных игр 2 2

Вкачестве исходных данных заданы две матрицы:

 

 

 

 

 

 

 

S1b

S2b

 

 

 

 

 

 

 

 

 

 

 

a

 

a11

a12

S1a ,

 

 

 

 

 

 

 

 

 

ij

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a21

a22

S2a

 

 

 

 

 

 

 

 

 

 

 

S1b

S2b

 

 

 

 

 

 

 

 

 

 

 

b

 

b11

b12

 

S1a .

 

 

 

 

 

 

 

 

 

ij

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b21

b22

 

S2a

 

 

 

 

 

 

Смешанные стратегии

для

A:

S

a

P

, P

, для

B :

 

 

 

 

 

 

 

 

 

 

 

1a

2a

 

 

S

b

P

, P

.

 

 

 

 

 

 

 

 

 

 

 

 

1b

2b

 

 

 

 

 

 

 

 

 

 

 

 

Выигрыш участника A равен:

111

 

 

a S

a

, S

b

 

 

a P P

 

 

a P P

 

a P P

 

a P P

.

 

 

 

 

 

 

 

 

 

 

11 1a 1b

 

 

 

12 1a 2b

 

21 2a 1b

 

 

22 2a 2b

 

С учетом

P

 

 

1

 

 

 

P

и P

 

 

 

1

 

P

 

:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2a

 

 

 

 

 

 

 

1a

 

 

 

 

2b

 

 

 

 

 

 

 

1b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a S

a

, S

b

 

 

 

a P P

 

 

a P

1 P

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

11 1a 1b

 

 

 

12 1a

 

 

1b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a

21

1

 

P

 

 

P

 

 

a

22

1

 

P

 

 

1

P

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1a

 

1b

 

 

 

 

 

 

 

1a

 

 

1b

 

 

 

 

 

 

После упрощения получим:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a S

a

, S

b

 

 

 

 

P P

 

a a

22

 

 

a a

21

a a

22

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1a

 

1b

 

 

11

 

 

 

 

 

12

 

 

12

 

 

 

 

 

P

 

a

21

 

 

 

a

22

 

 

a

22

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Так как в нашем случае смешанная стратегия

Sa

определяется

одной вероятностью

 

 

P

,

а S

b

 

P

 

, то условие приемлемой страте-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1a

 

 

 

 

 

 

 

1b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

гии для Sa запишется в виде:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a P

 

, P

 

 

 

 

a P

, P

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1a

 

 

1b

 

 

 

 

 

 

1a

 

1b

 

 

 

 

 

 

 

 

 

Чистая стратегия

 

S

 

будет приемлемой (лучшей), когда

P

1

 

 

 

 

 

 

 

 

 

 

 

 

 

1a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1a

 

или когда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

 

a

 

 

a

 

 

 

a

 

 

 

a

 

 

 

a

 

 

a

0 .

 

 

 

 

 

 

 

 

 

 

 

1b

 

 

11

 

22

 

 

 

12

 

 

 

 

21

 

12

 

 

22

 

 

 

 

 

 

Из данного неравенства можем сделать вывод, что чистая страте-

гия S

ia

– приемлемая, если P

 

 

 

P*

 

:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1b

 

 

1b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

 

 

 

 

 

 

 

a22

 

 

 

a12

 

 

 

 

 

P*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1b

 

 

a11

 

 

a22

 

 

 

a12

 

a21

 

 

1b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

при знаменателе C

 

 

 

a11

 

 

a22

 

 

a12

 

 

 

a21

0 .

 

 

 

 

 

 

 

 

 

Если же C

 

 

0 ,

то тогда P

 

 

 

 

 

 

 

 

a22

a12

 

 

,

и

S

– прием-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1b

 

 

a11

 

 

a22

a12

a21

 

1a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

лемая при P

 

 

 

 

P* .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1b

 

 

 

1b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Напротив, стратегия S

2a

приемлема при

P

 

0, т.е. при условии,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1a

 

 

 

 

 

 

 

что

112

 

 

 

 

 

 

 

 

P

a

 

 

a

a

a

 

a

 

 

a

 

0 .

 

 

 

 

 

 

 

 

 

 

 

1b

11

 

22

 

12

21

 

12

 

21

 

 

 

 

 

 

Таким

образом,

при

C

0

стратегия

 

S2a

 

приемлема,

если

P

P

*

 

 

 

 

a22

a12

 

 

, а при C

 

0

 

 

 

 

 

*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

если P

P

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1b

 

1b

 

a11

a22

a12

a21

 

 

 

 

 

 

 

 

1b

1b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

На рис. 2.8 приведены зависимости при C

 

0 и C

 

0 .

 

 

 

 

P1b

 

 

 

 

C>0

 

 

 

 

 

 

 

P1b

 

 

C<0

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

Fa

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P*1b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P*1b

 

 

 

 

 

 

 

 

Fa

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

1

P1a

 

0

 

 

 

 

 

 

 

1 P1a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 2.8. Множество приемлемых стратегий для участника А

 

 

Для построения Gb

 

S1a , S1b

запишем выражение для выигрыша

участника B :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b S

a

, S b P P

 

b P P

b P P

b P P

;

 

 

 

 

 

b

 

 

 

11 1a 1b

 

12 1a 2b

 

21 2a 1b

 

22 2a 2b

 

 

 

 

 

P

 

1

 

 

P

; P

1

 

P

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2a

 

 

 

 

1a

 

2b

 

 

1b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b S

a

, S

 

P P

b b b b

b b

 

P b b

 

b .

 

 

b

 

 

 

1b 1a

11

 

 

22 12

21

21

22

 

1a 12

22

22

 

Чистая стратегия

S

 

приемлемая P

 

1 , если

 

 

 

 

 

 

 

 

 

 

 

 

1b

 

 

 

 

 

 

1b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

b

 

 

b

b

b

 

b

 

 

b

 

0

 

 

 

 

 

 

 

 

 

 

 

1a

11

22

 

12

21

 

21

 

22

 

 

 

 

 

или P

 

 

 

 

 

 

b22

b21

 

 

 

 

P*

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1a

 

b11

 

b22

b12

 

 

b21

1a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

при условии, что знаменатель

D

b11

b22

b12

b21

0.

 

 

 

Если D

 

0, то чистая стратегия S1b

приемлема при

 

 

 

113

 

 

P

 

b22

b21

 

P* .

 

 

 

 

 

1a

b11

b22

b12

b21

 

1a

 

 

 

 

 

 

 

 

 

 

 

 

На рис.

2.9 приведены зависимости

G P

, P

при D

0

и

 

 

 

 

 

 

b

1a

1b

 

 

 

D

0.

 

 

 

 

 

 

 

 

 

 

 

P1b

D<0

 

 

P1b

D>0

 

 

 

 

1

 

 

 

1

 

 

 

 

 

 

 

 

Gb

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Gb

 

 

 

 

0

P*1a

 

 

0

 

 

P*1a

 

 

 

 

 

1 P1a

 

 

 

1 P1a

 

 

 

Рис. 2.9. Множество приемлемых стратегий для участника B

 

 

 

Решением биматричной игры будет пересечение Fa

и Gb .

 

 

 

Возможны четыре варианта пересечения Fa

и Gb

(в зависимости

от знаков C и D).

 

 

 

 

 

 

 

 

 

 

Первый вариант

 

 

 

 

 

 

 

 

 

 

P

 

 

 

 

 

 

 

 

 

 

 

1b

 

 

 

 

 

C 0, D 0 .

 

 

 

 

 

 

 

 

 

Реше-

 

1

 

 

 

 

ние

единственное

 

 

Gb

 

Fa

 

P* , P* .

 

 

 

 

P*

 

 

 

 

1a

1b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

 

 

 

 

 

 

 

 

 

 

 

1a

 

 

 

 

 

 

 

0

P*

 

1

 

 

 

 

 

 

 

 

 

1a

 

 

 

 

 

 

 

 

 

 

 

 

 

114

 

 

 

 

 

 

 

Второй вариант

 

 

 

 

 

 

 

P

 

 

 

 

 

 

 

 

1b

 

 

 

 

C 0, D 0 .

 

 

 

 

 

 

Ре-

1

 

 

(1,1)

 

шением будет P* ,

P* ,

 

 

Gb

 

 

 

 

1a

1b

 

 

 

 

точки

пересечения

P*

 

 

F

 

 

 

 

(1,1) и (0,0) – неустой-

1b

 

 

a

 

 

 

 

 

 

 

 

чи-

 

 

 

 

вы.

 

 

 

 

 

 

P

 

 

 

 

 

 

 

 

1a

 

 

 

 

 

0

P*

 

1

 

 

 

 

 

 

1a

 

 

 

 

 

 

 

Третий вариант

 

 

 

 

 

 

 

 

 

 

 

C

0, D

0. Решением бу-

P1b

 

 

дет P*

, P* . Точки (1, 0) и (0,

 

 

 

 

1a

1b

 

 

 

1

 

 

1)

дают неустойчивые реше-

 

 

ния.

 

 

 

 

 

Gb

 

 

 

 

 

 

 

 

 

 

 

 

 

P1*b

 

 

 

 

 

 

 

 

 

 

 

Fa

 

 

 

 

 

 

 

 

P1a

 

 

 

 

 

0

P1*a

 

1

 

 

 

 

 

Четвертый вариант

 

 

 

 

 

 

 

 

 

C

0, D

0 . Решение единст-

P1b

 

 

венное – P* ,

P* .

 

 

 

 

 

 

 

1a

1b

 

 

1

 

 

 

 

 

 

 

 

 

Gb

 

 

 

 

 

 

 

P1*b

 

 

 

 

 

 

 

 

 

 

Fa

 

 

 

 

 

 

 

 

 

P1a

 

 

 

 

 

0

P1*a

1

115

 

 

 

 

 

Пример решения биматричной игры. Для каждого участника за-

дана матрица выигрышей:

 

 

 

 

 

a

 

3

1

,

 

 

 

 

b

 

 

 

6

 

0

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ij

 

1

6

 

 

 

 

 

 

ij

 

 

1

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Находим оптимальные смешанные стратегии:

 

 

 

 

 

 

 

 

*

 

 

 

a22

a12

 

 

 

 

 

 

 

 

6

1

 

 

7

 

 

 

 

 

P

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

, C 0;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1b

 

 

a11

a22

a12

 

 

a21

3 6 1 1 9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

 

 

 

b22

b21

 

 

 

 

3

1

2

 

 

 

 

 

 

 

 

P

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

,

 

D

0.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1a

 

 

b11

b22

b12

 

b21

6

3

1 5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рассчитываем выигрыши участников игры:

 

 

 

 

 

 

 

a

a(S* , S* ) a P* P*

 

a P* P*

a P*

P*

 

a P*

P*

;

 

 

a b

 

11 1a 1b

 

12 1a 2b

 

 

21 2a 1b

 

22 2a 2b

 

 

 

 

a

3 2

7

1 2

2

 

1 3

7

6 3

 

2

 

 

103 ;

 

 

 

 

 

 

5

9

5

9

 

5

9

5

 

9

 

 

45

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b

 

6 2

7

3 2

2

 

1 3

7

3 3

 

2

 

123.

 

 

 

 

 

 

5

9

 

5

9

 

5

9

5

 

9

 

45

 

 

 

 

 

 

 

 

 

 

 

 

 

Отметим, что принцип нахождения оптимальной смешанной стратегии для игрока А – минимизация выигрыша противника, и для участника В – тоже минимизация выигрыша противника. Этот принцип

распространим для решения игр размерности n m.

2.4.3. Решение биматричных игр n m

 

Даны две матрицы выигрышей

 

и

 

bij

 

 

размерности n m.

aij

 

 

 

Необходимо найти оптимальные смешанные стратегии:

 

S*

{P*} и

S*

{P*

}.

 

a

ia

b

 

 

 

jb

 

 

Оптимальную смешанную стратегию {P*} находим из условия

 

 

 

 

 

 

ia

 

 

минимизации выигрыша противника

min

b

,

а {P* }

– из условия

 

 

 

 

 

 

 

jb

 

минимизации выигрыша противника min

a .

 

 

 

116

Для нахождения {P*} ставим задачу линейного программирова-

 

ia

 

 

 

 

 

ния:

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

max xi

,

 

 

 

 

 

i 1

 

 

 

 

n

 

 

 

 

 

при ограничениях

bij xi

1 ( j

1, 2,...,m), xi

0.

i

1

 

 

 

 

 

На основе найденных

x* вычисляем

{P*} (см. п. 2.3, решение

 

 

i

 

ia

 

 

матричных игр n m).

 

 

 

 

 

Для нахождения

{P* }

ставим задачу линейного программирова-

 

jb

 

 

 

 

 

 

 

 

m

 

 

 

ния:

 

max

y j

 

 

 

 

 

 

j 1

 

 

 

 

m

 

 

 

 

 

при ограничениях:

aij yj

1 (i

1, 2, ...,n) ,

yj

0.

j 1

 

 

 

 

 

На основе найденных

y* вычисляем

{P*

}

(см. п. 2.3. решение

 

 

j

 

jb

 

 

матричных игр n m).

Выигрыши участников определяются с использованием их матриц выигрышей:

n

m

 

 

n

m

a

a P*P*

,

b

 

b P*P* .

ij ia jb

 

 

ij ia jb

i 1

j 1

 

 

i 1

j 1

Следует сказать, что матричные (антагонистические) игры являются частным случаем биматричных игр, поэтому для их решения можно использовать принцип решения биматричных игр.

Следует также отметить, что принцип решения биматричных игр может использоваться для решения игр с тремя и более участниками. Чтобы это продемонстрировать, рассмотрим решение диадических игр с тремя участниками.

117

2.5. Диадические игры

Игры, в которых каждому участнику предоставляется только две чистые стратегии, называются диадическими. Участник A: S1a, S2a ,

участник B : S1b, S2b , участник C : S1c, S2c .

В диадических играх смешанная стратегия участника A описыва-

ется вероятностью

P

, так как

P

1 P

. Поэтому решить диади-

 

1a

 

2b

1a

 

 

 

ческую игру – значит найти оптимальные P*

, P*

, P* .

 

 

 

 

1a

1b

1c

Продемонстрируем метод решения диадических игр на примере из [2]. Имеются предприятия: A, B и C , осуществляющие сброс воды в один водоем. Каждый из них имеет две чистые стратегии:

S1a , S1b , S1c – используют очистные сооружения; S2a , S2b , S2c – не используют очистные сооружения.

Водоем такой, что если два или более предприятий сбрасывают неочищенную воду, то вода загрязняется выше нормы, и все предприятия платят штраф (-3). Использование очистных средств обходится предприятию в (-1).

Для каждого из участников должны быть заданы матрицы полез-

ности: aijk , bijk , cijk .

Удобно представить эти матрицы графически на кубе (рис. 2.10). Углы куба – возможные исходы (в скобках указаны расходы трех

предприятий при соответствующем исходе aijk ,bijk , cijk ).

Зафиксируем стратегии участников B и C

 

 

 

 

S

P , P

S

P

, P

.

 

 

b

1b 2b

c

1c

2c

 

 

Приемлемая смешанная стратегия Sa

– это лучшая стратегия для

участника A при фиксированных Sb , Sc .

 

 

 

 

Fa Sb , Sc

– зависимость приемлемой стратегии Sa

от Sb , Sc ,

Gb Sa , Sc

– зависимость приемлемой стратегии Sb

от Sa , Sc ,

118

Hc Sa , Sb

– зависимость приемлемой стратегии Sc от Sa , Sb .

 

 

P2c

 

 

 

1

(-1,-1,0)

(-3,-4,-3)

 

(-4,-3,-3)

(-3,-3,-3)

 

 

(-1,-1,-1)

 

(0,-1,-1)

 

 

 

 

1

P2a

1

 

 

 

 

P2b

(-1,0,-1)

(-3,-3,-4)

 

Рис. 2.10. Графическое представление матриц полезностей для участников

Найдем оптимальные стратегии для всех участников на пересечении этих функций. Построим эти функции для нашего примера. Так как у нас в примере игра симметричная, то достаточно построить од-

ну зависимость Fa Sb , Sc .

 

 

 

 

 

При первой чистой стратегии P

1 выигрыш будет:

 

 

 

 

1a

 

 

 

a P P a P P

a P P a P P

,

111 1b 1c

112 1b

2c

 

121 2b 1c

122 2b 2c

 

а при второй чистой стратегии

P2a

 

1 :

 

 

a P P a P P

a P P a P P

.

211 1b 1c

212 1b

2c

 

221 2b 1c

222 2b 2c

 

Чтобы первая стратегия была приемлемой, она должна быть лучше второй, поэтому первый выигрыш должен быть не хуже второго.

Сгруппируем слагаемые:

a

a P P a

a P P a

a P P

111

211 1b 1c 112

212 1b 2c 121

221 2b 1c

a122 a222 P2b P2c 0.

119