Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Chast_4_Vzaimodeystvia_-_konflikty_i_sotrudnich...docx
Скачиваний:
3
Добавлен:
19.11.2019
Размер:
725.72 Кб
Скачать

Глава 4.1. Матричные игры

1. Понятие матричной игры

2. Решение игры

3. Удаление стратегий

4. Смешанное расширение матричных игр

5. Решение игр размерности 22 и 2n в смешанных стратегиях

6. Предметный указатель

1. Понятие матричной игры

В этой главе будет рассмотрена простейшая модель конфликтных ситуаций  матричные игры двух лиц. Изложим эту модель, учитывая, что некоторые её свойства присущи значительно более сложным конфликтам. Сначала дадим содержательное описание моделируемой ситуации.

В игре участвуют два игрока (скажем, A и B). У каждого игрока имеется конечное число воз-можных действий, которые обычно называются стратегиями. Природа этих действий может быть самой разнообразной, но сама по себе она не имеет значения. Каждый игрок выбирает одну из сво-их стратегий независимо от другого игрока. Реально это значит, что игрок A не знает, какую стра-тегию выбирает игрок B, а игрок B не знает, какую стратегию выбирает игрок A. После того, как оба выбора сделаны, игрок A получает выигрыш, зависящий от обеих выбранных стратегий. Если выигрыш  положительное число, то игрок B платит игроку A соответствующую сумму (в заранее обговорённой валюте); в противном случае игрок A платит игроку B. Игрок A стремится максими-зировать свой выигрыш, а игрок B стремится минимизировать свой проигрыш.

При формальном описании игры в силу конечности множеств стратегий у обоих игроков без ограничения общности можно считать, что сами стратегии задаются натуральными числами от 1 до m у игрока A и от 1 до n у игрока B. Поэтому выигрыш игрока A можно задавать платёжной матрицей Q размера mn: если игроки выбрали стратегии i{1, ..., m} и j{1, ..., n}, то выигрыш игрока A равен числу qij  элементу матрицы Q, стоящему на пересечении i-ой строки и j-го столб-ца. Напомним, что проигрыш игрока B считается равным выигрышу игрока A. Можно считать, что выирыш игрока B при выборе стратегий i{1, ..., m} и j{1, ..., n} равен числу qij. Игры, в которых суммарный выигрыш всех игроков равен нулю, называются играми с нулевой суммой). Таким образом, матричная игра двух лиц является  по определению  игрой с нулевой суммой.

2. Решение игры

В матричной игре с платёжной матрицей Q игрок A стремится максимизировать свой выигрыш при любом выборе стратегии игроком B. Предположим, что он выбирает стратегию i{1, ..., m}. Поскольку игрок A не знает, какую именно стратегию (т.е. какой индекс j) выбрал игрок B, то всё, что он может себе гарантировать  это выгрыш в размере

gi = . (1)

Естественно, что игрок A выберет такую стратегию i{1, ..., m}, которая максимизирует его гарантированный выгрыш gi. Поэтому он выбирает стратегию i*, для которой

= . (2)

Заметим, что при любом i{1, ..., m} выражение , входящее в (2), не зависит от j. Поэтому значение зависит только от платёжной матрицы Q. Любая стратегия i*, удовлетво-ряющая условию (2), называется оптимальной стратегией игрока A (оптимальная стратегия i* может определяться неоднозначно, так как gi может быть максимальным при различных i{1, ..., m}).

Проведённые рассуждения показывают, что именно должен делать игрок А, чтобы до-биться максимально возможного гарантированного выигрыша. Величина , которая определя-ется только по платёжной матрице Q, называется нижней ценой игры и обозначается через V.

Игрок B стремится минимизировать свой проигрыш. Предположим, что он выбирает стра-

тегию j{1, ..., n}. Поскольку игрок B не знает, какую именно стратегию выбрал игрок А, то

всё, что он может себе гарантировать  это проигрыш в размере

fj = . (3)

Естественно, что игрок B выберет такую стратегию j{1, ..., n}, которая минимизирует его га-рантированный выгрыш fj. Поэтому он выбирает стратегию j*, для которой

= . (4)

Как и значение , значение зависит только от платёжной матрицы Q. Любая стратегия j*, удо-влетворяющая условию (4), называется оптимальной стратегией игрока B (оптимальная страте-гия j* может определяться неоднозначно, так как fj может быть минимальным при различных j{1, ..., n}).

Проведённые рассуждения показывают, что именно должен делать игрок B, чтобы до-биться минимально возможного гарантированного проигрыша. Величина , которая определя-ется только по платёжной матрице Q, называется верхней ценой игры и обозначается через V+.

В силу теоремы о минимаксе (см. главу 3.1) для любой матрицы Q имеет место неравенст-во

≤ (5)

или, с учётом (2) и (4),

VV+.

Таким образом, гарантированный выигрыш игрока А не может быть больше гарантированного проигрыша игрока B.

В теории игр особенно важны те случаи, когда нижняя и верхняя цены игры совпадают. Общее значение V = V = V+. называется ценой игры. При этом имеет место следующее

Утверждение 1. 1) V=V+ тогда и только тогда, когда некоторый элемент платёжной матрицы Q является одновременно максимальным в её i*-ой строке и минимальным в её j*-ом столбце, т.е. для любых i{1, ..., m} и j{1, ..., n}

≤ ≤ . (6)

2) цена игры V совпадает с ; 3) стратегии i* и j* являются оптимальными ■

Пара стратегий i*, j*, удовлетворяющих требованиям утверждения 1, может определять-ся неоднозначно. Однако для всех таких пар i*, j* элементы платёжной матрицы Q равны одному и тому же числу  цене игры V. Всякий элемент платёжной матрицы Q, который является одновременно максимальным в i*-ой строке и минимальным в j*-ом столбце, называ-ется седловой точкой матрицы Q.

Заметим, что в силу неравенств (6) любому игроку оказывается невыгодным менять опти-мальную стратегию, если другой игрок будет придерживаться своей оптимальной стратегии. Для игрока А это следует из 1-го неравенства, для игрока В  из 2-го неравенства. Именно в силу разумности одновременного выбора игроками в данной ситуации своих оптимальных стратегий, любая пара стратегий i*, j*, удовлетворяющих требованиям утверждения 1, называ-ется решением игры.

Решения существуют далеко не у всех игр рассматриваемого типа. Как выбирать страте-гии в случае отсутствия седловых точек у платёжной матрицы, будет показано в разделе 4 дан-ной главы.

Пример 1. Рассмотрим матричную игру двух лиц со следующей платёжной матрицей:

Q = . (7)

Найдём, в соответствии с формулами (1) и (2), оптимальные стратегии игрока А. По фор-муле (1)

g1 = = min{7, 6, 5, 4} = 4;

g2 = = min{1, 8, 2, 3} = 1;

g3 = = min{8, 1, 3, 2} = 1.

По формуле (2) = max{4, 1, 1}, откуда следует, что оптимальная стратегия i* = 1 и нижняя цена игры V= 4.

Найдём, в соответствии с формулами (3) и (4), оптимальные стратегии игрока В. По фор-муле (3)

f1 = = max{7, 1, 8} = 8;

f2 = = max{6, 8, 1} = 8;

f3 = = max{5, 2, 3} = 5;

f4 = = max{4, 3, 2} = 4.

По формуле (4) = min{8, 8, 5, 4} = 4, откуда следует, что оптимальная стратегия j* = 4 и верхняя цена игры V+= 4.

Таким образом, нижняя цена игры совпадает с верхней ценой. Как и должно быть по ут-верждению 1, цена игры 4 равна = q14. Пара стратегий 1, 4 является решением игры и седловой точкой матрицы Q

Пример 2. Рассмотрим матричную игру двух лиц со следующей платёжной матрицей:

Q = , (8)

все элементы которой, кроме q24, совпадают с соответствующими элементами платёжной матрицы из примера 1.

Найдём, в соответствии с формулами (1) и (2), оптимальные стратегии игрока А. По фор-муле (1)

g1 = = min{7, 6, 5, 4} = 4;

g2 = = min{1, 8, 2, 5} = 1;

g3 = = min{8, 1, 3, 2} = 1.

По формуле (2) = max{4, 1, 1}, откуда следует, что оптимальная стратегия i* = 1 и нижняя цена игры V= 4.

Найдём, в соответствии с формулами (3) и (4), оптимальные стратегии игрока В. По фор-муле (3)

f1 = = max{7, 1, 8} = 8;

f2 = = max{6, 8, 1} = 8;

f3 = = max{5, 2, 3} = 5;

f4 = = max{4, 5, 2} = 5.

По формуле (4) = min{8, 8, 5, 5} = 5, откуда следует, что множеством оптимальных страте-гий j* является множество {3, 4} и верхняя цена игры V+ = 5.

Таким образом, в данном случае, в отличие от примера 1, нижняя цена игры не равна верхней цене. Поэтому для данной платёжной матрицы Q решений игры, как и седловых точек, нет ■

Для любой матричной игры верно следующее

Утверждение 2. При прибавлении любого числа a (положительного или отрицательного) ко всем элементам платёжной матрицы Q множества оптимальных стратегий обоих игроков не изменяются, а нижняя и верхняя цена игры получены из исходных прибавлением того же числа a

В силу утверждения 2 существование решения игры также не зависит от прибавлении ко всем элементам платёжной матрицы Q произвольной константы.

Задание 1. В играх с указанными платёжными матрицами найти оптимальные стратегии обоих игроков, нижнюю и верхнюю цены игры. Указать решение игры, если оно есть; в противном случае явно указать на его отсутствие. В качестве образца см. примеры 1 и 2

15

20

25

19

17

15

21

18

30

19

27

10

19

20

25

01

20

25

15

25

10

19

20

9

27

14

37

20

19

19

15

02

14

16

30

25

18

19

18

15

24

15

10

27

26

6

-99

03

10

27

15

34

21

18

15

30

20

15

19

25

23

13

29

04

21

19

12

14

17

25

34

18

19

25

20

12

14

29

10

05

17

12

10

8

22

22

28

18

38

33

33

14

17

21

13

06

17

8

23

15

24

32

20

26

22

21

23

19

37

11

28

07

11

18

14

26

12

27

10

12

13

21

13

21

35

23

29

08

10

11

12

23

27

12

28

25

20

14

11

22

17

19

10

09

10

27

37

14

30

12

14

27

12

22

16

24

14

25

24

10

22

15

24

234

-23

24

22

26

22

15

14

0

13

24

22

11

25

19

16

25

19

27

10

8

18

30

15

20

30

15

21

12

16

8

15

20

30

18

24

22

18

965

12

21

30

25

15

13

25

19

21

14

25

18

30

19

15

20

30

25

30

15

210

14

8

13

24

24

16

30

15

27

26

8

22

22

31

13

30

15

27

12

14

25

8

14

25

10

27

20

22

18

12

14

17

16

15

20

25

19

17

15

21

18

30

19

27

10

19

20

25

17

20

25

15

25

10

19

20

9

27

14

37

20

19

19

15

18

14

16

30

25

18

-19

18

15

24

15

10

27

26

6

-90

19

30

27

15

34

21

18

15

30

20

15

19

25

23

13

29

20

21

19

12

14

17

25

14

18

19

25

20

12

14

29

10

21

17

12

10

80

22

22

28

18

38

33

33

13

17

21

13

22

17

8

27

15

24

32

20

26

22

21

23

19

37

11

28

23

11

18

14

26

12

27

10

12

13

21

13

21

35

27

29

24

10

11

12

13

27

12

28

25

20

14

11

22

17

19

30

25

10

27

15

34

21

18

-15

30

20

15

19

25

23

-13

29

26

21

-19

12

14

17

25

34

-18

19

25

20

12

14

-29

10

27

16

8

15

20

30

18

24

12

18

965

12

21

-30

25

15

28

25

19

21

14

25

18

30

-19

15

20

30

25

30

15

10

29

8

-13

24

24

16

30

15

-27

26

48

22

22

31

13

30

30

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]