Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный университет им. М.В. Ломоносова

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Chast_4_Vzaimodeystvia_-_konflikty_i_sotrudnich...docx

Скачиваний:

Добавлен:

19.11.2019

Размер:

725.72 Кб

Скачать

☆

<<< < Предыдущая 12 / 112 3 4 5 6 7 8 9 10 11 > Следующая >>>

Глава 4.1. Матричные игры

1. Понятие матричной игры

2. Решение игры

3. Удаление стратегий

4. Смешанное расширение матричных игр

5. Решение игр размерности 22 и 2n в смешанных стратегиях

6. Предметный указатель

1. Понятие матричной игры

В этой главе будет рассмотрена простейшая модель конфликтных ситуаций  матричные игры двух лиц. Изложим эту модель, учитывая, что некоторые её свойства присущи значительно более сложным конфликтам. Сначала дадим содержательное описание моделируемой ситуации.

В игре участвуют два игрока (скажем, A и B). У каждого игрока имеется конечное число воз-можных действий, которые обычно называются стратегиями. Природа этих действий может быть самой разнообразной, но сама по себе она не имеет значения. Каждый игрок выбирает одну из сво-их стратегий независимо от другого игрока. Реально это значит, что игрок A не знает, какую стра-тегию выбирает игрок B, а игрок B не знает, какую стратегию выбирает игрок A. После того, как оба выбора сделаны, игрок A получает выигрыш, зависящий от обеих выбранных стратегий. Если выигрыш  положительное число, то игрок B платит игроку A соответствующую сумму (в заранее обговорённой валюте); в противном случае игрок A платит игроку B. Игрок A стремится максими-зировать свой выигрыш, а игрок B стремится минимизировать свой проигрыш.

При формальном описании игры в силу конечности множеств стратегий у обоих игроков без ограничения общности можно считать, что сами стратегии задаются натуральными числами от 1 до m у игрока A и от 1 до n у игрока B. Поэтому выигрыш игрока A можно задавать платёжной матрицей Q размера m  n: если игроки выбрали стратегии i{1, ..., m} и j{1, ..., n}, то выигрыш игрока A равен числу q_ij  элементу матрицы Q, стоящему на пересечении i-ой строки и j-го столб-ца. Напомним, что проигрыш игрока B считается равным выигрышу игрока A. Можно считать, что выирыш игрока B при выборе стратегий i{1, ..., m} и j{1, ..., n} равен числу q_ij. Игры, в которых суммарный выигрыш всех игроков равен нулю, называются играми с нулевой суммой). Таким образом, матричная игра двух лиц является  по определению  игрой с нулевой суммой.

2. Решение игры

В матричной игре с платёжной матрицей Q игрок A стремится максимизировать свой выигрыш при любом выборе стратегии игроком B. Предположим, что он выбирает стратегию i{1, ..., m}. Поскольку игрок A не знает, какую именно стратегию (т.е. какой индекс j) выбрал игрок B, то всё, что он может себе гарантировать  это выгрыш в размере

g_i = . (1)

Естественно, что игрок A выберет такую стратегию i{1, ..., m}, которая максимизирует его гарантированный выгрыш g_i. Поэтому он выбирает стратегию i*, для которой

= . (2)

Заметим, что при любом i{1, ..., m} выражение , входящее в (2), не зависит от j. Поэтому значение зависит только от платёжной матрицы Q. Любая стратегия i*, удовлетво-ряющая условию (2), называется оптимальной стратегией игрока A (оптимальная стратегия i* может определяться неоднозначно, так как g_i может быть максимальным при различных i{1, ..., m}).

Проведённые рассуждения показывают, что именно должен делать игрок А, чтобы до-биться максимально возможного гарантированного выигрыша. Величина , которая определя-ется только по платёжной матрице Q, называется нижней ценой игры и обозначается через V^.

Игрок B стремится минимизировать свой проигрыш. Предположим, что он выбирает стра-

тегию j{1, ..., n}. Поскольку игрок B не знает, какую именно стратегию выбрал игрок А, то

всё, что он может себе гарантировать  это проигрыш в размере

f_j = . (3)

Естественно, что игрок B выберет такую стратегию j{1, ..., n}, которая минимизирует его га-рантированный выгрыш f_j. Поэтому он выбирает стратегию j*, для которой

= . (4)

Как и значение , значение зависит только от платёжной матрицы Q. Любая стратегия j*, удо-влетворяющая условию (4), называется оптимальной стратегией игрока B (оптимальная страте-гия j* может определяться неоднозначно, так как f_j может быть минимальным при различных j{1, ..., n}).

Проведённые рассуждения показывают, что именно должен делать игрок B, чтобы до-биться минимально возможного гарантированного проигрыша. Величина , которая определя-ется только по платёжной матрице Q, называется верхней ценой игры и обозначается через V⁺.

В силу теоремы о минимаксе (см. главу 3.1) для любой матрицы Q имеет место неравенст-во

≤ (5)

или, с учётом (2) и (4),

V^ ≤ V⁺.

Таким образом, гарантированный выигрыш игрока А не может быть больше гарантированного проигрыша игрока B.

В теории игр особенно важны те случаи, когда нижняя и верхняя цены игры совпадают. Общее значение V = V^= V⁺. называется ценой игры. При этом имеет место следующее

Утверждение 1. 1) V^=V⁺ тогда и только тогда, когда некоторый элемент платёжной матрицы Q является одновременно максимальным в её i*-ой строке и минимальным в её j*-ом столбце, т.е. для любых i{1, ..., m} и j{1, ..., n}

≤ ≤ . (6)

2) цена игры V совпадает с ; 3) стратегии i* и j* являются оптимальными ■

Пара стратегий i*, j*, удовлетворяющих требованиям утверждения 1, может определять-ся неоднозначно. Однако для всех таких пар i*, j* элементы платёжной матрицы Q равны одному и тому же числу  цене игры V. Всякий элемент платёжной матрицы Q, который является одновременно максимальным в i*-ой строке и минимальным в j*-ом столбце, называ-ется седловой точкой матрицы Q.

Заметим, что в силу неравенств (6) любому игроку оказывается невыгодным менять опти-мальную стратегию, если другой игрок будет придерживаться своей оптимальной стратегии. Для игрока А это следует из 1-го неравенства, для игрока В  из 2-го неравенства. Именно в силу разумности одновременного выбора игроками в данной ситуации своих оптимальных стратегий, любая пара стратегий i*, j*, удовлетворяющих требованиям утверждения 1, называ-ется решением игры.

Решения существуют далеко не у всех игр рассматриваемого типа. Как выбирать страте-гии в случае отсутствия седловых точек у платёжной матрицы, будет показано в разделе 4 дан-ной главы.

Пример 1. Рассмотрим матричную игру двух лиц со следующей платёжной матрицей:

Q = . (7)

Найдём, в соответствии с формулами (1) и (2), оптимальные стратегии игрока А. По фор-муле (1)

g₁ = = min{7, 6, 5, 4} = 4;

g₂ = = min{1, 8, 2, 3} = 1;

g₃ = = min{8, 1, 3, 2} = 1.

По формуле (2) = max{4, 1, 1}, откуда следует, что оптимальная стратегия i* = 1 и нижняя цена игры V^= 4.

Найдём, в соответствии с формулами (3) и (4), оптимальные стратегии игрока В. По фор-муле (3)

f₁ = = max{7, 1, 8} = 8;

f₂ = = max{6, 8, 1} = 8;

f₃ = = max{5, 2, 3} = 5;

f₄ = = max{4, 3, 2} = 4.

По формуле (4) = min{8, 8, 5, 4} = 4, откуда следует, что оптимальная стратегия j* = 4 и верхняя цена игры V⁺= 4.

Таким образом, нижняя цена игры совпадает с верхней ценой. Как и должно быть по ут-верждению 1, цена игры 4 равна = q₁₄. Пара стратегий 1, 4 является решением игры и седловой точкой матрицы Q ■

Пример 2. Рассмотрим матричную игру двух лиц со следующей платёжной матрицей:

Q = , (8)

все элементы которой, кроме q₂₄, совпадают с соответствующими элементами платёжной матрицы из примера 1.

Найдём, в соответствии с формулами (1) и (2), оптимальные стратегии игрока А. По фор-муле (1)

g₁ = = min{7, 6, 5, 4} = 4;

g₂ = = min{1, 8, 2, 5} = 1;

g₃ = = min{8, 1, 3, 2} = 1.

По формуле (2) = max{4, 1, 1}, откуда следует, что оптимальная стратегия i* = 1 и нижняя цена игры V^= 4.

Найдём, в соответствии с формулами (3) и (4), оптимальные стратегии игрока В. По фор-муле (3)

f₁ = = max{7, 1, 8} = 8;

f₂ = = max{6, 8, 1} = 8;

f₃ = = max{5, 2, 3} = 5;

f₄ = = max{4, 5, 2} = 5.

По формуле (4) = min{8, 8, 5, 5} = 5, откуда следует, что множеством оптимальных страте-гий j* является множество {3, 4} и верхняя цена игры V⁺= 5.

Таким образом, в данном случае, в отличие от примера 1, нижняя цена игры не равна верхней цене. Поэтому для данной платёжной матрицы Q решений игры, как и седловых точек, нет ■

Для любой матричной игры верно следующее

Утверждение 2. При прибавлении любого числа a (положительного или отрицательного) ко всем элементам платёжной матрицы Q множества оптимальных стратегий обоих игроков не изменяются, а нижняя и верхняя цена игры получены из исходных прибавлением того же числа a ■

В силу утверждения 2 существование решения игры также не зависит от прибавлении ко всем элементам платёжной матрицы Q произвольной константы.

Задание 1. В играх с указанными платёжными матрицами найти оптимальные стратегии обоих игроков, нижнюю и верхнюю цены игры. Указать решение игры, если оно есть; в противном случае явно указать на его отсутствие. В качестве образца см. примеры 1 и 2

15	20	25	19	17
15	21	18	30	19
27	10	19	20	25

20	25	15	25	10
19	20	9	27	14
37	20	19	19	15

14	16	30	25	18
19	18	15	24	15
10	27	26	6	-99

10	27	15	34	21
18	15	30	20	15
19	25	23	13	29

21	19	12	14	17
25	34	18	19	25
20	12	14	29	10

17	12	10	8	22
22	28	18	38	33
33	14	17	21	13

17	8	23	15	24
32	20	26	22	21
23	19	37	11	28

11	18	14	26	12
27	10	12	13	21
13	21	35	23	29

10	11	12	23	27
12	28	25	20	14
11	22	17	19	10

10	27	37	14	30
12	14	27	12	22
16	24	14	25	24

22	15	24	234	-23
24	22	26	22	15
14	0	13	24	22

25	19	16	25	19
27	10	8	18	30
15	20	30	15	21

16	8	15	20	30
18	24	22	18	965
12	21	30	25	15

25	19	21	14	25
18	30	19	15	20
30	25	30	15	210

8	13	24	24	16
30	15	27	26	8
22	22	31	13	30

27	12	14	25	8
14	25	10	27	20
22	18	12	14	17

15	20	25	19	17
15	21	18	30	19
27	10	19	20	25

20	25	15	25	10
19	20	9	27	14
37	20	19	19	15

14	16	30	25	18
-19	18	15	24	15
10	27	26	6	-90

30	27	15	34	21
18	15	30	20	15
19	25	23	13	29

21	19	12	14	17
25	14	18	19	25
20	12	14	29	10

17	12	10	80	22
22	28	18	38	33
33	13	17	21	13

17	8	27	15	24
32	20	26	22	21
23	19	37	11	28

11	18	14	26	12
27	10	12	13	21
13	21	35	27	29

10	11	12	13	27
12	28	25	20	14
11	22	17	19	30

10	27	15	34	21
18	-15	30	20	15
19	25	23	-13	29

21	-19	12	14	17
25	34	-18	19	25
20	12	14	-29	10

16	8	15	20	30
18	24	12	18	965
12	21	-30	25	15

25	19	21	14	25
18	30	-19	15	20
30	25	30	15	10

8	-13	24	24	16
30	15	-27	26	48
22	22	31	13	30

■

<<< < Предыдущая 12 / 112 3 4 5 6 7 8 9 10 11 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
04.08.2019167.94 Кб1chast_1.doc
#
22.03.2016407.04 Кб17Chast_1_Reader_2009[1].doc
#
22.03.2016534.53 Кб18Chast_1_Sbornik_Uprazhneniy[1].doc
#
25.08.20198.26 Mб151Chast_2(1).doc
#
21.04.20192.85 Mб5chast_2.doc
#
19.11.2019725.72 Кб3Chast_4_Vzaimodeystvia_-_konflikty_i_sotrudnich...docx
#
13.09.201960.42 Кб2Checkpoint Test 2.doc
#
01.09.201970.66 Кб13Chekhia_1.doc
#
27.10.20183.24 Mб69chemistry.docx
#
15.12.2018641.54 Кб6ChemLect.doc
#
04.05.20191.31 Mб31chemmetr(3ed)-core-FINAL.doc