Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Матричные игры (110

..pdf
Скачиваний:
11
Добавлен:
15.11.2022
Размер:
260.14 Кб
Скачать

Определение 8. Смешанной стратегией игрока 1 называется вектор x =

m

( 1; :::; m) : i = 1; i > 0},

i=1

Смешанной стратегией игрока 2 называется вектор y = ( 1; :::; m) :

n

i = 1; i > 0},

i=1

Удобно считать вектор x строкой, а вектор y - столбцом. Чистая стратегия является частным случаем смешанной стратегии. Так, например, чистая стратегия i игрока 1 есть вектор (0; :::; 0; 1; 0; :::; 0), i-ая компонента которого равна 1, а остальные равны нулю.

Определение 9. Смешанным расширением игры A называется игра =

 

 

 

 

 

 

 

 

n

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

{

X;

 

Y

;

K

},

где

X

= {x = ( 1; :::; m) :

i = 1; i > 0},

Y

= {y =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=1

 

 

( 1; :::; n) :

 

 

j = 1;

j > 0} – множества смешанных стратегий игроков

 

 

 

 

 

 

 

=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

 

m n

 

 

 

в игре A, а

K

(x; y) =

aij i j = xAy – функция выигрыша в смешанных

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1 j=1

 

 

 

стратегиях, где x –

вектор строка, длиной m; y – вектор столбец, длиной

 

∑ ∑

 

 

 

n.

Теорема 4.1. Пусть A и A- две матричные (m × n)-игры , причем A=

A + B; > 0; = const, а B - матрица с одинаковыми элементами , т.е. ij = для всех i и j. Тогда Z( A) = Z( A), A= A + , где A

и A - смешанные расширения этих игр,а Z( A); Z( A) – множества всех ситуаций равновесия в играх A′ и A соответственно, A′ и A - значения

игр Aи A.

Доказательство теоремы приведено в [1], стр. 24.

Обычно говоря о матричной игре, имеют в виду ее смешанное расширение, опуская в обозначении черту сверху.

Теорема 4.2. Всякая матричная игра имеет ситуацию равновесия в смешанных стратегиях.

11

Доказательство теоремы приведено в [1], стр. 28 - 30.

Определение 10. Спектром смешанной стратегии игрока в конечной антагонистической игре называется множество всех его чистых стратегий, вероятность применения которых согласно этой стратегии положительна.

Теорема 4.3. Для того чтобы ситуация (x ; y ) была равновесной в игре

A, а число = K(x ; y ) – значением игры A необходимо и достаточно выполнение следующих неравенств для всех i M и j N:

K(i; y ) 6 K(x ; y ) 6 K(x ; j):

Доказательство теоремы приведено в [1], стр. 32.

Теорема 4.4. Для матричной игры справедливо соотношение max min K(x; j) = A;

xj

min max K(i; y) = A:

yi

Доказательство теоремы приведено в [2], стр. 35.

Определение 11. Чистая стратегия i M (j N) игрока 1 (2) называется существенной или активной, если существует оптимальная стра-

тегия этого игрока

x = ( 1; 2; : : : ; m)

 

(y = ( 1; 2; : : : ; n)),

для которой i >

0 ( j > 0):

Теорема 4.5. Для каждой существенной стратегии i игрока 1 и любой оптимальной стратегии y Y игрока 2 в игре A, выполняется равенство

K(i; y ) = A:

Для каждой существенной стратегии j игрока 2 и любой оптимальной стратегии x X игрока 1 в игре A,выполняется равенство

K(x ; j) = A:

12

Доказательство теоремы приведено в [2], стр. 38.

Определение 12. Говорят, что стратегия x(y) игрока 1 (2) доминирует стратегию x′′(y′′) этого же игрока в (m×n)-игре A, если для всех чистых стратегий игрока 2 (1) j (1; : : : ; n)

(i (1; : : : ; m) ) выполняется:

K(x; j) > K(x′′; j); K(i; y) ≤ K(i; y′′)

или, что одно и тоже,

xaj > x′′aj; (aiy≤ aiy′′):

Определение 13. Будем говорить, что стратегия x′′(y′′) игрока 1(2) доминируема, если существует стратегия x≠ x′′ (y≠ y′′) этого игрока, которая доминирует стратегию x′′(y′′). В противном случае, стратегия x′′(y′′) недоминируема.

Определение 14. Если x = ( 1; :::; m) X и 1 ≤ i ≤ m + 1, то расширением стратегии x на i-м месте будем называть вектор xi = ( 1; :::; i−1; 0; i; :::; m) Rm+1.

Определение 15. Игра = (X; Y ; K) называется подыгрой игры = (X; Y; K), если XX; Y Y; а функция K: X× Y → R1 является сужением функции K на X× Y .

Теорема 4.6. Пусть = (X; Y; K) – конечная антагонистическая игра,

= (X\{x0}; Y \{y0}; K) – подыгра игры , а x0 и y0 – чистые стратегии игроков 1 и 2 в игре , доминируемые некоторыми стратегиями x; yсоответственно, спектр которых не содержит x0; y0. Тогда всякое решение

(x ; y ; ) игры является решением игры .

13

Доказательство теоремы приведено в [2], стр. 40.

Эта теорема означает, что если чистая стратегия i является доминируемой, то можно, вычеркнув строку в исходной матрице, перейти к игре с матрицей меньшей размерности.

Теорема 4.7. Тройка (x ; y ; ) является решением игры = (X; Y; K), тогда и только тогда, когда (x ; y ; a + b) является решением игры = (X; Y; aK + b), где b – любое вещественное число, a > 0.

Доказательство теоремы приведено в [2], стр. 41.

14

4.2.Решение матричной игры на примере задачи о разорении двух фирм.

Постановка задачи. Предположим, что фирма A производит некоторый сезонный товар, который имеет спрос в течение n единиц времени. Этот товар поступает на рынок в момент i (i = 1; 2; :::; n). Для конкурентной борьбы с фирмой A дочерняя фирма B концерна D, не заботясь о собственных доходах, производит аналогичный товар, который поступает на рынок в момент j (j = 1; 2; :::; n). Ее цель – разорение первой фирмы, после чего ей будет легко, опираясь на капитал D, наверстать упущенное. Для этой цели проще всего продавать товар по сниженной цене. Однако иногда имеются законы или соглашения, запрещающие поступать подобным образом. В этом случае, единственным законным инструментом этой фирмы является выбор момента поступления товара на рынок, и она должна минимизировать доходы первой фирмы.

Пусть качество конкурирующих товаров зависит от времени их поступления на рынок относительно друг друга – чем позже товар выбрасывается на рынок, тем качество его выше, а реализуется только товар более высокого качества. Тогда если фирма A выбросит свой товар в момент i, а фирма B

– в момент j > i, то фирма A, не имея конкурента в течение j − i единиц времени, получит за это время доход c(j −i), где c – доход от продажи товара в единицу времени. В момент времени j на рынке появляется товар фирмы

B, который имеет более высокое качество. Поэтому с момента j, фирма A

теряет рынок и в дальнейшем дохода не получает. Если же i > j, то фирма A; выбросив на рынок более качественный товар, будет получать доход в течение всего отрезка i; n. Так как число оставшихся единиц времени равно n − i + 1, то доход фирмы A будет равен c(n − i + 1). В том случае, когда

15

i = j, т.е. на рынок одновременно поступают оба товара, естественно считать, что эти товары имеют одинаковый спрос, и поэтому фирма A получит доход, равный c(n − i + 1)=2.

Фирма A выбирает i-ю единицу времени поступления товара на рынок, стремясь максимизировать свой доход, а фирма В, выбирая j-ю единицу времени, преследует прямо противоположную цель – минимизировать доход фирмы A. Следовательно, рассмотренная ситуация конкуренции двух одинаковых фирм является антагонистическим конфликтом. Для построения математической модели этого конфликта – конечной антагонистической игры, примем за игроков 1 и 2 соответственно фирмы A и B.

Очевидно, что X = Y = {1; 2; :::; n} – множество чистых стратегий игроков 1 и 2, а функция выигрыша игрока 1 определяется равенством:

c(j − i);

H( i; j) = 1=2c(n − i + 1);

c(n − i + 1);

i< j;

i= j;

i> j:

Решение.

Решим построенную игру для X = Y = {1; 2; 3; 4}. Обозначим исходную игру за = (X; Y; H). В матричной форме игра определяется матрицей

выигрышей:

 

 

 

 

 

 

 

 

2c

c

2c

3c

 

H =

 

3c 3c=2

c 2c

 

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2c

2c

c

c

 

 

 

 

 

 

 

 

c

c

c

c=2

 

 

 

 

 

 

где c > 0. Для дальнейшего решения задачи воспользуемся теоремой (4.1).

16

Прежде всего заметим, что по теореме (4.7) достаточно решить игру 1, где

H1 = H=c. В матричной форме игра 1 определяется матрицей выигрышей:

 

 

 

2

1

2

3

 

 

 

 

 

2

2

1

1

 

 

H1

=

 

3

3=2 1

2

 

:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1

1

1=2

 

 

 

 

 

 

 

Воспользуемся определением (12). Элементы четвертой строки этой матрицы не больше соответствующих элементов третьей строки, и поэтому третья стратегия игрока 1 доминирует четвертую. Кроме того, элементы первого столбца матрицы H1 не меньше соответствующих элементов второго столбца. Следовательно, вторая стратегия игрока 2 доминирует его первую стратегию. Далее, из теоремы (4.6) следует, что всякое решение игры 2 =< X\{4}; Y \{1}; H1 > является решением игры 1. В матричной форме игру

2 можно представить матрицей:

2

 

 

1

2

3

 

 

H

=

 

 

 

 

 

;

 

3=2

1

2

 

 

 

 

 

 

 

 

 

 

 

21 1

вкоторой i-й строке матрицы соответствует i-я стратегия игрока 1, а j-му столбцу j + 1-я стратегия игрока 2.

Очевидно, что элементы второй строки этой матрицы не больше полусуммы соответствующих элементов первой и третьей строк. Следовательно, вторая стратегия игрока 1 доминируется смешанной стратегией, которая с равными вероятностями использует первую и третью стратегии этого игрока. Кроме того, элементы третьего столбца матрицы H2 не меньше соответствующих элементов второго столбца. Это значит, что стратегия под номером 3

игрока 2 доминирует его стратегию под номером 4. Применяя теорему (4.6),

17

получим, что всякое решение игры 3 =< X\{4; 2}; Y \{1; 4}; H2 > является решением игры 2, а значит, и игры 1. Игра 3 определяется матрицей:

H3 =

 

1

2

 

;

 

 

2

1

 

 

в которой первая строка соответствует стратегии под номером 1, вторая – стратегии под номером 3 первоначальной игры, а первый и второй столбцы соответствуют стратегиям 2 и 3 первоначальной игры.

Матрица H3 не имеет седловой точки, так как не выполнено равенство:

max min hij = min max hij;

i j

j i

а это значит, что игра 3 не имеет решения в чистых стратегиях, т.е. оптимальные стратегии игроков являются смешанными. Далее будем решать игру

графоаналитическим методом.

 

 

 

 

 

Дана матрица

 

 

 

 

 

H3 =

1

2

:

 

 

2

1

 

 

Пусть x1 и x2 – смешанные стратегии игрока 1 и x1 + x2 = 1; (x1; x2) =

=( ; 1 ); [0; 1], и пусть игрок 2 выбрал чистую стратегию j (1; 2). Найдем оптимальные стратегии и посчитаем значение игры.

Выигрыш игрока 1 в ситуации (x; j) по определению равен

K(x; j) = hij + (1 )hij;

или, в более подробной записи

K(( ; 1 ); 1) = ( ; 1 ) 1 = + 2; 2

K(( ; 1 ); 2) = ( ; 1 ) 2 = + 1: 1

18

Геометрически выигрыш 1 игрока представляет собой прямую в координатах ( ; K).

Таким образом, каждой чистой стратегии j соответствует своя прямая.

Графиком функции H( ) = min K(x; j) является нижняя огибающая семей-

j

ства прямых. Эта функция вогнута как нижняя огибающая семейства вогнутых (в данном случае линейных) функций. Точка , в которой достигается максимум функции H( ) по [0; 1], и дает требуемое оптимальное решение x = ( ; 1 ) и значение игры A = H( ).

Таким образом, – решение уравнения + 2 = + 1 = A. Отсюда получаем оптимальную стратегию x = (1=2; 1=2) игрока 1 в игре 3 и значение игры A = 3=2. Так как матрица H3 была получена из матрицы H1 вычеркиванием второй и четвертой строк, то оптимальной стратегией 1 игрока в игре 1 является расширение указанной стратегии на 2-м и 4-м местах, т. е.

x = (1=2; 0; 1=2; 0).

Для нахождения оптимальной стратегии y = (y2; y3) воспользуемся тео-

ремами (4.4) и (4.5).

 

 

 

 

 

 

Имеем:

 

 

 

y2

 

 

(1; 0)

1

2

= y2 + 2y3 = 3=2;

 

 

2

1

y3

 

 

(0; 1)

 

1

2

y2

 

= 2y2 + y3 = 3=2:

 

 

2

1

y3

 

 

Отсюда получаем оптимальную стратегию y = (1=2; 1=2) игрока 2 в игре

3, следовательно y = (0; 1=2; 1=2; 0) – оптимальная стратегия игрока 2 в игре 1, а значение игры 1 равно 3/2.

Соответственно решением игры будет тройка (x ; y ; 3c=2):

19

Следовательно, фирма A с равными вероятностями должна выбрасывать товар на рынок в 1-ю и 3-ю единицы времени, а фирма B с равными вероятностями – во 2-ю и 3-ю единицы времени. В этом случае математическое ожидание дохода фирмы A будет равно 3c=2.

20

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]