
Матричные игры (110
..pdf
5.Бесконечные антагонистические игры.
5.1.Основные определения
Бесконечные антагонистические игры являются существенно более сложным объектом, чем матричные игры.
Определение 16. Тройка = (X; Y; H); где X; Y – произвольные бесконечные множества, элементы которых являются чистыми стратегиями игроков 1 и 2 соответственно, а функция H : X × Y → R1 – функция выигрыша игрока 1, называется бесконечной антагонистической игрой.
Определение 17. Множество вероятностных мер X; заданных на - алгебре борелевских множеств пространства X, называется множеством смешанных стратегий первого игрока. Аналогично множество вероятностных мер Y , заданных на -алгебре борелевских множеств пространства Y; называется множеством смешанных стратегий второго игрока.
Определение 18. Тройка =< X; Y ; H >; где H( ; ); X;
Y - математическое ожидание выигрыша игрока 1 по мерам и , равное: ∫ ∫
H( ; ) = H(x; y)d (x)d (y);
X Y
называется смешанным расширением бесконечной антагонистической игры.
Определение 19. Пара ( ; ) называется ситуацией в смешанных стратегиях.
Определение 20. Если
sup inf H( ; ) = inf sup H( ; );
|
|
Y |
Y |
|
X |
X |
то общее значение этих двух величин называется значением игры.
21

Определение 21. Стратегия X называется максиминной стратегией в игре ; если
inf H( ; ) = max inf H( ; ):
|
|
|
Стратегия Y называется минимаксной стратегией в игре ; если
sup H( ; ) = min sup H( ; ):
|
|
|
|
Теорема 5.1. Игра =< X; Y; H >; где X; Y - метрические сепарабельные компакты, а H-непрерывная функция на их произведении, имеет значение.
Доказательство теоремы приведено в [2], стр. 108.
Определение 22. Ситуация (x ; y ) называется ситуацией равновесия бесконечной антагонистической игры, если для любых x X; y Y выполняются неравенства
H(x; y ) 6 H(x ; y ) 6 H(x ; y):
Определение 23. Стратегия игрока в бесконечной антагонистической игре называется оптимальной, если существует стратегия другого игрока, в паре с которой они образуют ситуацию равновесия.
Теорема 5.2. Если игра имеет значение, игроки – оптимальные стратегии, то множество всех ситуаций равновесия является прямым произведением множества оптимальных стратегий первого игрока на множество оптимальных стратегий второго игрока; множество оптимальных стратегий первого игрока равно множеству его максиминных стратегий, а множество оптимальных стратегий второго игрока равно множеству его минимаксных стратегий в игре ; выигрыши во всех ситуациях равновесия одинаковы и равны значению игры.
22
Доказательство теоремы аналогично доказательству этой теоремы для дискретного случая, приведенному в [2], стр. 34.
Теорема 5.3. Если игра =< X; Y; H > имеет значение, а игроки - оптимальные стратегии, то
max inf H( ; y) = ;
y
min sup H(x; ) = ;
x
равенства
inf H( ; y) = ;
y
sup H(x; ) =
x
являются необходимыми и достаточными условиями оптимальности стратегий и :
Доказательство теоремы приведено в [2], стр. 109.
Определение 24. Спектром смешанной стратегии ( ) назовем наименьшее замкнутое множество, -мера ( -мера) которого равна единице.
Теорема 5.4. Если =< X; Y; H > – бесконечная антагонистическая игра, имеющая решение ( ; ; ), а функция H( ; y) непрерывна по y, то справедливо равенство H( ; y0) = для любой точки y0, содержащейся в спектре стратегии . Если функция H(x; ) непрерывна по x, то справедливо равенство H(x0; ) = для любой точки x0, содержащейся в спектре стратегии .
Доказательство теоремы приведено в [2], стр. 114.
23

5.2.Решение задачи о разорении фирмы для непрерывного случая
Представим себе, что в примере матричной игры время не дискретно, а непрерывно, причем каждая из фирм может начать поставлять товар на рынок в любой момент времени отрезка [0; 1]: Тогда, если первая фирма поставляет товар в момент x, а вторая - в момент y, то функция выигрыша первой фирмы запишется в виде
|
c(y − x); |
x < y; |
(1) |
||
H(x; y) = |
|
1=2c(1 |
− |
x); x = y; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
c(1 − x); |
x > y: |
|
||
|
|
|
|
|
|
|
|
|
|
|
|
Разделив элементы матрицы выигрышей в примере матричной игры на c
и n, что не изменяет множества оптимальных стратегий игроков, получим матрицу
H( |
i−1 |
; |
j−1 |
) ; 1 6 i; j 6 n; |
|
n |
|
n |
где функция H определена формулой (1).
Таким образом, матричная игра в некотором смысле аппроксимирует рассматриваемую здесь бесконечную игру, что вполне согласуется со
здравым смыслом - моделируемые конфликты отличны только в одном: в первом случае время дискретно, а в другом - непрерывно. Так как оптимальные стратегии игроков не зависят от c; в дальнейшем будем считать c = 1:
Решение этой игры для дискретного случая было получено в разделе 2. Можно легко убедиться, все вероятности, участвующие в образовании оптимальной стратегии игрока 2 ( АУС "синих") с ростом n стремятся к нулю. Последнее верно также и по отношению к вероятностям оптимальной стратегии игрока 1; за исключением 1: Кроме того, решение игры с дискретным време-
24
нем реализовалось на квадратной подматрице. Поэтому естественно предположить, что в описываемой здесь игре с непрерывным временем, во-первых, оптимальная стратегия игрока 2 задается плотностью ga; отличной от нуля лишь на отрезке [0; a]; a < 1: Во-вторых, оптимальная стратегия игрока
1 точку 0 использует с положительной вероятностью, а далее также определяется плотностью, которая равна нулю вне отрезка [0; 1]: Обозначим такую стратегию через = ( 0j; f ): Эта запись означает, что число нуль используется с вероятностью , а все числа из отрезка [0; a] - с общей вероятностью
1 − , причем условная плотность распределения на [0; a] равна f =(1 − ):
Вычислим
∫1 ∫a
H(x; ) = H(x; y)d = H(x; y)g (y)dy =
0 0
∫x ∫a
= (1 − x)g (y)dy + (y − x)g (y)dy
0 x
при 0 6 x 6 a:
Как легко видеть, из этой записи, функция H(x; ) непрерывна по x:
Поэтому, если предположить, что все числа отрезка [0; a] входят в спектр оптимальной стратегии игрока 1; то в силу теоремы (5.4) имеет место равенство
∫0x |
(1 − x)g (y)dy + ∫xa |
(y − x)g (y)dy = : |
(2) |
Дифференцируя равенство (2) по y; получим |
|
||
(1 − x)g (x) − ∫0x g (y)dy − ∫xa g (y)dy = 0: |
(3) |
25

Так как здесь
∫x ∫a ∫a
g (y)dy + g (y)dy = g (y)dy = 1;
0 x 0
то решая уравнение (3) относительно g (x), имеем |
|
||
|
g (x) = 1=(1 − x): |
(4) |
|
Следовательно, |
|
|
|
a |
|
|
|
∫0 |
1 |
dy = − ln(1 − a) = 1; |
|
|
|
||
1 − y |
|
т.е. a = 1 − 1=e: Подставив g (y) = 1=(1 − y) для 0 6 y 6 1 − 1=e в равенство (2), находим
|
x |
|
|
1−1=e |
|
|
|
|
|
= |
1 − x |
dy + |
∫x |
y − x |
dy = |
1 |
; |
|
|
|
|
|
|
||||||
|
∫0 |
1 − y |
1 − y |
e |
|
|
|||
(что справедливо для любого 0 6 x 6 a ). |
|
|
|
||||||
Далее, |
|
|
|
|
|
|
|
|
|
y |
|
|
|
a |
|
|
|
|
|
H( ; y) = ∫0 |
(y − x)f (x)dx + ∫y (1 − x)f (x)dx + (y); |
(5) |
|||||||
|
|
0 < y 6 1 − 1=e: |
|
|
|
||||
Рассуждая аналогично, придем к равенству |
|
|
|
||||||
∫0y (y − x)f (x)dx + ∫y a (1 − x)f (x)dx + y = ; |
0 < y 6 a: |
(6) |
Будем предполагать, что плотность f на полуинтервалу (0; a] дифференцируема. Продифференцировав равенство (6) два раза по y; получим дифференциальное уравнение
2f (y) = (1 − y)f′ (y):
Его можно записать в виде
f′ (y) |
= |
2 |
; |
|
f (y) |
1 − y |
|||
|
|
26

откуда ln f (y) = −2 ln(1 − y) + c; так что функция f (y) = c=(1 − y)2 (c –
произвольная константа) является решением этого уравнения. Мы предпола-
гаем
1∫−1=e
f (x)dx = 1 − ;
0
поэтому
f |
(x) = |
1 − |
1 |
; 0 < x |
6 |
1 |
|
1 |
: |
(7) |
|
e − 1 (1 − x)2 |
− e |
||||||||||
|
|
|
|
|
Подставив эту плотность в равенства (6). После интегрирования по x при-
дем к равенству |
|
|
|
|
|
|
|
|
|
|
1 − 1 − y + y = : |
(8) |
|||||||
|
e |
− |
1 |
− |
e |
− |
1 |
|
|
|
|
|
|
|
|
|
|
Для того чтобы последнее равенство было тождеством при всех
0 < y 6 1 − 1e , необходимо, чтобы = 1=e.
Таким образом, если f (x) задана формулой (7), а = 1=e, то
H( ; y) ≡ ; |
0 < y 6 1 − 1=e: |
(9) |
||
Если же g (y) определена формулой (4) при = 1 − 1=e; то |
|
|||
|
1 |
|
||
H(x; ) ≡ ; |
0 < x 6 1 − |
|
: |
(10) |
e |
Докажем, что найденные стратегии и оптимальны, а значение игры
равно 1=e. Для этого сначала вычислим
|
|
|
|
|
|
|
1−1=e |
|
|
|
|
|
|
|
|
|
|
|
|
|
H( ; 0) = |
1 |
|
1 |
+ |
1 |
∫0 |
1 − x |
dx = |
1 |
1 |
+ |
1 |
|
> |
1 |
= : |
||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||
2 |
· e |
e |
(1 − x)2 |
2 |
· e |
e |
e |
|||||||||||||
|
|
|
|
|
|
Теперь в силу тождеств (9) и (10) достаточно доказать неравенства
H( ; y) > = H( ; ); 1 − 1=e < x 6 1; |
(11) |
27

H(x; ) > = H( ; ); |
1 − 1=e < y 6 1: |
(12) |
||||||||||||
Функция |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1−1=e |
|
|
|
|
|
|
|
|
|
H( ; y) = |
1 |
y + |
1 |
∫0 |
y − x |
|
dx; |
y |
> |
1 |
1 |
; |
||
|
|
|
|
|
|
|||||||||
|
|
|
(1 − x)2 |
− e |
||||||||||
|
e |
e |
|
|
|
|
линейно возрастает по y.
Так как H( ; 1 −1=e) = 1=e = ; то из возрастании этой функции следует
неравенство (11). При 1 − 1=e < x выполняется неравенство
1−1=e |
1 − x |
|
|
|
1 |
|
|
H(x; ) = |
dy = 1 |
|
x < |
= : |
|||
|
|
|
|
||||
∫0 |
1 − y |
− |
|
e |
|
Таким образом, значение игры равно = 1=e; оптимальная стратегия игрока 2 на сегменте [0; 1 − 1=e] задается плотностью 1=(1 − y); соответствующая оптимальной стратегии игрока 1 функция распределения имеет в точке
0 "скачок равный 1=e, а на интервале (0; 1 − 1=e) определяется плотностью
1=(e(1 − x))2:
28
Список литературы
[1]Теория игр : Учебное пособие для студ. ун-тов, обуч. по спец. "Математика"/ Л. А. Петросян, Н. А. Зенкевич, Е. А. Семина.— М. : Университет : Высш. шк., 1998.— 299 с.
[2]Введение в прикладную теорию игр / Г.Н. Дюбин, В.Г. Суздаль; под ред. Н.Н. Воробьева .— М. : Наука, 1981.— 336 с.
[3]Теория игр с примерами из математической экономики / Мулен Э.; пер. с франц.— М. : Мир, 1985.— 200 с.
[4]Теория игр / Оуэн Г.; пер. с англ.— М. : Мир, 1971.— 232 с.
[5]Математическая теория игр и приложения / Мазалов В. В. — СПб. : Лань, 2010.— 446 с.
[6]Теория игр / Петросян Л., Зенкевич Н., Шевкопляс Е.— СПб.: БХВПетербург, 2011.— 432 с.
29
Учебное издание
Орлов Владимир Петрович
МАТРИЧНЫЕ ИГРЫ
Учебно-методическое пособие для вузов
Подп. в печ. 09.11.2012. Усл. печ. л. 2,3. Заказ 1029.
Отпечатано с готового оригинал-макета в типографии Издательско-полиграфического центра
Воронежского государственного университета. 394000, г. Воронеж, ул. Пушкинская, 3. Тел. +7 (473) 220-41-33