Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Матричные игры (110

..pdf
Скачиваний:
8
Добавлен:
15.11.2022
Размер:
260.14 Кб
Скачать

5.Бесконечные антагонистические игры.

5.1.Основные определения

Бесконечные антагонистические игры являются существенно более сложным объектом, чем матричные игры.

Определение 16. Тройка = (X; Y; H); где X; Y – произвольные бесконечные множества, элементы которых являются чистыми стратегиями игроков 1 и 2 соответственно, а функция H : X × Y → R1 – функция выигрыша игрока 1, называется бесконечной антагонистической игрой.

Определение 17. Множество вероятностных мер X; заданных на - алгебре борелевских множеств пространства X, называется множеством смешанных стратегий первого игрока. Аналогично множество вероятностных мер Y , заданных на -алгебре борелевских множеств пространства Y; называется множеством смешанных стратегий второго игрока.

Определение 18. Тройка =< X; Y ; H >; где H( ; ); X;

Y - математическое ожидание выигрыша игрока 1 по мерам и , равное: ∫ ∫

H( ; ) = H(x; y)d (x)d (y);

X Y

называется смешанным расширением бесконечной антагонистической игры.

Определение 19. Пара ( ; ) называется ситуацией в смешанных стратегиях.

Определение 20. Если

sup inf H( ; ) = inf sup H( ; );

 

 

Y

Y

 

X

X

то общее значение этих двух величин называется значением игры.

21

Определение 21. Стратегия X называется максиминной стратегией в игре ; если

inf H( ; ) = max inf H( ; ):

 

 

 

Стратегия Y называется минимаксной стратегией в игре ; если

sup H( ; ) = min sup H( ; ):

 

 

 

 

Теорема 5.1. Игра =< X; Y; H >; где X; Y - метрические сепарабельные компакты, а H-непрерывная функция на их произведении, имеет значение.

Доказательство теоремы приведено в [2], стр. 108.

Определение 22. Ситуация (x ; y ) называется ситуацией равновесия бесконечной антагонистической игры, если для любых x X; y Y выполняются неравенства

H(x; y ) 6 H(x ; y ) 6 H(x ; y):

Определение 23. Стратегия игрока в бесконечной антагонистической игре называется оптимальной, если существует стратегия другого игрока, в паре с которой они образуют ситуацию равновесия.

Теорема 5.2. Если игра имеет значение, игроки – оптимальные стратегии, то множество всех ситуаций равновесия является прямым произведением множества оптимальных стратегий первого игрока на множество оптимальных стратегий второго игрока; множество оптимальных стратегий первого игрока равно множеству его максиминных стратегий, а множество оптимальных стратегий второго игрока равно множеству его минимаксных стратегий в игре ; выигрыши во всех ситуациях равновесия одинаковы и равны значению игры.

22

Доказательство теоремы аналогично доказательству этой теоремы для дискретного случая, приведенному в [2], стр. 34.

Теорема 5.3. Если игра =< X; Y; H > имеет значение, а игроки - оптимальные стратегии, то

max inf H( ; y) = ;

y

min sup H(x; ) = ;

x

равенства

inf H( ; y) = ;

y

sup H(x; ) =

x

являются необходимыми и достаточными условиями оптимальности стратегий и :

Доказательство теоремы приведено в [2], стр. 109.

Определение 24. Спектром смешанной стратегии ( ) назовем наименьшее замкнутое множество, -мера ( -мера) которого равна единице.

Теорема 5.4. Если =< X; Y; H > – бесконечная антагонистическая игра, имеющая решение ( ; ; ), а функция H( ; y) непрерывна по y, то справедливо равенство H( ; y0) = для любой точки y0, содержащейся в спектре стратегии . Если функция H(x; ) непрерывна по x, то справедливо равенство H(x0; ) = для любой точки x0, содержащейся в спектре стратегии .

Доказательство теоремы приведено в [2], стр. 114.

23

5.2.Решение задачи о разорении фирмы для непрерывного случая

Представим себе, что в примере матричной игры время не дискретно, а непрерывно, причем каждая из фирм может начать поставлять товар на рынок в любой момент времени отрезка [0; 1]: Тогда, если первая фирма поставляет товар в момент x, а вторая - в момент y, то функция выигрыша первой фирмы запишется в виде

 

c(y − x);

x < y;

(1)

H(x; y) =

 

1=2c(1

x); x = y;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

c(1 − x);

x > y:

 

 

 

 

 

 

 

 

 

 

 

 

 

Разделив элементы матрицы выигрышей в примере матричной игры на c

и n, что не изменяет множества оптимальных стратегий игроков, получим матрицу

H(

i−1

;

j−1

) ; 1 6 i; j 6 n;

 

n

 

n

где функция H определена формулой (1).

Таким образом, матричная игра в некотором смысле аппроксимирует рассматриваемую здесь бесконечную игру, что вполне согласуется со

здравым смыслом - моделируемые конфликты отличны только в одном: в первом случае время дискретно, а в другом - непрерывно. Так как оптимальные стратегии игроков не зависят от c; в дальнейшем будем считать c = 1:

Решение этой игры для дискретного случая было получено в разделе 2. Можно легко убедиться, все вероятности, участвующие в образовании оптимальной стратегии игрока 2 ( АУС "синих") с ростом n стремятся к нулю. Последнее верно также и по отношению к вероятностям оптимальной стратегии игрока 1; за исключением 1: Кроме того, решение игры с дискретным време-

24

нем реализовалось на квадратной подматрице. Поэтому естественно предположить, что в описываемой здесь игре с непрерывным временем, во-первых, оптимальная стратегия игрока 2 задается плотностью ga; отличной от нуля лишь на отрезке [0; a]; a < 1: Во-вторых, оптимальная стратегия игрока

1 точку 0 использует с положительной вероятностью, а далее также определяется плотностью, которая равна нулю вне отрезка [0; 1]: Обозначим такую стратегию через = ( 0j; f ): Эта запись означает, что число нуль используется с вероятностью , а все числа из отрезка [0; a] - с общей вероятностью

1 , причем условная плотность распределения на [0; a] равна f =(1 ):

Вычислим

1 a

H(x; ) = H(x; y)d = H(x; y)g (y)dy =

0 0

x a

= (1 − x)g (y)dy + (y − x)g (y)dy

0 x

при 0 6 x 6 a:

Как легко видеть, из этой записи, функция H(x; ) непрерывна по x:

Поэтому, если предположить, что все числа отрезка [0; a] входят в спектр оптимальной стратегии игрока 1; то в силу теоремы (5.4) имеет место равенство

0x

(1 − x)g (y)dy + xa

(y − x)g (y)dy = :

(2)

Дифференцируя равенство (2) по y; получим

 

(1 − x)g (x) 0x g (y)dy − xa g (y)dy = 0:

(3)

25

Так как здесь

x a a

g (y)dy + g (y)dy = g (y)dy = 1;

0 x 0

то решая уравнение (3) относительно g (x), имеем

 

 

g (x) = 1=(1 − x):

(4)

Следовательно,

 

 

 

a

 

 

 

0

1

dy = ln(1 − a) = 1;

 

 

 

1 − y

 

т.е. a = 1 1=e: Подставив g (y) = 1=(1 − y) для 0 6 y 6 1 1=e в равенство (2), находим

 

x

 

 

11=e

 

 

 

 

 

=

1 − x

dy +

x

y − x

dy =

1

;

 

 

 

 

 

 

0

1 − y

1 − y

e

 

 

(что справедливо для любого 0 6 x 6 a ).

 

 

 

Далее,

 

 

 

 

 

 

 

 

 

y

 

 

 

a

 

 

 

 

 

H( ; y) = 0

(y − x)f (x)dx + y (1 − x)f (x)dx + (y);

(5)

 

 

0 < y 6 1 1=e:

 

 

 

Рассуждая аналогично, придем к равенству

 

 

 

0y (y − x)f (x)dx + y a (1 − x)f (x)dx + y = ;

0 < y 6 a:

(6)

Будем предполагать, что плотность f на полуинтервалу (0; a] дифференцируема. Продифференцировав равенство (6) два раза по y; получим дифференциальное уравнение

2f (y) = (1 − y)f′ (y):

Его можно записать в виде

f′ (y)

=

2

;

f (y)

1 − y

 

 

26

откуда ln f (y) = 2 ln(1 − y) + c; так что функция f (y) = c=(1 − y)2 (c –

произвольная константа) является решением этого уравнения. Мы предпола-

гаем

11=e

f (x)dx = 1 − ;

0

поэтому

f

(x) =

1

1

; 0 < x

6

1

 

1

:

(7)

e − 1 (1 − x)2

e

 

 

 

 

 

Подставив эту плотность в равенства (6). После интегрирования по x при-

дем к равенству

 

 

 

 

 

 

 

 

 

1 1 y + y = :

(8)

 

e

1

e

1

 

 

 

 

 

 

 

 

 

Для того чтобы последнее равенство было тождеством при всех

0 < y 6 1 1e , необходимо, чтобы = 1=e.

Таким образом, если f (x) задана формулой (7), а = 1=e, то

H( ; y) ≡ ;

0 < y 6 1 1=e:

(9)

Если же g (y) определена формулой (4) при = 1 1=e; то

 

 

1

 

H(x; ) ≡ ;

0 < x 6 1

 

:

(10)

e

Докажем, что найденные стратегии и оптимальны, а значение игры

равно 1=e. Для этого сначала вычислим

 

 

 

 

 

 

 

11=e

 

 

 

 

 

 

 

 

 

 

 

 

H( ; 0) =

1

 

1

+

1

0

1 − x

dx =

1

1

+

1

 

>

1

= :

 

 

 

 

 

 

 

 

 

 

 

2

· e

e

(1 − x)2

2

· e

e

e

 

 

 

 

 

 

Теперь в силу тождеств (9) и (10) достаточно доказать неравенства

H( ; y) > = H( ; ); 1 1=e < x 6 1;

(11)

27

H(x; ) > = H( ; );

1 1=e < y 6 1:

(12)

Функция

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

11=e

 

 

 

 

 

 

 

 

 

H( ; y) =

1

y +

1

0

y − x

 

dx;

y

>

1

1

;

 

 

 

 

 

 

 

 

 

(1 − x)2

e

 

e

e

 

 

 

 

линейно возрастает по y.

Так как H( ; 1 1=e) = 1=e = ; то из возрастании этой функции следует

неравенство (11). При 1 1=e < x выполняется неравенство

11=e

1 − x

 

 

 

1

 

H(x; ) =

dy = 1

 

x <

= :

 

 

 

 

0

1 − y

 

e

 

Таким образом, значение игры равно = 1=e; оптимальная стратегия игрока 2 на сегменте [0; 1 1=e] задается плотностью 1=(1 − y); соответствующая оптимальной стратегии игрока 1 функция распределения имеет в точке

0 "скачок равный 1=e, а на интервале (0; 1 1=e) определяется плотностью

1=(e(1 − x))2:

28

Список литературы

[1]Теория игр : Учебное пособие для студ. ун-тов, обуч. по спец. "Математика"/ Л. А. Петросян, Н. А. Зенкевич, Е. А. Семина.— М. : Университет : Высш. шк., 1998.— 299 с.

[2]Введение в прикладную теорию игр / Г.Н. Дюбин, В.Г. Суздаль; под ред. Н.Н. Воробьева .— М. : Наука, 1981.— 336 с.

[3]Теория игр с примерами из математической экономики / Мулен Э.; пер. с франц.— М. : Мир, 1985.— 200 с.

[4]Теория игр / Оуэн Г.; пер. с англ.— М. : Мир, 1971.— 232 с.

[5]Математическая теория игр и приложения / Мазалов В. В. — СПб. : Лань, 2010.— 446 с.

[6]Теория игр / Петросян Л., Зенкевич Н., Шевкопляс Е.— СПб.: БХВПетербург, 2011.— 432 с.

29

Учебное издание

Орлов Владимир Петрович

МАТРИЧНЫЕ ИГРЫ

Учебно-методическое пособие для вузов

Подп. в печ. 09.11.2012. Усл. печ. л. 2,3. Заказ 1029.

Отпечатано с готового оригинал-макета в типографии Издательско-полиграфического центра

Воронежского государственного университета. 394000, г. Воронеж, ул. Пушкинская, 3. Тел. +7 (473) 220-41-33

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]