Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1smol_yakov_e_r_metody_resheniya_konfliktnykh_zadach-1

.pdf
Скачиваний:
4
Добавлен:
19.11.2019
Размер:
1.15 Mб
Скачать

q3

6

J(4,3,4) J(6,2,6)

N P

L J(7,1,6)

M J(8,4,5)

 

H

 

K -

q2

J(2,8,3) J(4,7,5)

E

 

F

 

J(5,6,5)

 

J(3,5,6)

q1

 

 

Ðèñ. 3.6.

стратегия i-го игрока, принимающая всего два значения. Найдем наисиль-

нейшие равновесия и решение кооперативной игры.

Базовая система равновесий приводит к следующим результатам:

A1

= (E, F, K, L, M, N, P ),

A2 = (E, F, H, K, M, N, P ),

A3

= (E, F, K, L, M, N, P ),

A = (E, F, K, M, N, P ),

AP12

= (E, F, H, K, L, M, P ), AP13 = (L, M),

AP23

= (E, F, H, K), AP2 = , A0 = ,

B1 = (E, F, K), B2 = (E, M), B3 = (E, K, M), B = (E),

D10

= D¯1 = D20 = D¯1 = (E), D30 = D¯3 = (E, K, M),

D0

= D¯ = (E), D0n = D¯ n = (E),

Ситуация (E) претендует на роль единственного наисильнейшего равновесия в этой игре. Все остальные ситуации существенно более слабые равновесия. Первая итерация (т.е. игра на множестве A) предоставляет дополнительную информацию относительно равновесий:

A11

= (E, M, K, N, P ), A21 = (F, F, K, M, N),

 

A31

= (E, F, K, M, N, P ), A1 = (E, K, M, N),

 

A121 = (E, K, M, P ), A131 = (E, M), A231 = (E, F, K), AP1 2 = (E), A01 = (E),

B1

= (E, K), B1

= (E, M), B1 = (E, K, M), B1

= (E),

1

 

 

 

2

3

 

(D10 )1 = D¯11 = (E), (D20 )1 = D¯11 = E,

 

(D30 )1 = D¯31 = (E, K, M) (D0)1 = D¯ 1 = (E),

 

C1

= (E, K), C1

= (E, M), C1 = (E, K, M), C1

= (E),

1

 

 

 

2

3

 

D1

 

= (E), D1 = (E), D1 = (E, K, M), D1 = (E),

1

 

 

 

2

3

 

¯0

)

1

= (E, K, M, N),

 

(C

 

 

а вторая итерация (т.е. игра на множестве A1) завершает исследование рав-

181

новесий:

A21 = A22 = A23 = A2 = A1 = (E, K, M, N),

B12 = (E, K), B22 = (E, M), B32 = (E, K, M), B2 = (E),

A212 = (E, K, M), A213 = (EM), A223 = (E, K), A2P2 = A02 = (E).

Èòàê, E действительно наисильнейшее равновесие, а M, K è N очень слабые равновесия. Поскольку равновесие E по существу единственно, то

дележ кооперативного дохода JP3 (M) = v(P3) = 17 производится по формуле (4.2) с учетом ограничений (4.1).

Найдем последовательность оптимальных коалиций, рассчитав сначала функции v(Pi) è π:

v(1) = 3, v(2) = 3, v(3) = 4, v(1, 2) = 8, v(1, 3) = 13, v(2, 3) = 11,

v(1, 2, 3) = 8/3, π(1, 2) = 3/2, π(1, 3) = 3, π(2, 3) = 5/2, π(1, 2, 3) = 8/3.

Поскольку функция π достигает максимума (равного 3) на коалиции (1,3),

то отсюда следует, что в данной задаче реализуется последовательность оптимальных коалиций {(1,3), (2)}.

По формуле (4.2) дел¼ж в игре зада¼тся формулами: x1 = 17 · 165 = 5, 3, x2 = 17 · 166 = 5, 4, x3 = 17 · 165 = 5, 3.

Однако в данном случае ограничения (4.1) нарушаются, так как x1 + x3 = 5,3 + 5,3 = 10, 6 < 13. А следовательно, 1-й и 3-й игроки могут отказаться от кооперации, гарантируя себе при этом совместный выигрыш не меньше 13. Если же учесть, что в равновесной ситуации E они получают одинаковый

доход, то это да¼т им основания надеяться получить поровну и в кооперации, прич¼м не менее, чем по 6,5. При этом 2-й игрок не может надеяться получить выигрыш больше 4 несмотря на то, что в равновесной ситуации он мог бы

получить больше своих соперников. Так что только один дел¼ж x1 = 6,5, x2 = 4, x3 =6,5 удовлетворяет формулам (4.1) при выполнении обязательного условия, что 1-й и 3-й игроки, согласно формуле (4.2), должны получить поровну.

182

ГЛАВА 4. АНТАГОНИСТИЧЕСКИЕ ИГРОВЫЕ И КОНФЛИКТНЫЕ ЗАДАЧИ

Под антагонистическими понимаются задачи с двумя участниками, в которых если один из них что-то получает, то именно это теряет другой. Поэтому подобные задачи называют играми с нулевой суммой. По существу эти игры являются частным случаем рассмотренных в первой главе игр с двумя участниками, в которых сумма выигрышей обоих игроков равна нулю, т.е.

J1 + J2 = 0. Это равенство позволяет трактовать такие игры как игры, в которых у игроков имеется всего одна платежная функция J, которую, на-

пример, 1-й игрок минимизирует, а 2-й максимизирует. В самом деле, (из этого равенства следует, что) если в некоторой задаче 2-й игрок максимизирует функцию J2, а 1-й игрок максимизирует свою функцию J1 = −J2, òî,

4

вводя обозначение J2 = J, получаем антагонистическую игру с платежной функцией J, которую 1-й игрок минимизирует, а 2-й максимизирует.

В основе классической теории антагонистических игр лежит геометриче- ское понятие седловой точки, определяющей в интуитивном представлении весьма удовлетворительное состояние равновесия, поскольку эта точка, являясь минимумом целевой функции участников по одной переменной и максимумом по другой, позволяет каждому гарантировать себе значение целевой функции не хуже получаемого в этой точке при любом поведении противника. Отклонение любого из участников от седловой точки может лишь ухудшить его выигрыш, если другой сохраняет верность ей. К сожалению, целевые (платежные) функции в реальных игровых задачах редко имеют форму "седла". И тогда возникает проблема: как же определить решение в подобной игре? Для случая, когда участники имеют возможность играть в антагонистическую игру многократно, Дж.Нейман в 1928 г. вв¼л понятие смешанных стратегий, согласно которым участники в каждой партии игры делают свой выбор случайным образом в соответствии с предварительно найденными функциями распределения вероятности (смешанными стратегиями), в классе которых, как доказал Дж.Нейман, седловая точка игры всегда существует. Однако в реальной жизни вс¼ реализуется однократно и использование смешанных стратегий (позволяющих реализовать решение седловую точку лишь в случае бесконечного числа партий) теряет смысл.

Правда, в дифференциальных играх понятие смешанных стратегий (по крайней мере таких, какие были впервые введены в дифференциальные игры в работе [40]), оказывается весьма плодотворным, так как даже с их участни-

183

ем игра оста¼тся по существу детерминированной и не требует своего многократного "проигрывания . Однако, к сожалению, в дифференциальных играх смешанные стратегии не позволили существенно расширить класс игр, имеющих решение в смысле седловой точки.

Отсутствие "седла"в естественном по своей постановке классе переменных (называемых чистыми стратегиями) вынуждает искать иные понятия решения антогонистической игры. Поскольку любая антагонистическая игра, как показано выше, сводится к играм, рассмотренным в первой главе, то естественно ожидать, что полученные выше понятия конфликтного равновесия применимы и для антагонистических задач. Прич¼м вследствие того, что они являются частным случаем рассмотренных в первой главе игр с двумя участниками, в отношении них можно ожидать получения даже более "глубоких" результатов, чем полученные в первой главе.

Полученные в этой главе понятия антагонистических равновесий, дополняют результаты монографии [57] и позволяют по-новому взглянуть на седловые точки, максимины и минимаксы.

1. Понятия антагонистических равновесий

Антагонистические модели будем рассматривать в трактовке задач принятия или отказа от предложения [46], то есть в следующем смысле. Если (q , r ) некоторая ситуация (образованная из пары стратегий игроков q

è r , независимо от того, чистые эти стратегии или смешанные) на доступном игрокам множестве выбора G, например (q , r ) ситуация равновесия

в каком-либо смысле, и один из участников, например 1-й, с нею не согласен, то делать свой выбор он может лишь на доступном ему множестве G(r ),

представляющем собой сечение множества G.

В основу семейства предлагаемых антагонистических равновесий положим понятие слабо экстремальной ситуации [43, 44, 46] (т.е. определение 1.1.1), ко-

торое может быть определено на произвольном множестве G в произведении топологических пространств Q è R. Учитывая, однако, что подобная общ-

ность пространств с точки зрения возможных приложений представляется излишней, определения равновесий дадим для более частных пространств, определенных в следующих допущениях, сформулированных с учетом того, что почти все полученные в этой главе результаты оказывается возможным перенести на антагонистические дифференциальные игры.

184

Допущения 1.2
Допущения 1.1.

Пусть Q и R метрические компакты, а G произвольное множество в их произведении Q Ч R, причем такое, что любые непустые его сечения G(q) и G(r), где q Q, r R, являются компактами; и пусть на множестве Q Ч R определена ограниченная функция (или функционал) J(q, r), непрерывная по каждой переменной в отдельности при

всех допустимых фиксированных значениях другой.

Пусть Q, R и G метрические компакты, причем G Q Ч R, а J(q, r) непрерывная функция (функционал) на Q Ч R.

Предполагается, что 1-й игрок, выбирая стратегию (состояние) q из доступного ему множества P rQG(r) èëè P rQG, стремится минимизировать J, а 2-й игрок, выбирая r P rRG(q) èëè r P rRG, стремится максимизировать J. Чтобы упростить обозначения, сечение G(q) множества G рассматривается, в зависимости от подтекста, в качестве или подмножества в G, или подмножества в R. (Нередко через G(q) обозначают подмножество множества R, а через q × G(q) сечение множества G как подмножество G, ÷òî,

однако, менее удобно).

Определение 1.1. Точку (ситуацию) (q , r ) G назовем A1- экстремальной, если множество G(r ) одноточечное или (когда оно содержит более одной точки) если любой стратегии q G(r ) 1-го игрока мож-

но поставить в соответствие по крайней мере одну допустимую стратегию rˆ = rˆ < q > G(q) 2-го игрока, так, чтобы имело место отношение

J

(

q, r

 

J

(

q , r

)

.

 

.

 

 

 

ˆ) ≥

 

 

 

 

(1 1)

Подобным же образом, с заменой неравенства (1.1) на неравенство

 

 

J q, r

) ≤

J

(

q , r

)

(1

. a

)

 

 

 

 

 

 

1

определяется A2-экстремальная ситуация. Ситуацию (q , r ) G назовем (симметричным) A-равновесием, если (q , r ) A1 ∩ A2.

Согласно определению 1.1 ситуация (q , r ) G A2 -экстремальна, если какую бы точку r 6= r из доступного ему множества точек G(q ) 2-é èã-

рок ни выбрал, у 1-го игрока найдется ответный выбор хотя бы одной точки

4

(стратегии) qˆ = qˆ < r > G(r), приводящей к ситуации (ˆq, r), в которой 2-й игрок получает не больше, чем в ситуации (q , r ).

Теорема 1.1. Множества A1 è A2 не пусты, если удовлетворяются допущения 1.1.

Доказательство. Рассмотрим сечение G(q) множества G, проходящее через произвольно заданную точку (q, r) G. Поскольку G(q) компакт, а

185

(q , r )
(q , r ).

J(q, ·) непрерывная функция, то в сечении G(q) достигается максимум

J(q, r ) = max J(q, r).

r G(q)

Ситуация (q, r ) A2 -экстремальна, так как любому возможному выбору 2- го игрока r G(q), r 6= r , можно поставить в соответствие выбор qˆ < r >= q

1-го игрока так, чтобы удовлетворялось неравенство (1.1a). Следовательно, в каждом сечении G(q) множества G всегда существует A2 -экстремальная ñè- туация, причем множество A2 не исчерпывается ситуациями подобного рода.

Аналогично устанавливается непустота множества A1.

Теорема 1.2. При удовлетворении допущений 1.1 чтобы ситуация (q , r ) G áûëà A1-экстремальной, необходимо и достаточно, чтобы

inf max J

(

q, r

) ≥

J

(

q , r

.

(1.2)

q G(r ) r G(q)

 

 

)

 

 

Доказательство.Достаточность. Если нижняя грань J(¯q, r¯ < q¯ >) в (1.2) достигается в точке (¯q, r¯ < q¯ >) , то из (1.3) следует, что для любой

стратегии

 

G(r )

найдется зависящая от

 

стратегия

4

 

q

 

q

 

rˆ < q >= rˆ

 

частности, стратегия rˆ = r¯ < q >, доставляющая максимум функции J в сечении G(q)), такая, что J(q, rˆ < q >) ≥ J(¯q, r¯ < q¯ >) ≥ J(q , r ), à

это и означает в силу определения 1.1 A1-экстремальность ситуации

Если же допустить, что нижняя грань в (1.2) не достигается и что ситуация в (1.2) не принадлежит множеству A1, то это означает, что найдется стратегия q G(r ), такая, что для любой стратегии r G(q) окажется

J(q, r) < J(q , r ), что противоречит (1.2).

Необходимость. Пусть ситуация (q , r ) удовлетворяет неравенству (1.1). Это неравенство лишь еще более усилится, если в качестве rˆ < q > выбрать стратегию r¯ < q >, доставляющую функции (функционалу) J ìàê-

симум в сечении G(q). Если принять во внимание, что в определении A1-

экстремальности утверждается, что неравенство (1.1) выполняется для любой стратегии q G(r ), то, следовательно, оно сохранится и в случае, если

берется то (предельное) значение переменной q на множестве G(r ), äëÿ êî-

торого определяется величина inf J(q, r¯ < q >), равная левой части (1.2).

q G(r )

Отсюда следует, что A1-экстремальная ситуация (q , r ) удовлетворяет нера-

венству (1.3).

Следствие 1.1. Аналогично доказывается, что для того, чтобы ситуация (q , r ) G áûëà A2-экстремальной, необходимо и достаточно, чтобы

sup min J(q, r) ≤ J(q , r ).

(1.2a)

r G(q ) q G(r)

186

Следствие 1.2. Чтобы ситуация (q , r ) G являлась симметричным A-равновесием, необходимо и достаточно, чтобы

sup min J

(

q, r

) ≤

J

(

q , r

inf max J(q, r).

(1.3)

r G(q ) q G(r)

 

 

 

) ≤ q G(r ) r G(q)

 

 

 

 

 

 

 

 

 

 

Следствие 1.3. На множестве G при допущениях 1.1 имеет место неравенство

sup min J

(

q, r

inf max J(q, r).

(1.4)

r G(q ) q G(r)

 

) ≤ q G(r ) r G(q)

 

 

 

 

 

 

Действительно, из определений минимума и максимума следует, что для всех (q, r) G справедливы неравенства

min J

(

q, r

) ≤

J(q, r), max J

(

q, r

) ≥

J(q, r),

q

 

G(r)

 

r G(q)

 

 

 

 

 

 

 

 

 

 

 

 

откуда следует

min J(q, r) ≤ max J(q, r).

q G(r) r G(q)

Поскольку левая часть этого неравенства представляет собой независящую от переменной q функцию, то, применяя к обеим его частям операцию определения нижней грани по q в произвольно заданном сечении G(r ), получаем

min J(q, r) ≤ inf max J(q, r).

q G(r) q G(r ) r G(q)

Аналогичным образом, применяя к обеим частям последнего неравенства операцию определения верхней грани по r в произвольном сечении G(q ),

получаем неравенство (1.4).

Теорема 1.3. В игре, удовлетворяющей допущениям 1.1, существует симметричное A-равновесие с любой заданной точностью ε.

Доказательство. Пусть сначала в некоторой точке (q1, r1 < q1 >) достигается минимакс

ˆ1

1

1

4 ˆ1

1

, r < q

1

>),

(1.5a)

min max J(q, r) = J

(q

, r

) = J

= max J(q

 

q P rQG r G(q)

 

 

 

r G(q1)

 

 

 

 

Из последнего равенства в (1.5a) следует, согласно теореме 1.1, что ситуа- öèÿ (q1, r1) A2-экстремальна и удовлетворяет неравенству

J(q1, r1) ≥ J(q1, r), r G(q1),

(1.4b)

а из первого равенства в (1.5a) следует, что для любой стратегии

q P rQG

найдется зависящая от q стратегия rˆ < q >, такая, что

 

J(q, rˆ < q >) ≥ J(q1, r1).

(1.4c)

187

Последнее неравенство, с учетом определения 1.1, показывает, что A2- экстремальная на основе доказанного выше ситуация (q1, r1) является также и A1-экстремальной, а следовательно, (q1, r1) A1 ∩ A2.

Интересно отметить, что из неравенств (1.4b) и (1.4c) следует, что A1- экстремальна не только ситуация (q1, r1) из сечения G(q1), íî è âñå ýòî ñå÷å-

ние. Более того, именно вследствие этого замечательного свойства и оказывается возможным вышеприведенное доказательство.

Минимакс (1.5a) в игре, удовлетворяющей допущениям 1.1, может не достигаться. Однако в подобной игре всегда существует конечное значение

¯1

4 ¯1

4

inf J(q, r¯ < q >), (1.4d)

J

= J

(¯q, r¯ < q¯ >) = inf max J(q, r) =

 

 

q P rQG r G(q)

q P rQG

где через (¯q, r¯ < q¯ >) обозначена предельная точка на множестве G, â êîòî-

рой определяется нижняя грань ¯1 в (1.4d). Заметим, что если нижняя грань

J

в (1.4d) не достигается, то в общем случае уже не любая ситуация из сечения G(¯q) A1-экстремальна (A1-экстремальным оказывается всего лишь предель-

ное сечение ¯ (

G(¯q) G(¯q)), представляющее собой предел сечений G(q) ïðè

¯

q q¯). Но предельное сечение G(¯q), во-первых, не обязано быть компактным, а во-вторых, оно не обязательно совпадает со всем сечением G(¯q), в связи с

¯

чем максимум функции J(¯q, r) ïî r в предельном сечении G(¯q) может или не достигаться, или не совпадать с ее максимумом в сечении G(¯q), что и приводит к A-равновесию всего лишь с точностью ε. Формально, доказательство

этого факта почти повторяет вышеприведенное доказательство для случая (1.5a). Действительно, из (1.4d), с одной стороны, следует, что при любом ε > 0 найдется qε Q, такое, что

 

¯1

+ ε.

(1.4e)

max J(qε, r < qε >) ≤ J

r<qε> G(qε)

 

 

 

откуда, в свою очередь, следует

 

 

 

¯1

+ ε при любом r G(qε).

(1.4f)

J(qε, r < qε >) ≤ J

С другой стороны, из (1.4d) следует, что при любой допустимой стратегии q P rQG − Qε, ãäå Qε обозначает множество всех тех qε, с которыми удовлетворяется неравенство (1.4e), найдется стратегия rˆ G(q), такая, что

¯1

+ ε.

(1.4g)

J(q, rˆ) ≥ J

Из (1.4f) и (1.4g) получаем неравенство J(q, rˆ) ≥ J(qε, r < qε

>), îçíà-

чающее в силу определения 1.1, что любая ситуация (qε, r < qε >) G, ãäå

188

r < qε > G(qε), A1-экстремальна с точностью ε. Далее, из равенства

4

sup J(qε, r) = max J(qε, r) = J(qε, r¯ < qε >) = J(qε, r¯ε)

r G(qε) r G(qε)

следует, что ситуация (qε, r¯ε) является A2-экстремальной. Таким образом, су- ществует симметричное A-равновесие с точностью ε.

Предложение 1.1. Множество ситуаций (q1, r1) G, доставляющих функционалу J минимакс (1.5a), является подмножеством множества ситуаций, в которых достигается минимакс

1

4

1

(1.5b)

Jr = Jr (¯q, r¯) = min max J(q, r),

 

 

q G(r ) r G(q)

 

ãäå r P rRG.

Доказательство. Действительно, легко видеть, что если некоторая ситуация (q1, r1) доставляет функционалу J минимакс в (1.5a), то она доставит

функционалу J минимакс и в (1.5b) при некотором значении r , но не наобо- рот. В самом деле, пусть множество G содержит хотя бы одну изолированную точку (ˆq, rˆ) такую, что сечения G(ˆq) è G(ˆr) не содержат никаких других то- чек из G, и пусть эта точка не удовлетворяет (1.5a). Однако легко проверяется непосредственно, что она удовлетворяет (1.5b), где следует положить r = rˆ.

Вполне очевидно также и неравенство ˆ1 1

J Jr .

Предложение 1.2. Множество ситуаций (q2, r2) G, доставляющих функционалу J максимин

ˆ2

4 ˆ 2

2

) = max min J(q, r),

(1.5c)

J

= J(q

, r

r P rRG q G(r)

является подмножеством множества ситуаций, в которых достигается

максимин

4

 

 

2

2

(1.5d)

Jq = Jq (˜q, r˜) = max min J(q, r).

 

 

r G(q ) q G(r)

 

ãäå q P rQG.

В качестве первого шага усиления множества A-равновесий представляется естественным сузить множества A1 è A2 следующим образом. Если ситу- àöèÿ (q, r) A1, то отклоняться от нее 1-му игроку нецелесообразно ввиду угрозы со стороны 2-го. Следовательно, устойчивость этой ситуации будет тем сильнее, чем выгоднее она для 2-го игрока (не подверженного в ситуаци- ÿõ èç A1 угрозам со стороны 1-го игрока). В связи с этим примем следующее определение.

189

Определение 1.2. Ситуацию (q , r ) A1 назовем B1-экстремальной, если образующая ее стратегия 2-го игрока удовлетворяет условию

max J(q , r) = J(q , r ).

(1.6)

r A1(q )

Аналогичным образом, ситуация (q , r ) A2 определяется как B2 - экстремальная, если образующая ее стратегия 1-го игрока удовлетворяет условию

min J(q, r ) = J(q , r ).

(1.6a)

q A2(r )

 

Ситуацию (q , r ) G назовем (симметричным)

B-равновесием, если

(q , r ) B1 ∩ B2.

 

Дальнейшее усиление равновесий по схеме главы 1 позволяет прийти к понятию седловой точки с позиций, очень далеких от ее геометрического представления. Следующий шаг к усилению равновесий сделаем, если заметим, что всякая B1-экстремальная ситуация (q , r ) определялась как ситуация, в которой 2-й игрок при каждой стратегии q P rQA1 максимизирует J(q , ·) на множестве A1(q ). Однако, если допустить теперь возможность 2-му искать максимум также и на более широком доступном ему множестве G(q ),

но при этом не учитывать те сечения G(q ), максимум в которых оказывается вне сечения A1(q ), то мы приходим к следующему усилению (сужению) понятия B-равновесия.

Определение 1.3. Ситуацию (q , r ) A1 назовем C1-экстремальной, если образующая ее стратегия 2-го игрока удовлетворяет условию

max J(q , r) = J(q , r ).

(1.7a)

r G(q )

 

Множество ситуаций (q , r ) A1, удовлетворяющих условию (1.7a), обо- значим C1. Точно так же ситуация (q , r ) A2 определяется как C2- экстремальная, если образующая ее стратегия 1-ãî игрока удовлетворяет условию

min J(q, r ) = J(q , r ).

(1.7b)

q G(r )

Ситуацию (q , r ) назовем C- равновесием, если (q , r ) C1 ∩ C2, а следо- вательно, (q , r ) A и имеет место равенство

min J(q, r ) = J(q , r ) =

max J(q , r).

(1.7)

q G(r )

r G(q )

 

190