1smol_yakov_e_r_metody_resheniya_konfliktnykh_zadach-1
.pdfq3
6
J(4,3,4) J(6,2,6)
N P
L J(7,1,6) |
M J(8,4,5) |
|||
|
H |
|
K - |
q2 |
J(2,8,3) J(4,7,5) |
E |
|
F |
|
J(5,6,5) |
|
J(3,5,6) |
|
q1 |
|
|
Ðèñ. 3.6.
стратегия i-го игрока, принимающая всего два значения. Найдем наисиль-
нейшие равновесия и решение кооперативной игры.
Базовая система равновесий приводит к следующим результатам:
A1 |
= (E, F, K, L, M, N, P ), |
A2 = (E, F, H, K, M, N, P ), |
|
A3 |
= (E, F, K, L, M, N, P ), |
A = (E, F, K, M, N, P ), |
|
AP12 |
= (E, F, H, K, L, M, P ), AP13 = (L, M), |
||
AP23 |
= (E, F, H, K), AP2 = , A0 = , |
||
B1 = (E, F, K), B2 = (E, M), B3 = (E, K, M), B = (E), |
|||
D10 |
= D¯1 = D20 = D¯1 = (E), D30 = D¯3 = (E, K, M), |
||
D0 |
= D¯ = (E), D0n = D¯ n = (E), |
Ситуация (E) претендует на роль единственного наисильнейшего равновесия в этой игре. Все остальные ситуации существенно более слабые равновесия. Первая итерация (т.е. игра на множестве A) предоставляет дополнительную информацию относительно равновесий:
A11 |
= (E, M, K, N, P ), A21 = (F, F, K, M, N), |
|
||||
A31 |
= (E, F, K, M, N, P ), A1 = (E, K, M, N), |
|
||||
A121 = (E, K, M, P ), A131 = (E, M), A231 = (E, F, K), AP1 2 = (E), A01 = (E), |
||||||
B1 |
= (E, K), B1 |
= (E, M), B1 = (E, K, M), B1 |
= (E), |
|||
1 |
|
|
|
2 |
3 |
|
(D10 )1 = D¯11 = (E), (D20 )1 = D¯11 = E, |
|
|||||
(D30 )1 = D¯31 = (E, K, M) (D0)1 = D¯ 1 = (E), |
|
|||||
C1 |
= (E, K), C1 |
= (E, M), C1 = (E, K, M), C1 |
= (E), |
|||
1 |
|
|
|
2 |
3 |
|
D1 |
|
= (E), D1 = (E), D1 = (E, K, M), D1 = (E), |
||||
1 |
|
|
|
2 |
3 |
|
¯0 |
) |
1 |
= (E, K, M, N), |
|
||
(C |
|
|
а вторая итерация (т.е. игра на множестве A1) завершает исследование рав-
181
новесий:
A21 = A22 = A23 = A2 = A1 = (E, K, M, N),
B12 = (E, K), B22 = (E, M), B32 = (E, K, M), B2 = (E),
A212 = (E, K, M), A213 = (EM), A223 = (E, K), A2P2 = A02 = (E).
Èòàê, E действительно наисильнейшее равновесие, а M, K è N очень слабые равновесия. Поскольку равновесие E по существу единственно, то
дележ кооперативного дохода JP3 (M) = v(P3) = 17 производится по формуле (4.2) с учетом ограничений (4.1).
Найдем последовательность оптимальных коалиций, рассчитав сначала функции v(Pi) è π:
v(1) = 3, v(2) = 3, v(3) = 4, v(1, 2) = 8, v(1, 3) = 13, v(2, 3) = 11,
v(1, 2, 3) = 8/3, π(1, 2) = 3/2, π(1, 3) = 3, π(2, 3) = 5/2, π(1, 2, 3) = 8/3.
Поскольку функция π достигает максимума (равного 3) на коалиции (1,3),
то отсюда следует, что в данной задаче реализуется последовательность оптимальных коалиций {(1,3), (2)}.
По формуле (4.2) дел¼ж в игре зада¼тся формулами: x1 = 17 · 165 = 5, 3, x2 = 17 · 166 = 5, 4, x3 = 17 · 165 = 5, 3.
Однако в данном случае ограничения (4.1) нарушаются, так как x1 + x3 = 5,3 + 5,3 = 10, 6 < 13. А следовательно, 1-й и 3-й игроки могут отказаться от кооперации, гарантируя себе при этом совместный выигрыш не меньше 13. Если же учесть, что в равновесной ситуации E они получают одинаковый
доход, то это да¼т им основания надеяться получить поровну и в кооперации, прич¼м не менее, чем по 6,5. При этом 2-й игрок не может надеяться получить выигрыш больше 4 несмотря на то, что в равновесной ситуации он мог бы
получить больше своих соперников. Так что только один дел¼ж x1 = 6,5, x2 = 4, x3 =6,5 удовлетворяет формулам (4.1) при выполнении обязательного условия, что 1-й и 3-й игроки, согласно формуле (4.2), должны получить поровну.
182
ГЛАВА 4. АНТАГОНИСТИЧЕСКИЕ ИГРОВЫЕ И КОНФЛИКТНЫЕ ЗАДАЧИ
Под антагонистическими понимаются задачи с двумя участниками, в которых если один из них что-то получает, то именно это теряет другой. Поэтому подобные задачи называют играми с нулевой суммой. По существу эти игры являются частным случаем рассмотренных в первой главе игр с двумя участниками, в которых сумма выигрышей обоих игроков равна нулю, т.е.
J1 + J2 = 0. Это равенство позволяет трактовать такие игры как игры, в которых у игроков имеется всего одна платежная функция J, которую, на-
пример, 1-й игрок минимизирует, а 2-й максимизирует. В самом деле, (из этого равенства следует, что) если в некоторой задаче 2-й игрок максимизирует функцию J2, а 1-й игрок максимизирует свою функцию J1 = −J2, òî,
4
вводя обозначение J2 = J, получаем антагонистическую игру с платежной функцией J, которую 1-й игрок минимизирует, а 2-й максимизирует.
В основе классической теории антагонистических игр лежит геометриче- ское понятие седловой точки, определяющей в интуитивном представлении весьма удовлетворительное состояние равновесия, поскольку эта точка, являясь минимумом целевой функции участников по одной переменной и максимумом по другой, позволяет каждому гарантировать себе значение целевой функции не хуже получаемого в этой точке при любом поведении противника. Отклонение любого из участников от седловой точки может лишь ухудшить его выигрыш, если другой сохраняет верность ей. К сожалению, целевые (платежные) функции в реальных игровых задачах редко имеют форму "седла". И тогда возникает проблема: как же определить решение в подобной игре? Для случая, когда участники имеют возможность играть в антагонистическую игру многократно, Дж.Нейман в 1928 г. вв¼л понятие смешанных стратегий, согласно которым участники в каждой партии игры делают свой выбор случайным образом в соответствии с предварительно найденными функциями распределения вероятности (смешанными стратегиями), в классе которых, как доказал Дж.Нейман, седловая точка игры всегда существует. Однако в реальной жизни вс¼ реализуется однократно и использование смешанных стратегий (позволяющих реализовать решение седловую точку лишь в случае бесконечного числа партий) теряет смысл.
Правда, в дифференциальных играх понятие смешанных стратегий (по крайней мере таких, какие были впервые введены в дифференциальные игры в работе [40]), оказывается весьма плодотворным, так как даже с их участни-
183
ем игра оста¼тся по существу детерминированной и не требует своего многократного "проигрывания . Однако, к сожалению, в дифференциальных играх смешанные стратегии не позволили существенно расширить класс игр, имеющих решение в смысле седловой точки.
Отсутствие "седла"в естественном по своей постановке классе переменных (называемых чистыми стратегиями) вынуждает искать иные понятия решения антогонистической игры. Поскольку любая антагонистическая игра, как показано выше, сводится к играм, рассмотренным в первой главе, то естественно ожидать, что полученные выше понятия конфликтного равновесия применимы и для антагонистических задач. Прич¼м вследствие того, что они являются частным случаем рассмотренных в первой главе игр с двумя участниками, в отношении них можно ожидать получения даже более "глубоких" результатов, чем полученные в первой главе.
Полученные в этой главе понятия антагонистических равновесий, дополняют результаты монографии [57] и позволяют по-новому взглянуть на седловые точки, максимины и минимаксы.
1. Понятия антагонистических равновесий
Антагонистические модели будем рассматривать в трактовке задач принятия или отказа от предложения [46], то есть в следующем смысле. Если (q , r ) некоторая ситуация (образованная из пары стратегий игроков q
è r , независимо от того, чистые эти стратегии или смешанные) на доступном игрокам множестве выбора G, например (q , r ) ситуация равновесия
в каком-либо смысле, и один из участников, например 1-й, с нею не согласен, то делать свой выбор он может лишь на доступном ему множестве G(r ),
представляющем собой сечение множества G.
В основу семейства предлагаемых антагонистических равновесий положим понятие слабо экстремальной ситуации [43, 44, 46] (т.е. определение 1.1.1), ко-
торое может быть определено на произвольном множестве G в произведении топологических пространств Q è R. Учитывая, однако, что подобная общ-
ность пространств с точки зрения возможных приложений представляется излишней, определения равновесий дадим для более частных пространств, определенных в следующих допущениях, сформулированных с учетом того, что почти все полученные в этой главе результаты оказывается возможным перенести на антагонистические дифференциальные игры.
184
Пусть Q и R метрические компакты, а G произвольное множество в их произведении Q Ч R, причем такое, что любые непустые его сечения G(q) и G(r), где q Q, r R, являются компактами; и пусть на множестве Q Ч R определена ограниченная функция (или функционал) J(q, r), непрерывная по каждой переменной в отдельности при
всех допустимых фиксированных значениях другой.
Пусть Q, R и G метрические компакты, причем G Q Ч R, а J(q, r) непрерывная функция (функционал) на Q Ч R.
Предполагается, что 1-й игрок, выбирая стратегию (состояние) q из доступного ему множества P rQG(r) èëè P rQG, стремится минимизировать J, а 2-й игрок, выбирая r P rRG(q) èëè r P rRG, стремится максимизировать J. Чтобы упростить обозначения, сечение G(q) множества G рассматривается, в зависимости от подтекста, в качестве или подмножества в G, или подмножества в R. (Нередко через G(q) обозначают подмножество множества R, а через q × G(q) сечение множества G как подмножество G, ÷òî,
однако, менее удобно).
Определение 1.1. Точку (ситуацию) (q , r ) G назовем A1- экстремальной, если множество G(r ) одноточечное или (когда оно содержит более одной точки) если любой стратегии q G(r ) 1-го игрока мож-
но поставить в соответствие по крайней мере одну допустимую стратегию rˆ = rˆ < q > G(q) 2-го игрока, так, чтобы имело место отношение
J |
( |
q, r |
|
J |
( |
q , r |
) |
. |
|
. |
|
||||
|
|
ˆ) ≥ |
|
|
|
|
(1 1) |
||||||||
Подобным же образом, с заменой неравенства (1.1) на неравенство |
|
|
|||||||||||||
J q, r |
) ≤ |
J |
( |
q , r |
) |
(1 |
. a |
) |
|||||||
|
(ˆ |
|
|
|
|
|
1 |
определяется A2-экстремальная ситуация. Ситуацию (q , r ) G назовем (симметричным) A-равновесием, если (q , r ) A1 ∩ A2.
Согласно определению 1.1 ситуация (q , r ) G A2 -экстремальна, если какую бы точку r 6= r из доступного ему множества точек G(q ) 2-é èã-
рок ни выбрал, у 1-го игрока найдется ответный выбор хотя бы одной точки
4
(стратегии) qˆ = qˆ < r > G(r), приводящей к ситуации (ˆq, r), в которой 2-й игрок получает не больше, чем в ситуации (q , r ).
Теорема 1.1. Множества A1 è A2 не пусты, если удовлетворяются допущения 1.1.
Доказательство. Рассмотрим сечение G(q) множества G, проходящее через произвольно заданную точку (q, r) G. Поскольку G(q) компакт, а
185
J(q, ·) непрерывная функция, то в сечении G(q) достигается максимум
J(q, r ) = max J(q, r).
r G(q)
Ситуация (q, r ) A2 -экстремальна, так как любому возможному выбору 2- го игрока r G(q), r 6= r , можно поставить в соответствие выбор qˆ < r >= q
1-го игрока так, чтобы удовлетворялось неравенство (1.1a). Следовательно, в каждом сечении G(q) множества G всегда существует A2 -экстремальная ñè- туация, причем множество A2 не исчерпывается ситуациями подобного рода.
Аналогично устанавливается непустота множества A1.
Теорема 1.2. При удовлетворении допущений 1.1 чтобы ситуация (q , r ) G áûëà A1-экстремальной, необходимо и достаточно, чтобы
inf max J |
( |
q, r |
) ≥ |
J |
( |
q , r |
. |
(1.2) |
q G(r ) r G(q) |
|
|
) |
|
|
Доказательство.Достаточность. Если нижняя грань J(¯q, r¯ < q¯ >) в (1.2) достигается в точке (¯q, r¯ < q¯ >) , то из (1.3) следует, что для любой
стратегии |
|
G(r ) |
найдется зависящая от |
|
стратегия |
4 |
(â |
|
q |
|
q |
|
rˆ < q >= rˆ |
|
частности, стратегия rˆ = r¯ < q >, доставляющая максимум функции J в сечении G(q)), такая, что J(q, rˆ < q >) ≥ J(¯q, r¯ < q¯ >) ≥ J(q , r ), à
это и означает в силу определения 1.1 A1-экстремальность ситуации
Если же допустить, что нижняя грань в (1.2) не достигается и что ситуация в (1.2) не принадлежит множеству A1, то это означает, что найдется стратегия q G(r ), такая, что для любой стратегии r G(q) окажется
J(q, r) < J(q , r ), что противоречит (1.2).
Необходимость. Пусть ситуация (q , r ) удовлетворяет неравенству (1.1). Это неравенство лишь еще более усилится, если в качестве rˆ < q > выбрать стратегию r¯ < q >, доставляющую функции (функционалу) J ìàê-
симум в сечении G(q). Если принять во внимание, что в определении A1-
экстремальности утверждается, что неравенство (1.1) выполняется для любой стратегии q G(r ), то, следовательно, оно сохранится и в случае, если
берется то (предельное) значение переменной q на множестве G(r ), äëÿ êî-
торого определяется величина inf J(q, r¯ < q >), равная левой части (1.2).
q G(r )
Отсюда следует, что A1-экстремальная ситуация (q , r ) удовлетворяет нера-
венству (1.3).
Следствие 1.1. Аналогично доказывается, что для того, чтобы ситуация (q , r ) G áûëà A2-экстремальной, необходимо и достаточно, чтобы
sup min J(q, r) ≤ J(q , r ). |
(1.2a) |
r G(q ) q G(r)
186
Следствие 1.2. Чтобы ситуация (q , r ) G являлась симметричным A-равновесием, необходимо и достаточно, чтобы
sup min J |
( |
q, r |
) ≤ |
J |
( |
q , r |
inf max J(q, r). |
(1.3) |
r G(q ) q G(r) |
|
|
|
) ≤ q G(r ) r G(q) |
|
|||
|
|
|
|
|
|
|
|
|
Следствие 1.3. На множестве G при допущениях 1.1 имеет место неравенство
sup min J |
( |
q, r |
inf max J(q, r). |
(1.4) |
r G(q ) q G(r) |
|
) ≤ q G(r ) r G(q) |
|
|
|
|
|
|
|
Действительно, из определений минимума и максимума следует, что для всех (q, r) G справедливы неравенства
min J |
( |
q, r |
) ≤ |
J(q, r), max J |
( |
q, r |
) ≥ |
J(q, r), |
||
q |
|
G(r) |
|
r G(q) |
|
|
||||
|
|
|
|
|
|
|
|
|
|
откуда следует
min J(q, r) ≤ max J(q, r).
q G(r) r G(q)
Поскольку левая часть этого неравенства представляет собой независящую от переменной q функцию, то, применяя к обеим его частям операцию определения нижней грани по q в произвольно заданном сечении G(r ), получаем
min J(q, r) ≤ inf max J(q, r).
q G(r) q G(r ) r G(q)
Аналогичным образом, применяя к обеим частям последнего неравенства операцию определения верхней грани по r в произвольном сечении G(q ),
получаем неравенство (1.4).
Теорема 1.3. В игре, удовлетворяющей допущениям 1.1, существует симметричное A-равновесие с любой заданной точностью ε.
Доказательство. Пусть сначала в некоторой точке (q1, r1 < q1 >) достигается минимакс
ˆ1 |
1 |
1 |
4 ˆ1 |
1 |
, r < q |
1 |
>), |
(1.5a) |
min max J(q, r) = J |
(q |
, r |
) = J |
= max J(q |
|
|||
q P rQG r G(q) |
|
|
|
r G(q1) |
|
|
|
|
Из последнего равенства в (1.5a) следует, согласно теореме 1.1, что ситуа- öèÿ (q1, r1) A2-экстремальна и удовлетворяет неравенству
J(q1, r1) ≥ J(q1, r), r G(q1), |
(1.4b) |
а из первого равенства в (1.5a) следует, что для любой стратегии |
q P rQG |
найдется зависящая от q стратегия rˆ < q >, такая, что |
|
J(q, rˆ < q >) ≥ J(q1, r1). |
(1.4c) |
187
Последнее неравенство, с учетом определения 1.1, показывает, что A2- экстремальная на основе доказанного выше ситуация (q1, r1) является также и A1-экстремальной, а следовательно, (q1, r1) A1 ∩ A2.
Интересно отметить, что из неравенств (1.4b) и (1.4c) следует, что A1- экстремальна не только ситуация (q1, r1) из сечения G(q1), íî è âñå ýòî ñå÷å-
ние. Более того, именно вследствие этого замечательного свойства и оказывается возможным вышеприведенное доказательство.
Минимакс (1.5a) в игре, удовлетворяющей допущениям 1.1, может не достигаться. Однако в подобной игре всегда существует конечное значение
¯1 |
4 ¯1 |
4 |
inf J(q, r¯ < q >), (1.4d) |
J |
= J |
(¯q, r¯ < q¯ >) = inf max J(q, r) = |
|
|
|
q P rQG r G(q) |
q P rQG |
где через (¯q, r¯ < q¯ >) обозначена предельная точка на множестве G, â êîòî-
рой определяется нижняя грань ¯1 в (1.4d). Заметим, что если нижняя грань
J
в (1.4d) не достигается, то в общем случае уже не любая ситуация из сечения G(¯q) A1-экстремальна (A1-экстремальным оказывается всего лишь предель-
ное сечение ¯ (
G(¯q) G(¯q)), представляющее собой предел сечений G(q) ïðè
→ ¯
q q¯). Но предельное сечение G(¯q), во-первых, не обязано быть компактным, а во-вторых, оно не обязательно совпадает со всем сечением G(¯q), в связи с
¯
чем максимум функции J(¯q, r) ïî r в предельном сечении G(¯q) может или не достигаться, или не совпадать с ее максимумом в сечении G(¯q), что и приводит к A-равновесию всего лишь с точностью ε. Формально, доказательство
этого факта почти повторяет вышеприведенное доказательство для случая (1.5a). Действительно, из (1.4d), с одной стороны, следует, что при любом ε > 0 найдется qε Q, такое, что
|
¯1 |
+ ε. |
(1.4e) |
max J(qε, r < qε >) ≤ J |
|||
r<qε> G(qε) |
|
|
|
откуда, в свою очередь, следует |
|
|
|
¯1 |
+ ε при любом r G(qε). |
(1.4f) |
|
J(qε, r < qε >) ≤ J |
С другой стороны, из (1.4d) следует, что при любой допустимой стратегии q P rQG − Qε, ãäå Qε обозначает множество всех тех qε, с которыми удовлетворяется неравенство (1.4e), найдется стратегия rˆ G(q), такая, что
¯1 |
+ ε. |
(1.4g) |
J(q, rˆ) ≥ J |
||
Из (1.4f) и (1.4g) получаем неравенство J(q, rˆ) ≥ J(qε, r < qε |
>), îçíà- |
чающее в силу определения 1.1, что любая ситуация (qε, r < qε >) G, ãäå
188
r < qε > G(qε), A1-экстремальна с точностью ε. Далее, из равенства
4
sup J(qε, r) = max J(qε, r) = J(qε, r¯ < qε >) = J(qε, r¯ε)
r G(qε) r G(qε)
следует, что ситуация (qε, r¯ε) является A2-экстремальной. Таким образом, су- ществует симметричное A-равновесие с точностью ε.
Предложение 1.1. Множество ситуаций (q1, r1) G, доставляющих функционалу J минимакс (1.5a), является подмножеством множества ситуаций, в которых достигается минимакс
1 |
4 |
1 |
(1.5b) |
Jr = Jr (¯q, r¯) = min max J(q, r), |
|||
|
|
q G(r ) r G(q) |
|
ãäå r P rRG.
Доказательство. Действительно, легко видеть, что если некоторая ситуация (q1, r1) доставляет функционалу J минимакс в (1.5a), то она доставит
функционалу J минимакс и в (1.5b) при некотором значении r , но не наобо- рот. В самом деле, пусть множество G содержит хотя бы одну изолированную точку (ˆq, rˆ) такую, что сечения G(ˆq) è G(ˆr) не содержат никаких других то- чек из G, и пусть эта точка не удовлетворяет (1.5a). Однако легко проверяется непосредственно, что она удовлетворяет (1.5b), где следует положить r = rˆ.
Вполне очевидно также и неравенство ˆ1 ≤ 1
J Jr .
Предложение 1.2. Множество ситуаций (q2, r2) G, доставляющих функционалу J максимин
ˆ2 |
4 ˆ 2 |
2 |
) = max min J(q, r), |
(1.5c) |
J |
= J(q |
, r |
r P rRG q G(r)
является подмножеством множества ситуаций, в которых достигается
максимин |
4 |
|
|
2 |
2 |
(1.5d) |
|
Jq = Jq (˜q, r˜) = max min J(q, r). |
|||
|
|
r G(q ) q G(r) |
|
ãäå q P rQG.
В качестве первого шага усиления множества A-равновесий представляется естественным сузить множества A1 è A2 следующим образом. Если ситу- àöèÿ (q, r) A1, то отклоняться от нее 1-му игроку нецелесообразно ввиду угрозы со стороны 2-го. Следовательно, устойчивость этой ситуации будет тем сильнее, чем выгоднее она для 2-го игрока (не подверженного в ситуаци- ÿõ èç A1 угрозам со стороны 1-го игрока). В связи с этим примем следующее определение.
189
Определение 1.2. Ситуацию (q , r ) A1 назовем B1-экстремальной, если образующая ее стратегия 2-го игрока удовлетворяет условию
max J(q , r) = J(q , r ). |
(1.6) |
r A1(q )
Аналогичным образом, ситуация (q , r ) A2 определяется как B2 - экстремальная, если образующая ее стратегия 1-го игрока удовлетворяет условию
min J(q, r ) = J(q , r ). |
(1.6a) |
q A2(r ) |
|
Ситуацию (q , r ) G назовем (симметричным) |
B-равновесием, если |
(q , r ) B1 ∩ B2. |
|
Дальнейшее усиление равновесий по схеме главы 1 позволяет прийти к понятию седловой точки с позиций, очень далеких от ее геометрического представления. Следующий шаг к усилению равновесий сделаем, если заметим, что всякая B1-экстремальная ситуация (q , r ) определялась как ситуация, в которой 2-й игрок при каждой стратегии q P rQA1 максимизирует J(q , ·) на множестве A1(q ). Однако, если допустить теперь возможность 2-му искать максимум также и на более широком доступном ему множестве G(q ),
но при этом не учитывать те сечения G(q ), максимум в которых оказывается вне сечения A1(q ), то мы приходим к следующему усилению (сужению) понятия B-равновесия.
Определение 1.3. Ситуацию (q , r ) A1 назовем C1-экстремальной, если образующая ее стратегия 2-го игрока удовлетворяет условию
max J(q , r) = J(q , r ). |
(1.7a) |
r G(q ) |
|
Множество ситуаций (q , r ) A1, удовлетворяющих условию (1.7a), обо- значим C1. Точно так же ситуация (q , r ) A2 определяется как C2- экстремальная, если образующая ее стратегия 1-ãî игрока удовлетворяет условию
min J(q, r ) = J(q , r ). |
(1.7b) |
q G(r )
Ситуацию (q , r ) назовем C- равновесием, если (q , r ) C1 ∩ C2, а следо- вательно, (q , r ) A и имеет место равенство
min J(q, r ) = J(q , r ) = |
max J(q , r). |
(1.7) |
q G(r ) |
r G(q ) |
|
190