Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1smol_yakov_e_r_metody_resheniya_konfliktnykh_zadach

.pdf
Скачиваний:
5
Добавлен:
29.10.2019
Размер:
1.15 Mб
Скачать

а левую часть этого последнего неравенства можно представить в эквивалентной форме

max J

(

q , r

);

inf

max J

(

q, r

)}

,

(2.17)

min{r G(q )

 

q G(r )−q

r G(q)

 

 

 

откуда видно, что левая часть неравенства (2.20) не может быть больше правой, так как согласно (2.21) представляет собой наименьшее из двух чисел, одним из которых является правая часть (2.20). Следовательно,

inf

max J(q, r)

max J(q , r).

q G(r )

r

 

G(q)

r G(q )

 

 

 

 

Таким образом, из (2.15)-(2.17) следует, что если ситуация (q , r ) равно-

весна в смысле слабозависимой седловой точки (1.9), то должны иметь место равенства, в которых минимум по q íà G(r ) достигается:

 

 

inf

max J(q, r) =

q

min

max J(q, r) =

 

q G(r )

r

 

G(q)

 

G(r )

r G(q)

 

 

 

 

 

 

 

 

 

 

max J(q , r) = J(q , r ) = min

 

max J(q, r),

r

 

G(q )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

q P rQG

r G(q)

т. е. ситуация (q , r ) удовлетворяет левому равенству в (2.2). Аналогичным

образом устанавливается, что и правое неравенство в (2.15) на самом деле оказывается равенством, если ситуация (q , r ) равновесна в смысле (1.9), и

что максимум по r íà G(q ) достигается. А это означает, что эта ситуация удовлетворяет и правому равенству в (2.2).

Естественно ожидать существование седловых точек в тех случаях, когда целевая функция имеет форму седла. Все известные теоремы существования седловых точек в той или иной мере предъявляют к целевой функции это "геометрическое"требование. Приведем формулировки некоторых наиболее общих из известных теорем существования классической и зависимой седловой точки и докажем обобщающую их теорему.

Теорема 2.4. [3, с. 34]. Если Q и R компактные хаусдорфовы пространства, J(·, r) полунепрерывная снизу выпуклая функция при всех r R, а J(q, ·) полунепрерывная сверху вогнутая функция при всех q Q,

то классическая седловая точка (2.1) существует.

Теорема 2.5. [46, с. 39]. Если удовлетворяются допущения 1.2 и функция J(q, r) монотонна по каждой переменной в отдельности, то существует зависимая седловая точка (1.10).

Теорема 2.6. [32]. Если множество G таково, что все его непустые сечения G(q) и G(r) и P rQG, P rRG являются выпуклыми компактами, а

201

функция J(q, r) непрерывна на QЧR, выпукла по q при всех r R и вогнута по r при всех q Q, то существует зависимая седловая точка.

Докажем теорему, обобщающую теорему 2.6 сразу в трех направлениях: 1выпуклость проекций множества G на подпространства Q è R не предпола-

гается; 2 множество G бесконечномерно; 3 платежная функция J(q, r)

замкнутое ограниченное отображение. Доказательство проведем при следующих допущениях:

Допущения 2.1. Пусть Q è R компактные множества в хаусдорфовом линейном локально-выпуклом топологическом пространстве; G замкнутое связное множество в Q × R, такое, что любые непустые его сечения G(q) è G(r) выпуклы, а каждое сечение W (q) èëè W (r) замкнутого выпуклого множества W = Co{P rQG× P rRG} содержит в себе соответственно сече- ния G(q) èëè G(r); функция (функционал) J(q, r) замкнутое ограниченное отображение; J(·, r) непрерывное и выпуклое отображение Q → E1 ïðè âñåõ r R; J(q, ·) непрерывное и вогнутое отображение R → E1 ïðè âñåõ q Q.

В качестве базы доказательства существования зависимой седловой точки будет использована следующая теорема Гликсберга-Фана [3, с. 498, 99]:

Теорема 2.7. Любое замкнутое отображение p: W → W компактного выпуклого множества W в себя в хаусдорфовом линейном локальновыпуклом топологическом пространстве, переводящее точки w W в замкнутые выпуклые множества p(w) W , обладает свойством неподвижной точки: существует w p(w).

Теорема 2.8 [49]. Пусть Q, R и G множества, а J(q, r) плат¼жная функция (функционал) в антагонистической игре на множестве G, удовлетворяющие требованиям допущений 2.1. Тогда отображение p = (p1, p2), составляющие которого имеют вид

p1(q, r) = {y G(r) : J(y, r) = min J(q, r)},

q G(r)

(2.18)

p2(q, r) = {z G(q) : J(q, z) = max J(q, r)},

r G(q)

замкнуто и переводит множество W в себя. По теореме 2.7 отображение p обладает свойством неподвижной точки: существует w = (q, r) p(w). И наконец, точка (q, r) является седловой точкой (1.10) в антагонистиче- ской игре.

202

Доказательство. Прежде всего следует отметить, что отображение p = (p1, p2) не пусто, что является следствием компактности множеств G(q) è G(r) и непрерывности на них функций J(·, r) è J(q, ·) соответственно, благодаря чему обеспечивается достижение минимума и максимума в (2.18). Выпуклость множеств p(q, r) есть следствие выпуклости множеств G(q) è G(r), выпуклости J(·, r) и вогнутости J(q, ·).

Из самого определения (2.18) отображения p следует, что его неподвижные точки если и существуют, то обязательно находятся во множестве G W . Если точка (q, r) W такова, что одно из сечений G(q) èëè G(r) оказывается пустым, то отображение p = (p1, p2) вырождается в p = p1 èëè p = p2

. Докажем, что отображение p(q, r) замкнуто, то есть для любой последовательности (qk, rk) G, сходящейся к точке (q0, r0) G, и любой последовательности (yk, zk) p(qk, rk), такой, что (yk, zk) → (y0, z0), оказывается

(y0, z0) p(q0, r0).

Возьмем любую точку (y, z) p(q0, r0). Из непрерывности функционала J по каждой переменной в отдельности следует

J(q0, z) = lim J(qk, z).

(2.19)

k→∞

 

При каждом k = 1, 2, . . . с учетом определения (2.18) значений z справедливо отношение

J

q

, z

max J

q

, r

k) =

J

q

, z

k)

,

 

( k

 

) ≤ rk

G(qk)

( k

 

 

( k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

причем qk → q0 è zk → z0 ïðè k → ∞; откуда при k → ∞ с учетом (2.19) следует

J(q0

, z) ≤ klim J(qk, zk),

(2.20)

 

→∞

 

Учитывая, что функционал J(q, r) замкнут по совокупности переменных, имеем

J(q0, z) ≤ klim J(qk, zk) = J(q0, z0).

(2.21)

→∞

 

Аналогичным образом устанавливается, что

 

J(y, r0) ≥ klim J(yk, rk) = J(y0, r0).

(2.22)

→∞

 

Если учесть, что точка (y, z) взята из множества p(q0, r0), то точка (y0, z0) при условиях (2.21),(2.22) не может не принадлежать множеству p(q0, r0), если учесть определение этого множества. Но тогда согласно теореме 2.7 существует точка (q, r) p(q, r), а следовательно, имеют место равенства (2.1),

203

то есть существует зависимая седловая точка в антагонистической игре на множестве G с платежной функцией J(q, r).

Пример 2.1. Пусть G замкнутая четверть тороидальной фигуры, лежащая в положительном ортанте эвклидова пространства (q1, q2, r) и содер-

жащая круг (r − a)2+ (q2 − a)2 = a2 в качестве одной из своих границ, обра-

зованная вращением указанного круга относительно оси r + q2 = b, b > a 2

( 2 + 1). 1-й игрок, распоряжаясь выбором переменной q = (q1, q2), минимизирует функцию J = q1+ q2 + r, а 2-й игрок, выбирая допустимые значения r, максимизирует J.

Множество G и его проекция на плоскость (q1, q2) в этой игре, очевидно, не выпуклы. А следовательно, все известные теоремы существования седловой точки, включая теорему из книги [32], не позволяют сделать какого-либо заключения о существовании седловой точки в этой игре. Однако из теоремы 2.8 следует, что зависимая седловая точка существует. Чтобы убедиться в этом, остается лишь заметить, что каждое сечение W (r) замкнутого выпук-

лого множества W = Co{P rQG× P rRG} содержит в себе соответствующее сечение G(r). Удовлетворение остальных допущений теоремы 2.8 очевидно.

Замечание 2.2. Общим для всех рассмотренных в этом разделе типов седловых точек (q , r ) является то обстоятельство, что на множествах ( G(q )

è G(r )) допустимых отклонений игроков от равновесной ситуации (q , r )

имеются такие подмножества, по отношению к которым равновесная стратегия (каждого игрока) оказывается стратегией наказания для противника в том смысле, что сохраняющий равновесную стратегию игрок может не заботиться о том, чтобы каким-то образом наказать игрока, отклоняющегося от состояния равновесия (q , r ) на указанном подмножестве, поскольку этот

последний не в состоянии улучшить для себя значение платежной функции J(q, r) при сохранении противником неизменной своей равновесной стратегии (q èëè r ). Для классической, слабозависимой и зависимой седловых точек (q , r ) каждое из указанных выше подмножеств всегда совпадает со всем множеством допустимых отклонений G(q ) è G(r ). А для сильнозависимой седловой точки эти подмножества, представляющие собой множества A(q ) è A(r ), оказываются в общем случае собственными (строгими) подмножествами множеств допустимых стратегий G(q ) è G(r ), соответственно. Так что если игроки, отклоняясь от сильнозависимой седловой точки (q , r ), используют стратегии из множеств A(q ) è A(r ), то это не улучшает их выигрыша

при пассивном поведении противника, всего лишь сохраняющего неизменной свою равновесную стратегию. Однако если отклонение от сильнозависимой

204

седловой точки выходит за пределы множеств A(q ) è A(r ), то противни-

ку уже недостаточно сохранять неизменной свою равновесную стратегию, а требуется применять стратегию наказания, выражаемую определением 1.1. В действительности же, игроки не решатся отклоняться от сильнозависимой седловой точки ни на множествах A(q ) è A(r ), где противнику достаточно

быть пассивным, ни на их дополнении G(q )\A(q ) è G(r )\A(r ), где против-

ник несомненно реализует активную угрозу, поскольку в антагонистической игре, как видно из определения 1.1, угроза всегда выгодна угрожающему.

Теорема 2.9. Пусть удовлетворяются допущения 1.1 и множество A

компактно. Тогда любая сильная активная седловая точка (1.12) является

сильнозависимой седловой точкой (1.11).

Доказательство. Пусть ситуация (q , r ) сильная активная седловая

точка. Покажем, что она является также сильнозависимой седловой точкой, т.е. удовлетворяет равенствам

min max J(q, r) = J(q , r ) =

max min J(q, r)

(2.23)

q A(r ) r A(q)

r A(q ) q A(r)

 

Если учесть, что A(r ) P rQA, ÷òî A(q ) P rRA и что ситуация (q , r ), по определению сильной активной седловой точки, удовлетворяет равенствам (1.12), то оказывается справедливой следующая система неравенств

 

inf

 

 

max J(q, r)

 

inf

 

max J(q, r) =

 

q

 

A(r )

r

 

A(q)

 

 

 

 

 

 

 

 

 

q P rQA

r A(q)

 

min max J(q, r) = max J(q , r) = J(q , r ) =

 

q P rQA r A(q)

r A(q )

 

 

 

 

 

 

min

 

J(q, r ) =

max

 

 

min J(q, r) =

(2.24)

 

 

q

 

A(r )

r

 

P rRA

 

 

 

 

 

 

 

 

 

q A(r)

 

 

 

sup

 

 

min J(q, r)

r

sup

min J(q, r).

 

 

r P rRA

 

q A(r)

 

 

A(q )

q A(r)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Левое неравенство в (2.24) можно переписать в виде

q

inf

max J(q, r)

r

max J(q , r),

(2.25)

 

A(r )

r

 

A(q)

 

A(q )

 

 

 

 

 

 

 

 

а левую часть неравенства (2.25) можно представить в эквивалентной форме

max J

(

q , r

);

inf

max J

q, r

)}

,

(2.26)

min{r A(q )

 

q A(r )−q

r A(q)

(

 

 

откуда видно, что левая часть неравенства (2.25) не может быть больше правой, так как согласно (2.26) представляет собой наименьшее из двух чисел, одним из которых является правая часть (2.25). Следовательно,

q

inf

max J(q, r)

r

max J(q , r).

 

A(r )

r

 

A(q)

 

A(q )

 

 

 

 

 

 

205

Таким образом, из (2.24)-(2.26) следует, что если ситуация (q , r ) ÿâëÿ-

ется сильной активной седловой точкой, то должны иметь место следующие равенства, в которых минимум по q íà A(r ) достигается:

 

q

inf

max J(q, r) =

q

min

max J(q, r) =

 

 

A(r )

r

 

A(q)

 

A(r )

r A(q)

 

 

 

 

 

 

 

 

 

 

 

max J(q , r) = J(q , r ) = min

 

max J(q, r),

r

 

A(q )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

q P rQA

r A(q)

т. е. ситуация (q , r ) удовлетворяет левому равенству в (2.23). Аналогичным

образом устанавливается, что и правое неравенство в (2.24) на самом деле оказывается равенством, если ситуация (q , r ) равновесна в смысле (1.12), и

что максимум по r íà A(q ) достигается. А это означает, что эта ситуация удовлетворяет и правому равенству в (2.23)

3. Антагонистические многозначные игры

Игровые задачи с многозначными платежными функциями по ряду при- чин до сих пор остаются совершенно не изученными. Необходимость в их исследовании возникает по крайней мере в связи с тем, что задачами подобного класса с неявно присутствующей многозначностью оказываются, например, дифференциальные игры с подвижными краевыми условиями. Однако многозначность может присутствовать в задаче не только неявным образом, но и вполне явно. Например, функции q/r, q/(q + r), qr/(q2 + r2) многозначны в

начале координат (q, r) = (0, 0), а следовательно, будучи использованы в ка- честве платежных функций, вводят в игру неоднозначность явным образом.

Допущения 3.1. Пусть Q и R метрические компакты, а G непустое подмножество в их произведении Q Ч R, такое, что любые непустые сечения G(q) и G(r) являются компактными множествами, и пусть на множестве QЧR определен ограниченный многозначный функционал J[q, r]

(заключение аргумента в квадратные скобки будет указывать всюду ниже

в этом разделе на факт многозначности функционала) .

Определение 3.1. При удовлетворении допущений 3.1 ограниченный многозначный функционал J[q, r] назовем компонентно замкнутым, если для каждого непустого сечения G(r) множество значений J[·, r] замкнуто в E1 Ч G(r); и аналогично, для каждого непустого сечения G(q) множество значений J[q, ·] замкнуто в E1 × G(q), ãäå E1 вещественная ось.

206

оказывается компонентно
замкнуты, согласно пред-
Утверждение 3.1.

Допущения 3.2. Пусть Q и R метрические пространства, а G компакт в Q Ч R, и пусть на Q Ч R определен ограниченный многозначный функционал J[q, r].

Определение 3.2. При удовлетворении допущений 3.2 ограниченный многозначный функционал J[q, r] назовем замкнутым, если множество его зна- чений замкнуто в E1 × G.

Всякий замкнутый функционал компонентно замкнут .

Доказательство. В самом деле, в случае замкнутого функционала множество J[q, r] его значений замкнуто в E1 × G. А поскольку любые сечения

J[·, r] è J[q, ·] замкнутого в E1 ×G множества J[q, r] ложению 1.4.4 из [6, с. 61], то функционал J[q, r] замкнутым.

Определение 3.3.Верхней огибающей J[q, r] многозначного функционала J[q, r] на G назовем функционал sup J[q, r], а нижней infJ[q, r] при всех q, r G.

Следующее определение обобщает понятие A-равновесия на случай мно-

гозначной игры.

Определение 3.4.Ситуацию (q , r ) G назовем многозначной A1- экстремальной (соответственно, достижимой Ad1-экстремальной) â èãðå с многозначным функционалом J[q, r], если при фиксированной стратегии r допустимой оказывается только одна стратегия q G(r ) или если любой стратегии q G(r ) \ q можно поставить в соответствие, по

крайней мере, одну допустимую стратегию rˆ = rˆ < q > 2-го игрока (т.е. стратегию rˆ G(q)) так, чтобы имело место отношение

J

q, r

J

q , r

,

.

[

ˆ] ≥

[

]

 

(3 1)

где некоторое (соответственно, некоторое из множества достижимых значений) из множества значений J[q, rˆ] в каждой из точек (q, rˆ) G(q) не меньше некоторого из множества значений J[q , r ] функционала J в точ- ке (q , r ). Подобным же образом с изменением смысла неравенства (3.1) и

роли переменных q и r определяется многозначная A2-экстремальная (ñî- ответственно, достижимая Ad2-экстремальная) ситуация:

J q, r

] ≤

J

q , r

.

. a

[

]

 

(3 1 )

Ситуацию (q , r ) G назовем ситуацией многозначного A-равновесия (соответственно, ситуацией достижимого Ad- равновесия), если неравенства

207

(3.1),(3.1a) удовлетворяются в точке

(q , r )

одновременно, т.е. если

4

 

 

 

 

 

 

 

A =

A1 ∩ A2

(соответственно,

A

d 4

d

 

d

 

 

 

= A1

∩ A2).

 

 

Замечание 3.1. Отличие A-равновесия îò Ad-равновесия в том, что в

первом из них в каждой точке многозначности любой конкретной платежной функции все значения этой платежной функции рассматриваются как эквивалентные. Однако в реальных условиях, в зависимости от текущего состояния игры, переход в ту или иную точку многозначности, как привило, обеспечивает всего лишь одно конкретное значение из всего возможного множества значений платежной функции в этой точке. Так что реально достижимыми при переходе из любой заданной ситуации в любую другую доступную игроку, осуществляющему этот переход, ситуацию многозначности платежной функции оказываются вовсе не все значения многозначной платежной функции в этой последней ситуации. На приведенных ниже примерах это различие между A- è Ad-равновесиями проявляется достаточно ярко.

Усиление A- è Ad-равновесий дается нижеследующим определением, пред-

ставляющим собой обобщение сильнозависимой седловой точки.

Определение 3.5. Ситуацию (q , r ) G назовем многозначной (соответственно, достижимой) сильнозависимой седловой точкой в игре с неоднозначным целевым функционалом J[q, r], если

J[q , r] ≤ J[q , r ] ≤ J[q, r ],

(3.2)

q A(r ), r A(q ), (q Ad(r ), r Ad(q )),

где некоторое из множества значений J[q , r] (соответственно, некоторое из множества достижимых для 2-го игрока значений J[q , r]) в каждой из точек (q , r), r A(q ) (соответственно, r Ad(q )), не больше некоторого из множества значений J[q , r ] в точке (q , r ); и аналогично, некоторое из множества значений J[q , r ] в точке (q , r ) не больше некоторого из множества значений J[q, r ] (соответственно, некоторого из множества достижимых для 1-го игрока значений J[q, r ]) в каждой из точек (q, r ), q A(r ) (соответственно, q Ad(r )).

Следующее определение, усиливающее определение 3.5, является рассчи- танной на многозначные игры модификацией определения классической зависимой седловой точки (представляющей собой зависимое равновесие по Роузу Нэшу.

Определение 3.6. Ситуацию (q , r ) G назовем многозначной (соответственно, достижимой) седловой точкой в игре с неоднозначным целе-

208

вым функционалом J[q, r], если

J[q , r] ≤ J[q , r ] ≤ J[q, r ], q G(r ), r G(q ),

(3.3)

где некоторое из множества значений J[q , r] (соответственно, некоторое из множества достижимых для 2-го игрока значений J[q , r]) в каждой из точек (q , r), r G(q ), не больше некоторого из множества значе- ний J[q , r ] в точке (q , r ); и аналогично, некоторое из множества значе- ний J[q , r ] в точке (q , r ) не больше некоторого из множества значений J[q, r ] (соответственно, некоторого из множества достижимых для 1-го игрока значений J[q, r ]) в каждой из точек (q, r ), q G(r ).

Если учесть, что множество A-равновесий в любых однозначных играх

не пусто (во всяком случае, с любой заданной точностью), то естественно ожидать и всегда существующих модификаций этого равновесия на случай многозначных игр. Чтобы дать представление о подобных модификациях, дадим две характерные модификации, основанные на понятии огибающей, весьма полезные с точки зрения приложений, как это видно из приведенных

ниже примеров.

Определение 3.7.Ситуацию (q , r ) G назовем оптимистической Aopt1 - экстремальной, если в формулировке определения 2 неравенство (1) (соответственно, (1a)) заменить следующим

J

q, r

J

q , r

]

.

[

ˆ] ≥

[

 

(3 4)

(соответственно, следующим

 

 

] ≤

 

 

q , r

 

.

. a

J q, r

J

])

 

[

 

 

(3 4 )

Ситуацию (q , r ) G назовем ситуацией оптимистического Aopt-равновесия, если неравенства (3.4) и (3.4a) удовлетворяются одновременно, т.е. если

A

opt

4 opt

opt

 

= A1

∩ A2 .

Определение 3.8.Ситуацию (q , r ) G назовем пессимистической Ap1- экстремальной (соответственно, Ap2-экстремальной), если в формулировке

определения 3.4 неравенство (3.1) (соответственно, (3.1a)) заменить следующим

 

 

q, r

 

 

q , r

 

.

J

J

]

[

ˆ] ≥

[

 

(3 5)

(соответственно, следующим

J q, r

] ≤

J

q , r

])

.

. a

[

 

 

(3 5 )

209

Ситуацию (q , r ) G назовем ситуацией пессимистического Ap- равновесия, если неравенства (3.5) и (3.5a) удовлетворяются одновременно,

ò.å. åñëè

A

p

4 p

p

 

 

= A1

∩ A2.

Замечание 3.2. Определение 3.4 содержит в себе в качестве частных случаев не только определение A-равновесия для однозначных задач, но и

определения 3.5 и 3.6, а следовательно, если установлены некоторые условия существования Aopt- è Ap-равновесий, то по крайней мере те же условия су-

ществования выполняются и в отношении многозначного A-равновесия. Если же учесть, что равновесия Aopt è Ap существуют, по крайней мере, с любой заданной точностью ε в любых игровых задачах (что подтверждает нижеследующая теорема, доказанная в отношении равновесия Ap, причем доказа- тельство существования равновесия Aopt проводится аналогично), то станет ясно, что доказывать какую-либо теорему существования многозначного A-

равновесия, вообще говоря, нет необходимости.

Определения 3.5 и 3.6 допускают усиление, аналогичное тому, каковым явилось, например, определение 3.5 по отношению к определению 3.4. Причем полученное в результате усиление, в свою очередь, может быть усилено точно так же, как определение 3.5 усилено определением 3.6. Приведем, так сказать, первую ступень подобного усиления.

Определение 3.9.Ситуацию (q , r ) G назовем оптимистической сильнозависимой седловой точкой, если

 

[q , r] ≤

 

[q , r ], r A(q ), J[q , r ] ≤ J[q, r ], q A(r ).

 

J

J

(3.6)

Определение 3.10.Ситуацию (q , r ) G назовем пессимистической сильнозависимой седловой точкой, если

J[q , r] ≤ J[q , r ], r A(q ),

J

[q , r ] ≤

J

[q, r ], q A(r ).

(3.7)

Определения 3.9 и 3.10, очевидно, могут быть усилены заменой в них множества A на множество G, что приведет к определениям оптимистической

и пессимистической многозначной (достижимой) седловой точки. А в каче- стве теорем существования этих последних равновесий могут рассматриваться все известные теоремы существования (по Роузу Нэшу) дëя однозначных

функционалов, когда их условиям удовлетворяют верхняя ( J) и нижняя (J) огибающие многозначного функционала J. Правда, проверка этих условий в

отношении огибающих, во-первых, далеко не всегда может оказаться практически доступной, а во-вторых, едва ли существует практический пример

210