Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1smol_yakov_e_r_metody_resheniya_konfliktnykh_zadach-1

.pdf
Скачиваний:
4
Добавлен:
19.11.2019
Размер:
1.15 Mб
Скачать

Правда, эти теоремы теряют свою конструктивность при формальном их переносе на равновесия (4.3) и (4.4), во-первых, вследствие трудностей в проверке топологических свойств огибающих и, во-вторых, потому, что в многозначных играх огибающие обычно разрывны.

Теорема 4.1. В игре с компонентно замкнутыми функционалами Ji[q],

i = 1, N существует равновесие (4.6) с любой заданной точностью ε.

Доказательство. Вследствие ограниченности функционалов Ji, i =

1, N, величина

0

4

sup

inf J1[q

1

; q1

]

J1

=

 

 

q1

P rQ1 G q1

G(q1)

 

 

 

 

 

 

 

 

 

 

конечна, причем из самого определения этой величины следует, с одной стороны, что для любого ε1 > 0 найдется стратегия q1 P rQ1 G, такая, что

inf

J

 

[

q1

;

q

 

] ≥

J0

ε

,

(4.8)

q1 G(q1ε1 )

 

1

 

 

1

1

1

 

 

откуда следует

J1[q1; q1 ] ≥ J10 − ε1, q1 G(q1 ).

(4.9)

С другой стороны, из определения числа J0

Q

1 следует, что если

1 означает

множество всех стратегий q1 , удовлетворяющих неравенству (4.8), то для

любой (допустимой) стратегии q1 P rQ1 G − Q1

найдется стратегия 1

G(q1), такая, что

 

J1[ˆq1; q1] ≤ J10 − ε1.

(4.10)

Из неравенств (4.9) и (4.10) следует

 

J1[ˆq1; q1] ≤ J10 − ε1 J1[q1; q1 ].

Однако из последних неравенств, если их сравнить с неравенством (4.6) при

i = 1, следует, что любая ситуация (q1; q1 ) G, ãäå q1 G(q1 ), оказыва- ется пессимистической Ap1-экстремальной с точностью ε1. Далее, рассмотрим

величину

0

4

sup

inf

J2[q3 . . . qN ; q1 ; q2],

(4.11)

J2

=

 

 

q2 P rQ2 G(q1ε1 ) (q3...qN ) G(q1 ,q2)

 

 

из самого определения которой следует, по аналогии с вышепроведенным рассмотрением величины J10, что для любого ε2 > 0 найдется стратегия q2 P rQ2 G(q1 ), такая, что

J2[ˆq3 . . . qˆN ; q1 ; q2] ≤ J20 − ε2 J2[q3 . . . qN ; q1 ; q2 ].

81

С учетом определения 4.9 отсюда получаем, что все ситуации (q3 . . . qN ; q1 ; q2 ) G(q1 , q2 ) оказываются пессимистическими Ap2-экстремальными

с точностью 1, ε2). А поскольку множество G(q1 , q2 ) является подмно-

жеством множества G(q1 ), которое, как показано выше, является пессими- стическим Ap1-экстремальным с точностью ε1, то отсюда следует, что любая

ситуация из множества G(q1 , q2 ) оказывается одновременно пессимистиче- ñêîé Ap1- è Ap2-экстремальной с точностью 1, ε2). Продолжая этот процесс,

получаем точку (q1 , . . . , qN ) G, которая оказывается пессимистической

p

4

 

 

 

 

 

, . . . , εN )

äëÿ âñåõ

i = 1, N

, т.е. оказы-

Ai -экстремальной с точностью

ε = (ε1

 

 

вается ситуацией пессимистического Ap-равновесия с точностью ε . Аналогичным образом доказывается также и следующая теорема:

Теорема 4.2. В игровой задаче с ограниченными замкнутыми функционалами Ji[q], i = q, N существует многозначное A-равновесие с любой заданной точностью ε.

Поскольку наиболее простой иллюстрацией использования многозначных равновесий является какая-либо простая антагонистическая игра, то именно пример подобной игры и приводится ниже. Однако, чтобы облегчить применение многозначных равновесий в случае антагонистических игр, приведем краткие сводки вида изложенных выше многозначных равновесий для случая подобных игр.

В самом деле, использовать непосредственно определения 4.4 4.9 в отношении антагонистических игр не очень-то удобно, если учесть, что в этих играх по существу всего одна платежная функция. В связи с этим введем

платежную функцию в антагонистической игре в виде J(q, r), ãäå q стратегия игрока, заинтересованного в минимизации функции J, à r стратегия игрока, заинтересованного в максимизации J. Ниже приводятся лишь аналоги неравенств (4.1)-(4.6) в приложении к антагонистическим играм. Попрежнему через G обозначается допустимое множество стратегий игроков,

ò.å. (q, r) G Q × R, где множества Q è R играют роль множеств Qi.

В случае антагонистических игр равновесия (4.1)-(4.6) задаются, соответственно, следующими неравенствами:

J q, r

] ≤

J

q , r

, J

q, r

J

q , r

];

. a

[

]

[

ˆ] ≥

[

 

(4 1 )

J[q , r] ≤ J[q , r ] ≤ J[q, r ], q G(r ), r G(q );

 

[q , r] ≤

 

[q , r ],

r G(q ), J[q, r ] ≥ J[q , r ], q G(r );

J

J

J[q , r] ≤ J[q , r ],

r G(q ),

 

[q, r ] ≥

 

[q , r ], q G(r );

J

J

(4.2a) (4.3a) (4.4a)

82

q

6 F

G

- r

OE

Ðèñ. 1.6

 

 

 

] ≤

 

 

q , r

, J

q, r

J

q , r

 

 

. a

 

 

J q, r

J

];

)

 

 

[

]

[

ˆ] ≥

 

[

 

(4 5

 

J q, r

] ≤

J

q , r

, J

q, r

J

q , r

]

.

. a

)

 

 

[

]

[

ˆ] ≥

[

 

 

(4 6

Пример 4.1. Рассмотрим антагонистическую игру на области

G, ïðåä-

ставляющей собой половину (треугольную область OEF ) квадрата Q × R =

[0, 1] × [0, 1] в первой четверти прямоугольной системы координат

{q, O, r}

с началом в точке O (рис. 1.6). 1-й игрок, выбирая чистую стратегию q на множестве P rQG èëè G(r), минимизирует функцию J = q/r, а 2-й игрок, выбирая r P rRG èëè r G(q), максимизирует J. В точке O начале системы координат {O, r, q} функция J многозначна и принимает значения из промежутка [0,1].

Множество многозначных A-равновесий и множество пессимистических Ap-равновесий совпадают в этой задаче со всем множеством G = OEF , а множество оптимистических Aopt-равновесий сводится к одной точке O:

Aopt1 = OE, Aopt2 = G \ (O; E], Aopt = Aopt1 ∩ Aopt2 = Aopt2 = O,

Как множество многозначных седловых точек, так и множество оптимистических седловых точек состоят каждое из одной точки O, а множество

пессимистических седловых точек сосредоточено на отрезке OE. Точка O,

устойчивая в смысле любого из рассмотренных выше равновесий, наиболее предпочтительна для обоих игроков.

83

ГЛАВА 2. КОНФЛИКТНЫЕ ЗАДАЧИ СО МНОГИМИ УЧАСТНИКАМИ

Если в предыдущей главе рассматривались задачи только с двумя участниками, то в этой главе число участников предполагается произвольным. Это требует обобщения большинства из введенных выше понятий конфликтного равновесия на задачи с любым числом участников, причем такого обобщения, при котором все (без исключения) вышеизложенные понятия оказывались бы частным случаем вновь предлагаемых.

Напомним, что классическая теория некооперативных игр [12, 13] базируется по существу лишь на понятии равновесия по Роусу Нэшу [102, 106], явившемся естественным обобщением понятия классической седловой точки. К сожалению, прикладные возможности теории, основанной на этом понятии, оказались весьма ограниченными как в связи с тем, что это равновесие существует в очень ограниченном классе задач, так и в связи с тем, что оно, как правило, определяет далеко не наиболее предпочтительную для всех участников ситуацию, как это было показано во введении на примере игрыДилемма заключенного . Так что при исследовании различного рода конфликтов опираться только на равновесие по Роусу Нэшу весьма неразумно. Необходимы и другие понятия равновесия (не вносящие в игру каких-либо искусственных норм поведения). И при разрешении конфликтных ситуаций следует опираться на наиболее сильное (среди существующих в рассматриваемой задаче) равновесие, которое в наибольшей степени устраивает всех участников и которое любые из участников и любые коалиции из них не имели бы реальных шансов улучшить для себя.

С учетом того, что моделирование экономического развития стран и регионов широко проводится с использованием теории игр, необходимо обеспечить в первую очередь, чтобы сама эта теория была надежным инструментом, приводящим к эффективным и достойным доверия экономическим решениям, устраивающим всех, чего, к сожалению, не скажешь о классиче- ской теории игр, основанной по существу лишь на равновесии по Нэшу и на некоторых максминах, не имеющих никакого отношения к понятию игровой устойчивости (игровому равновесию).

Изложенная выше для двух участников, а в этой главе для любого числа участников теория конфликтных равновесий позволяет находить решение любых игровых задач, причем в большинстве случаев единственное, обеспечивающее всем участникам устраивающие их выигрыши, которые они не

84

в состоянии улучшить для себя, поскольку это решение, представляющее собой наиболее сильное среди существующих в рассматриваемой задаче равновесий, обладает наисильнейшей устойчивостью к возможным отклонениям участников от него. В некоторых задачах подобным равновесием может оказаться и равновесие по Нэшу.

В первой главе было доказано, что, поскольку A-равновесие никогда не

пусто, то любая игровая задача всегда имеет равновесие (решение), в каче- стве которого может быть взято одно из найденных наисильнейших, роль которых, в крайнем случае, может играть никогда не пустое множество A.

А чтобы любая задача имела единственное решение, необходимо располагать достаточно богатой базовой системой равновесий, поиск которой, однако, к настоящему времени еще не завершен.

1. Базовая и расширенная системы симметричных равновесий для задач со многими участниками

Допущения 1.1. Пусть Qi, i = 1, N, метрические пространства, а G компактное множество в их произведении Q1 ×. . .×QN , и пусть на множестве G определены непрерывные функции (функционалы) Ji(q), i = 1, N, q = q1 . . . qN G.

Пусть P rQiG проекция множества G на пространство Qi, à G(qi) è G(qi)сечения (срезы) множества G.

Предполагается, что i-й игрок, выбирая стратегию (состояние) qi èç ïðî-

екции P rQiG множества G на пространство Qi или из доступного ему сече- íèÿ G(qi), ãäå qi = q1 . . . qi−1qi+1 . . . qN , стремится обеспечить максимум своей платежной функции Ji(q), i = 1, N. Положим Ji = P Jk.

k6=i

Допускается объединение игроков в любые коалиции, прич¼м в любой кон- фликтной задаче любая коалиция Pk, составленная из произвольного числа

k участников, выбирая стратегию (состояние) qPk из проекции P rQPk G ìíî- жества G на пространство QPk или же из доступного этой коалиции сечения G(qPN−k ), ãäå qPN−k произвольная стратегия остальных (N −k) участников, всегда заинтересована в достижении максимума своей платежной функции

P

JPk (q) = Ji.

i Pk

Предварительно построим семейство базовых равновесий, получающееся в случае, когда на любые действия любого игрока-одиночки все остальные

85

реагируют совместно (объединив свои действия против этого игрока). В основу построения иерархических цепей из равновесий снова положим понятие

A-равновесия.

Определение 1.1.Ситуацию (точку) q G назовем Ai-экстремальной, åñëè èëè G(qi ) = qi , или каждой стратегии qi G(qi ) \ qi этого игрока можно поставить в соответствие по крайней мере одну ответную стратегию qˆi = qˆi < qi > остальных N − 1 игроков, такую, чтобы

J

qi, q

i) ≤

J

i(

q

)

.

.

 

i

 

 

 

(1 1)

Обозначая через Ai множество всех Ai-экстремальных ситуаций, ситуацию (точку) q G назовем ситуацией симметричного слабого активного

равновесия или, короче,

A

-равновесием, если

4

.

 

 

q A1 ∩ . . . ∩AN = A

 

Множество естественных симметричных усилений наислабейшего понятия A-равновесия дается нижеследующими определениями, понятным образом

обобщающими аналогичные им понятия равновесий (1.1.2)-(1.1.12) из первой главы .

Определение 1.2. Ситуацию q Ai назовем Bi-экстремальной, åñëè она удовлетворяет условию

 

max

Ji(q , qi) = Ji(q ).

 

 

 

(1.2)

 

qi

A

(q )

i

 

 

 

 

 

 

 

i

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

N

4

 

 

Назовем ситуацию

q G B

-равновесием, если

q

iT

, ãäå

Bi

 

 

 

Bi = B

 

 

 

 

 

 

 

 

=1

 

 

 

множество всех Bi-экстремальных ситуаций.

Множество Bi-экстремальных ситуаций ищется следующим образом. При любом выборе i-игроком своей стратегии qi из множества P rQiAi (ò.å. èç ïðî- екции множества Ai íà Qi) остальным участникам, образующим коалицию из N − 1 игроков, он предоставляет возможность выбрать наилучшую для них совместную стратегию qi в сечении Ai(qi), приводящую к ситуации (qi, qi ), в которой достигается максимум их совместной функции Ji(qi, qi ). Иначе говоря, i-й игрок при любом выборе своей стратегии предоставляет остальным

две очень благоприятные для них возможности: во-первых, возможность выбрать наиболее выгодные для них ситуации и, во-вторых, сделать им этот

наивыгоднейший для них выбор именно на множестве Ai, т.е. на множестве, на котором они полностью контролируют i-го игрока, не позволяя ему покинуть это множество (что следует из самого определения множества Ai). Множество же Bi представляет собой объединение всех подобных ситуаций

86

Ci. Îòñþ-

(наивыгоднейших для остальных участников), определяемых в каждом из всех возможных сечений Ai(qi).

А одно из возможных естественных усилений B-равновесия дается следу-

ющим определением.

Определение 1.3. Ситуацию q Ai назовем Ci-экстремальной, åñëè она удовлетворяет условию

 

 

max

Ji(q , qi) = Ji(q ).

 

 

 

(1.3)

 

 

qi

 

G(q )

i

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

4

 

 

Ситуацию

q G

назовем

C

-равновесием, если

q

iT

, ãäå

Ci

 

 

 

 

 

Ci = C

 

множество всех Ci-экстремальных ситуаций.

 

 

 

 

 

 

 

 

 

 

 

 

=1

 

 

 

Поиск множества Ci проводится авналогично поиску множества Bi, íî ñî следующими особеностями. При любом выборе i-м игроком своей стратегии

qi остальным игрокам предоставляется возможность найти максимум своей

плат¼жной функции Ji во вс¼м сечении G(qi). И если только этот максимум оказывается также и в сечении Ai(qi), то ситуация (qi, qi ), в которой

этот максимум достигается, считается принадлежащей множеству

да уже следует, что множество Ci может быть всего лишь частью множества

Bi, представляя собой объединение лишь тех ситуаций, максимумы которых, найденные в сечениях G(qi), оказались принадлежащими одновременно и се- чениям Ai(qi). Так что, очевидно, далеко не всегда максимум функции Ji â сечении G(qi) оказывается одновременно и максимумом в сечении Ai(qi), а следовательно, множество Bi не может быть меньше множества Ci. Заметим, что лишь в случае двух участников C-равновесие напоминает равновесие по

Íýøó.

Следующие два определения совершенно естественным образом усиливают, соответственно, понятия B- è C-равновесий.

¯

Определение 1.4. Ситуацию q Bi назовем Di-экстремальной, если она удовлетворяет условию:

max Ji(q) = Ji(q ),

q Bi

или (что то же самое, но только в разв¼рнутом виде) условию

 

max

Ji(Arg

max

Ji(qi, qi)) = Ji(q ),

(1.4)

 

qi P rQiAi

qi Ai(qi)

 

 

 

 

 

 

 

N

 

4 ¯ .

 

и назовем ее ¯

-равновесием, если

q

iT

¯

 

D

 

 

Di = D

 

 

 

 

 

=1

 

 

 

87

B0-экстремальных ситуаций да¼тся определением:
в (1.4), выбирает наилучшую для себя ситуацию

Если в определении Bi-экстремальных ситуаций предполагается, что i-й игрок (при любом сво¼м выборе допустимой стратегии) предлагает остальным участникам, образующим коалицию из N − 1 игроков, выбрать наилуч- шие для них ситуации, то в определении 1.4 он теперь уже сам из отобранных остальными участниками ситуаций, являющихся аргументами функции Ji(·)

q , обеспечивающую ему максимальный выигрыш Ji(q ). Очевидно, аргументом (Arg) функции Ji â левой части равенства (1.4) является множество Bi, определяемое равенством

(1.2). Совершенно аналогичный смысл имеет и следующее определение.

Определение 1.5. Ситуацию q Ci назовем Di-экстремальной, åñëè

 

 

 

max Ji(q) = Ji(q ),

 

 

 

 

(1.5)

 

 

 

q Ci

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

q

N

4

 

 

 

 

 

 

и назовем ее

 

-равновесием, если

 

.

 

 

 

 

 

 

D

 

 

 

 

i=1 Di = D

 

 

 

 

 

 

В задачах, в которых множество B

пусто, а следовательно, автоматически

T

 

 

 

 

¯

 

 

оказываются пустыми и любые его усиления множества C, D è D, следует

попробовать найти множество

B0, являющееся обобщением (расширением)

множества B, вводимое следующим определением:

 

 

 

 

 

Определение 1.6. Ситуацию q A назовем Bi0

-экстремальной, если

она удовлетворяет условию

 

 

 

 

 

 

 

 

 

 

 

 

 

 

max

Ji(q , qi) = Ji(q ).

 

 

 

(1.6)

 

 

 

qi A(q )

 

i

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

4

 

 

 

Назовем ситуацию

q G B0

-равновесием, если

q

Bi0

, ãäå

Bi0

 

 

 

 

 

 

 

 

 

= B0

 

 

 

 

 

 

 

 

 

 

 

=1

 

 

 

 

множество всех Bi0

-экстремальных ситуаций.

 

iT

 

 

 

 

Смысл B0-равновесия аналогичен смыслу B-равновесия. Различие в их

поиске только в том, что если Bi-экстремальные ситуации ищутся на множе- ñòâå Ai, то любые из Bi0-экстремальных ситуаций ищутся на одном и том же множестве A ïðè âñåõ i.

Естественное усиление

Определение 1.7. Ситуацию

она удовлетворяет условию

qi P rQiA

i

 

max J

 

Arg

и назовем ее D0-равновесием, если

q A назовем Di0-экстремальной, если

max Ji(q) = Ji(q ), (1.7)

qi A(qi)

 

N

4

 

q

Di0

.

= D0

 

 

iT

 

 

 

=1

 

 

88

Следующее определение гораздо сложнее всех предшествующих определений понятий конфликтного равновесия и поэтому рекомендуется к применению только в указанном ниже исключительном случае.

Определение 1.8. Ситуацию q Ai назовем D¯i0

-экстремальной, если

max

Ji(Arg max

Ji(q)) = Ji(q ), i = 1, 2, ...N.

(1.8)

qi Ai(qi )

qi Ai(qi)

 

 

 

 

 

 

 

 

N

 

Назовем ситуацию q базовым D¯ 0

-равновесием, если q

k=1 k0 .

 

Если множества D, D¯ è D0 оказываются пустыми (при

T

 

 

 

 

 

непустом множестве

B), то имеет смысл проверить все ситуации из множества B на возможность

принадлежности их к множеству ¯ 0-равновесных ситуаций. Поскольку аргу-

D

ментом функции Ji в (1.8) являются элементы множества Bi, то, следователь-

íî, ¯ 0-равновесные ситуации образуют подмножество множества

D B, которое,

как правило, состоит из небольшого числа ситуаций, а следовательно, проверка этого незначительного числа точек на их возможную принадлежность

к множеству ¯ 0-равновесных ситуаций не окажется чрезмерно трудо¼мкой.

D

Если же в конфликтной задаче оказывается, что множество B0 не пусто, но

¯ 0, 0, ¯

пусты все или почти все множества B, D D D, D, то следует проверить все ситуации из множества B0 на возможность принадлежности их к определ¼н- ному ниже множеству DA-равновесных ситуаций, которое столь же сложно

определяется и ищется, как и множество ¯ 0-равновесных ситуаций.

D

Определение 1.9. Ситуацию q A назовем DiA-экстремальной, åñëè

max

Ji(Arg max Ji(q)) = J(q ), i = 1, 2, ...N.

(1.9)

qi A(qi )

qi A(qi)

 

N

Назовем ситуацию q базовым DA-равновесием, если q T DiA.

k=1

Из определения мнрожества DA-равновесных ситуаций видно, что аргу-

ментом функции Ji служит множество Bi0-экстремальных ситуаций, а следовательно, искать множество DA-равновесных ситуаций следует на множестве

B0-равновесных ситуаций, которое, как правило, состоит из небольшого числа точек.

¯0-равновесием, если

Определение 1.10. Ситуацию q A назовем C

 

max Ji(qi , qi) = Ji(q ), i =

 

 

 

qi

1, N,

(1.10)

A(qi )

 

 

 

 

ãäå qi = (q1, . . . , qi−1, qi+1, . . . , qN ).

89

Заметим, что ситуация q G называется равновесной по Нэшу (бу-

дем называть ее ¯N

C -равновесием), если в определении 1.10 множество A заменить на множество G.

Привед¼нные 10 понятий конфликтного равновесия составляют основную базовую систему равновесий, которая позволяет с помощью доказанных ниже аналогов теорем 1.1.6 и 1.1.7 из главы 1 в подавляющем большинстве задач находить единственное наисильнейшее равновесие. Однако, поскольку найти единственное наисильнейшее равновесие с помощью указанных средств не всегда уда¼тся, то полезными являются как три следующих определения понятий равновесия, так и, в особенности, множество привед¼нных после них понятий коалиционного равновесия, по существу почти всегда оказывающихся необходимыми при решении задач с тремя и более участниками.

ˆ0

Определение 1.11. Ситуацию q A назовем Ci-экстремальной, åñëè образующая ее коалиционная стратегия остальных игроков, исключая i-го, удовлетворяет условию

 

 

max Ji(qi, qi ) = Ji(q ), i = 1, . . . , N.

 

 

(1.11)

 

 

qi G(qi )

 

 

 

 

Ситуацию q

 

G назовем Cˆ0-равновесием, если q

N

Cˆ0

, ãäå Cˆ0

 

 

iT

ìíî-

жество всех ˆ

 

i

i

 

 

 

 

 

 

 

 

 

=1

 

 

 

 

Ci0

-экстремальных ситуаций.

 

 

 

 

Легко заметить, что ˆ0-равновесие находится в том же отношении к

C C-

0-равновесие к ˆ 0-равновесие равновесию, как B B-равновесию, а следующее D

0-равновесие к ¯ находится в том же отношении к D-равновесию, как и D D-

равновесию.

ˆ0 назовем ˆ 0-равновесием, если

Определение 1.12. Ситуацию q C D

max Ji(q) = Ji(q ), i = 1, 2, ..., N.

(1.12)

q Cˆi0

 

Следующее определение DG-равновесия по форме является полным анало- ãîì DA-равновесия. А по существу, оно представляет собой незначительное обобщение D-равновесия, совпадающее всегда с этим последним на выпуклых множествах G. Однако, если принадлежность некоторой ситуации q ê DA-равновесию проверяется, как правило, в очень небольшом числе точек, образующих множество B0, то искать DG-равновесные ситуации следует на вс¼м множестве G, что представляет собой крайне сложную задачу. Прич¼м даже в случае непустоты множества DG поиск этих равновесий едва ли может оправдать целесообразность затраченного на этот поиск труда.

90