Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1smol_yakov_e_r_metody_resheniya_konfliktnykh_zadach-1

.pdf
Скачиваний:
4
Добавлен:
19.11.2019
Размер:
1.15 Mб
Скачать

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ им. М.В.ЛОМОНОСОВА

Факультет вычислительной математики и кибернетики

Э.Р.Смольяков

МЕТОДЫ РЕШЕНИЯ КОНФЛИКТНЫХ ЗАДАЧ

МОСКВА 2010 г.

1

ÓÄÊ 518.9(075.8) ÁÁÊ 22. 18ÿ73 Ñ51

Печатается по решению Редакционно-издательского совета факультета

Вычислительной математики и кибернетики МГУ им. М.В.Ломоносова

Рецензенты:

Академик РАН, д.ф.-м.н., профессор А.Б.Куржанский, д.т.н., профессор Е.Н.Хоботов

Смольяков Э.Р.

С51 Методы решения конфликтных задач: Учебное пособие. М.: Издательский отдел факультета ВМиК МГУ им. М.В.Ломоносова (лицензия ИД N 05899 от 24.09.2001 г.); МАКС Пресс, 2010. 244с.

ISBN 978-5-89407-413-9

ISBN 978-5-317-03192-3

Излагаются теория и практические методы решения любых конфликтных задач, составляющие основу курса лекций автора, читаемого им на факультете Вычислительной математики и кибернетики МГУ им. М.В.Ломоносова и позволяющего в рамках единой теории находить единственное решение всевозможных игровых задач антагонистических, некооперативных, кооперативных и иных типов в противоположность классической теории игр, в которой задачи разных типов традиционно изучались независимо друг от друга и зачастую для них не удавалось найти не только единственное, но и хотя бы какое-нибудь удовлетворительное решение.

Учебное пособие для студентов и специалистов математиков, физиков, экономистов и политиков.

ÓÄÊ 518.9(075.8)

ÁÁÊ 22.18ÿ73

ISBN 978-5-89407-413-9

ISBN 978-5-317-03192-3

c Факультет вычислительной математики и

кибернетики МГУ имени М.В.Ломоносова

c Э.Р.Смольяков

Введение

Со времени зарождения теории игр, за которое наиболее естественно принять 1928 г., когда Дж.Нейманом впервые было со строго математических позиций сформулировано понятие седловой точки в чистых и смешанных стратегиях, л¼гшее в основу понятия решения антагонистических игр, и до сих пор наиболее важными для прогресса теории игр и конфликтов и в то же время наиболее трудными с точки зрения их поиска являлись математи- ческие формулировки понятий конфликтного равновесия, не навязывающие участникам каких-либо искусственных норм поведения.

Êчислу первых подобных формулировок игрового равновесия можно, пожалуй, отнести всего лишь три, ставших классическими, предложенных Дж.Нейманом в 1928 г. [103, 33], Дж.Нэшем в 1951 г. [102] и Э.Вайсбордом

â1974 г. [9]. Безусловно, заслуживает особого внимания также теория гарантированных результатов Ю.Б.Гермейера, построенная им в 1971 1976 г. [14] и содержащая по существу некоторые предпосылки для последующего поиска игровых равновесий, хотя в ней и не было предложено каких-либо новых принципов игровых равновесий.

Однако перечисленных, казавшихся удовлетворительными с математиче- ской и интуитивной точек зрения, понятий равновесия (решения) игры было явно недостаточно, чтобы хотя бы в минимальной степени обеспечить запросы практики (и в особенности экономики). Многочисленные попытки применения этих игровых равновесий в рыночной экономике зачастую приводили к неудовлетворительным результатам, что обусловлено тем, что эти равновесия пытались применять для разрешения любых конфликтных ситуаций, не считаясь с содержательно довольно ограниченными возможностями этих равновесий, которые допустимо и полезно было бы использовать только

âкомплексе с другими понятиями равновесия, которые ещ¼ не были известны.

Êсожалению, упомянутые равновесия существуют лишь в очень ограни- ченных классах игровых задач, прич¼м, когда существуют, нередко оказываются неединственными в игре. И эта их неединственность создала в среде специалистов по теории игр даже иллюзию, будто бы для игровых задач множественность решений неизбежна и естественна. К тому же, равновесие по Нэшу, например, даже когда существует и единственно в игре, нередко может быть абсолютно неприемлемо одновременно для всех участников вследствие того, что это равновесие может указать на самую худшую для всех

3

участников ситуацию. (как это демонстрируется, к примеру, на стр. 9 в [74]). Нельзя сказать, что классические понятия равновесия неудовлетворительны. Наоборот, они кажутся весьма логичными и красивыми. Но беда в том, что их далеко не достаточно, чтобы решать с их помощью любые конфликтные задачи. Есть задачи, использование в которых классических равновесий да¼т превосходный результат. Но подобные задачи являются, скорее, редким исключением, чем правилом. И дело здесь в том, что для решения любых задач необходимо располагать достаточно богатой базовой системой естественных понятий конфликтного равновесия, применение которой к любой задаче должно приводить к единственному е¼ решению.

Отсутствие удовлетворительных определений равновесия (и недостаточ- ность их числа) и являлось основным тормозом в разработке эффективной для широкого круга приложений теории игр и конфликтов. Заметим, что теорию игр и конфликтов можно сделать удовлетворительной только в том случае, если в этой теории имеется понятие слабого конфликтного равновесия, существующего в любых конфликтных задачах, поскольку в этом случае открывается возможность вводить любые другие понятия более сильных конфликтных равновесий (не содержащих в себе каких-либо искусственных норм поведения участников), не интересуюсь вопросами их существования. При таком построении теории оказывается, что любая конфликтная задача всегда имеет наисильнейшее равновесие (решение). А вопрос о его единственности в этом случае начинает зависеть по существу только от числа используемых базовых понятий равновесия. Эта идеология построения общей теории игр и конфликтов и была заложена в монографии [74] и расширена в данном издании.

Следует заметить, что поиск новых понятий игрового равновесия, не вносящих в игру никаких искусственных норм поведения, является задачей весьма трудной, на что указывает хотя бы то, что прогресс теории игр в 20-м столетии, несмотря на усилия большого числа математиков, в том числе всемирно известных, был более чем скромен. И лишь с 80-х годов 20 века наметилась положительная тенденция и удалось получить, опираясь на классиче- ские равновесия, множество новых понятий игрового равновесия [46, 55, 74], которые позволили находить наисильнейшие равновесия, т.е. наиболее устой- чивые и наиболее приемлемые для всех участников решения любых игровых задач антагонистических, некооперативных, кооперативных, статических, динамических и иных типов, прич¼м решать любые типы игр с единых позиций, а не так, как приходилось делать в классической теории игр, где для

4

каждого типа игр искали свои специфические понятия равновесия.

Понятно, что игры, обладающие какой-либо симметрией относительно участников, теоретически могут иметь много наисильнейших равновесий. И ожидать единственности решения в любых подобных играх было бы нелогично ни от какой сколь угодно разумно построенной системы равновесий. А вот если игра имеет хоть какую-то асимметрию относительно участников, то, представляется, разумно построенная система понятий равновесия должна обязательно привести всего к единственному наисильнейшему равновесию (а следовательно, и решению) в подобной игре. И это единственное решение могла бы обеспечить некоторая "полная"(по аналогии с полнотой системы собственных функций в гильбертовом пространстве) система понятий равновесия. Поиск подобной "полной"системы (но состоящей из конечного множества понятий равновесия) по существу и являлся основной целью работ [40-83] в области конфликтных задач. Теорию игр можно будет считать концептуально заверш¼нной только тогда, когда в любых игровых задачах, даже со сколь угодно малой стратегической асимметрией относительно участников, удастся находить единственное наисильнейшее равновесие.

Поскольку предлагаемая в данной книге система конфликтных равновесий всегда содержит в сво¼м составе наислабейшее A-равновесие, существующее

в любых задачах с любыми плат¼жными функциями в произвольных пространствах, а все остальные равновесия строятся как усиления этого всегда существующего равновесия, то вопрос о существовании решения в любой игре оказался полностью закрытым независимо от того, в каких задачах и при ка-

ких условиях существуют любые из равновесий, усиливающих A-равновесие. Прич¼м с точки зрения всевозможных приложений излагаемой теории вопрос о существовании любых равновесий, усиливающих A-равновесие, не

представляет никакого практического интереса, если построена достаточнополная система усиленных равновесий, поскольку в подобной системе наиболее сильное из существовующих в задаче равновесий и будет играть роль наисильнейшего равновесия. В крайнем случае, эту роль могут исполнять всегда существующие A-равновесия, получающиеся в результате некото-

рой итерационной процедуры, проводимой над множеством A. А вот вопрос

о единственности наисильнейшего равновесия (решения) хотя уже и существенно продвинут , но вс¼ же оста¼тся пока ещ¼ не реш¼нным до конца и по сей день и может быть закрыт только с нахождением полной системы равновесий или же при каких-то принципиально иных подходах к поиску понятий решения конфликтных задач, которые, возможно, будут предложены

5

когда-нибудь в будущем.

По существу началом теории игр можно считать работу Дж.Неймана [103], в которой он, анализируя антагонистическую игру (т.е. игру, в которой один из игроков выигрывает то, что проигрывает другой), вводит понятие платеж-

ной функции J игроков в классе так называемых чистых (естественных)

или же смешанных (вероятностных) стратегий, которую один из игроков максимизирует, а другой минимизирует, и формулирует, например, в классе чистых стратегий следующее уравнение, позволяющее находить оптимальную чистую стратегию каждого из игроков

min max J(u, v) = J(u , v ) = max min J(u, v),

(0.1)

u U v V

v V u U

 

ãäå u чистая стратегия (т.е. точка во множестве его возможных выборов U) 1-го игрока, минимизирующего функцию J(u, v) (определяющую, например, его проигрыш в игре), а v чистая стратегия 2-го игрока, максимизи-

рующего эту функцию, определяющую его выигрыш в этой игре. Согласно Дж.Нейману пара стратегий (точек) (u , v ), удовлетворяющая равенствам

(0.1), образует равновесную ситуацию в игре, называемую седловой точкой, от которой ни один из игроков не пожелает отклониться, так как это лишь ухудшит его состояние. То, что эта пара действительно является решением антагонистической игры становится более наглядным из следующих равенств, которые, как показал Дж.Нейман, эквивалентны равенствам (0.1):

min J(u, v )

u U

= J(u , v ) = max J(u , v).

(0.2)

v V

 

Действительно, из правого равенства в (0.2) видно, что если 1-й игрок выбирает стратегию u , то 2-му необходимо выбрать стратегию v , максими-

зирующую функцию J(u , v) при заданной фиксированной стратегии u ; ïðè

этом любые попытки 2-го игрока отклониться от своей оптимальной стра- тегии v приведут к снижению его выигрыша. Аналогичные рассуждения

справедливы в отношении левого равенства в (0.2). Заметим, что ситуация (u , v ) оказывается пассивно устойчивой к отклонениям от нее любого из

игроков, пассивно в том смысле, что если, например, 1-й игрок выберет свою оптимальную стратегию u , то ему можно не беспокоиться о выборе стратегии

2-ым игроком, поскольку, согласно равенству (0.2), при любом выборе v 6= v

2-й игрок не сможет увеличить своой выигрыш по сравнению с выигрышем J(u , v ), который он получает в равновесной ситуации (u , v ).

К сожалению, это превосходное с содержательной и интуитивной точек зрения решение существует в весьма редких играх, что видно без какого-либо

6

математического доказательства хотя бы из того, что ситуация (u , v ), удовлетворяющая равенствам (0.1) и (0.2) (т.е. являющаяся минимумом функции J(u, v) по первой переменной и максимумом по второй) возможна только в том случае, если (в ее окрестности) функция J имеет вид конского седла ; но

функции, имеющие подобную геометрическую форму, сравнительно редко встречаются в практике игровых задач. Так что большая часть антагонисти- ческих игр не имеет классического решения вида седловой точки. Однако любой антагонизм все же имеет какое-то разрешение. Можно предположить, что найденное Дж. Нейманом решение это всего лишь одно из возможных решений антагонистических игр, а следовательно, необходимо искать ещ¼ и другие понятия игрового равновесия. Но, как показала дальнейшая история, находить новые понятия решения в теории игр оказалось чрезвычайно трудно.

Поиски нового, более общего решения типа седловой точки привели Дж.Неймана к идее смешанной стратегии . Смешанными называются стра-

тегии, задаваемые не точками на множествах U è V , а функциями распределения вероятности q(u) è r(v), определ¼нными на этих множествах, в соответствии с которыми и определяются конкретные реализации u è v, представляющие собой случайные числа, выпадающие в соответствии со случайными законами q(u) è r(v). При подобной постановке игры смешанные стратегии

действительно дают решение типа седловой точки в любой игре при условии, что исходная игра состоит из бесконечного числа повторяющихся партий. Если же игра состоит из одной или нескольких партий (что реально и имеет место в действительности), то едва ли найдутся игроки, которых удовлетворил бы случайный выбор, определяемый оптимальными смешанными

стратегиями (т.е. функциями распределения вероятности) q(u) è r(v). Òàê

что смешанные стратегии, к сожалению, все же не позволили решить проблему существования решения произвольной игры. Необходимо было искать иные понятия решения, причем не в классе каких-то там искусственно вводи-

мых функций (распределения вероятности) q(u) è r(v), а в классе исходных игровых переменных u è v, называемых чистыми стратегиями.

Заметим, что любая антагонистическая игра является по существу частным случаем некоторой неантагонистической (некооперативной) игры, в которой 2-й игрок, выбирая стратегию v V , максимизирует платежную функ-

öèþ J2(u, v) = J(u, v), а 1-й игрок, выбирая u U, минимизирует J1(u, v) = −J(u, v). При подобном представлении антагонистической игры понятие решения в форме седловой точки (0.2) может быть переписано в эквивалентном

7

¯N -равновесием), âî-
C
qj ,
Смысл равновесной ситуации

виде следующим образом

max J1(u, v ) = J1(u , v ),

max J2(u , v) = J2(u , v ).

u U

v V

А подобная запись привела Дж. Нэша в 1951 г. к следующему понятию решения некооперативных игр с N участниками, которое мы запишем в пере-

менных qi, под которыми можно подразумевать как чистые, так и смешанные стратегии, получившему название равновесия по Нэшу [102] (идея которого была, однако, предвосхищена С. Роусом [106]):

max Ji(qi , qi) = Ji(q ), i =

 

 

 

1, N,

(0.3)

qi Qi

 

ãäå Qi допустимое множество стратегий qi i-го игрока, qi = q1 . . . qi−1

qi+1 . . . qN совокупная стратегия всех игроков, исключая i-ãî (i = 1, N). q , удовлетворяющей равенствам (0.3) в том,

что любой i-й игрок не в состоянии улучшить ее для себя, если остальные N − 1 игроков согласны с этой ситуацией. Другими словами, можно еще сказать, что в ситуации q у любых N −1 игроков, не включающих в свой состав i-го игрока, имеется пассивная угроза в адрес i-го игрока, пассивная в том смысле, что если бы i-игрок отклонился от ситуации q в надежде повысить свой выигрыш, то ему не удалось бы этого достичь даже в условиях пассивности всех остальных игроков, сохраняющих неизменными свои стратегии

j 6= i.

В 1965 г. Дж.Розен [107] обобщил равновесие (0.3) на случай, когда игра происходит на произвольном выпуклом подмножестве G множества Q1 ×. . .× QN . В этом случае равенства (0.3) принимают вид

max Ji(qi , qi) = Ji(q ), i =

 

 

 

1, N,

(0.4)

qi G(qi )

 

ãäå G(qi ) сечение (срез) множества G, получающееся, если зафиксировать стратегию qi . К сожалению, равновесие по Нэшу как в форме (0.3), так и в форме (0.4) (которое, ради краткости, будем называть

первых, существует в очень узком классе игр и, во-вторых, в содержательном отношении не вполне удовлетворительно, на что указывает следующий пример некооперативной игры двух лиц под названием Дилемма заключенного [31], в которой выигрыши игроков задаются матрицами

J1 = "

1

100

#,

J2 = "

1

0

#.

 

0

90

 

 

100

90

 

8

Стратегия 1-го игрока это выбор одной из двух строк матрицы J1, à стратегия 2-го выбор одного из двух столбцов матрицы J2, так что, напри- мер, если 1-й игрок выбирает вторую строку, а 2-й игрок первый столбец, то в игре реализуется ситуация a21, в которой каждый из игроков получает выигрыш, равный единице (J1 = J2 = 1). Ситуация a21 равновесна по Нэшу в этой игре, так как единица в матрице J1 является максимумом в первом столбце, а единица в матрице J2 является максимумом во второй строке, а следовательно, эта ситуация удовлетворяет равенствам (0.3), причем она единственная равновесная по Нэшу в этой игре. В то же время совершенно очевидно, что ситуация a12, в которой каждый из игроков получает выигрыш, равный 90, гораздо выгоднее для них обоих. И несомненно, в реальной игре каждый игрок предпочтет ситуацию a12 в 90 раз менее выгодной равновесной по Нэшу ситуации a21. Заметим, что устойчивость ситуации a12 оказывается по существу не меньшей, чем ситуации a21, если вышеопределен- ные пассивные угрозы, характеризующие равновесие по Роусу Нэшу (0.3), дополнить рассмотренными ниже так называемыми активными угрозами игроков. Этот простейший пример наглядно демонстрирует, что равновесная по Нэшу ситуация a21 может быть совершенно неприемлема для игроков, в то время как неравновесная по Нэшу ситуация a12 весьма привлекательна для них обоих. Указанные две причины отсутствие в большинстве игр и содержательная неудовлетворительность равновесия по Нэшу вынуждали искать новые понятия равновесия. И в конце концов эти равновесия были найдены на пути создания теории так называемых активных равновесий [43 83]. Эта теория позволила находить приемлемое для всех игроков решение любых (антагонистических, некооперативных и кооперативных) игр и задач принятия или отказа игроков от сделанного им предложения, причем в большинстве из них находить единственное решение (наисильнейшее из существующих в задаче равновесий), которое, с одной стороны, обладает весьма сильной устойчивостью, а с другой, обеспечивает всем участникам также и наибольшие выигрыши, которые они не в состоянии улучшить для себя. Конечно же, в некоторых задачах подобным равновесием может оказаться и равновесие по Роусу Нэшу.

Как показала история, наиболее трудными для исследования оказались кооперативные игры. Некооперативные игры характеризуются тем, что их участники по тем или иным причинам не имеют возможности образовать кооперации с последующим разделом между ними полученного совместно выигрыша, и выигрыш каждого из них определяется исключительно полу-

9

ченным в результате игры значением его платежной функции. А в коопе-

ративных играх все игроки, действуя совместно, сначала находят суммар-

N

P

ный выигрыш, т.е. находят max Ji, что не представляет принципиальных

1=1

трудностей, а затем делят этот выигрыш между собой (в предположении, конечно, что выигрыш допускает подобный раздел, что возможно, например, в случае допустимости денежной оценки выигрыша каждого из участников), причем именно этот дел¼ж и представляет собой трудноразрешимую задачу. Заметим, что кооперативные игры, в которых возможен раздел суммарного выигрыша между игроками в любых пропорциях, принято называть играми с трансферабельной полезностью. Если дел¼ж-решение не опирается на сильнейшие равновесия в игре (которые в классической теории вообще не были известны), то с подобным дележ¼м не согласится хотя бы один из участников, и у него имеются возможности перевести игру в ситуацию, обеспечивающую ему выигрыш больший, чем получаемый им в соответствии с дележ¼м-решением кооперативной игры.

Идеальным решением (устойчивым справедливым дележом) кооперативной игры с трансферабельной полезностью можно, пожалуй, назвать такое, которое, во-первых, существует в любой игре; во-вторых, с ним вынужден согласиться любой участник игры, т.е. оно должно удовлетворять некоторым требованиям естественной устойчивости, в соответствии с которыми выход участника из кооперации не позволит ему выиграть больше причитающейся ему доли от справедливого дележа; в-третьих, это решение (справедливый дел¼ж) является единственным. К примеру, классическое решение Дж.Неймана и О.Моргенштерна [33] не удовлетворяет первому и третьему из предъявленных к идеальному решению требованиям и весьма условно удовлетворяет второму требованию. К сожалению, все остальные известные решения не удовлетворяют обязательному для любых решений второму требованию (устойчивости решения), например, таковым является вектор Шепли [12 13]. И только в [78, 80] было, наконец, доказано, как на основе наисильнейше-

го (или равноценных наисильнейших) равновесия в игре с N участниками

можно определить справедливый дел¼ж в кооперативной игре, устраивающий одновременно всех участников, от которого ни один из них не пожелал бы или не посмел бы отказаться.

Для построения удовлетворительной кооперативной теории необходимо располагать удовлетворительной теорией конфликтных равновесий. Однако, когда Дж.Нейман и О.Моргенштерн впервые приступили к созданию коопе-

10