Organizatsionno-upravlencheskie_reshenia / Управленческие решения_Балдин К.В, Воробьев С.Н, Уткин В.Б_Учебник_2006 -496с
.PDFпопробовать сформировать новую игру, с использованием других стратегий, либо оценить возможности введения в игру стратегий угроз, либо пойти со вторым игроком на перегово ры и тогда — заняться планированием деловой беседы.
В общем случае ситуация в максиминных стратегиях не всегда является равновесной. Это заставляет игроков адапти роваться друг к другу, выдвигать последовательно усложняю щиеся гипотезы об ответных реакциях конкурента и собствен ных контрмерах. Такое поведение называют рефлексивным. Оно побуждает каждого игрока отклоняться от своей макси минной (минимаксной) стратегии с целью улучшения значения выигрыша в свою пользу. В таком случае первый игрок может только предполагать, как поступит второй: будет ли он при держиваться своей максиминной стратегии Ъ* или отклонится от нее. В значительной степени на решения игроков по - пре жнему будут влиять их личностные качества, величина пред полагаемого выигрыша v(a*, b*), а также их искусство блефо вать и рефлексировать. В конечном итоге выиграет тот, кто более искусно маскировал свои истинные намерения и удач нее предсказал намерения своего соперника.
Если игра может повторяться достаточно большое коли чество раз (не менее 25—30), а шкала оценочной функции v(a, Ъ) достаточно близка к количественной, то для получе ния равновесной ситуации первому игроку следует прибег нуть к применению не чистых, а так называемых смешанных стратегий. Ситуация равновесия в смешанных стратегиях с у ществует всегда, это доказано строго математически. Что такое смешанная стратегия? Чтобы ввести это определение, вспомним, что для матричной игры множества стратегий иг роков дискретны. Но раз это так, то все стратегии у каждо го из игроков можно пронумеровать и ссылаться на них не по их наименованиям, а по их номерам. Пусть для опреде ленности у первого игрока во множестве А имеется га чистых стратегий, а у второго игрока во м н о ж е с т в е В и м е е т с я
|
п чистых стратегий. Тогда смешанной стратегией первого иг |
|
рока на множестве чистых стратегий 1, 2,...,т называется ве - |
242 |
243 |
244 |
245 |
246 |
247 |
ций. Для установления ситуаций равновесия по Нэшу вос пользуемся графической интерпретацией правила (3.12). Стрел ками будем обозначать условно-оптимальный выбор для к а ж дой из сторон: стрелка направляется на более предпочтитель ную альтернативу при фиксированной стратегии конкурента.
Условно-оптимальные выборы сторон Л и В совпадают на ситуациях (1,2) и (2,1), так как соответствующие стрелки (вер тикальные для А и горизонтальные для В) сходятся на этих элементах биматрицы. Это означает, что для данной игры имеется две ситуации равновесия по Нэшу, выигрыши в к о торых превосходят максиминный уровень. Однако этих ситу аций две, и они принципиально отличаются по предпочти тельности для каждой из сторон: ситуация (1,2) более пред почтительна стороне А, а ситуация (2,1) — стороне В. Поэто му игра не имеет решения в чистых стратегиях.
Пример 2. Стороны А и В решают договориться о масш табах сокращения объема выпускаемой продукции. У каждой из сторон две стратегии:
1 — поддерживать выпуск на прежнем уровне;
2 — произвести существенное сокращение выпуска про дукции.
Измерение предпочтительности ситуаций даст тот или иной результат в зависимости от того, отсутствуют или име ются у каждой из сторон действенные методы контроля в ы полнения договоренностей.
Вначале пусть действенных мер контроля нет. Это озна чает, что если стороны решат произвести существенное с о кращение выпуска продукции, а затем какая-то из них тай но нарушит соглашение, то это резко отразится на предпоч тительности создавшегося положения для другой стороны. 248
Сторона А: |
|
Максиминные стратегии |
игроков приводят к с и т у а |
ции (1,1), обеспечивающей им |
одинаковые максиминные р е |
зультаты равные трем. В то же время игра имеет одну рав новесную ситуацию (1,1), совпадающую с максиминной и да ю щ у ю каждому из игроков выигрыш, равный максиминному. Кроме того, равновесная ситуация доминируется немаксиминной и неравновесной ситуацией (2,2). Таким образом, с о гласно сформулированным критериям рациональности игра имеет решение в максиминных чистых стратегиях. Содержа тельно это означает, что при отсутствии действенных мер контроля за соблюдением соглашения и санкций за допущен ные нарушения ни одной из сторон невыгодно идти на сокра щение выпуска продукции.
Пусть теперь у каждой из сторон имеются действенные меры контроля за соблюдением соглашения и разработана система штрафных санкций за нарушения договоренности. В этом случае биматрица игры может иметь, например, сле дующий вид:
Сторона В:
Сторона А:
Максиминные стратегии сторон остаются прежними (не идти на сокращение выпуска продукции). Равновесных по Нэшу ситуаций для данной игры две: (1,1) и (2,2). Ситуация (2,2) доминирует над ситуацией (1,1). Выигрыш в ситуации (2,2)
249
для каждой из сторон выше максиминного, следовательно, решением игры является недоминируемая ситуация (2,2), имеющая выигрыш больше максиминного. Содержательно это означает, что при наличии действенных мер контроля за с о блюдением соглашения и эффективной системы штрафных санкций за нарушения договоренностей сторонам выгодно идти на кардинальные сокращения выпуска продукции.
Рассмотренные примеры являются иллюстративными в смысле условности значений выигрышей сторон. Эти выиг рыши назначались нами в соответствии с простым предпоч тением одного исхода над другим без детализации, на сколь ко или во сколько раз сильнее то или иное предпочтение. Для таких игр — "игр с предпочтениями" — бессмысленно говорить о применении смешанных стратегий. Если же би - матричная игра описывается в шкале полезностей не менее совершенной, чем интервальная, то рассмотрение смешан ных стратегий оправдано, если это допустимо их интерпре тацией в рамках данного конфликта.
Итак, ситуация равновесия по Нэшу — это схема анали за, пригодная для случая, когда никакое кооперирование не допускается. Но что делать, если и равновесный (по Нэшу) выигрыш участников не устраивает? В таком случае им ни чего не остается, как начать обмениваться информацией и договариваться о совместном поведении в игре. Математичес кой моделью конфликта при таком подходе становится к о о перативная игра, которая ведется по следующим правилам:
•разрешено заключать совместные соглашения;
•допускается совместный выбор стратегий (в общем слу чае — смешанных);
•допускается передавать полезность от одного игрока к другому (хотя, возможно, и не всегда линейно).
Каждый из приведенных пунктов правил ведения коопе ративных игр в целом означает следование принципу груп повой рациональности. Однако последний пункт, хотя и пред полагает, что игроки могут "покупать и продавать" друг д р у гу имеющуюся в их распоряжении полезность, чтобы улуч -
250 |
251 |
уменьшения одних значений своих частных компонентов за счет увеличения других, то поиск экстремума в задаче (3.15) как раз и отражает стремление к наилучшему компромисс ному дележу полезности между игроками. При этом согласно соотношению (3.15) большую часть общей полезности при д е леже получит тот игрок, у которого минимаксный результат (то самое "начало отсчета") или status quo представляет б о лее предпочтительную величину. Это примерно соответству ет некой гипотетической ситуации дележа определенной сум мы денег между богатым и бедным, однако саму эту сумму они получат только при условии, что смогут договориться, как ее разделить. В такой ситуации, чтобы получить хоть что-то, более бедный скорее всего вынужден будет пойти на некоторые уступки при дележе, а богатый, у которого ф и нансовое положение более прочное, может позволить себе дольше торговаться и настаивать на большей доле для себя.
Предположим, что кто - то из игроков все же не у д о в летворен компромиссным решением, получаемым в ходе р е шения задачи (3.15). В таком случае он может исследовать свои стратегические возможности по применению стратегий угроз.
Что мы будем понимать под стратегией угрозы? Во - пер вых, это некая реальная или провозглашенная в качестве возможной для применения в игре альтернатива поведения того или иного игрока. Во-вторых, эта альтернатива должна быть эффективна в отношении достижения цели дележа, а именно — объявление одним из игроков о намерении исполь зовать стратегию угрозы должно склонить другого игрока к мысли, что ему выгоднее пойти на уступки при дележе, чем попасть в ситуацию, когда будет применена стратегия угро зы. Таким образом, эффективность стратегии угрозы опреде ляется не только результатом предполагаемого истинного воздействия по каким-то физическим объектам. Такое воз действие может привести к изменению состояния объектов, связей между ними, формы или качества входящих в них элементов. Кроме того, эффективность стратегии угрозы в
252 |
253 |
Рис. 3.7. Область допустимых решений в биматричной игре
(1,1) и (2,2). Из геометрии области допустимых решений сле дует, что все недоминируемые дележи, среди которых сле дует вести поиск компромисса, образуют "северо-восточную" границу данной области. Это недоминируемое множество представляет собой отрезок, соединяющий точки со значени ями выигрышей для ситуаций (1,1) и (2,2). В то же время, как мы у ж е отмечали, ситуация (1,1) более предпочтительна для второго игрока, а ситуация (2,2) — для первого. Предполо жим, что первый игрок попробует угрожать применить свою вторую стратегию, если второй не согласится на компромисс ное решение, геометрически приближенное к точке, отобра жающей на рис. 3.7 ситуацию (2,2).
Будет ли такая угроза первого игрока эффективной? Нет! Очевидно, что второй игрок может легко парировать эту уг-
254 |
255 |
3.3.3. Технология анализа игр N лиц и методы группового выбора
Рассмотрим теперь подходы к поиску решений в группе, состоящей из нескольких лиц. Эта группа может включать или субъектов, не общающихся друг с другом, или лиц, ко торые могут вступать в переговоры и образовывать коалиции. Если каждый из субъектов действует независимо от осталь ных, не ведет никаких переговоров и, следовательно, не может вступать ни в какие коалиции, то анализ поведения такой группы с точки зрения ЛПР ничем не отличается от анализа парных игр. Другими словами, ЛПР всю группу как бы делит на две части — " Я " и "Не Я" и рассматривает свое поведение в контексте "против всех". Такой случай не пред ставляет особого интереса. Совершенно другое дело, как мы отмечали в предыдущем параграфе, если игроки могут обме ниваться информацией, дискутировать, вступать в перегово ры и образовывать коалиции.
Обычно решение игр N лиц в виде математической ф о р мулы найти практически не удается. Есть лишь общие реко мендации о том, как это целесообразно делать [39].
Если же подойти к анализу игр N лиц концептуально шире, то для их решения можно предложить и неожидан ные математические приемы, и известные "демократичес кие процедуры" принятия решений. Здесь все зависит от того, по каким правилам ведется игра и какими полномочиями о б ладают игроки в ней. В одном случае каждому из игроков может быть разрешено лишь выдвигать предложения о зна чениях дележа в игре, а также обмениваться информацией и убеждать других участников примкнуть к его мнению. При этом каждый из игроков может не иметь серьезной возмож ности повлиять на окончательное решение о дележе, просто сказав, что будет поступать как ему угодно. В другом случае у каждого из игроков может быть "суверенное право" наста ивать на обязательном учете в решении конкретно его пред ложений, так как все игроки, например, договорились сле довать неким традициям "социальной справедливости".
256 |
257 |
Так вот, если игроки не наделены подобным "суверен ным правом", но обладают другими, указанными в этих при мерах, возможностями, то, оказывается, можно применить математический аппарат, вроде бы неуместный для исполь зования в условиях поведенческой неопределенности. Речь идет об использовании аппарата для анализа Марковских стохас тических процессов. Если же игрокам дано "суверенное пра во" требовать обязательного учета в общем решении своего индивидуального мнения, то целесообразно применить ма тематическую модель группового выбора или воспользовать ся технологиями и методами ведения деловых бесед.
Цепи Маркова находят приложения в самых разнообраз ных отраслях деятельности, зачастую не являющихся по своей природе стохастическими. Например [49], монах орде на св. Августина Грегор Мендель стохастическим считал про цесс обмена генами при скрещивании сортов гороха. Для м о делирования этого процесса хорошо подходят цепи Маркова. Однако такой ли он в действительности, генетика пока не может ответить точно. Другое хорошо известное приложе ние теории цепей Маркова к нестохастическим процессам — описание денежных потоков при расчете наличными между городами в государстве. Наконец, еще одной интересной для нас задачей, не являющейся по своей природе вероятност ной, является задача об общих закономерностях формирова ния мнения в социальной группе. К этому типу относятся и экономическая задача инвестирования финансовых средств в некоторый проект группой лиц, и задача принятия поли тического решения об интенсивности реагирования прави тельственного кабинета на то или иное политическое собы тие, и некоторые сходные задачи экономической теории и практики.
Рассмотрим кратко суть "Марковского" подхода и поста новку задачи отыскания решения в игре N лиц [49]. Пусть группа состоит из N членов и она должна принять решение, какую сумму выделить на предлагаемый проект. В начальный
258
(3.16)
Для того чтобы выявить окончательное решение после достаточно большого числа шагов процесса обмена мнениями (и, следовательно, влияниями), граф влияний преобразуют в так называемый обращенный граф, который затем считают стохастическим.
На рис. 3.9 представлен обращенный граф, полученный из графа влияния, изображенного на рис. 3.8. Чтобы постро -
259
260 |
261 |
|