Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие 1615.pdf
Скачиваний:
2
Добавлен:
30.04.2022
Размер:
1.5 Mб
Скачать

Для этой игры max min aij = -2 < 4 = min max aij. В результате, если иг-

i

j

j

i

роки будут следовать предложенным выше правилам, то Игрок 1 выберет стратегию 1 и будет ожидать, что Игрок 2 выберет стратегию 2, при которой проигрыш равен -2, в то время как Игрок 2 изберет стратегию 3 и будет ожидать, что Игрок 1 выберет стратегию 2 с выигрышем, равным 4. Однако если Игрок 2 выберет свою третью стратегию, то Игрок 1 поступит правильнее, выбирая вторую, а не первую стратегию. Аналогично, если Игрок 1 выберет первую стратегию, то Игроку 2 выгоднее выбрать вторую стратегию, а не третью. По всей видимости, в играх такого типа принцип решения в чистых стратегиях оказывается непригодным.

В описанной ситуации игрокам становится важно, чтобы противник не угадал, какую стратегию он будет использовать. Для осуществления этого плана игрокам следует пользоваться так называемой смешанной стратегией. По существу смешанная стратегия игрока представляет собой правило случайного выбора чистой стратегии. Математически его можно представить как вероятностное распределение на множестве чистых стратегий данного игрока.

Мы будем предполагать использование игроками их смешанных стратегий независимым, так что вероятность, с которой Игрок 1 выбирает i-ую стратегию, а Игрок 2 – j-ую, равна xi yj. В этом случае платеж равен aij.

Для случая игры со смешанными стратегиями платежная матрица принимает следующий вид (табл. 5.4).

Таблица 5.4

Платежная матрица

 

y1

y2

.....

yn

x1

a11

a12

.....

a1n

x2

a21

a22

.....

a2n

.....

.....

.....

.....

.....

xn

am1

am2

.....

amn

Подход к определению решения игры при смешанных стратегиях также основывается на критерии минимакса. Единственная разница заключается в том, что первый игрок выбирает хi так, чтобы максимизировать наименьший ожидаемый выигрыш по столбцам, тогда как второйигрок выбирает yj с целью минимизировать наибольший ожидаемый проигрыш по строкам. Математически критерий минимакса при смешанных стратегиях может быть описан следующим образом. Первый игрок выбирает стратегию, обеспечивающую

m

maxxi minj i=1 aij xi ,

85

где переменные х и у удовлетворяют соотношениям

m

xi0, i=1, …, m, xi =1, (5.3)

i=1

n

yj0, j=1, …, n, y j =1, (5.4)

j=1

а второй игрок выбирает стратегию, обеспечивающую

n

 

min max aij y j

.

y j i j=1

Эти величины определяются соответственно как среднеожидаемые максиминные и среднеожидаемые минимаксные платежи.

Если х* i и у* j — оптимальные решения для обоих игроков, каждому элементу платежной матрицы aij соответствует вероятность xi* y*j . Следова-

m n

тельно, оптимальное ожидаемое значение игры v* = ∑∑aij xi* y*j .

i=1 j=1

Как и в случае чистых стратегий, выполняется соотношение:

минимаксный ожидаемый проигрыш максиминный ожидаемый выигрыш.

Когда хi и yj соответствуют оптимальным решениям, выполняется строгое равенство и результирующее значение равно ожидаемому (оптимальному) значению игры. Это утверждение следует из теоремы о минимаксе и приведено ниже без доказательства.

Справедлива следующая основная теорема теории матричных игр с нулевой суммой (теорема фон Неймана).

Теорема. Каждая конечная игра с нулевой суммой имеет, по крайней мере, одно оптимальное решение среди смешанных стратегий.

Теорема о минимаксе утверждает, что сформулированные задачи для Игрока 1 и Игрока 2 всегда имеют решение для любой матрицы выигрышей.

Так же, как и для вполне определенных игр, стратегия х* Игрока 1 называется максиминной, стратегия y* Игрока 2 – минимаксной, значение v – ценой игры.

В случае, когда v=0, игра называется справедливой.

Очевидным следствием из теоремы о минимаксе является соотноше-

ние

 

x aij y* < V < x* aij y,

(5.5)

которое означает, что никакая стратегия Игрока 1 не позволит выиграть ему сумму большую, чем цена игры, если Игрок 2 применяет свою минимаксную стратегию, и никакая стратегия Игрока 2 не даст возможности проиграть ему сумму меньшую, чем цена игры, если Игрок 1 применяет свою максиминную стратегию.

86

Это верно также для чистых стратегий как для частного случая смешанных стратегий (т.е. чистая стратегия - это стратегия, используемая с вероятностью 1): использование любой чистой стратегии в случае, если противник использует свою оптимальную стратегию, не позволяет выиграть больше (проиграть меньше) цены игры. Этот факт нередко используется для разработки конкретных алгоритмов решения антагонистических матричных игр.

5.5. Игры с ненулевой суммой и кооперативные игры

В игре с ненулевой суммой уже становится необязательно, чтобы один из участников выигрывал, а другой проигрывал; напротив, они могут и выигрывать, и проигрывать одновременно. Поскольку интересы игроков теперь не являются полностью противоположными, их поведение становится более разнообразным.

Так, например, если в игре с нулевой суммой каждому игроку невыгодно было сообщать другому свою стратегию (это могло уменьшить его выигрыш), то в игре с ненулевой суммой становится желательным координировать свои действия с партнером или каким-либо способом влиять на его действия.

Игры с ненулевой суммой могут быть кооперативными и некооперативными. В некооперативных играх игроки принимают решения независимо друг от друга либо потому, что осуществление соглашения невозможно, либо потому, что оно запрещено правилами игры.

Один из подходов к решению некооперативных игр состоит в определении точек равновесия игры. Понятие равновесия в теории игр шире понятия оптимальности в теории оптимизации и включает последнее в качестве частного случая. В общем случае пара стратегий X, Y для Игрока 1 и Игрока 2 называется точкой равновесия по Нэшу, если ни одному из игроков невыгодно отклоняться от своей стратегии в одиночку, если выигрыш при этом не увеличивается.

Рассмотрим пример, когда матрица выигрышей игры имеет следующий вид:

(4;1) (0;0)

(0;0) (1;4) .

Легко видеть, что в данной игре пары стратегий х = (1, 0), у = (1, 0) и х=(0,1), у = (0,1) являются равновесными, т.е. Игроку 2 (1) невыгодно отклоняться от 1-й (2-й) стратегии, если Игрок 1 (2) придерживается 1-й (2-й) стратегии. Отметим также, что выигрыши в равновесных точках различны.

87

Доказано, что для любой конечной некооперативной игры с ненулевой суммой (называемой также биматричной игрой) всегда существует, по крайней мере, одна равновесная пара смешанных стратегий. В общем случае равновесное решение может быть неединственным, и каждому из решений могут соответствовать различные значения выигрыша каждого из игроков.

Кооперативной игрой называется игра с ненулевой суммой, в которой игрокам разрешается обсуждать перед игрой свои стратегии и договариваться о совместных действиях, т.е. игроки могут образовывать коалиции. Основная задача в кооперативной игре состоит в дележе общего выигрыша между членами коалиции.

В случае игры двух лиц предполагается, что два игрока не могут воздействовать друг на друга, пока не придут к некоторому соглашению.

На множестве возможных выигрышей выделяется множество Паретооптимальных решений, т.е. множество точек, принадлежащих некоторому множеству S, для которых увеличение выигрыша одного из игроков возможно только за счет уменьшения выигрыша его партнера.

Рассмотрим пример, в котором имеются два продавца, продающие определенный товар на рынке. Оба из них знают, что чем выше цена, тем меньше общий объем продаж [5].

Для простоты предположим, что каждый из них может продать либо 400 единиц некоторого товара, либо 100 единиц. Известно, что при продаже 800 единиц на рынке складывается цена, равная 100 денежным единицам (д.е.), при 500 единицах — 200 д.е., а при объеме продаж 200 единиц — 500 д.е. Матрица выигрышей продавцов показана в табл. 5.5.

Таблица 5.5

Матрица выигрышей

Продавец 1 /Продавец 2

400

100

 

 

 

400

40000/40000

80000/20000

 

 

 

100

20000/80000

50000/50000

 

 

 

Если бы игроки имели возможность и желание согласовывать свои действия, то они решили бы продать по 100 единиц и получить прибыль по 50 000 д.е. каждый.

Предположим теперь, что по каким-либо причинам они принимают решения независимо друг от друга. Каковы оптимальные стратегии для игроков в этом случае? Пара стратегий (400,100) не является ситуацией равновесия, так как в этом случае второму игроку выгодно изменить свою стратегию на 400 и тем самым увеличить свой выигрыш с 20000 до 40 000 д.е.

Если рассмотреть пару стратегий (100,100), то она также не является ситуацией равновесия, поскольку каждому отдельному игроку выгодно по-

88

менять свою стратегию на 100 и получить вместо 50 000 д.е. выигрыш в 80 000 д.е. Если же мы рассмотрим пару стратегий (400,400), то отклонение каждого отдельного игрока является для него невыгодным. Эта ситуация на-

зывается ситуацией некооперативного равновесия.

Таким образом, основным определяющим свойством ситуации некооперативного равновесия является невыгодность для каждого отдельного игрока отклоняться от своей стратегии, входящей в ситуацию равновесия. В этом случае речь не идет о каких-либо договоренностях между игроками и поэтому такое равновесие называется некооперативным. Напротив, когда возможность достижения определенных договоренностей между игроками существует, игроки стараются найти такую пару стратегий, для которой не существует другой пары, одновременно улучшающей выигрыши обоих игроков. Такая пара стратегий называется ситуацией кооперативного равновесия. В рассмотренном ранее примере это пары стратегий (100,100).

Этот пример игр можно отнести к так называемым биматричным играм, суть которых состоит в следующем. Пусть первый игрок имеет m чистых стратегий, а второй игрок имеет п чистых стратегий. Выигрыши первого игрока при различных выборах стратегий игроками задаются матрицей

А1= aij1 — платежная матрица первого игрока, а А2 = aij2 — платежная

матрица второго игрока.

На практике решение в чистых стратегиях для биматричных игр встречается крайне редко, поэтому решение ищется в смешанных стратегиях, которые определяются так же, как и для матричных игр соотношениями (5.3) и (5.4). Среднеожидаемые выигрыши игроков в этом случае определяются соотношениями

n m

 

n m

 

V (x, y) = ∑∑aij1 xi y j

и

W (x, y) = ∑∑aij2 xi y j .

(5.6)

i=1 j=1

 

i=1 j=1

 

В биматричных играх существует несколько критериев оптимальности. Важнейшими из них являются критерий оптимальности по Парето и критерий, выделяющий ситуации равновесия по Нэшу. Основные определения этих двух подходов.

1. Оптимальность по Парето. Пусть имеется несколько целевых функций F1(z),..., Fn(z), каждую из которых хотят максимизировать. Вектор решения z называется оптимальным по Парето (или эффективным), если не существует другого вектора z*, для которого значения всех функций Fi(z)Fi(z*), и хотя бы одно неравенство строгое.

Суть данного подхода состоит в том, что рассматриваются решения, которые лучше по одному критерию, но хуже по другому, и нет такого вектора, который был бы лучше сразу по всем критериям.

Множество эффективных векторов называется множеством Парето, а любой вектор этого множества — оптимумом по Парето.

89

В случае биматричной игры z = (x, у), а в качестве целевых функций рассматриваются функции V(x,y) и W(х,у), заданные соотношениями (5.6).

2. Ситуации равновесия по Нэшу. Это такая пара смешанных страте-

гий *, у* ), что для любых произвольных стратегий х и у выполняются нера-

венства V(x*, у*) ≥ V(х, у* ) и W (x*, у*) ≥ W(x*, у).

Смысл ситуации равновесия в том, что никому из игроков в одиночку невыгодно от нее отклоняться, его выигрыш при этом не увеличивается.

Справедлива следующая основная теорема теории биматричных игр. Теорема Нэша. Существует хотя бы одна ситуация равновесия в любой

биматричной игре.

Замечание. В разных ситуациях равновесия (их может быть несколько) выигрыши игроков различны.

5.6. Введение в теорию игр п лиц

Во многих реальных ситуациях в процессе принятия решений участвует более двух игроков. Рассмотрим случай, когда участников игры трое или более. Пусть N= {1, 2,..., п} — множество игроков; хi — стратегия i-го игрока; Xi — множество стратегий i-го игрока; fi (x1,…, xn) — функция выигрыша i-го игрока в зависимости от выбранных стратегий x1,…, xn (ситуация игры). Такую игру называют игрой п лиц. Введем определение характеристической функции [5].

Определение. Функцию v(S) называют характеристической функцией для игры п лиц, если для любого подмножества S множества игроков N (S N), v(S) — максимальный суммарный гарантированный выигрыш игроков подмножества S при условии их оптимальных совместных действий. Или в математическом виде

V (S) = max min fi (x1,..., xn ) .

(5.7)

i S

i S

i S

 

x X

x X

 

i

i i

i

 

Оптимальная стратегия для коалиции гарантирует, с одной стороны, что сумма индивидуальных выигрышей не будет меньше того, что может себе обеспечить коалиция в целом, а, с другой стороны, что выигрыш каждого игрока не должен быть меньше того количества, которое он может себе обеспечить самостоятельно.

5.7. Позиционные игры

Рассмотрим еще один пример анализа рыночного поведения с помощью аппарата теории игр, когда задача по своей структуре несколько отличается от задач, обсуждавшихся ранее. Предположим следующую ситуацию. На рынке некоторого продукта доминирует производитель-монополист (Фирма 1), и монопольное положение приносит ему 12 млрд р. прибыли.

90

Высокая прибыль в данном секторе привлекает других производителей, и, в частности, Фирма 2 решает вопрос: построить ли ей свой завод и начать на нем производство такого же товара? Однако ей известно, что Фирма 1 может предпринять некоторые действия в ответ на вторжение.

С одной стороны, Фирма 1 может снизить объем своего производства, уступая часть рынка Фирме 2 и деля с ней получаемую прибыль. В этом случае каждая из фирм получит по 6 млрд р. прибыли. С другой стороны, Фирма 1 может сохранить объем своего производства. В этом случае рост совокупного предложения товара Фирмами 1 и 2 снизит цену на этот товар и, как следствие, прибыль Фирмы 1 упадет до 5 млрд р.

Одновременно снижение цен приведет к тому, что Фирма 2, сделавшая предварительные затраты для выхода на новый для нее рынок, понесет чистые убытки: она потеряет на этом деле 2 млрд р.

Вслучае, если Фирма 2 воздержится от вступления на рынок, она ничего не выиграет и не проиграет (ее прибыль равна 0 млрд р.). Фирма 1 продолжает получать монопольную прибыль в 12 млрд р. Если же Фирма 1 вдруг решит в этой ситуации снизить объем своего производства, ее прибыль упадет до 8 млрд р.

Впринципе сформулированная конечная неантагонистическая игра двух лиц может быть описана следующей матрицей выигрышей (первыми указаны выигрыши Фирмы 1, млрд р.):

Стратегия Фирмы 1 Сохранить объем Снизить объем производства производства

 

(5;2)

(6;6)

 

 

 

 

(12;0)

(8;0)

 

Однако заметим, что описанная игра по своим условиям отличается от уже рассмотренных игр. Если ранее мы предполагали, что игроки принимают свои решения одновременно, не зная о решении партнера (что было весьма существенно!), то в данной игре Фирма 1 принимает решение, уже зная о решении, избранном Фирмой 2, и это в корне меняет ситуацию.

Игры подобного типа, где задается последовательность принятия решений игроками, называются позиционными играми; число игроков и шагов

вних может равняться 2, 3 и т.д.

Кпозиционным многошаговым играм двух лиц, где игроки принимают решения, зная о всех предыдущих решениях партнера, можно отнести, например, шахматы и шашки. В силу отмеченных особенностей структуры позиционной игры ее более наглядно представляет не матрица выигрышей, а дерево решении (или, в общем случае, граф решений), приводящее игроков из исходной позиции в конечные. Так, описанную игру Вступление на рынок

91

можно представить следующим деревом (рис. 5.1), ветви которого соответствуют решениям партнеров, а у каждой из висячих вершин указаны выигрыши игроков (как и ранее, первыми указаны выигрыши Фирмы 1,в млрд р.).

Решение Фирмы 2

Решение Фирмы 1

Выигрыши

Вступить

Сохранить

(5;-2)

Снизить

(6;6)

 

 

Сохранить

(12;0)

Воздержаться

Снизить (8;0)

Рис. 5.1. Дерево решений для игры «Вступление на рынок»

Вершины дерева игры называются позициями; позиции, непосредственно следующие за некоторой позицией, называются альтернативами; позиции, не имеющие альтернатив, называются окончательными, а ведущие в них пути - партиями (так, описанная игра имеет четыре партии). Часть дерева решений, описывающая игру из некоторой позиции после нескольких начальных шагов партнеров, называется подыгрой, и ее решение может представлять самостоятельную задачу.

Описанная игра Вступление на рынок имеет две пары стратегий (две партии), удовлетворяющих условию равновесия по Нэшу: партия, когда Фирма 2 решает воздержаться от вступления на рынок, а Фирма 1 сохраняет объем своего производства, и партия, когда Фирма 2 решает вступить на рынок, а Фирма I, в свою очередь, снижает объем производства. Легко убедиться, что в каждой из этих двух партий отступление всех игроков от своей стратегии приводит к уменьшению его выигрыша.

Возникает вопрос: реализация какой из этих двух равновесных партий наиболее вероятна? В непозиционной игре, в которой игроки принимают решение одновременно и независимо друг от друга, реализация обеих партий была бы равновероятна, т.е. у исследователя нет никаких причин ожидать, что один из исходов будет встречаться чаще при многократной реализации этой игры.

Однако в позиционной игре необходимо учитывать, что Фирма 1 принимает решение, уже зная о решении, принятом Фирмой 2. При этом менеджеры Фирмы 2, которая должна сделать первый шаг, при выборе своей стратегии могут рассуждать следующим образом: «Если мы не вступим на рынок со своей продукцией, то в любом случае мы ничего не потеряем. С другой

92

стороны, если мы решим внедриться на рынок, не исключено, что Фирма 1 сохранит объем своего производства и для нас это обернется потерями в 2 млрд р.» Затем, следуя принципу максимизации своего минимального выигрыша, Фирма 2 должна была бы избрать стратегию «Воздержаться от вступления на рынок» - ее прибыль в этом случае максимальна (0 млрд р. больше, чем -2 млрд р.).

Эти, казалось бы, логичные рассуждения не учитывают одной из главных предпосылок теории игр - предположения о рациональном поведении игроков, стремящихся к максимизации своих выигрышей. В данном случае это заставляет менеджеров Фирмы 2 задать себе вопрос: «А насколько вероятна реализация Фирмой I стратегии «Сохранить объем производства», если мы вторгнемся на рынок? Ведь в этом случае Фирма 1 получит меньшую прибыль (5 млрд р.), чем в случае, если она снизит объем своего производства и поделится частью рынка с нами, получив при этом 6 млрд р.» В итоге, учитывая, что Фирма 1 будет вести себя рационально, ее ответом на вступление Фирмы 2 на рынок должно стать снижение объема своего производства, а не реализация угрозы сохранить прежний объем производства и подавить Фирму 2.

В данном случае в теории игр речь идет о правдоподобности угроз. В обсуждаемой игре угроза Фирмы 1 сохранить объем производства в ответ на вторжение Фирмы 2 на рынок является неправдоподобной, поскольку ее реализация приводит к меньшему выигрышу по сравнению с другими исходами.

Учитывая этот факт, можно утверждать, что наиболее вероятной будет реализация партии, когда Фирма 2 вступает на рынок, а Фирма 1 в ответ на это вторжение снижает объем своего производства: эта партия равновесна по Нэшу и, кроме того, учитывает степень правдоподобности угрозы Фирмы 1 сохранить объем своего производства и подавить таким образом Фирму 2.

Рассмотрим пример игры Вступление но рынок с несколько измененными исходными данными. Дерево решений этой игры и выигрыши фирм в млрд р. представлены на рис. 5.2.

Решение Фирмы 2

Решение Фирмы 1

Выигрыши

Вступить

Сохранить

(4;-2)

Снизить

(3;6)

 

 

Сохранить

(12;0)

Воздержаться

Снизить (8;0)

Рис. 5.2. Дерево решений для игры «Вступление па рынок»

93

Анализ игры, представленной на рис. 5.2, показывает, что угроза Фирмы 1 сохранить объем своего производства является вполне правдоподобной: прибыль Фирмы 1 в этом случае (4 млрд р.) не меньше, чем в случае, если она снизит объем своего производства и уступит часть рынка Фирме 2 (3 млрд р.).

Стратегия Фирмы 1 «Сохранить объем производства» является доминирующей, т.е., следуя этой стратегии, Фирма 1 получает большую прибыль, чем в случае реализации другой своей стратегии «Снизить объем производства», - независимо от решений Фирмы 2.

Учитывая этот факт, Фирма 2, во избежание лишних потерь, должна избрать стратегию «Воздержаться от вступления на рынок». Как следствие, в данном случае наиболее вероятной является реализация равновесной партии, когда Фирма 2 воздерживается от вступления на рынок, а Фирма 1 сохраняет объем своего производства, продолжая пользоваться монопольным положением.

Рассмотренный пример описывает случай так называемой устойчивой монополии, когда фирма-монополист в состоянии эффективно реализовать угрозу подавления своих потенциальных партнеров. Это может объясняться естественными условиями производства, его технологическими особенностями, факторами, позволяющими фирме-монополисту гибко реагировать на действия противников (большой запас мощностей, реклама, вложения в перспективные исследования и т.п.). Поэтому вполне естественным выглядит желание государственных органов контролировать, а по возможности и ограничивать деятельность подобных фирм - устойчивых монополистов.

Таким образом, проблемы рыночного взаимодействия могут быть эффективно описаны и исследованы в терминах теории игр.

5.8. Выбор оптимальной стратегии в условиях неопределенности (игры с природой)

Вреальных экономических условиях чаще всего приходится решать задачи при ограниченности, неточности исходной информации о самом объекте или внешней среде, в которой он функционирует. При принятии управленческих решений о деятельности экономического объекта необходимо учитывать важную характеристику внешней среды – неопределенность

Вусловиях рыночной экономики существует множество источников возникновения неопределенности для различных экономических объектов. К ним, в первую очередь, можно отнести:

недостаточность полноты информации об объекте, процессе, явлении, ограниченность в сборе информации, постоянная ее изменчивость;

наличие противоборствующих тенденций, столкновение противоречивых интересов;

94

невозможность однозначной оценки объекта в силу влияния внешнеэкономических факторов;

влияние других экономических объектов на данный объект и т.д. Неопределенность обусловливает появление ситуаций, не имеющих

однозначного исхода (решения). Среди различных видов ситуаций, с которыми в процессе производства сталкиваются предприятия, особое место занимает ситуация риска. Обычно ей сопутствуют три условия:

-наличие неопределенности;

-необходимость выбора альтернативы;

-возможность оценки вероятности осуществления (оптимальности) выбираемых альтернатив.

Таким образом, если существует возможность количественно и качественно определить степень вероятности (оптимальности) того или иного варианта, это и есть ситуация риска.

5.8.1. Специфика ситуации полной неопределенности

Мы предполагали, что все участники игры имеют свои интересы, которые выражаются либо платежными матрицами (антагонистические игры, биматричные игры), либо платежными функциями (игры п лиц). Однако так бывает далеко не всегда. Ситуации, при которых нам либо ничего не известно об интересах второй стороны (или сторон), либо эти интересы действительно отсутствуют (второй игрок — «природа»), характеризуются как ситуации принятия решений в условиях полной неопределенности (или

игры с «природой»).

Естественно, что термин «природа» употребляется здесь в некотором символическом смысле как обозначение некой действительности, мотивы проявления которой нам неизвестны.

Как мы отмечали, теория игр — это математическая дисциплина, исследующая ситуации, в которых принятие решений зависит от нескольких участников. Поэтому тот факт, что в рассматриваемой ситуации вторая сторона не имеет каких-либо интересов, несколько меняет подход к выбору оптимальной стратегии. То есть разумно рассмотреть несколько иные критерии, чем, например, принцип минимакса для антагонистической игры (игры с нулевой суммой) двух лиц.

5.8.2. Критерии выбора оптимальной стратегии

Рассмотрим игру, заданную платежной матрицей первого игрока (матрица выигрышей первого игрока размера m x n) — A = aij m×n .

95

1. Максиминный критерий Вальда. Это тот самый критерий, который использовался при рассмотрении игр с нулевой суммой (антагонистических игр). Он отражает «принцип гарантированного результата», то есть мы полагаем самый неблагоприятный для нас случай и пытаемся выбрать такую стратегию, которая максимизировала бы наш выигрыш в самой неблагоприятной ситуации. В математическом виде критерий записывается как

V = max min aij .

(5.8)

i

j

 

 

 

В качестве оптимальной выбирается стратегия, при которой достигается значение max. Иногда этот критерий называют критерием «крайнего пес-

симизма».

2. Критерий максимакса. Этот критерий является противоположным по своему смыслу предыдущему критерию. А именно, он предполагает рассмотрение не самого неблагоприятного случая (критерий Вальда), а наоборот – наиболее благоприятного. Выбирается в качестве оптимальной такая стратегия, для которой этот самый благоприятный случай дает самый большой выигрыш. В математическом виде критерий записывается следующим образом:

V = max max aij

.

 

i

j

(5.9)

 

 

В качестве оптимальной стратегии выбирается стратегия, при которой

достигается значение max. Иногда этот

 

критерий называют критерием

«крайнего оптимизма».

 

 

 

3. Критерий Гурвица. Этот критерий является своего рода обобщением двух предыдущих критериев. Он представляет собой целое семейство критериев, зависящих от некоторого параметраα, смысл которо го — в определении баланса между подходами «крайнего пессимизма» и «крайнего оптимизма». В математическом виде критерий записывается как

V = max α max a

ij

+(1α) min a

 

 

i

 

j

j

ij .

(5.10)

 

 

 

 

 

 

В качестве оптимальной стратегии выбирается стратегия, при которой достигается значение max. Значение параметра выбирается из интервала 0<α<1. Критерий Вальда является частным случаем критерия Сэвиджа при α = 0 , а критерий максимакса – при α = 1. Выбор конкретного значения параметра определяется скорее субъективными факторами, например склонностью к риску ЛПР (лица принимающего решение). При отсутствии какихлибо явных предпочтений вполне логично, например, выбрать значение

α=0,5.

4. Критерий Сэвиджа (критерий минимаксного риска). Применение данного критерия предполагает рассмотрение некоторой производной матрицы, смысл которой состоит в том, что для каждой стратегии второго игрока определяется выигрыш в наиболее благоприятном случае (при наиболее

96

правильном выборе стратегии первым игроком для данной ситуации), а далее вычисляются величины «недополученных» выигрышей для всех остальных стратегий первого игрока при рассматриваемой стратегии второго игро-

ка. Элементы матрицы R =

 

 

 

rij

 

 

 

m×n ,

которая обычно называется матрицей

 

 

 

 

 

 

 

 

aij . Далее к матрице рисков применя-

риска, рассчитывают как rij

= max aij

 

 

 

 

 

i

 

ется минимаксный подход, а именно:

R = min max rij .

(5.11)

i

j

 

 

 

В качестве оптимальной стратегии выбирается стратегия, на которой достигается min. Тем самым выбираем такую стратегию, для которой значение «недополучения» будет иметь наименьшее значениеиз максимально возможных.

5. Критерий Лапласа. Этот критерий исходит из условия, что игроку ничего не известно о принципах или вероятностях применения вторым игро-

ком своих стратегий, то мы предполагаем эти вероятности все равными Тогда критерий можно записать как

 

 

1

n

 

V = max

 

aij .

i

n j=1

 

1n .

(5.12)

Таким образом, смысл данного критерия — максимизация ожидаемого выигрыша в предположении о равновероятности применения вторым игроком своих стратегий.

5.9. Применение теории матричных игр в управлении

Теория игр рассматривает задачи выбора оптимальных решений с учетом возможных действий других участников и случайных событий.

Вигре могут сталкиваться интересы двух и более противников.

Впервом случае игра называется парной, во втором - множественной. Рассмотрим парные игры, а участников игры обозначим А и В. Предположим, что интересы участников поддаются количественному описанию, т.е. результат игры определяется некоторым числом.

Задачей теории игр является выработка рекомендаций для игроков, т.е. определение оптимальной стратегии, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш.

Рассмотрим применение теории игр на примере взаимодействия 2-х строительных организаций - заказчика и подрядчика.

Допустим, что СМУ заключило договор с заводом ЖБИ на централизованную поставку раствора на 180 тыс. р. Если в течение дня раствор не поступит, заказчик терпит убытки в сумме 530 тыс. р. из-за простоя.

97

СМУ может послать на ЖБИ собственный транспорт, дополнительные расходы при этом составят 70 тыс.р. Однако опыт предыдущей работы показал, что это увеличивает надежность поставок только на 50%.

Можно увеличить вероятность получения раствора до 70%, послав на завод своего представителя. Дополнительные затраты при этом составят 60 тыс.р.

Если произвести предварительную оплату работ в размере 100%, то это позволит повысить вероятность выполнения работ в срок до 80%, однако приведет к дополнительным затратам, кроме надбавки за срочность в размере 110 тыс. р.

Можно разместить заказ у другого, абсолютно надежного поставщика по цене, повышенной на 50%. При этом возможны дополнительные расходы, кроме расходов на транспорт, в размере 60 тыс.р., связанные со сверхурочной работой по выработке раствора, поступившего от обоих поставщиков сразу.

Таким образом, заказчик имеет пять своих чистых стратегий:

-ничего не предпринимать;

-оправить собственный транспорт;

-оправить на завод своего представителя;

-произвести предварительную оплату работ;

-разместить заказ у другого, абсолютно надежного подрядчика. У поставщика имеется две чистые стратегии:

-поставки осуществляются в установленные сроки;

-поставки не выполняются в установленные сроки.

Затраты заказчика, в зависимости от его различных стратегий и стратегии подрядчика (П1 - поставка выполнена своевременно, П2 - поставка не выполнена в договорные сроки), представлены в табл. 6.6.

Рассмотрим, например, как получены суммарные затраты заказчика при применении им 3-й стратегии, а поставщиком - 2-й (поставки нет).

При 3-й стратегии вероятность поставки в срок составляет 70%, следовательно, вероятность того, что поставка не будет выполнена своевременно - 30%. Стоимость раствора составит

(180×70)/100=126 тыс. р.

Убытки, связанные с простоем производства, составят

(530×30)/100=159 тыс. р.

Транспортные расходы – 70 тыс.р. и дополнительные затраты, связанные с командированием своего представителя, – 60 тыс.р.

Доплата за срочность составит 100 тыс.р., дополнительные затраты на авансирование работ – 60 тыс. р. Суммарные затраты составят 415 тыс.р.

98

Таблица 5.6 Исходные данные для определения стратегий заказчика

Страте-

 

Затраты

Транс-

Командиро-

Предоп-

Издержки

Итого,

гия

Стоимость

от про-

портные

вочные

лата про-

от реали-

тыс.р.

 

раствора,

стоя ра-

расходы,

расходы,

дукции,

зации рас-

 

 

тыс.р.

бочих,

твора,

 

 

 

тыс.р.

тыс.р.

тыс.р.

тыс.р.

тыс.р.

 

 

 

 

 

 

 

С1→П1

180

0

0

0

0

0

180

 

 

 

 

 

 

 

 

С1→П2

0

530

0

0

0

0

530

 

 

 

 

 

 

 

 

С2→П1

180

0

70

0

0

0

250

 

 

 

 

 

 

 

 

С2→П2

90

265

70

0

0

0

425

 

 

 

 

 

 

 

 

С3→П1

180

0

70

60

0

0

310

 

 

 

 

 

 

 

 

С3→П2

126

159

70

60

0

0

415

 

 

 

 

 

 

 

 

С4→П1

180

0

70

0

110

0

360

 

 

 

 

 

 

 

 

С4→П2

144

106

70

0

110

0

430

 

 

 

 

 

 

 

 

С5→П1

450

0

70

0

0

60

580

 

 

 

 

 

 

 

 

С5→П2

270

0

70

0

0

0

340

 

 

 

 

 

 

 

 

Составим матрицу игры, представленную в табл. 5.7.

Таблица 5.7

Исходные данные для определения стратегий ЖБИ

Стратегия СМУ

 

Стратегия ЖБИ

 

 

 

 

 

П1

 

П2

 

 

 

 

С1

-180

 

-530

 

 

 

 

С2

-250

 

-425

 

 

 

 

С3

-310

 

-415

 

 

 

 

С4

-360

 

-430

 

 

 

 

С5

-580

 

-340

 

 

 

 

Поскольку игроком А по терминологии, принятой выше, является заказчик, то в соответствующих клетках записываем "выигрыш" со знаком минус (убытки).

Задача руководства заказчика - определить оптимальную стратегию, обеспечивающую минимум ожидаемых убытков в условиях неопределенности относительно поведения поставщика.

Решение этой игры можно получить в геометрической интерпретации (рис.5.3). Отложим по горизонтальной оси надежность подрядчика, измерен-

99

ную вероятностями в диапазоне от 0 до 1 и обозначим ее как Y, а затраты заказчика обозначим через X1 при наличии поставки, иначе X2.

Для первой стратегии СМУ (С1) затраты составят 180 тыс. р. при Y=1 и 530 тыс. р. при Y=0 (поставки нет). Изобразим на графике затраты при применении первой стратегии, изменяющиеся от 180 тыс. р. при абсолютной надежности подрядчика (Y=1) до 530 тыс.р. при нулевой надежности (Y=0), соединив прямой линией ординату X1=-530 и X2=-180.

Аналогично построим зависимости затрат заказчика при 2-5 стратегиях. Получим график ожидаемых затрат заказчика при применении своих чистых затрат стратегий против смешанных стратегий поставщика.

Из рисунка видно, что при надежности поставщика от 0 до 0,21 оптимальной является пятая стратегия (C5), при надежности поставщика от 0,21 до 0,6 оптимальной является вторая стратегия (C2), а при надежности поставщика от 0,6 до 1 - первая стратегия (С1).

Мы рассматривали задачу как антагонистическую, что принципиально неверно, поскольку поставщик не стремится нанести СМУ максимальный ущерб. Поэтому его надежность может быть и не наихудшей с точки зрения СМУ.

Неантагонистические игры, когда действия второго игрока зависят не от его сознательной деятельности, а от объективной действительности, называют играми с природой. Второй игрок (природа) действует случайно, в условиях неопределенности (климатические условия, спрос на продукцию и т.д.).

В играх с природой применяют следующие критерии: 1. Максиминный критерий Вальда:

Y= max min aij = (530;425;415;430;480) = −415.

ij

Всоответствии с максимальным критерием Вальда оптимальной является 3-я стратегия (послать на ЖБИ свой транспорт и представителя).

2. Максимаксный критерий (абсолютного оптимизма):

Y= max min(180;250;310;360;340) = −180.

ij

Всоответствии с этим критерием выбираем 1-ю стратегию (ничего не предпринимать), представленную на рис. 5.3.

100

0

0.21

0.6

1

Y

-180

-250

-310

-340

-360

-415

-425

-430

-530

Х1

-580

Х2

Рис. 5.3. Геометрическая интерпретация решения

3. Критерий Сэвиджа (критерий минимакса риска). Суть критерия состоит в выборе такого решения, при котором минимизируются потери из-за ошибочных решений. Для этого строится матрица рисков по условию:

rij = max aij aij.

(5.13)

i

 

В нашем случае матрица рисков имеет вид

 

 

0

190

 

 

 

70

85

 

 

 

 

r

= 130

75

.

ij

 

 

90

 

 

180

 

 

 

400

75

 

Затем определяют

 

 

 

 

 

 

Y = max min rij = min(190;85;130;180;400) =85.

i

j

i

Таким образом, согласно критерию Сэвиджа, оптимальной является 2-я стратегия (послать на ЖБИ свой транспорт).

101