Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

TI_v_EMM_2014

.pdf
Скачиваний:
8
Добавлен:
27.05.2015
Размер:
3.52 Mб
Скачать

U3(C) < U3(A) < U3(B) < U3(D).

1

 

 

Вето на

 

Вето

на

Вето

на

Вето на

 

 

 

 

а

 

b

 

 

 

 

 

 

 

c

 

 

 

d

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

2

 

2

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

Вето на

 

Вето на

 

Вето на

 

 

 

Вето на

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b c

d

a

c

d

a

b

d

a

b

c

c

d

b

d

d

a

d

d

 

b

b

a

b

 

РИС. 2. РЕДУЦИРОВАННАЯ ИГРА В РАЗВЁРНУТОЙ ФОРМЕ d

Для игры на рис. 2. игрок 1, зная предпочтения игрока 2 из (6), может получить ещѐ более простую игру с одним участником (рис. 3.).

 

 

1

 

о

 

 

 

a

b

c

d

b

a

 

b

Рис.3. Редуцированная игра в развѐрнутой форме с одним участником

Отсюда совершенно очевидно, как должен действовать игрок 1: отводя кандидата b, он обеспечивает избрание наиболее выгодного для себя кандидата a. Тем самым игрок 1 реализует стратегию, являющуюся компонентой сложного равновесия.

Заметим, что если игрок 1 применяет свою осторожную стратегию, отклоняя на первом шаге наименее выгодного для себя кандидата d, то в конечном итоге избранным оказывается менее выгодный (чем в сложном равновесии) для него кандидат b.

Описанная «попятная» процедура последовательной редукции дерева игры в развѐрнутой форме на основе полной информации о функциях выигрыша всех игроков называется алгоритмом Куна.

Теорема Куна утверждает, что при достаточно слабом дополнительном предположении игра в развѐрнутой форме (которую всегда можно представить как игру в нормальной форме) разрешима по доминированию, а выигрыши, соответствующие сложному равновесию, задаются алгоритмом Куна.

Пример: парадоксальный метод дележа.

81

Пираты делят добычу: 100 слитков золота. Процедура дележа устроена следующим образом. Сначала самый старший пират предлагает делѐж по своему выбору. Если хотя бы половина пиратов согласна с этим дележом, то он считается принятым. В противном случае (т.е. если большинство пиратов отвергает предложенный делѐж) второй по старшинству пират предлагает новый делѐж добычи среди оставшихся (n- 1) пиратов. Старший пират никакого участия в дальнейшѐм дележе не принимает. Если новый делѐж отвергается большинством голосов, то предложивший его пират устраняется от дальнейшего участия в дележе, и процедура повторяется для (n-2) пиратов и т.д.

Вычислим сложное поведение пиратов. Предположение о полной информированности является здесь вполне естественным, т.к. каждый пират из двух возможных дележей предпочитает, конечно, тот, в котором его доля золотых слитков больше.

Если осталось только два пирата, то старший из них забирает всю добычу, поскольку младший пират не составляет большинства. Предположим, что осталось три пирата. Тогда старший из них предлагает делѐж, дающий 99 слитков ему и 1 слиток младшему пирату. Младший пират вынужден согласиться с твоим предложением, поскольку он понимает, что, оставшись один на один со средним пиратом, он не получит ничего.

Если пиратов четверо (4, 3, 2, 1), то старший из них (4) будет рассуждать следующим образом: «Если моѐ предложение отвергнут, то три оставшихся игрока поделят добычу так: (99, 0, 1) (см. предыдущее рассуждение). Следовательно, я должен предложить такой делѐж, который хотя бы одному из них был выгоднее этого, а мне давал наибольшую возможную долю». Единственным решением этой задачи является делѐж (99, 0, 1, 0), в котором старший пират (4) жертвует всего лишь одним слитком золота в пользу пирата

2.

Равновесный делѐж для произвольного количества пиратов теперь можно найти по индукции:

 

2p+2

 

 

2p+1

 

 

2p

 

 

 

 

7

 

 

6

 

 

5

 

 

4

 

 

3

 

 

2

 

 

1

 

 

Число

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

пиратов

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100

 

0

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

99

 

0

 

1

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

99

 

0

 

1

 

0

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

98

 

0

 

1

 

0

 

1

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

98

 

0

 

1

 

0

 

1

 

0

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

97

 

0

 

1

 

0

 

1

 

0

 

1

 

 

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100-p

0

 

 

…1

0

 

1

 

0

 

1

 

0

 

1

 

 

2p+1

 

 

 

 

 

100-p

0

 

1

 

 

…0

1

 

0

 

1

 

0

 

1

 

0

 

 

2p+2

 

 

 

 

 

Итак, если n 2 p 1

или n 2 p 2 , то в дележе, соответствующем сложному равновесию,

доля старшего пирата равна 100 p слитков.

По одному слитку получают p пиратов, которые имеют

номера той же точности, что и старший пират. Парадоксальность этой процедуры дележа состоит в том, что с виду она весьма «демократична», однако добыча делится отнюдь не поровну!

Причина этого парадокса в том, что при последовательном исключении доминируемых стратегий не остается никакой возможности для кооперации. Рассмотрим случай трѐх игроков. Среднему пирату следовало бы поспешить предложить младшему некоторый договор (например, о дележе (50,50)), чтобы провалить предложение старшего пирата. Но откуда у младшего пирата возьмѐтся уверенность в том, что средний пират, став старшим, не отнимет у него всю добычу? Ведь именно такое поведение вытекает из стремления к максимизации выигрыша.

Доминирующая стратегия, осторожное и сложное поведение, могут быть определены игроками независимо друг от друга. Каждый игрок самостоятельно, зная только нормальную форму игры, может вычислить стратегию (или стратегии), рекомендуемую одним из указанных принципов оптимальности.

82

Занятие 5-6. Тема 2. Равновесие по Нэшу.

Вычисление равновесий Нэша

Чтобы для конкретной игры вычислить равновесие Нэша в чистых стратегиях, необходимо проверить наличие собственного значения оператора R для собственного числа 1. Оператор R - отображение произвольной игровой ситуации на совокупность лучших ответов игроков на задаваемую для них этой ситуацией обстановку. Таким образом, для бесконечных игр, задача сводится к нахождению вида этого оператора и решения уравнения

x* = R(x*)

(1)

Пример. Вычисление равновесий Нэша для игры «Фермеры на общем поле».

Целевые функции игроков в этой игре Ki = хi (120 – х1 - х2). Функции выигрыша вогнуты по стратегиям игроков, поэтому в этой игре существует равновесие Нэша в чистых стратегиях.

Наилучший ответ игрока при фиксированном поведении противника вычисляется в результате нахождения максимума функции выигрыша по стратегии этого игрока, то есть xi*=Ri(x-i) = arg max Ki (xi,x-

i).Частная производная в этой точке равна нулю, то есть значит x1 =60–, i=1,2.

Получили систему уравнений

решением которой является пара стратегий X1 = х2 =40, приводящих к выигрышам K1= К2 =1600. Заметим, что при условии безусловного сотрудничества игроков, то есть в случае объединения их

выигрышей и выбора стратегий из условия максимизации нового критерия К = К11, х2) + К21, х2), стратегии игроков были бы х1 = х2 = 30 .

При этом K = 3600, то есть при распределении выигрыша поровну на долю каждого из игроков достается по 1800 единиц, что больше, чем при конкуренции. Эта оптимальная по Парето ситуация, не является, однако, равновесной, так как неустойчива по односторонним отклонениям игроков от оптимальной по Парето стратегии.

Система (1) может давать несколько решений, и все они будут равновесиями Нэша.

Кроме того, уравнения системы (1) могут оказаться зависимыми. Это значит, что равновесий Нэша в этой игре бесконечное множество. Например, для игры двух лиц с функциями выигрыша Кi = l(x1+x2- c)-xi,

где l(x):=

множество равновесных ситуаций описывается равенством x1

+ х2 = с. Такая ситуация характерна в основном для игр с разрывной функцией выигрыша.

Пример. «Нахождение равновесий Нэша в смешанных стратегиях в игре «Семейный спор».

Пусть матрица выигрышей имеет вид

Смешанная стратегия первого игрока определяется одним числом р – вероятностью выбора им первой стратегии, смешанная стратегия второго, соответственно, числом q. Вычисляем:

K1(x1,qx2 +(1 - q)y2) = 4q , K1(x2,qx2 + (1 - q)y2) = 1 – q.

Таким образом, при q < 0,25, наилучшим ответом первого игрока является стратегия у1, при q>0,25 - стратегия х1. При q = 0,25 обе стратегии равнозначны с точки зрения ожидаемого выигрыша. То есть наилучший ответ первого игрока:

p*(q) =

Аналогично, наилучший ответ второго игрока:

q*(p) =

83

Занятие 7,8. Тема 3. Антагонистические игры. Чистые и смешанные сратегии.

Упражнение 1.

Установить цену игры V и оптимальность смешанных стратегий Р° = (0,4; 0,6) и Q° = (0; 0; 0,6; 0,4) для игры с платежной матрицей 2x4

Bj

B1

B2

B3

B4

Ai

 

 

 

 

 

 

 

 

 

A1

2

3

1

4

 

 

 

 

 

A2

4

2

3

1

 

 

 

 

 

Упражнение 2.

В условиях упражнения 1 установить оптимальность стратегий Р° = (0,4; 0,6) и Q°= (0; 0; 0,6; 0,4) .

Упражнение.3.

Для доказательства оптимальности стратегий Р° = (0,4; 0,6) и Q° = (0; 0; 0,6; 0,4) и определения цены игры в условиях упражнения 2.10.1 применить теорему 2.10.5.

Упражнение.4.

В условиях упражнения 3 показать, что выигрыш игрока А больше цены игры, если игрок А использует свою оптимальную смешанную стратегию Р° = (0,4; 0,6), а игрок В использует свои чистые стратегии B1 и В2 . Показать, что ни одна из активных стратегий обоих игроков не является оптимальной.

Упражнение.5.

Сформировать смешанную стратегию Q таким образом, чтобы она представляла собой смесь активных стратегий В3 и В4 игрока В в пропорциях 0,2 и 0,8 соответственно и проверить выполнение утверждения 2) теоремы 2.10.7 (о смесях активных стратегий) при условии, что игрок А применяет свою оптимальную стратегию Р° = (0,4; 0,6).

Занятие 9-10. Тема 3. Антагонистические игры. Удаление доминируемых стратегий.

Рассмотрим [3x5] — игру с матрицей

Bj

 

 

 

 

 

Ai

B1

B2

B3

B4

B5

 

 

 

 

 

 

A1

-2

1

3

0

1

 

 

 

 

 

 

A2

-1

-4

2

-1

-4

 

 

 

 

 

 

A3

1

-5

6

3

-5

 

 

 

 

 

 

В данной матрице В2 и В5 — дублирующие стратегии игрока В. Поэтому один из этих столбцов можно удалить.Удалим, например, 5-й столбец. В оставшейся матрице 3-й столбец строго, а 4-й столбец нестрого доминируются 1-м столбцом. Поэтому можно удалить также 3-й и 4-й столбцы. В результате получим матрицу

Bi

B1

B2

Ai

 

 

A1

-2

1

 

 

 

A2

-1

-4

 

 

 

A3

1

-5

 

 

 

2-я строка матрицы строго доминируется выпуклой комбинацией 1-й и 3-й строк с коэффициентами ג1 = ⅓ и ג3 = ⅔:

84

Поэтому нужно отбросить 2-ю строку. В результате получим матрицу

Bj

B1

B2

Ai

 

 

 

 

 

A1

-2

1

 

 

 

A2

1

-5

 

 

 

Нижняя цена в чистых стратегиях игры с последней матрицей α = -2, а верхняя цена β=1. Так как α < β, то решение надо искать в смешанных стратегиях. Предположим, что Р° = (р°, 1-р°) и Q° = (q°, 1-q°)— оптимальные стратегии игроков и V— цена игры. Тогда по необходимым условиям оптимальности стратегий, , имеем:

Умножив 1-е неравенство системы на 2 и прибавив ко 2-му, получим:

-3 ≥ 3V, V ≤ -1

Умножив 3-е неравенство системы на 2 и прибавив к 4-му, получим:

-3 ≤ 3V, V ≥ -1

Из неравенств следует равенство V= -1. Подставим найденное значение V в систему и получим :

Из первых двух уравнений этой системы: р° = 2/3, а из вторых двух уравнений : = 2/3.

Учитывая удаленные столбцы и строку для исходной игры, получим следующее (частное) решение: P°= (⅔; 0; ⅓), Q°= (⅔; ⅓; 0; 0; 0), V = -1. Поскольку 4-й столбец матрицы игры нестрого доминировался 1-м столбцом, то могут существовать и другие оптимальные стратегии игрока В, в которых чистая стратегия B4 будет входить с положительной вероятностью.

Занятие 11-13. Тема 4. Игры с природой. (Принятие решений в условиях неопределенности и риска. Теория статистических решений.) Критерии Байеса и Лапласа. Вальда, Гурвица, Сэвиджа, миниминный, максимаксный.

Сведем все критерии в таблицу. Критерии относительно выигрышей

№№

Критерий

 

Вероятности состояний природы

Показатель

эффективности

п/п

 

 

q1

,..., qn

 

 

стратегии

 

 

 

 

 

 

 

 

 

 

 

Ai , i 1,..., m

1B

Критерий

Бейса

q1

,..., qn

 

 

 

 

 

n

 

 

относительно выигрышей

 

 

 

 

ai

 

q j aij

, i 1,..., m.

 

 

 

 

 

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

2B

Критерий

Лапласа

q

... q

 

1

 

 

 

n

 

 

относительно выигрышей

1

 

n

n

ai

 

aij , i 1,..., m.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

 

 

3B

Критерий

относительный

q1

: q2 ... : qn

1 : 2 ... : n .

 

 

 

n

 

 

значений вероятностей

 

 

 

 

ai

 

j aij

, i 1,..., m.

 

 

 

 

 

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

85

 

 

 

 

n

 

1

 

 

 

q j

j

k

, j 1,...,m.

 

 

 

 

k 1

 

 

 

Критерии относительно рисков состояний природы с учетом рисков

№№

Критерий

 

Вероятности состояний природы

Показатель

эффективности

п/п

 

 

q1

,..., qn

 

 

 

 

стратегии

 

 

 

 

 

 

 

 

 

 

 

 

Ai , i 1,..., m

1P

Критерий

Бейса

q1

,..., qn

 

 

 

 

 

 

n

 

 

 

 

 

ri

q j rij

, i 1,..., m.

 

относительно рисков

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2P

Критерий

Лапласа

 

... q

 

1

 

 

n

 

q

n

ri

rij , i 1,..., m.

 

относительно рисков

1

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j 1

 

3P

Критерий

относительный

q1

: q2 ... : qn

1 : 2 ... : n .

 

 

n

 

ri

j rij

, i 1,..., m.

 

значений

вероятностей

 

 

n

 

 

1

 

состояний

природы с

 

 

 

 

j 1

 

 

учетом рисков

q j

j

k

, j 1,...,m.

 

 

 

 

 

 

 

 

k 1

 

 

 

 

 

 

Пример. «Покупка акций» Инвестирование средств в приобретение акций является одним из самых доступных для широкого

круга инвесторов, но в то же время и одним из самых рискованных видов инвестиций.

Предположим, что инвестор может купить акции одной из трех компаний К1, К2, K3. При этом он намерен руководствоваться доходностью акций, которая определяется как отношение дохода к цене акций и выражается в процентах. Доход по акциям представляет собой сумму дивидендов и курсовых разниц в цене акций. Информация о доходности акций в различные временные периоды систематически публикуется.

Более сложной задачей для инвестора является оценка надежности эмитентов акций, поскольку соответствующая информация в проспектах эмиссии, публикуемых перед выпуском акций, или в листингах фондовой биржи, на которой котируются акции, совершенно недостаточна и быстро устаревает. Поэтому инвесторам приходится использовать косвенные данные, формируя представления о надежности эмитентов по колебанию доходности их акций. Практическая статистика показывает, что большое колебание доходности чаще всего говорит о низкой надежности эмитента акций, т.е. об опасности ситуации, а низкий показатель колебания свидетельствует об обратном.

В качестве математической модели описанной ситуации можно рассмотреть игру с природой, в которой роль сознательного игрока играет инвестор, а роль природы П исполняет ситуация на фондовом рынке, складывающаяся в разные временные периоды по разному, и влияющая на доходность акций объективно, не противодействуя осознанно инвестору.

Предположим, что имеются данные о доходности в процентах годовых при состоянии природы П, характеризующихся месяцами с января по апрель: П1 данные за январь, П2 — данные за февраль, П3 — данные за март и П4 — данные за апрель. Из этих данных сформируем матрицу игры

 

Пi

П1

П2

П3

П4

 

Ai

 

 

 

 

 

 

 

 

 

А1

 

8

4

6

20

(1)

А2

 

7

7

7

7

 

А3

 

6

12

8

10

 

Таким образом, в распоряжении игрока А (инвестора) имеется три стратегии: Аi — покупка акций компании Ki, i=1,2,3, а природа П может находится в одном из четырех состояний (рынка ценных бумаг): Пj, j =1,2,3,4.

Инвестору надлежит принять решение в условиях неопределенности, какой компании отдать предпочтение? Другими словами надо найти решение описанной игры с природой в чистых стратегиях.

86

Среди стратегий игрока А нет доминирующих остальные стратегии. Так, что явно предпочтительной стратегии нет. Среди стратегий также нет доминируемых, которые, как заведомо невыгодные, можно было бы отбросить.

Средние доходности при стратегиях А1, А2, А3, вычисляемые как средние арифметические элементов строк матрицы (1), равны соответственно 9,5; 7; 9, а колебания доходностей равны соответственно 20-4=16; 7-7=0, 12-6=6. Отсюда видно, что хотя средняя доходность при выборе стратегии А1 самая высокая, но и самая высокая предположительная ненадежность компании К1, поскольку при стратегии А1 самый высокий показатель колебания доходности 16. При стратегии А2 самый низкий показатель колебания доходности 0, т.е. компания К2 является надежной, но, к сожалению, и самый низкий средний уровень доходности 7. Стратегия А3 занимает как бы промежуточное положение между стратегиями А1 и А2 со средней доходностью 9 и колебанием 6.

Найдем и сравним между собой оптимальные стратегии по каждому из критериев: крайнего пессимизма Вальда, крайнего оптимизма, пессимизма-оптимизма Гурвица относительно выигрышей в опасной и безопасной ситуациях и по обобщенному критерию Гурвица относительно выигрышей в опасной и безопасной ситуациях.

Расположив доходности в каждой строке матрицы (1) в неубывающем порядке и матрицу с переставленными элементами дополнив строкой сумм элементов каждого столбца, получим матрицу (2):

j

1

2

3

4

 

Bi

Wi

 

 

Mi

 

 

 

 

 

 

 

В1

4

6

8

20

 

В2

7

7

7

7

(2)

В3

6

8

10

12

 

bj

17

21

25

39

 

где Wi и Mi — минимальная и максимальная доходности i — строки, i =1,2,3, а bj — сумма доходностей j-го столбца матрицы (2), j = 1,2,3,4.

Применим критерий Вальда. Из первого столбца матрицы (2) показатели эффективности стратегий А1, А2, А3 по критерию Вальда соответственно равны W1=4, W2=7, W3=6 и, следовательно, максимин W=max{4, 7, 6}=7=W2. Поэтому, по критерию Вальда, оптимальной является стратегия А2.

Таким образом, инвестор, будучи безнадежным пессимистом, предполагает, что ситуация на рынке ценных бумаг складывается для него наихудшим образом, т.е. природа действует против него осознанно и злонамеренно. Поэтому он принимает крайне осторожное решение: приобрести акции компании К2, минимальная доходность которых (W2=7) больше минимальных доходностей акций остальных двух компаний (W1=4, W3=6). К тому же компания К2 надежнее компаний K1 и K3 (показатель колебания доходности ее акций, равный нулю, самый низкий), но с самой низкой средней доходностью.

Теперь найдем оптимальную стратегию, руководствуясь критерием крайнего оптимизма. В четвертом столбце матрицы (2) стоят показатели эффективности стратегий по максимаксному критерию: M1=20, М2=7, М3=12. Тогда макси-макс М=max{20; 7; 12}=20=М1. Следовательно, по критерию крайнего оптимизма оптимальной будет стратегия А1, при выборе которой инвестор уверен, что природа будет находится в благоприятнейшем для него состоянии П4 и, таким образом, он получит наибольшую доходность акций, правда при самой низкой надежности компании K1.

Перейдем к нахождению оптимальной стратегии под углом зрения критерия пессимизма-оптимизма Гурвица относительно выигрышей с показателем оптимизма λ .

Сначала предположим, что выбор стратегии инвестору приходится делать в опасной ситуации, которую он прогнозирует либо на основании своей интуиции, либо основываясь на каких-то показателях, отрицательно характеризующих ситуацию на фондовом рынке. Поэтому показатель оптимизма λ можно выбрать в соответствии с принципом невозрастания средних выигрышей в первом и четвертом столбцах матрицы (2) при j = п = 4 :

4

 

 

b1

 

 

17

 

17

.

b1

b4

 

17 39

 

56

 

 

 

 

 

Тогда показатель пессимизма 1 39 56 .

 

Следовательно, можем вычислить показатели

эффективности стратегии А1, А2, А3 по рассматриваемому критерию:

87

 

 

17

 

 

 

 

 

 

39

 

 

 

17

 

 

 

G1

( ) G1

 

 

 

 

 

 

 

(1 )W1 M1

 

 

4

 

 

 

 

 

20 8,86 ,

 

 

 

 

56

 

56

 

 

 

56

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

17

 

 

 

39

 

 

 

 

17

 

G2

( ) G2

 

 

 

 

 

 

 

(1 )W2 M 2

 

 

 

 

7

 

 

7 7 ,

 

 

 

 

 

56

56

 

 

 

 

56

 

 

 

 

 

 

 

 

 

 

17

 

 

 

 

 

 

39

 

 

 

17

 

 

G3

( ) G3

 

 

 

 

 

(1 )W3 M3

 

 

 

6

 

 

 

12 7,82 .

 

 

 

56

56

 

 

56

 

 

 

 

 

 

 

 

 

 

 

Тогда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

17

 

 

 

 

 

 

 

 

 

 

 

 

 

 

G( ) G

 

 

 

 

 

 

max{8,86; 7; 7,82} 8,86 G1 ( )

 

 

 

 

 

 

 

 

 

 

 

56

 

 

 

 

 

 

 

 

 

 

 

 

и потому оптимальной по критерию Гурвица относительно выигрышей с показателем оптимизма 17 56

будет стратегия А1.

Теперь допустим, что ситуация на фондовом рынке безопасна для инвестора. В таком случае показатель оптимизма λ можно выбрать по принципу неубывания средних выигрышей в первом и четвертом столбцах матрицы (2), при j = n = 4 :

4

 

 

b4

 

39

 

39

.

b1

b4

17 39

56

 

 

 

 

 

Стало быть показатель пессимизма 1 17 56 . Мы видим, что в безопасной ситуации по сравнению с

опасной показатели оптимизма и пессимизма поменялись местами. Для показателей эффективности стратегий по рассматриваемому критерию получим следующие значения:

 

39

 

 

 

 

 

17

 

 

 

 

39

 

 

 

 

 

G1

( ) G1

 

 

 

 

 

(1 )W1 M1

 

 

 

4

 

 

 

20

15,14 ,

 

 

 

 

56

56

 

 

56

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

39

 

 

 

 

 

 

17

 

 

 

 

 

39

 

 

G2 ( ) G2

 

 

 

 

 

(1 )W2 M 2

 

 

 

7

 

 

7 7 ,

 

 

 

 

 

56

 

56

 

 

 

 

 

56

 

 

 

 

 

 

 

 

 

 

 

 

 

39

 

 

 

17

 

 

 

39

 

 

 

G3

( ) G3

 

 

 

(1

)W3 M3

 

 

 

 

 

6

 

 

 

 

 

12

10,18 .

 

 

 

56

 

56

 

56

 

 

 

 

 

 

 

 

 

Следовательно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

39

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

G( ) G

 

 

 

 

max{15,14; 7; 10,18} 15,14 G1 ( )

 

 

 

 

56

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и, значит, в качестве оптимальной

по

критерию Гурвица с

 

 

показателем

 

оптимизма 39 56 надо

рассматривать опять же стратегию А1.

Таким образом, критерий Гурвица с показателями оптимизма 17 56 и 39 56 рекомендует в

качестве оптимальной выбирать одну и ту же стратегию А1. Это говорит о том, что в рассматриваемом примере при выборе показателя оптимизма в соответствии с предложенным принципом, критерий Гурвица не различает опасную и безопасную ситуации. Ниже мы увидим, что в случае обобщенного критерия Гурвица это не так.

Найдем оптимальные стратегии по обобщенному критерию Гурвица.

В опасной ситуации, выбирая коэффициенты λ1, λ2, λ3, λ4 по принципу невозрастания средних выигрышей, находим их при n = 4 :

 

 

b4

 

b4

 

 

39

;

 

 

b3

 

 

25

;

 

 

b2

 

 

21

;

 

 

b1

 

17

.

(3)

 

 

 

2

 

 

3

 

 

4

 

 

1

 

b

 

b1 b2 b3 b4

 

102

 

 

b

 

102

 

 

b

 

102

 

 

b

102

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Показатели эффективности стратегий будут иметь следующие значения:

88

 

 

 

 

39

 

25

 

21

 

17

 

 

39

 

25

 

 

21

 

 

17

 

 

G1 ( 1, 2

, 3

,

4 ) G1

 

 

,

 

,

 

 

,

 

 

 

 

 

4

 

 

6

 

 

 

8

 

 

 

20

7, 98 ,

 

 

 

 

 

 

102

102

102

102

 

 

 

 

102 102

 

102 102

 

 

 

 

 

 

 

 

 

 

 

 

 

39

 

25

 

21

 

17

 

 

39

 

25

 

21

 

 

17

 

 

G2 ( 1 , 2

, 3

,

4 ) G2

 

 

,

 

,

 

 

,

 

 

 

 

 

7

 

 

7

 

 

7

 

 

 

7

7 ,

 

 

 

 

 

 

102

102

102

102

 

 

 

 

102 102

 

102 102

 

 

 

 

 

 

 

 

 

 

 

39

 

 

25

 

 

21

 

17

 

 

 

39

 

 

25

 

21

 

17

 

 

G3 ( 1 , 2 , 3 , 4 ) G3

 

 

 

 

,

 

 

 

 

,

 

 

 

 

,

 

 

 

 

 

 

 

6

 

 

 

8

 

 

10

 

 

12

8, 31.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

102

102

102

102

 

 

 

102 102 102 102

 

 

 

 

 

 

 

 

Поэтому

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

39

 

 

25

 

 

21

 

17

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

G( 1, 2 , 3

, 4 ) G

 

 

 

,

 

 

 

 

,

 

 

 

 

,

 

 

 

 

 

max{7, 98;

7;

8, 31} 8, 31 G3 ( 1, 2 , 3 , 4 )

 

 

 

 

 

 

 

 

 

 

 

102

 

 

102 102 102

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и, следовательно, оптимальной будет стратегия A3.

В рассматриваемой опасной ситуации с коэффициентами (3) при п = 4 показатели пессимизма и оптимизма равны соответственно:

 

 

 

 

 

 

39

 

 

25

 

32

,

 

1

 

 

19

.

 

 

 

 

p

2

 

 

 

 

 

 

 

 

o

p

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

102

 

102

 

 

 

51

 

 

 

 

 

 

 

 

 

 

51

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В безопасной ситуации коэффициенты λ1, λ2, λ3, λ4

 

вычисляем по формуле (2.21.21) в соответствии с

принципом неубывания средних выигрышей:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b1

 

17

;

 

 

 

 

b2

 

21

 

;

 

 

 

 

b3

 

 

25

;

 

 

b4

 

 

 

39

.

(4)

 

 

 

2

 

 

 

3

 

 

4

 

 

 

 

 

1

 

b

102

 

 

 

 

 

 

 

 

 

b

 

102

 

 

 

 

b

102

 

 

 

 

b

 

 

 

102

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Следовательно, находим показатели эффективности стратегий А1, А2, А3, A4 :

 

 

 

 

 

 

 

 

 

 

 

17

 

 

21

 

 

25

 

 

39

 

 

 

 

17

 

 

 

 

 

 

21

 

 

 

 

25

 

 

 

 

 

 

 

39

 

G1 ( 1, 2 , 3 , 4 ) G1

 

 

 

,

 

 

 

 

 

,

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

6

 

 

 

 

 

8

 

 

20 11, 51 ,

102

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

102

 

 

 

 

 

 

 

 

 

 

 

102 102 102

 

 

102

 

 

 

 

 

 

102

 

 

 

 

102

 

 

 

 

 

 

 

17

 

 

 

21

 

 

 

25

 

 

 

39

 

 

 

17

 

 

 

 

 

21

 

 

 

 

 

25

 

 

 

 

39

 

G2 ( 1, 2 , 3 , 4 ) G2

 

 

 

 

 

 

,

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

7

 

 

 

 

7

 

 

 

 

7

 

 

 

 

7 7 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

102

102

102

 

 

 

 

 

 

102 102 102 102

 

102

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

17

 

 

 

 

21

 

 

 

25

 

 

 

 

39

 

 

 

 

17

 

 

 

21

 

 

 

25

 

 

 

 

39

 

 

G3 ( 1, 2 , 3 , 4 ) G3

 

 

,

 

 

 

 

 

 

,

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

8

 

 

 

 

 

 

10

 

 

 

 

 

12 9, 69 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

102

102

102

 

 

 

 

102

 

 

102 102 102

102

 

 

 

 

 

 

 

 

 

откуда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

17

 

 

21

 

 

 

 

25

 

 

 

 

 

37

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

G( 1, 2

, 3 , 4 ) G

 

 

,

 

 

 

 

,

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

max{11, 51;

7; 9, 69; } 11, 51

 

G1 ( 1, 2 , 3 , 4 )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

102 102

 

 

102 102

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ипотому оптимальной является стратегия А1.

Вбезопасной ситуации с коэффициентами (4) при п = 4 показатели пессимизма и оптимизма соответственно равны

 

 

 

 

 

17

 

21

 

19

,

 

 

1

 

 

32

 

p

2

 

 

 

o

p

 

 

1

102

102

51

 

 

51

 

 

 

 

 

 

 

 

Таким образом, обобщенный критерий Гурвица в данном примере при указанном выборе коэффициентов λ1, λ2, λ3, λ4 в отличие от критерия Гурвица делает различие между опасной и безопасной ситуациями, в которых принимается решение о выборе оптимальной стратегии.

Для лучшей обозримости сведем полученные в данном примере результаты в таблицу.

89

Таблица

Выбор оптимальной стратегии

 

 

 

 

 

 

Коэффициенты критерия

 

 

Показатель

 

 

 

Максимальный показатель эффективностей стратегий

 

 

 

Оптимальная стратегия

 

Критерий

Опасность ситуации

 

 

 

 

 

 

 

 

 

 

 

 

 

№ п/п

 

 

 

оптимизма

 

пессимизма

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

Критерий крайнего

Крайне опасная

 

λ1=1,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

пессимизма Вальда

ситуация

 

 

λo=0

λp=1

 

W=G(1,0,0,0)=W2

А2

 

λ234=0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

Максимальный

Крайне

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

критерий крайнего

безопасная

λ123=0,

λo=1

λp=0

 

M=G(0,0,0,1)=M1

А1

 

оптимизма

(благоприятная)

 

λ4=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ситуация

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

Критерий

Опасная

 

 

 

39

 

 

 

 

 

 

 

 

G( 56 ) G( 56 ,

 

 

 

 

 

 

1

56 ,

 

 

 

 

 

 

 

 

пессимизма

ситуация

o

1756

p

5639

 

17

 

 

 

 

 

39

 

 

 

λ23=0,

 

 

0, 0, 17 ) G (

17 )

А1

 

 

 

 

 

 

 

 

17

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

56

 

 

 

 

 

 

 

56

 

 

 

 

 

1

 

56

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

оптимизма Гурвица

Безопасная

 

 

 

17

 

 

 

 

 

 

 

 

G( 56 ) G( 56 ,

 

 

 

 

 

 

1

56 ,

 

 

 

 

 

 

 

 

 

 

ситуация

o

5639

p

1756

 

39

 

 

 

 

 

17

 

 

 

 

 

λ23=0,

 

 

0, 0, 39 ) G (

39 )

А1

 

 

 

 

 

 

 

 

39

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

56

 

 

 

 

 

 

 

56

 

 

 

 

 

1

 

56

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

Обобщенный

Опасная

1

 

39

 

,

 

 

 

 

 

 

 

 

 

 

39

 

 

25

 

 

 

21

 

 

102

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

критерий

ситуация

 

 

 

 

 

 

 

 

 

G(102

, 102

 

, 102 ,

 

 

 

 

 

 

 

25

 

,

 

 

 

 

 

 

 

 

 

пессимизма —

 

 

2

102

 

o

1951

p

3251

 

 

10217 ) G3 (10239 ,

А3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

оптимизма Гурвица

 

 

3

 

 

21

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

102

 

 

 

 

 

 

 

 

 

25

,

21

,

17

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

17

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

102

102

102

 

 

 

 

 

 

 

 

102

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Безопасная

1

 

17

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

102

 

 

 

 

 

 

 

 

17

 

 

21

 

 

 

25

 

 

 

 

 

 

ситуация

 

 

 

 

 

 

 

 

 

G(102

, 102

 

, 102 ,

 

 

 

 

 

 

 

 

 

21

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

102

 

o

3251

p

1951

 

 

39

) G1 (

17

,

А1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

25

 

,

 

 

102

102

 

 

 

 

 

3

102

 

 

 

 

 

 

 

 

 

21

,

25

,

39

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

39

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

102

102

102

 

 

 

 

 

 

 

 

102

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример . Рассмотрим игру с природой, задаваемой матрицей выигрышей

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Табл.(4)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ai, Пj

 

П1

 

 

 

 

 

 

 

 

П2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

А1

 

4

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

А2

 

1

 

 

 

 

 

 

 

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Переставив элементы в первой строке матрицы (4), получим матрицу (5) :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Табл. (5)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вi, j

 

1

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Wi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

B1

 

2

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

B2

 

1

 

 

 

 

 

 

 

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Найдѐм чистою стратегию, оптимальную по критерию Вальда среди чистых стратегий. Из первого столбца матрицы (5) имеем показатели эффективности стратегий A1 и А2, равные соответственно W1=2 и W2=1. Тогда максимин W=max{2,1}=2= W1 и потому, оптимальной среди чистых будет стратегия A1, гарантирующая выигрыш, не меньше показателя еѐ эффективности W1=2.

Пусть P=(p1, p2) — произвольная смешанная стратегия из множества SA. Если обозначить p1 = p, то, в силу нормировочного равенства p1+ p2 =1, будем иметь:

90

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]