Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
sadovin_h_c_sadovina_t_n_osnovy_teorii_igr.pdf
Скачиваний:
34
Добавлен:
01.01.2020
Размер:
667.17 Кб
Скачать

4.ИГРЫ С ПРИРОДОЙ

4.1.Понятие игры с природой

Ситуации, рассмотренные в предыдущих главах, в экономической практике могут оказаться не вполне адекватными действительности, поскольку реализация моделей матричных игр предполагала возможность многократного повторения решений (действий), предпринимаемых в похожих условиях. На практике же количество экономических решений, принимаемых в похожих условиях, жестко ограничено. Нередко экономическая ситуация является уникальной, и решение должно приниматься однократно и в условиях неопределенности.

Неопределенность присутствовала и в рассмотренных выше антагонистических играх. Она заключалась в том, что ни один из игроков не обладал информацией о действиях противника. Но эта неопределенность в некоторой степени компенсировалась предположением о том, что игроки действуют осознанно, выбирая стратегии, наиболее выгодные для себя и наименее выгодные для противника.

Однако в экономической практике во многих задачах принятия решений существенно важным элементом является неопределенность другого вида. Эта неопределенность не связана с сознательным целенаправленным противодействием противника и заключается в том, что лицо, принимающее решение, недостаточно информировано об объективных внешних условиях, в которых будет приниматься решение. Неопределенность такого вида может порождаться различными причинами: нестабильностью экономической ситуации, рыночной конъюнктурой, курсами ва-

лют, уровнем

инфляции, налоговой политикой, изменяющимся

покупательским спросом и т. д.

То есть в

задачах подобного рода выбор решения зависит

от состояний

объективной(экономической) действительности,

называемой в модели «природой», а математические модели подобных конфликтных ситуаций называются «игрой с природой».

78

Таким образом, в игре с природой осознанно действует только один игрок, а именно, лицо, принимающее решение. «Природа» является вторым игроком, но не противником первого игрока, так как она осознанно против первого игрока не действует, принимая то или иное свое состояние неопределенным образом, конкретных целей в игре не преследует и безразлична к результату игры. Поэтому термин «природа» характеризует некую объективную реальность, которую не следует понимать буквально, хотя иногда это действительно характеризует состояние природы.

Изучение игр с природой должно также начинаться с построения платежной матрицы, что является наиболее трудоемким и ответственным этапом при принятии решений, так как ошибки, допущенные при формировании платежной матрицы, не могут быть компенсированы никакими вычислительными методами.

Пусть игрок A имеет m возможных стратегий Ai , i =1, m , а природа Q может находиться в одном из n возможных состоя-

ний Qj , j =1, n , которые можно рассматривать как ее«стратегии».

Тогда матрицу игры с природой можно представить в виде, анало-

гичном платежной матрице матричной игры, как A = {aij }

, или

 

 

 

 

 

 

 

 

 

 

 

m´n

æ

 

 

Q

Q

...

Q

ö

 

 

 

 

ç

 

 

1

2

 

n

÷

 

A

 

a

a

...

a

 

ç

1

 

 

11

 

12

 

 

1n

÷

 

A = ç A

 

a

a

 

...

a

2n

÷ ,

(4.1)

ç

2

 

 

21

 

22

 

 

÷

 

ç ...

 

... ...

... ...

÷

 

ç

A

 

a

 

a

 

...

a

 

÷

 

è

m

 

 

m1

 

m2

 

 

mn

ø

 

 

 

 

 

 

 

где aij — выигрыш игрока A при выборе им стратегии Ai и при состоянии природы Qj . Матрица игры с природой содержатель-

но отличается от платежной матрицы антагонистической матричной игры тем, что элементы столбцов матрицы (4.1) не являются проигрышами природы при соответствующих ее состояниях, то есть выигрыши aij платит не природа, а некая «третья сторона»,

или совокупность сторон, влияющих на принятие решений игроком.

79

С одной стороны, задача выбора игроком A чистой или смешанной стратегии в игре с природой проще, чем в матричной игре, так как в этом случае со стороны природы отсутствует систематическое противодействие игроку. С другой стороны, эта задача осложняется наличием неопределенности, связанной с дефицитом осведомленности игрока о характере проявлений состояний природы.

В игре с природой также можно доминировать(мажорировать) стратегии, что может позволить уменьшить размерность платежной матрицы. Например, в игре с матрицей размерности 5 ´5 :

æ 2

6

4

3

2ö

ç

9

4

5

1

3

÷

ç

÷

А = ç 2

3

1

4

2 ÷

ç

4

8

3

0

1

÷

ç

÷

ç

4

7

4

8

2

÷

è

ø

стратегия А5 доминирует стратегии А1 и А3 , поэтому их можно «удалить». Тогда размерность матрицы игры будет равна 3 ´5 :

 

æ9

4

5

1

3

ö

 

А =

ç

4

8

3

0

1

÷

,

ç

÷

 

ç

4

7

4

8

2

÷

 

 

è

ø

 

число строк в которой на две строки меньше, чем в исходной матрице. Таким образом, и в играх с природой можно и нужно пользоваться принципом доминирования стратегий игрокаA (строк матрицы игры). Однако этот принцип недопустим для второго игрока-природы, поскольку природа не стремится к выигрышу в игре, а действует неосознанно. Так, например, в последней матрице пятый столбец(Q5 ) доминирует первый, второй

и третий столбцы ( Q1 , Q2 и Q3 ). Поэтому в матричной игре эти столбцы можно было бы удалить. Но в игре с природой этого

80

делать нельзя. Это обстоятельство является еще одним свойством, отличающим игры с природой от матричных игр.

При решении вопроса о выборе возможной стратегии в игре с природой игрокA должен исходить из матрицы выигрышей. Однако она не всегда адекватно отражает имеющуюся ситуацию. На выбор стратегии должны влиять не только выигрыши, составляющие матрицу игры, но и показатели «удачности» и «неудачности» выбора данной стратегии при данном состоянии природы и благоприятности этого состояния для увеличения выигрыша.

Показателем благоприятности состояния Qj природы Q

называется наибольший выигрыш при этом состоянии, то есть наибольший элемент j-го столбца:

b j = max aij , j =1, n .

 

(4.2)

i

 

 

 

 

И для характеристики степени удачности применения игро-

ком стратегии Ai

при

состоянии

природыQj вводят понятие

«риска».

 

 

 

 

Риском rij игрока A при выборе им стратегииAi

и при со-

стоянии природы Qj

называется

разность между

показателем

благоприятности b j

и выигрышем aij :

 

rij = b j - aij ,

 

 

 

(4.3)

То есть риск — это разность между выигрышем, который игрок получил бы, если бы он точно знал, что состоянием среды будет Qj , и выигрышем, который он получит, не имея этой

информации.

Таким образом, риск rij игрока A представляет собой упущенную возможность максимального выигрышаbj (упущенную выгоду) при данном состоянии природы. Эта упущенная возможность определяется (см. (4.3)) невыигранной частью максимального выигрыша. Следовательно, величину риска можно интерпретировать как своеобразную плату за отсутствие информации о действительном состоянии природы. Другими словами, точная

81

информация о действительном состоянии природы Qj позволяет игроку выбрать ту стратегию Ai , при которой его выигрыш будет максимальным ( b j ).

Если ввести величину:

wj

= min aij ,

(4.4)

 

i

 

представляющую собой наименьший выигрыш игрокаA при состоянии природы Qj , то можно установить границу изменения рисков как:

0 £ rij £ b j - wj

,

(4.5)

где разность b j

- wj

называют колебанием выигрышей при

состояниях природы Qj .

 

Для данной матрицы выигрышей A матрица рисков RA

имеет

ту же размерность и следующий вид:

 

RA = {rij } .

(4.6)

m´n

 

Отметим, что матрица выигрышей (4.1) однозначно определяет матрицу рисков (4.6), так как каждый элемент rij этой

матрицы однозначно определяется по формулам(4.3). Обратное не верно, то есть одна и та же матрица рисков может соответствовать разным матрицам выигрышей.

№ 4.1. Постройте матрицу рисков для следующей

матрицы

выигрышей:

 

 

 

 

 

 

æ1

4

5

9

ö

 

A =

ç

3

8

5

3

÷

(4.7)

ç

÷ .

 

ç

4

6

6

2

÷

 

 

è

ø

 

82

Решение. Вычислим показатели благоприятности по форму-

лам (4.2):

b1 = 4 , b2 = 8 , b3 = 6 , b4 = 9 .

Тогда матрица рисков будет иметь вид:

 

æ3

4

1

0

ö

 

RА =

ç

1

0

1

6

÷

(4.8)

ç

÷ .

 

ç

0

2

0

7

÷

 

 

è

ø

 

Матрица рисков проясняет некоторые нюансы рассматриваемой игры с природой. Например, если игрок выбирает стратегию А2 , то при состояниях природы Q1 и Q4 он получает одинаковые

выигрыши a21 = a24 = 3 . Однако эти выигрыши не являются равноценными в смысле рисков, так как удачность выбора стратегии А2 по отношению к состояниям природы Q1 и Q4 разная. Показатель благоприятности состояния природы Q1 для возможности увеличения выигрыша равен b1 = 4 , а для Q4 b4 = 9 . Поэтому риски игрока A при выборе стратегии А2 и при состояниях при-

роды Q1 и Q4

равны соответственно:

r21 =1,

r24

= 6 .

Другими

словами, при

состоянии природы Q1

игрок

мог

бы

выиграть

по максимуму величину b1 = 4 , а выиграл, придерживаясь стра-

тегии А2 , а21 = 3 ед., «проиграв» всего r21 =1 ед. А при состоянии природы Q4 проиграл бы r24 = 6 ед. Таким образом, выбор

стратегии A2 по отношению к состояниюQ1 — более удачлив, чем по отношению к состоянию природыQ4 . Именно такую

ситуацию и отражает матрица рисков (4.8).

В этом примере мы сравнили одинаковые выигрыши при одной и той же стратегии игрока, но при разных состояниях природы. При этом было показано, что эти результаты могут быть неравноценными в смысле рисков. Одинаковые же выигрыши при разных стратегиях, но при одном и том же состоянии природы

83

всегда равноценны. Например, в матрице выигрышей (4.7) одинаковые выигрыши а13 = а23 = 5 при стратегиях А1 и А2 , и при состоянии природы Q3 — равноценны, поскольку равны соответствующие риски r13 = r23 =1 .

Для решения игры с природой требуется выбрать такую чистую (или смешанную) стратегию, которая была бы наиболее выгодной по сравнению с другими. Отметим, что смешанной стратегии у игрока может и не быть, если действия игрока являются альтернативными, то есть выбор одной стратегии отвергает все другие стратегии, например при выборе альтернативных проектов.

Методы принятия решений в игре с природой зависят от того — известны или нет вероятности состояний Qj природы. Если

эти вероятности неизвестны, то имеет место ситуация полной неопределенности, и это называется принятием решений в условиях полной неопределенности, а если эти вероятности известны априорно, то имеем дело с принятием решений в условиях риска.

4.2.Принятие решений

вусловиях полной неопределенности

Рассмотрим игру с природой, в которой вероятности состояний природы Qj неизвестны и отсутствует всякая возможность

получения о них какой-либо статистической информации. То есть мы находимся в состоянии полной неопределенности, связанной

с отсутствием информации о вероятностях состояний среды (природы).

В таких моделях для определения наилучших решений - ис пользуются, например, следующие критерии: максимакса, Вальда, Сэвиджа и Гурвица.

Критерий максимакса. Это критерий крайнего оптимизма, максимизирующий максимальные выигрыши для каждого состояния природы по формуле:

M = max max aij .

(4.9)

i

j

 

84

Для матрицы (4.7) этот критерий дает M = max{9, 8, 6} = 9 ,

что соответствует стратегии A1 .

Таким образом, максимаксный критерий является критерием крайнего оптимизма, так как он ориентирует лицо, принимающее решение, на наилучшее для него состояние природы и, как следствие отсюда, — на порой «шапкозакидательское» поведение при выборе стратегии. Вместе с тем, ситуации, требующие применения этого критерия, в экономике не так уж и редки. Этим критерием пользуются не только безоглядные оптимисты, но и игроки, поставленные в безвыходное положение и вынужденные руководствоваться принципом «пан или пропал».

Максиминный критерий Вальда. При применении данного критерия природа рассматривается как агрессивно настроенный и сознательно действующий противник, как в матричной игре. Поэтому выбирается стратегия, гарантирующая выигрыш не меньший, чем «нижняя цена игры с природой»:

W = max min aij .

(4.10)

i j

 

Для матрицы (4.7) этот критерий дает

W = max (1, 3, 2) = 3 .

что соответствует стратегии A2 .

В соответствии с этим критерием, из всех самых неудачных результатов выбирается самый лучший. Это перестраховочная позиция крайнего пессимизма, рассчитанная на худший случай.

Такая стратегия приемлема, например, когда игрок не столько хочет выиграть, сколько не хочет проиграть. Принципом критерия Вальда часто пользуются в обиходе, что подтверждается такими поговорками, как «береженого бог бережет» и т. д.

Выбранное таким образом решение полностью исключает риск. Это означает, что принимающий решение не может столкнуться с более худшим результатом, чем тот, на который он ориентируется. Это свойство заставляет считать критерий Вальда

85

одним из фундаментальных. Поэтому в технических и экономических задачах он применяется чаще всего как сознательно, так и неосознанно. Однако в практических ситуациях излишний пессимизм этого критерия может оказаться очень невыгодным.

Применение этого критерия может быть оправдано, если ситуация, в которой принимается решение, характеризуется следующими обстоятельствами:

о вероятности появления того или иного состояния природы ничего не известно;

с появлением того или иного состояния необходимо считаться;

реализуется лишь малое количество решений;

не допускается никакой риск.

Критерий минимального риска Сэвиджа. Этот критерий ана-

логичен критерию Вальда, только игрок в этой ситуации руководствуется матрицей рисков (4.6) и выбирает стратегию, при которой достигается минимально возможный из наибольших рисков:

S = min max rij .

(4.11)

i j

 

Для матрицы (4.8) получаем

S = min (4, 6, 7) = 4 .

То есть лучшей стратегией по этому критерию является стратегия A1 .

Хотя критерии Сэвиджа и Вальда являются критериями крайнего пессимизма, но в общем случае они не эквивалентны, то есть их применение может приводить к выбору разных стратегий, в чем мы убедились на приведенных выше примерах.

Обобщенный критерий пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами l1 , l2 , K, ln .

Переставим выигрыши ai1 , ai 2 , K, ain при каждой стратегии Ai (т.е. элементы каждой строки матрицы (4.1)), расположив их

86

в неубывающем порядке. Обозначим элементы полученной матрицы через bij , а саму матрицу как B:

æ

j

1

2

...

n

ö

ç

 

 

 

 

 

÷

B

b

b

...

b

ç

1

11

12

 

1n ÷

B = ç B

 

b

b

 

...

b

2n

÷ ,

(4.12)

 

ç

2

 

21

22

 

 

 

 

÷

 

 

ç ... ...

... ... ...

÷

 

 

ç B

 

b

b

 

...

b

 

÷

 

 

è

m

 

m1

m 2

 

 

 

mn

ø

 

где

 

 

 

 

 

 

 

 

 

 

 

 

 

bi1 £ bi 2 £K£ bin ,

 

i =

 

.

 

(4.13)

 

1, m

 

Например, матрица (4.7) примет вид:

 

 

æ1

4

5

9ö

 

 

 

 

 

 

 

В =

ç

3

3

5

8

÷

 

 

 

 

 

 

(4.12')

ç

÷

 

 

 

 

 

 

 

ç

2

4

6

6

÷

 

 

 

 

 

 

 

 

è

ø

 

 

 

 

 

 

 

В силу неравенств (4.13) в первом столбце матрицы B распо-

ложены минимальные выигрыши bi1 = min bij , а в последнем —

j

максимальные bin = max bij .

Для некоторых номеровi и j

 

j

 

 

 

 

возможны и равенства bij = aij .

 

Введем неотрицательные числаl1 , l2 , K, ln ,

удовлетво-

ряющие условию:

 

 

 

 

n

 

 

 

 

 

ålj

=1.

 

 

 

 

j =1

 

 

 

 

 

Тогда

показателем эффективности стратегии Ai

по данному

критерию будет число:

 

 

 

 

 

n

 

 

 

 

Gi (l1 , l2 ,K, ln ) = ålj bij ,

i =

 

,

(4.14)

1, m

j =1

87

а оптимальной стратегией Ai0 будет та, при которой достигается максимум (4.14):

Gi0 (l1 , l2 ,K, ln ) = G (l1 , l2 ,K, ln ) = maxi Gi (l1 ,l2 ,K,ln ) , (4.15)

Числа

 

én ù

 

 

 

 

 

 

 

 

 

ê

 

ú

 

 

 

n

 

 

 

 

 

 

 

 

ë

2 û

 

 

 

 

 

lp = ålj и lo = å lj ,

 

 

 

j =1

 

 

é n ù

 

 

 

 

 

 

 

 

 

j =ê

 

ú+1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ë

2 û

 

 

 

 

называются

соответственно показателями

пессимизма

и опти-

мизма. Здесь êé

n

úù — целая часть числа

n

. Тогда коэффициенты

 

 

 

 

 

 

 

ë 2

û

2

 

 

 

lj , j =

 

 

можно выбирать следующим

образом: чем

опаснее

1, n

ситуация, тем больше возникает желание подстраховаться, и тем

ближе к единице должен быть коэффициент пессимизмаl .

p

В более безопасной ситуации ближе к единице должен быть коэффициент оптимизма lo .

Таким образом, в данном критерии коэффициентыlp и lо

выражают

количественную меру соответственно

пессимизма

и оптимизма игрока A, выбирающего коэффициенты l1 , l2

, K, ln .

Если lo

> 0,5 , а lp < 0,5 , то критерий — более «оптимистич-

ный», чем «пессимистичный». Если lo < 0,5 , а lp > 0,5

— более

«пессимистичный», чем «оптимистичный». А если lo = lp = 0,5 —

то «реалистичный».

Рассмотрим теперь вопрос о формализации метода выбора коэффициентов l1 , l2 , K, ln в обобщенном критерии Гурвица

относительно выигрышей. С этой целью определим: а) сумму выигрышей по столбцам матрицыB:

m

bj = åbij , j =1, n ;

i=1

88

б) среднее значение выигрышейbij , расположенных в j

столбце:

 

 

 

1

 

 

1

m

 

 

=

bj

=

åbij ;

bj

 

 

 

 

 

 

m

 

m i =1

в)

общую сумму всех возможных выигрышей игрокаA:

 

 

 

n

 

n

m

b = åbj = ååbij .

j =1 = = j 1 i 1

С учетом свойств матрицы B получаем условия:

b1 £ b2 £K£ bn ,

или

b1 £ b2 £K£ bn .

Поэтому в случае выбора игроком более пессимистичной стратегии (lp > lo ) можно предложить выбрать коэффициенты

l1 , l2 , K, ln обратно пропорциональными средним выигрышам:

l1:l2 :K:ln = bn :bn-1:K:b1 ,

что приводит к следующим формулам для вычисления lj :

lj

=

bn - j +1

, j =

 

.

(4.16)

1, n

 

 

 

b

 

Если же игрок преисполнен оптимизма и считает ситуацию достаточно безопасной, то можно предложить выбрать коэффициенты l1 , l2 , K, ln следующим образом:

89

l1 : l2 : K : ln = b1 : b2 : K : bn ,

или, как:

lj

=

bj

, j =

 

.

(4.17)

1, n

 

 

 

b

 

В

случае реалистичного подхода

можно предложить и

lj =1n .

Отметим, что для применения формул (4.16) и (4.17) необходимо, чтобы все bj должны быть или положительными, ли отрицательными.

№ 4.2. Найдите оптимальную стратегию в игре с природой (4.7) по обобщенному критерию Гурвица.

Решение. Вычислим:

b1 = 6,

b2 =11, b3 =16,

b4

=23 и b = 56 .

Тогда, если игрок придерживается пессимистической стратегии,

то

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

l =

23

, l =

16

, l =

11

, l =

6

,

 

 

 

 

 

 

 

 

 

 

 

 

1

56

 

 

2

 

56

3

 

56

 

 

4

56

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

l

 

=

 

39

> l

 

=

 

17

.

 

 

 

 

 

 

 

 

 

 

 

 

p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

56

o

56

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вычислим

 

показатели эффективности стратегийAi , i =

 

 

 

i, m

по формулам (4.14):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

G =

23

 

×1+

16

× 4 +

11

×5 +

 

6

×9 =

196

,

 

 

 

 

 

 

 

 

 

 

1

56

 

 

56

 

 

56

 

 

56

 

56

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

90

G2

 

 

23

 

16

 

 

11

 

6

 

220

 

=

 

 

 

×3 +

 

 

 

×3 +

 

 

×5 +

 

 

 

×8

=

,

56

56

56

56

 

 

 

 

 

 

 

 

 

56

 

 

G =

23

 

× 2 +

16

 

× 4 +

11

×6 +

6

 

×6 =

212

.

 

 

 

 

 

 

 

 

3

 

 

56

 

 

56

 

 

56

 

56

56

 

 

 

 

 

 

 

 

 

 

 

 

Следовательно, оптимальной в этом случае является стратегия A2 , так как

 

 

ì196

220

 

212

ü

220

 

max G = max =

 

,

=

,

 

ý

 

G .

 

 

 

 

i

í

56

56

 

56

56

2

i =1,3

 

î

 

þ

 

Если игрок придерживается более оптимистичной стратегии, то, согласно формулам (4.17), получаем:

l =

6

 

,

l =

11

,

l =

16

,

l =

23

,

 

 

 

 

 

 

1

56

 

 

2

56

 

 

3

56

 

4

56

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

l =

39

> l

 

=

17

.

 

 

 

 

 

 

 

p

 

 

 

 

 

 

 

о

56

 

 

56

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда показатели эффективности будут равны:

G =

6

 

×1 +

11

× 4 +

16

×5 +

23

×9 =

337

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

56

 

 

56

 

 

 

56

 

 

56

 

 

56

 

 

 

 

 

 

 

 

 

 

 

 

 

 

G2 =

6

 

 

11

 

 

16

 

23

 

315

;

 

 

 

×3 +

 

 

 

 

×3 +

 

 

 

 

×5 +

 

 

 

 

 

×8

=

56

56

56

56

 

 

 

 

 

 

 

56

 

 

G =

6

 

× 2 +

11

× 4 +

16

×6 +

23

×6 =

290

.

 

 

 

 

 

 

 

3

56

 

 

56

 

 

56

 

56

56

 

 

 

 

 

 

 

 

 

 

и оптимальной будет стратегия A1 , так как:

 

 

ì

337

315

 

290

ü

337

 

max G = max =

 

,

=

,

 

ý

 

G .

 

 

 

 

i

í

56

56

 

56

56

1

i =1,3

 

î

 

þ

 

91

Если игрок придерживается реалистичной стратегии, то:

G1 =

1

(1 + 4 + 5 + 9) =

19

;

 

4

4

 

G =

1

 

(

3 + 3 + 5 + 8 =

19

;

 

 

 

 

 

 

2

4

 

)

4

 

 

 

 

G =

1

 

(

2 + 4 + 6 + 6 =

18

,

 

 

 

 

3

4

 

)

4

 

 

 

и игрок может выбирать между стратегиями А1

и А2 .

Отметим, что аналогичным образом

можно рассмотреть

и применение обобщенного критерия Гурвица применительно к матрице рисков RA .

Частным случаем обобщенного критерия является крите-

рий пессимизма-оптимизма Гурвица относительно

выигрышей

с показателем пессимизма l Î[0; 1]. То есть:

 

l = l=, l= =K= l

n-1

0,

l

1- l .

 

1

2

 

n

 

 

Показателем эффективности стратегии Аi по этому критерию

является величина:

 

 

 

 

 

Gi

= l × min aij + (1- l)× max aij

,

(4.18)

 

j

 

 

j

 

 

а оптимальная стратегия Ai0

определяется из условия:

 

Gi

(l) = G (l) = max Gi (l) .

 

(4.19)

0

 

i

 

 

 

 

Этот критерий учитывает как пессимистический, так и оптимистический подходы к решению игры. А именно, при l = 0 получаем критерий крайнего оптимизма, решение совпадает с критерием максимакса; при l =1 получаем критерий крайнего пессимизма и решение совпадает с критерием Вальда. l Î(0; 1)

92

характеризует склонность игрока к риску, а именно, чем ближе l

к1, тем игрок менее склонен к риску.

4.3. Решите № 4.2 по критерию (4.19). Решение. Предположим, что l = 0,5 . Тогда:

1 (

l

)

1 (

)

0,5

×1 + 0,5 ×9

= 5 ;

G

 

= G= 0,5

 

G2 (l) = G=2 (0,5) 0,5 ×3 + 0,5 ×8 = 5,5 ;

3 (

l

)

3 (

)

0,5

× 2

+ 0,5 ×6

= 4 .

G

 

= G= 0,5

 

И в силу (4.19) оптимальной будет стратегия A2 .

Критерий Гурвица предъявляет к ситуации, в которой принимается решение, следующие требования:

о вероятности появления того или иного состояния природы ничего не известно

с появлением того или иного состояния необходимо считаться;

реализуется лишь малое количество решений;

допускается некоторый риск.

Если по принятому критерию рекомендуется использование нескольких стратегий, то выбор между ними может производиться по дополнительному критерию, например, можно сравнивать между собой средние квадратические отклонения выигрышей.

Предположим, что один из рассмотренных выше критериев,

рекомендует

 

игроку

 

выбрать

стратегии A1

или A2

,

как в № 4.2

при lp

= l0

= 0,5 .

Тогда

 

вычислив

средние

квадратические

отклонения:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s

2

=

1

(

2

+ 4

2

+ 5

2

+ 9

2

)

-

æ1 + 4 + 5 + 9 ö2

8,1875,

s

 

» 2,86 ,

1

 

 

 

 

 

 

ç

 

 

÷

1

 

4

1

 

 

 

 

 

è

4

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ø

 

 

 

 

 

 

2

 

1

 

 

2

 

2

 

 

2

 

2

 

 

æ

3 + 3 + 5 + 8 ö2

 

 

 

 

 

s

2

=

 

(3

 

+ 3

 

+

5

 

+ 8

 

)- ç

 

=÷

4,1875,

s2 » 2,05 .

4

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

è

ø

 

 

 

 

 

93

можно рекомендовать из двух стратегий выбрать стратегиюA2

с меньшим значением среднего квадратического отклонения.

Общие рекомендации по выбору того или иного критерия дать затруднительно. Однако отметим следующее: если в отдельных ситуациях недопустим даже минимальный риск, то следует применять критерий Вальда; если определенный риск вполне приемлем, то можно воспользоваться критерием Сэвиджа. Можно рекомендовать одновременно применять поочередно различные критерии. После этого среди нескольких вариантов, отобранных таким образом, в качестве оптимального приходится волевым решением выделять некоторое окончательное решение.

Такой подход позволяет, во-первых, лучше проникнуть во все внутренние связи проблемы принятия решений и, во-вторых, ослабляет влияние субъективного фактора. Кроме того, различные критерии часто приводят к одному результату.

Таким образом, в случае отсутствия информации о вероятностях состояния среды теория не дает однозначных и математически строгих рекомендаций по выбору критериев принятия решений. Это объясняется, в большей мере, не слабостью теории, а неопределенностью самой ситуации. Единственный разумный выход в подобных случаях — попытаться получить дополнительную информацию, например, путем проведения исследований или экспериментов. В отсутствие дополнительной информации принимаемые решения теоретически недостаточно обоснованы и в значительной мере субъективны. Хотя применение математических методов в играх с природой не дает абсолютно достоверного результата и последний в определенной степени является субъективным (вследствие произвольности выбора критерия), оно, тем не менее, создает некоторое упорядочение, имеющихся в распо-

ряжении игрока данных, и способствует повышению качества принимаемых решений, а именно:

1.Задается множество состояний природы.

2.Определяются выигрыши и проигрыши при различных

сочетаниях состояний (Ai ,Qj ) .

Такое упорядочение представлений о проблеме само по себе способствует повышению качества принимаемых решений.

94