
Смагин Б.И.. Игры с природой
.pdf
Министерство сельского хозяйства РФ Федеральное государственное образовательное учреждение
высшего профессионального образования «Мичуринский государственный аграрный университет»
Кафедра математического моделирования экономических систем
УТВЕРЖДЕНО протокол № 9
методической комиссии экономического факультета от 12 марта 2008г.
ИГРЫ С ПРИРОДОЙ
Учебно-методическое пособие для студентов экономических специальностей
Мичуринск – наукоград РФ
2008
PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com
Учебно-методическое пособие составлено зав. кафедрой математи- ческого моделирования экономических систем, доктором экономических наук, профессором Б.И. Смагиным
Рецензент:
Зав. кафедрой математики и физики Мичуринского государственного
аграрного университета А.И. Бутенко
Рассмотрено на заседании кафедры Протокол № 8 от 13.02. 2008 г.
|
Содержание |
|
1. |
Основные понятия игры с природой………………..……..……… |
3 |
2. |
Принятие решений в условиях полной неопределенности..……. |
4 |
3. |
Принятие решений в условиях риска.…………………………… |
7 |
4. |
Контрольные вопросы и задания для практических занятий....… |
9 |
|
Список литературы………………………………………………… |
14 |
©Издательство Мичуринского государственного аграрного университета, 2008
2
PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com
1. ОСНОВНЫЕ ПОНЯТИЯ ИГРЫ С ПРИРОДОЙ
Отличительная особенность игры с природой состоит в том, что в ней имеется один активный игрок (игрок 1), а игрок 2 (природа) не дейст- вует сознательно против игрока 1 (по образному выражению А. Эйнштей- на, природа сложна, но не злонамеренна), а выступает как не имеющий конкретной цели партнер по игре, который выбирает свои ходы случайным образом. Термин «природа» характеризует некую объективную действи- тельность.
Платежная матрица игры с природой имеет вид:
æ a |
a |
K a |
ö |
|
ç 11 |
12 |
1n |
÷ |
|
A = ç a21 |
a22 |
K a2n ÷ |
, (1) |
|
ç K |
K |
K K ÷ |
|
|
ç |
am2 |
|
÷ |
|
èam1 |
K amn ø |
|
где aij – выигрыш игрока 1 при выборе им i-й стратегии, а игроком 2 – j-й стратегии (i= 1,2,…,m; j = 1,2,…,n). Следует сразу отметить, что мажори- рование стратегий в игре с природой имеет определенную специфику: ис- ключать из рассмотрения можно лишь доминируемые стратегии 1-го игро- ка. Если для всех j = 1,2,…,n выполняется условие aqj ≤ akj, то q-ю страте- гию игрока 1 можно не рассматривать и удалить из матрицы А. Столбцы же, которые отвечают стратегиям игрока 2 (природы) исключать из матри- цы игры А недопустимо, т.к. природа не стремится к выигрышу и для нее нет целенаправленно выигрышных или проигрышных стратегий. С одной стороны отсутствие противодействия упрощает игроку 1 задачу выбора решения, но имеет место проблема обоснования выбора, так как гаранти- рованный результат не известен.
Методы принятия решений в играх с природой зависят от характера неопределенности в поведении игрока 2, т.е. от того, известны или нет ве- роятности состояний (стратегий) природы. В первом случае мы имеем си- туацию риска, а во втором – полной неопределенности. В силу этого ино- гда игру с природой задают не в виде матрицы выигрышей, а в виде мат-
рицы рисков или матрицы упущенных возможностей
æç r11
R= çç Kr21 çè rm1
r12 |
K r1n ö |
|
r |
K r ÷ |
(2) |
22 |
2n ÷ |
|
K K K ÷ |
|
|
rm2 |
÷ |
|
K rmn ø |
|
Риском rij игрока 1 при использовании им i-й стратегии и при j-м со- стоянии среды (природы) называется разность между выигрышем, кото- рый игрок получил бы, если бы он знал, что наступит j-е состояние среды
3
PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com
и выигрышем, который игрок получит, не обладая этой информацией. Зная j-е состояние природы, игрок выбирает ту стратегию, при которой его вы- игрыш максимален, т.е.
rij = β j − aij |
= max aij − aij |
|
1 ≤ i ≤ m |
Например, для матрицы выигрышей
æ |
2 |
3 |
1 |
7 |
ö |
|
ç |
4 |
2 |
9 |
1 |
÷ |
|
ç |
÷ |
(3) |
||||
A = ç |
3 |
5 |
8 |
6 |
÷ |
|
ç |
6 |
4 |
2 |
2 |
÷ |
|
ç |
÷ |
|
||||
ç |
5 |
3 |
7 |
2 |
÷ |
|
è |
ø |
|
β1= 6; β2= 5; β3= 9; β4= 7. Поэтому матрица рисков
æ |
4 |
2 |
8 |
0 |
ö |
|
ç |
2 |
3 |
0 |
6 |
÷ |
|
ç |
÷ |
(4) |
||||
R = ç |
3 |
0 |
1 |
1 |
÷ |
|
ç |
0 |
1 |
7 |
5 |
÷ |
|
ç |
÷ |
|
||||
ç |
1 |
2 |
2 |
5 |
÷ |
|
è |
ø |
|
2. ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПОЛНОЙ НЕОПРЕДЕЛЕННОСТИ
В данной ситуации используются следующие критерии: максимакса, Вальда, Сэвиджа, Гурвица. Применение каждого из этих критериев проил- люстрируем на примере выше рассмотренной матрицы выигрышей и свя- занной с ней матрицы рисков.
Критерий максимакса (критерий крайнего оптимизма) определяет стратегию, максимизирующую максимальные выигрыши для каждого со- стояния природы. Наилучшим признается решение, при котором достига- ется максимальный выигрыш, равный
M = max max aij
1 ≤ i ≤ m 1 ≤ j ≤ n
Легко видеть, что для матрицы А наилучшим решением будет А2, при котором достигается максимальный выигрыш, равный 9.
4
PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com
Ситуации, требующие применения такого критерия в экономике ис- пользуют игроки, поставленные в безвыходное положение, при котором они руководствуются принципом «или пан, или пропал».
Максиминный критерий Вальда (критерий крайнего пессимизма) рассматривает природу как агрессивно настроенного и сознательно дейст- вующего противного, аналогичного тому, который был рассмотрен в мат- ричной игре двух лиц с нулевой суммой. Выбирается решение, для которо-
го достигается значение
|
|
W = max min aij |
|
||
|
|
1 ≤ i ≤ m 1 |
≤ j ≤ n |
|
|
Для платежной матрицы А имеем: |
|
|
|||
min a1 j |
= min a2 j |
= 1; min a3 j |
= 3; |
min a4 j |
= min a5 j = 2. |
1 ≤ j ≤ 4 |
1 ≤ j ≤ 4 |
1 ≤ j ≤ 4 |
|
1 ≤ j ≤ 4 |
1 ≤ j ≤ 4 |
Тогда |
W = max min aij |
= 3, |
|
||
|
|
||||
|
|
1 ≤ i ≤ m 1 ≤ j |
≤ n |
|
|
что соответствует третьей стратегии А3 игрока 1.
Такая стратегия ориентируется на худший случай, когда игрок не за- интересован в крупной удаче, но хочет застраховать себя от неожиданных проигрышей.
Критерий минимаксного риска Сэвиджа аналогичен выбору стра-
тегии по критерию Вальда, но игрок руководствуется не платежной матри- цей A, а матрицей рисков R:
|
|
S = min max r |
|
|
|
|
|
|
1 ≤ i ≤ m 1 ≤ j ≤ n ij |
|
|
|
|
Для выше приведенной матрицы R имеем: |
|
|
|
|||
max r |
= 8; max r |
= 6; max r |
= 3; max r |
= 7; max r |
= 5. |
|
1 ≤ j ≤ 4 1 j |
1 ≤ j ≤ 4 2 j |
1 ≤ j ≤ 4 3 j |
1 ≤ j ≤ 4 |
4 j |
1 ≤ j ≤ 4 5 j |
|
Минимально возможный из самых крупных рисков, равный 3, дости- гается при использовании третьей стратегии А3.
Критерий пессимизма – оптимизма Гурвица рекомендует руково-
дствоваться некоторым средним результатом, характеризующим состояние между крайним пессимизмом и оптимизмом. Согласно этому критерию
стратегия в матрице А выбирается в соответствии со значением
HA = max1≤i≤m {p ×1min≤ j≤n aij + (1- p) × max1≤ j≤n aij},
где р – коэффициент пессимизма (p [0; 1]). При р = 0 данный критерий совпадает с максимаксным критерием М, а при р = 1 – с критерием Вальда W. Рассмотрим процедуру применения данного критерия для матрицы А при р = 0,5:
5
PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com
для первой стратегии
0,5 |
|
min a |
|
+ max a |
|
|
= 0,5(1+ 7) = 4; |
||||||||||
|
|
|
|
(1≤ j≤4 |
1 j |
|
1≤ j≤4 |
1 j |
) |
|
|
|
|||||
для второй стратегии |
|
|
|
|
|
|
) |
|
|
|
|||||||
|
0,5 |
min a2 j + max a2 j |
= 0,5(1+ 9) = 5; |
||||||||||||||
|
|
|
|
|
|
(1≤ j≤4 |
|
|
|
1≤ j≤4 |
|
|
|
|
|
|
|
для третьей стратегии |
|
|
|
|
) |
|
|
|
|
||||||||
0,5 |
|
min a3 j |
+ max a3 j |
= 0,5(3 + 8) = 5,5; |
|||||||||||||
|
|
|
|
|
(1≤ j≤4 |
|
|
1≤ j≤4 |
|
|
|
|
|
||||
для четвертой стратегии |
|
|
|
|
) |
|
|
|
|||||||||
0,5 |
|
min a |
4 j |
|
+ max a |
4 j |
= 0,5(2 + 6) = 4; |
||||||||||
|
|
(1≤ j≤4 |
|
1≤ j≤4 |
|
|
|
||||||||||
для пятой стратегии |
|
|
|
|
|
) |
|
|
|
|
|||||||
0,5 |
min a5 j + max a5 j |
= 0,5(2 + 7) = 4,5. |
|||||||||||||||
|
|
|
( |
1≤ j≤4 |
|
|
1≤ j≤4 |
|
|
|
|
|
|||||
Тогда |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ij )} |
|
H |
A |
|
= max |
0,5 |
min a |
ij |
+ max a |
= 5,5, |
|||||||||
|
|
|
|
|
1≤i≤5 |
{ |
|
|
(1≤ j≤4 |
|
|
1≤ j≤4 |
|
т.е. оптимальной является третья стратегия А3. Очевидно, что при измене- нии коэффициент пессимизма р оптимальной может стать другая страте- гия. В частности при р = 0,2 оптимальной будет вторая стратегия при HA = 7,4.
Применительно к матрице рисков R критерий Гурвица имеет вид:
HR = 1min≤i≤m {p × max1≤ j≤n rij + (1- p) ×1min≤ j≤n rij }.
При р = 0 выбор стратегии осуществляется по условию наименьшего из всех возможных рисков, а при р = 1 – по критерию минимаксного риска Сэвиджа.
Рассмотрим результаты применения рассмотренных критериев на примере следующей платежной матрицы:
æ |
20 |
15 |
30 |
42 |
60 |
ö |
|
ç |
15 |
70 |
45 |
20 |
35 |
÷ |
|
A = ç |
÷ |
(5) |
|||||
ç |
25 |
20 |
40 |
75 |
10 |
÷ |
|
ç |
÷ |
|
|||||
è |
80 |
10 |
20 |
10 |
40 |
ø |
|
тогда матрица рисков
6
PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com
æ |
60 |
55 |
15 |
33 |
0 |
ö |
|
ç |
65 |
0 |
0 |
55 |
25 |
÷ |
|
R = ç |
÷ |
(6) |
|||||
ç |
55 |
50 |
5 |
0 |
50 |
÷ |
|
ç |
÷ |
|
|||||
è |
0 |
60 |
25 |
65 |
20 |
ø |
|
Для игрока 1 лучшими являются стратегии:
-по критерию максимакса – А4 (М = 80);
-по критерию Вальда – А1 и А2 (W = 15);
-по критерию Сэвиджа – А3 (S = 55);
-по критерию Гурвица (р = 0,5) – А4 (HA = 45).
Таким образом, при отсутствии информации о вероятностях всех возможных состояниях природы нет однозначных и математически обос- нованных рекомендаций для выбора наилучшей стратегии. Принимаемые же решения в значительной степени субъективны. Тем не менее, примене- ние математических методов позволяет упорядочить имеющиеся данные, т.к. задается множество состояний природы, альтернативные решения, вы- игрыши и потери при различных состояниях природы, что способствует повышению качества принимаемых решений.
3.ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ РИСКА
Вэтом случае различным состояниям природы поставлены в соот- ветствие соответствующие вероятности. Таким образом, игрок 1 принима- ет решение на основе критерия максимального ожидаемого среднего выиг- рыша или минимального ожидаемого среднего риска.
Если для некоторой игры с природой, заданной платежной матрицей
A={aij} стратегиям природы Пj (j=1,2,…,n) соответствуют вероятности pj, то оптимальной стратегией игрока 1 будет та, которая обеспечивает ему максимальный средний выигрыш (максимизирует математическое ожида- ние выигрыша), т.е.
n
max å p j × aij (7)
1≤i≤m j=1
Применительно к матрице упущенных возможностей (матрице рис- ков) оптимальной будет стратегия, обеспечивающая ему минимальный средний риск:
n
min å pj × rij (8)
1≤i≤m j=1
7
PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com
Следует отметить, что критерии (7) и (8) эквивалентны в том смысле, что они достигаются при одной и той же оптимальной стратегии Ai игрока 1. Действительно,
n |
|
n |
æ |
n |
n |
ö |
|
min å pjrij = min |
å pj (β j - aij ) = min ç |
å pj β j - å pjaij ÷ |
= |
||||
1≤i≤m j=1 |
1≤i≤m |
j=1 |
1≤i≤m è |
j=1 |
j=1 |
ø |
|
|
n |
|
n |
|
n |
= min å pjβ j - min |
å pjaij = const + max å pjaij |
||||
1≤i≤m |
j=1 |
1≤i≤m |
j=1 |
1≤i≤m |
j=1 |
|
|
|
Таким образом, значения критериев (7) и (8) отличаются только на
постоянную величину и достигаются при одной и той же оптимальной стратегии Ai. Пусть для платежной матрицы (5) р1 = 0,1; р2 = р3 = 0,2; р4 = 0,4; р5=0,1. Тогда
для первой стратегии
5
å pja1 j = 0,1× 20 + 0,2 ×15 + 0,2 ×30 + 0,4 × 42 + 0,1× 60 = 33,8
j=1
для второй стратегии
5
å pja2 j = 0,1×15 + 0,2 ×70 + 0,2 × 45 + 0,4 × 20 + 0,1× 35 = 36
j=1
для третьей стратегии
5
å pja3 j = 0,1× 25 + 0,2 × 20 + 0,2 × 40 + 0,4 ×75 + 0,1×10 = 45,5
j=1
для четвертой стратегии
5
å pja4 j = 0,1×80 + 0,2 ×10 + 0,2 × 20 + 0,4 ×10 + 0,1× 40 = 22
j=1
Таким образом, для игры, задаваемой платежной матрицей (5) при заданных вероятностях различных состояний природы, оптимальной стра- тегий по критерию (7) является А3.
Для матрицы рисков (6) имеем:
для первой стратегии
5
å pjr1 j = 0,1× 60 + 0,2 ×55 + 0,2 ×15 + 0,4 ×33 + 0,1× 0 = 33,2
j=1
для второй стратегии
5
å pjr2 j = 0,1×65 + 0,2 ×0 + 0,2 ×0 + 0,4 ×55 + 0,1× 25 = 31
j=1
8
PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com
для третьей стратегии
5
å pjr3 j = 0,1×55 + 0,2 ×50 + 0,2 ×5 + 0,4 ×0 + 0,1×50 = 21,5
j=1
для четвертой стратегии
5
å pjr4 j = 0,1×0 + 0,2 ×60 + 0,2 × 25 + 0,4 × 65 + 0,1× 20 = 45
j=1
Таким образом, и для критерия (8) лучшей является стратегия А3.
Рассмотренные процедуры принятия решений в условиях риска представляют собой одноэтапные игры с природой, которые удобно ис- пользовать в задачах, имеющих одно множество альтернативных решений и одно множество состояний природы. В то же время существует целый ряд задач, требующих анализа последовательности решений и состояний природы, когда одна совокупность стратегий игрока и состояний среды порождает другое состояние подобного типа. Причем последующие реше- ния основываются на результатах предыдущих. Подобного рода игры на- зываются многоэтапными или позиционными играми. Графическим изо-
бражением последовательности решений и состояний среды с указанием соответствующих вероятностей и выигрышей для любых комбинаций аль- тернатив и состояний природы является дерево решений.
4. КОНТРОЛЬНЫЕ ВОПРОСЫ И ЗАДАНИЯ ДЛЯ ПРАКТИЧЕСКИХ ЗАНЯТИЙ
1.Каким образом в игре с природой из платежной матрицы А полу- чается матрица рисков R?
2.Дайте интерпретацию элементов rij в матрице рисков R.
3.Какова процедура определения оптимальной стратегии при игре с природой в условиях полной неопределенности при использовании игро- ком 1 критериев:
а) максимакса; б) Вальда; в) Сэвиджа; г) Гурвица?
4.Какие критерии используются в игре с природой при принятии решений в условиях риска?
Задания для практических занятий
При игре с природой задана платежная матрица А.
æ a |
a |
a |
a |
ö |
ç 11 |
12 |
13 |
14 |
÷ |
A = ça21 |
a22 |
a23 |
a24 ÷ |
|
ç a31 |
a32 |
a33 |
a34 |
÷ |
ç |
a42 |
a43 |
a44 |
÷ |
èa41 |
ø |
9
PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com
Определить:
1.Матрицу рисков R и оптимальные стратегии первого игрока при использовании им а) критерия максимакса; б) критерия Вальда; в) крите- рия Сэвиджа и г) критерия Гурвица с коэффициентом пессимизма р;
2.Определить оптимальную стратегию при известном векторе веро- ятностей состояний природы Р = (р1, р2, р3, р4).
|
æ |
10 |
15 |
|
4 |
|
16 |
ö |
|
|
|
|
|||
|
ç |
12 |
18 |
|
5 |
|
22 |
÷ |
|
|
|
P = (0,3; 0,1; 0,2; 0,4) |
|||
1. |
A = ç |
|
|
÷ |
; |
p = 0,1; |
|||||||||
|
ç |
14 |
12 |
|
18 |
|
11 |
÷ |
|
|
|
|
|||
|
ç |
|
|
÷ |
|
|
|
|
|||||||
|
è |
6 |
21 |
|
17 |
|
8 |
ø |
|
|
|
|
|||
|
æ |
11 |
14 |
|
5 |
|
15 |
ö |
|
|
|
|
|||
|
ç |
|
|
|
|
|
|
÷ |
|
|
|
P = (0,1; 0,2; 0,3; 0,4) |
|||
2. |
A = ç |
13 |
17 |
|
6 |
|
21÷ |
; |
p = 0,2; |
||||||
|
ç |
|
11 |
|
19 |
|
10 |
÷ |
|
|
|
|
|||
|
ç15 |
|
|
÷ |
|
|
|
|
|||||||
|
è |
7 |
20 |
|
18 |
|
7 |
ø |
|
|
|
|
|||
|
æ |
15 |
14 |
|
11 |
|
18 |
|
ö |
|
|
|
|||
|
ç |
10 |
19 |
|
12 |
|
20 |
|
÷ |
|
|
P = (0,1; 0,3; 0,4; 0,2) |
|||
3. |
A = ç |
|
|
|
÷ |
; |
p = 0,3; |
||||||||
|
ç |
17 |
16 |
|
29 |
|
8 |
|
|
÷ |
|
|
|
||
|
ç |
|
|
|
|
÷ |
|
|
|
||||||
|
è |
13 |
26 |
|
18 |
|
12 |
|
ø |
|
|
|
|||
|
æ |
6 |
4 |
3 |
5 |
ö |
|
|
|
|
|
|
|
|
|
|
ç |
7 |
9 |
8 |
3 |
÷ |
|
p = 0,4; P = (0,2; 0,3; 0,4; 0,1) |
|||||||
4. |
A = ç |
÷ |
; |
||||||||||||
|
ç |
2 |
6 |
1 |
8 |
÷ |
|
|
|
|
|
|
|
|
|
|
ç |
÷ |
|
|
|
|
|
|
|
|
|||||
|
è |
6 |
7 |
2 |
5 |
ø |
|
|
|
|
|
|
|
|
|
|
æ |
17 |
12 |
|
13 |
|
16 |
ö |
|
|
|
||||
|
ç |
12 |
17 |
|
14 |
|
18 |
÷ |
|
|
P = (0,2; 0,1; 0,2; 0,5) |
||||
5. |
A = ç |
|
|
÷; |
p = 0,5; |
||||||||||
|
ç |
19 |
14 |
|
27 |
|
10 |
÷ |
|
|
|
||||
|
ç |
|
|
÷ |
|
|
|
||||||||
|
è |
15 |
22 |
|
20 |
|
11 |
ø |
|
|
|
||||
|
æ |
21 |
32 |
23 |
26 |
ö |
|
|
|
||||||
|
ç |
27 |
30 |
24 |
|
24 |
÷ |
|
|
P = (0,2; 0,2; 0,3; 0,3) |
|||||
6. |
A = ç |
|
÷ |
; |
p = 0,6; |
||||||||||
|
ç |
22 |
14 |
|
28 |
|
20 |
÷ |
|
|
|
||||
|
ç |
|
|
÷ |
|
|
|
||||||||
|
è |
15 |
23 |
28 |
|
29 |
ø |
|
|
|
10
PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com