 
        
        Смагин Б.И.. Игры с природой
.pdf 
Министерство сельского хозяйства РФ Федеральное государственное образовательное учреждение
высшего профессионального образования «Мичуринский государственный аграрный университет»
Кафедра математического моделирования экономических систем
УТВЕРЖДЕНО протокол № 9
методической комиссии экономического факультета от 12 марта 2008г.
ИГРЫ С ПРИРОДОЙ
Учебно-методическое пособие для студентов экономических специальностей
Мичуринск – наукоград РФ
2008
PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com
Учебно-методическое пособие составлено зав. кафедрой математи- ческого моделирования экономических систем, доктором экономических наук, профессором Б.И. Смагиным
Рецензент:
Зав. кафедрой математики и физики Мичуринского государственного
аграрного университета А.И. Бутенко
Рассмотрено на заседании кафедры Протокол № 8 от 13.02. 2008 г.
| 
 | Содержание | 
 | 
| 1. | Основные понятия игры с природой………………..……..……… | 3 | 
| 2. | Принятие решений в условиях полной неопределенности..……. | 4 | 
| 3. | Принятие решений в условиях риска.…………………………… | 7 | 
| 4. | Контрольные вопросы и задания для практических занятий....… | 9 | 
| 
 | Список литературы………………………………………………… | 14 | 
©Издательство Мичуринского государственного аграрного университета, 2008
2
PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com
1. ОСНОВНЫЕ ПОНЯТИЯ ИГРЫ С ПРИРОДОЙ
Отличительная особенность игры с природой состоит в том, что в ней имеется один активный игрок (игрок 1), а игрок 2 (природа) не дейст- вует сознательно против игрока 1 (по образному выражению А. Эйнштей- на, природа сложна, но не злонамеренна), а выступает как не имеющий конкретной цели партнер по игре, который выбирает свои ходы случайным образом. Термин «природа» характеризует некую объективную действи- тельность.
Платежная матрица игры с природой имеет вид:
| æ a | a | K a | ö | 
 | 
| ç 11 | 12 | 1n | ÷ | 
 | 
| A = ç a21 | a22 | K a2n ÷ | , (1) | |
| ç K | K | K K ÷ | 
 | |
| ç | am2 | 
 | ÷ | 
 | 
| èam1 | K amn ø | 
 | ||
где aij – выигрыш игрока 1 при выборе им i-й стратегии, а игроком 2 – j-й стратегии (i= 1,2,…,m; j = 1,2,…,n). Следует сразу отметить, что мажори- рование стратегий в игре с природой имеет определенную специфику: ис- ключать из рассмотрения можно лишь доминируемые стратегии 1-го игро- ка. Если для всех j = 1,2,…,n выполняется условие aqj ≤ akj, то q-ю страте- гию игрока 1 можно не рассматривать и удалить из матрицы А. Столбцы же, которые отвечают стратегиям игрока 2 (природы) исключать из матри- цы игры А недопустимо, т.к. природа не стремится к выигрышу и для нее нет целенаправленно выигрышных или проигрышных стратегий. С одной стороны отсутствие противодействия упрощает игроку 1 задачу выбора решения, но имеет место проблема обоснования выбора, так как гаранти- рованный результат не известен.
Методы принятия решений в играх с природой зависят от характера неопределенности в поведении игрока 2, т.е. от того, известны или нет ве- роятности состояний (стратегий) природы. В первом случае мы имеем си- туацию риска, а во втором – полной неопределенности. В силу этого ино- гда игру с природой задают не в виде матрицы выигрышей, а в виде мат-
рицы рисков или матрицы упущенных возможностей
æç r11
R= çç Kr21 çè rm1
| r12 | K r1n ö | 
 | 
| r | K r ÷ | (2) | 
| 22 | 2n ÷ | |
| K K K ÷ | 
 | |
| rm2 | ÷ | 
 | 
| K rmn ø | 
 | |
Риском rij игрока 1 при использовании им i-й стратегии и при j-м со- стоянии среды (природы) называется разность между выигрышем, кото- рый игрок получил бы, если бы он знал, что наступит j-е состояние среды
3
PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com
и выигрышем, который игрок получит, не обладая этой информацией. Зная j-е состояние природы, игрок выбирает ту стратегию, при которой его вы- игрыш максимален, т.е.
| rij = β j − aij | = max aij − aij | 
| 
 | 1 ≤ i ≤ m | 
Например, для матрицы выигрышей
| æ | 2 | 3 | 1 | 7 | ö | 
 | 
| ç | 4 | 2 | 9 | 1 | ÷ | 
 | 
| ç | ÷ | (3) | ||||
| A = ç | 3 | 5 | 8 | 6 | ÷ | |
| ç | 6 | 4 | 2 | 2 | ÷ | 
 | 
| ç | ÷ | 
 | ||||
| ç | 5 | 3 | 7 | 2 | ÷ | 
 | 
| è | ø | 
 | 
β1= 6; β2= 5; β3= 9; β4= 7. Поэтому матрица рисков
| æ | 4 | 2 | 8 | 0 | ö | 
 | 
| ç | 2 | 3 | 0 | 6 | ÷ | 
 | 
| ç | ÷ | (4) | ||||
| R = ç | 3 | 0 | 1 | 1 | ÷ | |
| ç | 0 | 1 | 7 | 5 | ÷ | 
 | 
| ç | ÷ | 
 | ||||
| ç | 1 | 2 | 2 | 5 | ÷ | 
 | 
| è | ø | 
 | 
2. ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПОЛНОЙ НЕОПРЕДЕЛЕННОСТИ
В данной ситуации используются следующие критерии: максимакса, Вальда, Сэвиджа, Гурвица. Применение каждого из этих критериев проил- люстрируем на примере выше рассмотренной матрицы выигрышей и свя- занной с ней матрицы рисков.
Критерий максимакса (критерий крайнего оптимизма) определяет стратегию, максимизирующую максимальные выигрыши для каждого со- стояния природы. Наилучшим признается решение, при котором достига- ется максимальный выигрыш, равный
M = max max aij
1 ≤ i ≤ m 1 ≤ j ≤ n
Легко видеть, что для матрицы А наилучшим решением будет А2, при котором достигается максимальный выигрыш, равный 9.
4
PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com
Ситуации, требующие применения такого критерия в экономике ис- пользуют игроки, поставленные в безвыходное положение, при котором они руководствуются принципом «или пан, или пропал».
Максиминный критерий Вальда (критерий крайнего пессимизма) рассматривает природу как агрессивно настроенного и сознательно дейст- вующего противного, аналогичного тому, который был рассмотрен в мат- ричной игре двух лиц с нулевой суммой. Выбирается решение, для которо-
го достигается значение
| 
 | 
 | W = max min aij | 
 | ||
| 
 | 
 | 1 ≤ i ≤ m 1 | ≤ j ≤ n | 
 | 
 | 
| Для платежной матрицы А имеем: | 
 | 
 | |||
| min a1 j | = min a2 j | = 1; min a3 j | = 3; | min a4 j | = min a5 j = 2. | 
| 1 ≤ j ≤ 4 | 1 ≤ j ≤ 4 | 1 ≤ j ≤ 4 | 
 | 1 ≤ j ≤ 4 | 1 ≤ j ≤ 4 | 
| Тогда | W = max min aij | = 3, | 
 | ||
| 
 | 
 | ||||
| 
 | 
 | 1 ≤ i ≤ m 1 ≤ j | ≤ n | 
 | 
 | 
что соответствует третьей стратегии А3 игрока 1.
Такая стратегия ориентируется на худший случай, когда игрок не за- интересован в крупной удаче, но хочет застраховать себя от неожиданных проигрышей.
Критерий минимаксного риска Сэвиджа аналогичен выбору стра-
тегии по критерию Вальда, но игрок руководствуется не платежной матри- цей A, а матрицей рисков R:
| 
 | 
 | S = min max r | 
 | 
 | 
 | |
| 
 | 
 | 1 ≤ i ≤ m 1 ≤ j ≤ n ij | 
 | 
 | 
 | |
| Для выше приведенной матрицы R имеем: | 
 | 
 | 
 | |||
| max r | = 8; max r | = 6; max r | = 3; max r | = 7; max r | = 5. | |
| 1 ≤ j ≤ 4 1 j | 1 ≤ j ≤ 4 2 j | 1 ≤ j ≤ 4 3 j | 1 ≤ j ≤ 4 | 4 j | 1 ≤ j ≤ 4 5 j | 
 | 
Минимально возможный из самых крупных рисков, равный 3, дости- гается при использовании третьей стратегии А3.
Критерий пессимизма – оптимизма Гурвица рекомендует руково-
дствоваться некоторым средним результатом, характеризующим состояние между крайним пессимизмом и оптимизмом. Согласно этому критерию
стратегия в матрице А выбирается в соответствии со значением
HA = max1≤i≤m {p ×1min≤ j≤n aij + (1- p) × max1≤ j≤n aij},
где р – коэффициент пессимизма (p [0; 1]). При р = 0 данный критерий совпадает с максимаксным критерием М, а при р = 1 – с критерием Вальда W. Рассмотрим процедуру применения данного критерия для матрицы А при р = 0,5:
5
PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com
для первой стратегии
| 0,5 | 
 | min a | 
 | + max a | 
 | 
 | = 0,5(1+ 7) = 4; | ||||||||||
| 
 | 
 | 
 | 
 | (1≤ j≤4 | 1 j | 
 | 1≤ j≤4 | 1 j | ) | 
 | 
 | 
 | |||||
| для второй стратегии | 
 | 
 | 
 | 
 | 
 | 
 | ) | 
 | 
 | 
 | |||||||
| 
 | 0,5 | min a2 j + max a2 j | = 0,5(1+ 9) = 5; | ||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | (1≤ j≤4 | 
 | 
 | 
 | 1≤ j≤4 | 
 | 
 | 
 | 
 | 
 | 
 | |
| для третьей стратегии | 
 | 
 | 
 | 
 | ) | 
 | 
 | 
 | 
 | ||||||||
| 0,5 | 
 | min a3 j | + max a3 j | = 0,5(3 + 8) = 5,5; | |||||||||||||
| 
 | 
 | 
 | 
 | 
 | (1≤ j≤4 | 
 | 
 | 1≤ j≤4 | 
 | 
 | 
 | 
 | 
 | ||||
| для четвертой стратегии | 
 | 
 | 
 | 
 | ) | 
 | 
 | 
 | |||||||||
| 0,5 | 
 | min a | 4 j | 
 | + max a | 4 j | = 0,5(2 + 6) = 4; | ||||||||||
| 
 | 
 | (1≤ j≤4 | 
 | 1≤ j≤4 | 
 | 
 | 
 | ||||||||||
| для пятой стратегии | 
 | 
 | 
 | 
 | 
 | ) | 
 | 
 | 
 | 
 | |||||||
| 0,5 | min a5 j + max a5 j | = 0,5(2 + 7) = 4,5. | |||||||||||||||
| 
 | 
 | 
 | ( | 1≤ j≤4 | 
 | 
 | 1≤ j≤4 | 
 | 
 | 
 | 
 | 
 | |||||
| Тогда | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ij )} | 
 | 
| H | A | 
 | = max | 0,5 | min a | ij | + max a | = 5,5, | |||||||||
| 
 | 
 | 
 | 
 | 
 | 1≤i≤5 | { | 
 | 
 | (1≤ j≤4 | 
 | 
 | 1≤ j≤4 | 
 | ||||
т.е. оптимальной является третья стратегия А3. Очевидно, что при измене- нии коэффициент пессимизма р оптимальной может стать другая страте- гия. В частности при р = 0,2 оптимальной будет вторая стратегия при HA = 7,4.
Применительно к матрице рисков R критерий Гурвица имеет вид:
HR = 1min≤i≤m {p × max1≤ j≤n rij + (1- p) ×1min≤ j≤n rij }.
При р = 0 выбор стратегии осуществляется по условию наименьшего из всех возможных рисков, а при р = 1 – по критерию минимаксного риска Сэвиджа.
Рассмотрим результаты применения рассмотренных критериев на примере следующей платежной матрицы:
| æ | 20 | 15 | 30 | 42 | 60 | ö | 
 | 
| ç | 15 | 70 | 45 | 20 | 35 | ÷ | 
 | 
| A = ç | ÷ | (5) | |||||
| ç | 25 | 20 | 40 | 75 | 10 | ÷ | 
 | 
| ç | ÷ | 
 | |||||
| è | 80 | 10 | 20 | 10 | 40 | ø | 
 | 
тогда матрица рисков
6
PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com
| æ | 60 | 55 | 15 | 33 | 0 | ö | 
 | 
| ç | 65 | 0 | 0 | 55 | 25 | ÷ | 
 | 
| R = ç | ÷ | (6) | |||||
| ç | 55 | 50 | 5 | 0 | 50 | ÷ | 
 | 
| ç | ÷ | 
 | |||||
| è | 0 | 60 | 25 | 65 | 20 | ø | 
 | 
Для игрока 1 лучшими являются стратегии:
-по критерию максимакса – А4 (М = 80);
-по критерию Вальда – А1 и А2 (W = 15);
-по критерию Сэвиджа – А3 (S = 55);
-по критерию Гурвица (р = 0,5) – А4 (HA = 45).
Таким образом, при отсутствии информации о вероятностях всех возможных состояниях природы нет однозначных и математически обос- нованных рекомендаций для выбора наилучшей стратегии. Принимаемые же решения в значительной степени субъективны. Тем не менее, примене- ние математических методов позволяет упорядочить имеющиеся данные, т.к. задается множество состояний природы, альтернативные решения, вы- игрыши и потери при различных состояниях природы, что способствует повышению качества принимаемых решений.
3.ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ РИСКА
Вэтом случае различным состояниям природы поставлены в соот- ветствие соответствующие вероятности. Таким образом, игрок 1 принима- ет решение на основе критерия максимального ожидаемого среднего выиг- рыша или минимального ожидаемого среднего риска.
Если для некоторой игры с природой, заданной платежной матрицей
A={aij} стратегиям природы Пj (j=1,2,…,n) соответствуют вероятности pj, то оптимальной стратегией игрока 1 будет та, которая обеспечивает ему максимальный средний выигрыш (максимизирует математическое ожида- ние выигрыша), т.е.
n
max å p j × aij (7)
1≤i≤m j=1
Применительно к матрице упущенных возможностей (матрице рис- ков) оптимальной будет стратегия, обеспечивающая ему минимальный средний риск:
n
min å pj × rij (8)
1≤i≤m j=1
7
PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com
Следует отметить, что критерии (7) и (8) эквивалентны в том смысле, что они достигаются при одной и той же оптимальной стратегии Ai игрока 1. Действительно,
| n | 
 | n | æ | n | n | ö | 
 | 
| min å pjrij = min | å pj (β j - aij ) = min ç | å pj β j - å pjaij ÷ | = | ||||
| 1≤i≤m j=1 | 1≤i≤m | j=1 | 1≤i≤m è | j=1 | j=1 | ø | 
 | 
| 
 | n | 
 | n | 
 | n | 
| = min å pjβ j - min | å pjaij = const + max å pjaij | ||||
| 1≤i≤m | j=1 | 1≤i≤m | j=1 | 1≤i≤m | j=1 | 
| 
 | 
 | 
 | |||
Таким образом, значения критериев (7) и (8) отличаются только на
постоянную величину и достигаются при одной и той же оптимальной стратегии Ai. Пусть для платежной матрицы (5) р1 = 0,1; р2 = р3 = 0,2; р4 = 0,4; р5=0,1. Тогда
для первой стратегии
5
å pja1 j = 0,1× 20 + 0,2 ×15 + 0,2 ×30 + 0,4 × 42 + 0,1× 60 = 33,8
j=1
для второй стратегии
5
å pja2 j = 0,1×15 + 0,2 ×70 + 0,2 × 45 + 0,4 × 20 + 0,1× 35 = 36
j=1
для третьей стратегии
5
å pja3 j = 0,1× 25 + 0,2 × 20 + 0,2 × 40 + 0,4 ×75 + 0,1×10 = 45,5
j=1
для четвертой стратегии
5
å pja4 j = 0,1×80 + 0,2 ×10 + 0,2 × 20 + 0,4 ×10 + 0,1× 40 = 22
j=1
Таким образом, для игры, задаваемой платежной матрицей (5) при заданных вероятностях различных состояний природы, оптимальной стра- тегий по критерию (7) является А3.
Для матрицы рисков (6) имеем:
для первой стратегии
5
å pjr1 j = 0,1× 60 + 0,2 ×55 + 0,2 ×15 + 0,4 ×33 + 0,1× 0 = 33,2
j=1
для второй стратегии
5
å pjr2 j = 0,1×65 + 0,2 ×0 + 0,2 ×0 + 0,4 ×55 + 0,1× 25 = 31
j=1
8
PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com
для третьей стратегии
5
å pjr3 j = 0,1×55 + 0,2 ×50 + 0,2 ×5 + 0,4 ×0 + 0,1×50 = 21,5
j=1
для четвертой стратегии
5
å pjr4 j = 0,1×0 + 0,2 ×60 + 0,2 × 25 + 0,4 × 65 + 0,1× 20 = 45
j=1
Таким образом, и для критерия (8) лучшей является стратегия А3.
Рассмотренные процедуры принятия решений в условиях риска представляют собой одноэтапные игры с природой, которые удобно ис- пользовать в задачах, имеющих одно множество альтернативных решений и одно множество состояний природы. В то же время существует целый ряд задач, требующих анализа последовательности решений и состояний природы, когда одна совокупность стратегий игрока и состояний среды порождает другое состояние подобного типа. Причем последующие реше- ния основываются на результатах предыдущих. Подобного рода игры на- зываются многоэтапными или позиционными играми. Графическим изо-
бражением последовательности решений и состояний среды с указанием соответствующих вероятностей и выигрышей для любых комбинаций аль- тернатив и состояний природы является дерево решений.
4. КОНТРОЛЬНЫЕ ВОПРОСЫ И ЗАДАНИЯ ДЛЯ ПРАКТИЧЕСКИХ ЗАНЯТИЙ
1.Каким образом в игре с природой из платежной матрицы А полу- чается матрица рисков R?
2.Дайте интерпретацию элементов rij в матрице рисков R.
3.Какова процедура определения оптимальной стратегии при игре с природой в условиях полной неопределенности при использовании игро- ком 1 критериев:
а) максимакса; б) Вальда; в) Сэвиджа; г) Гурвица?
4.Какие критерии используются в игре с природой при принятии решений в условиях риска?
Задания для практических занятий
При игре с природой задана платежная матрица А.
| æ a | a | a | a | ö | 
| ç 11 | 12 | 13 | 14 | ÷ | 
| A = ça21 | a22 | a23 | a24 ÷ | |
| ç a31 | a32 | a33 | a34 | ÷ | 
| ç | a42 | a43 | a44 | ÷ | 
| èa41 | ø | |||
9
PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com
Определить:
1.Матрицу рисков R и оптимальные стратегии первого игрока при использовании им а) критерия максимакса; б) критерия Вальда; в) крите- рия Сэвиджа и г) критерия Гурвица с коэффициентом пессимизма р;
2.Определить оптимальную стратегию при известном векторе веро- ятностей состояний природы Р = (р1, р2, р3, р4).
| 
 | æ | 10 | 15 | 
 | 4 | 
 | 16 | ö | 
 | 
 | 
 | 
 | |||
| 
 | ç | 12 | 18 | 
 | 5 | 
 | 22 | ÷ | 
 | 
 | 
 | P = (0,3; 0,1; 0,2; 0,4) | |||
| 1. | A = ç | 
 | 
 | ÷ | ; | p = 0,1; | |||||||||
| 
 | ç | 14 | 12 | 
 | 18 | 
 | 11 | ÷ | 
 | 
 | 
 | 
 | |||
| 
 | ç | 
 | 
 | ÷ | 
 | 
 | 
 | 
 | |||||||
| 
 | è | 6 | 21 | 
 | 17 | 
 | 8 | ø | 
 | 
 | 
 | 
 | |||
| 
 | æ | 11 | 14 | 
 | 5 | 
 | 15 | ö | 
 | 
 | 
 | 
 | |||
| 
 | ç | 
 | 
 | 
 | 
 | 
 | 
 | ÷ | 
 | 
 | 
 | P = (0,1; 0,2; 0,3; 0,4) | |||
| 2. | A = ç | 13 | 17 | 
 | 6 | 
 | 21÷ | ; | p = 0,2; | ||||||
| 
 | ç | 
 | 11 | 
 | 19 | 
 | 10 | ÷ | 
 | 
 | 
 | 
 | |||
| 
 | ç15 | 
 | 
 | ÷ | 
 | 
 | 
 | 
 | |||||||
| 
 | è | 7 | 20 | 
 | 18 | 
 | 7 | ø | 
 | 
 | 
 | 
 | |||
| 
 | æ | 15 | 14 | 
 | 11 | 
 | 18 | 
 | ö | 
 | 
 | 
 | |||
| 
 | ç | 10 | 19 | 
 | 12 | 
 | 20 | 
 | ÷ | 
 | 
 | P = (0,1; 0,3; 0,4; 0,2) | |||
| 3. | A = ç | 
 | 
 | 
 | ÷ | ; | p = 0,3; | ||||||||
| 
 | ç | 17 | 16 | 
 | 29 | 
 | 8 | 
 | 
 | ÷ | 
 | 
 | 
 | ||
| 
 | ç | 
 | 
 | 
 | 
 | ÷ | 
 | 
 | 
 | ||||||
| 
 | è | 13 | 26 | 
 | 18 | 
 | 12 | 
 | ø | 
 | 
 | 
 | |||
| 
 | æ | 6 | 4 | 3 | 5 | ö | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |
| 
 | ç | 7 | 9 | 8 | 3 | ÷ | 
 | p = 0,4; P = (0,2; 0,3; 0,4; 0,1) | |||||||
| 4. | A = ç | ÷ | ; | ||||||||||||
| 
 | ç | 2 | 6 | 1 | 8 | ÷ | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |
| 
 | ç | ÷ | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||
| 
 | è | 6 | 7 | 2 | 5 | ø | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |
| 
 | æ | 17 | 12 | 
 | 13 | 
 | 16 | ö | 
 | 
 | 
 | ||||
| 
 | ç | 12 | 17 | 
 | 14 | 
 | 18 | ÷ | 
 | 
 | P = (0,2; 0,1; 0,2; 0,5) | ||||
| 5. | A = ç | 
 | 
 | ÷; | p = 0,5; | ||||||||||
| 
 | ç | 19 | 14 | 
 | 27 | 
 | 10 | ÷ | 
 | 
 | 
 | ||||
| 
 | ç | 
 | 
 | ÷ | 
 | 
 | 
 | ||||||||
| 
 | è | 15 | 22 | 
 | 20 | 
 | 11 | ø | 
 | 
 | 
 | ||||
| 
 | æ | 21 | 32 | 23 | 26 | ö | 
 | 
 | 
 | ||||||
| 
 | ç | 27 | 30 | 24 | 
 | 24 | ÷ | 
 | 
 | P = (0,2; 0,2; 0,3; 0,3) | |||||
| 6. | A = ç | 
 | ÷ | ; | p = 0,6; | ||||||||||
| 
 | ç | 22 | 14 | 
 | 28 | 
 | 20 | ÷ | 
 | 
 | 
 | ||||
| 
 | ç | 
 | 
 | ÷ | 
 | 
 | 
 | ||||||||
| 
 | è | 15 | 23 | 28 | 
 | 29 | ø | 
 | 
 | 
 | |||||
10
PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com
