- •Эконометрика и экономико-математические методы и модели
- •Часть 3
- •Часть 3
- •Часть 3
- •9.1 Теоретические положения
- •1. Входные:
- •2. Выходные:
- •9.2. Задание
- •Список задач
- •10.1 Теоретические положения
- •10.2. Задание
- •Список задач
- •11.1 Теоретические положения.
- •11.2 Решение матричных игр с нулевой суммой
- •11.2.1 Решение матричных игр с нулевой суммой для игр с седловой точкой
- •11.2.2 Решение матричных игр с нулевой суммой для игр без седловой точки
- •11.3 Решение игр с природой по различным критериям
- •11.4. Задание
- •Список задач
- •12.1 Основные понятия
- •Классификация систем массового обслуживания
- •Основные характеристики систем массового обслуживания
- •12.2. Задание
- •Список задач
- •Список литературы
11.3 Решение игр с природой по различным критериям
Игры с природой – это модель (в игровой форме) ситуации, в которой один из участников безразличен к результату игры. Фактически, любую хозяйственную деятельность человека можно рассматривать как игру с природой. В широком смысле под термином «природа» понимают совокупность неопределенных факторов, внешних обстоятельств, влияющих на эффективность решений, принимаемых сознательным игроком.
В играх с природой степень неопределенности при принятии решения сознательным игроком велика, т.к. «природа», будучи безразличной, к исходу игры может реализовывать такие состояния, которые ей совершенно невыгодны.
Будем предполагать, что в игре с природой
сознательный игрок А может использовать
чистых стратегий
,
а природа П может реализовывать
различных состояний
.
Игроку А могут быть известны
вероятности
,
с которыми природа реализует свои
состояния, но он может и не знать их.
Действуя против природы, игрок А имеет
возможность использовать как чистые
стратегии
,
так и смешанные стратегии
.
Если игрок А в состоянии оценить
(величиной
)
последствия применения каждой своей
чистой стратегии
при любом состоянии
природы, то игру можно задать матрицей
следующего вида.
|
|
|
… |
|
|
|
|
… |
|
|
|
|
… |
|
|
… |
… |
… |
… |
|
|
|
… |
|
Поскольку игры с природой являются частным видом парных матричных игр, то вся теория игр переносится и на игры с природой. Однако игры с природой обладают и некоторыми особенностями. Например, решение достаточно найти только для игрока А, поскольку природа наши рекомендации воспринять не может. И ещё одна важная особенность: в играх с природой смешанные стратегии имеют ограниченное (главным образом теоретическое) значение: не всегда можно для них найти форму, удобную для использования в реальной обстановке. Смешанные стратегии приобретают смысл только при многократном повторении игры. В свете последнего замечания более естественными в играх с природой являются рекомендации в чистых стратегиях игрока А.
С учетом отмеченных особенностей сформулирован ряд критериев, которыми пользуются при выборе оптимальных стратегий игрока А в ситуациях, моделирующихся в игры с природой. Эти критерии основываются на здравом смысле, интуиции и практической целесообразности. Они дают некоторую логическую схему принятия решения. Критерии позволяют последовательным численным анализом ситуации с разных точек зрения оценить принимаемое решение и высказать рекомендации по тому или иному образу действий и тем самым выбрать что-то определенное. Если рекомендации, вытекающие из различных критериев, совпадают, принимается рекомендуемое решение. Если же рекомендации критериев противоречат друг другу, то необходимо сравнить, насколько значительно отличаются результаты по разным критериям, привлечь дополнительную информацию и сделать окончательный выбор.
Критерии подразделяются
на две группы. В случае, если известны
вероятности
состояний
природы, то применяются
критерии Байеса
или Лапласа.
В случае, если вероятности
состояний природы совсем
неизвестны и нельзя сделать о них никаких
предположений, пользуются критериями
Вальда,
Сэвиджа и
Гурвица.
Рассмотрим первую группу критериев (Байеса и Лапласа), применяемую, если известны вероятности состояний природы.
Если вероятности
состояний
природы известны, то
пользуются критерием
Байеса, в
соответствии с которым оптимальной
считается чистая стратегия
,
при которой максимизируется средний
выигрыш
игрока А,
т. е. обеспечивается
.
Если игроку А
все состояния
природы представляются
равновероятными, то полагают
(n – количество
стратегий) и, используя
"принцип недостаточного
основания" Лапласа,
оптимальной считают чистую стратегию
,
обеспечивающую максимум
среднего выигрыша
.
Рассмотрим вторую группу критериев (критериев Вальда, Сэвиджа и Гурвица), которая применяется в случае, если вероятности состояний совсем неизвестны и нельзя сделать о них никаких предположений.
Оптимальной по критерию
Вальда считается
максиминная чистая стратегия
,
при которой в
наихудших условиях гарантируется
максимальный выигрыш игрока
А,
т.е. ему обеспечивается
.
Критерий рекомендует игроку А
ожидать наихудшего
результата и в этом предположении искать
наиболее благоприятный исход (выигрыш),
который совпадает с нижней чистой ценой
игры. Критерий Вальда выражает позицию
крайнего пессимизма, и принимаемое
решение носит заведомо перестраховочный
характер. Однако этот критерий имеет
право на применение в практике вместе
с другими критериями, оценивающими
исследуемую ситуацию с других точек
зрения.
Оптимальной по критерию
Сэвиджа (минимаксного
риска) считается
та чистая стратегия
,
при которой минимизируется величина
максимального риска, т. е.
обеспечивается
.
Таким образом, критерий
Сэвиджа советует ориентироваться не
на выигрыш, а на риск. Это тоже критерий
крайнего пессимизма, но здесь пессимизм
понимается в ином свете: рекомендуется
всячески избегать большого риска при
принятии решения.
При выборе оптимальной стратегии игрока А по критерию Сэвиджа опираются как на платежную матрицу, так и на матрицу рисков.
Риском
игрока А,
когда он пользуется
чистой стратегией
при состоянии
природы, называется
разность между максимальным выигрышем,
который он мог бы получить, если бы
достоверно знал, что природой будет
реализовано именно состояние
,
и тем выигрышем,
который он получит, используя стратегию
в неведении о том,
какое же состояние
природа реализует.
Элементы
матрицы рисков определяются по формуле
,
где
– максимально возможный
выигрыш игрока А при
состоянии
(максимальный элемент
j-го
столбца платежной
матрицы, т.е.
).
Исследуя платежную матрицу, мы стремимся выбрать такое решение, чтобы выигрыш игрока А максимизировался, а анализируя матрицу рисков, стараемся минимизировать неизбежный риск, сопровождающий выбор решения.
Оптимальной по критерию Гурвица считается чистая стратегия , найденная из условия
,
где коэффициент доверия
принадлежит интервалу (0; 1) и выбирается
из субъективных соображений. При
=1
критерий Гурвица превращается в критерий
Вальда, при
= 0 – в критерий крайнего оптимизма,
когда рекомендуется выбирать стратегию,
обеспечивающую самый большой выигрыш.
В связи с этим критерий Гурвица называют
критерием пессимизма-оптимизма. При 0
<
< 1 получается нечто среднее между тем
и другим. Коэффициент доверия
выбирается на основании субъективных
соображений (опыта, здравого смысла и
т.д.). Чем ответственнее
ситуация, чем больше стремление
подстраховаться в ней и не рисковать
без должных оснований, тем ближе к
единице выбирается коэффициент доверия
.
Пример. Для отопления дома в зимний период используется уголь, цена на который зависит от времени года и характера зимы. Летом тонна угля стоит 7 ден.ед., в мягкую зиму – 8 ден. ед., в обычную зиму – 9 ден. ед., а в холодную – 10 ден. ед. Расход угля в отопительный сезон определяется характером зимы: на мягкую зиму достаточно 4 т., на обычную зиму – 5 т., на холодную зиму – 6 т. Затраты домовладельца зависят от количества купленного летом угля. Продать непотребовавшийся уголь возможности не будет. Используя игровой подход, составить платежную матрицу и определить выигрышную стратегию домовладельца.
Решение.
Пусть величины объема потребления (игроком А) пропорциональны состояниям природы Пi. Заготавливая летом уголь, домовладелец может ориентироваться либо на мягкую зиму (первая его чистая стратегия A1), либо на обычную (вторая его чистая стратегия A2), либо на холодную (третья его чистая стратегия A3), покупая соответственно 4, 5 или 6 т. угля. Игрок «Природа» может реализовать либо мягкую зиму (первая его чистая стратегия П1), либо обычную (вторая его чистая стратегия П2), либо холодную зиму (третья его чистая стратегия П3), что потребует затрат 4, 5 или 6 т. угля соответственно. Если решающее правило сформулировать как «доход минус издержки», то элементы платежной матрицы вычисляются так, как показано в таблице 1. Плата домовладельца за уголь лишь условно может называться его выигрышем, поскольку будет выражаться отрицательными числами (приходится отдавать собственные деньги!), а наилучшей будет стратегия, при которой затраты минимизируются.
Таблица 1
|
Мягкая зима П1=4 |
Обычная зима П2=5 |
Холодная зима П3=6 |
min |
A1=4 |
Закуплено летом 4 т., оказалось, что зима мягкая и нужно 4 т. –(4·7)= –28 |
Закуплено летом 4 т., оказалось, что надо дополнительно купить в обычную зиму еще 1 т. –(4·7+1·9)= –37 |
Закуплено летом 4 т., оказалось, что нужно дополнительно купить в холодную зиму еще 2 т. –(4·7+2·10)= –48 |
–48 |
A2=5 |
Закуплено летом 5 т., оказалось, что нужно 4 т., и неизрасходованный уголь продать возможности нет: –(5·7)= –35 |
Закуплено 5 т., оказалось, что нужно 5 т. –(5·7)= –35 |
Закуплено 5 т., оказалось, что нужно дополнительно купить в холодную зиму еще 1 т. –(5·7+1·10)= –45 |
–45 |
A3=6 |
Закуплено 6 т., оказалось, что нужно 4 т. –(6·7)= –42 |
Закуплено 6 т., оказалось, что нужно 5 т. –(6·7)= –42 |
Закуплено 6 т., оказалось, что нужно 6 т. –(6·7)= –42 |
–42 |
max |
–28 |
–35 |
–42 |
|
Найдем нижнюю чистую цену игры по формуле:
.
Верхнюю чистую цену игры находим по формуле:
.
Так как верхняя цена и нижняя цена равны, то игра имеет седловую точку, решается в чистых стратегиях и имеет чистую цену игры v = α = β= –42. Решение игры: (А3, В3, –42).
Оптимальный выбор для сознательного игрока А – чистая стратегия А3, т.е. игроку А следует рекомендовать запасти летом 6 т. угля, за что придется заплатить 42 ден.ед. Давать рекомендации второму игроку П (природе) по оптимальному поведению не имеет смысла.
Рассмотрим примеры применения различных критериев. Так как в задаче не указаны вероятности состояний природы, будем использовать критерии второй группы.
По критерию Вальда оптимальная максиминная чистая стратегия , при которой в наихудших условиях гарантируется максимальный выигрыш игрока А, определяется по формуле:
В нашем случае
Таким образом, по критерию Вальда с
позиции крайнего пессимизма для
игрока А оптимальной является третья
стратегия, соответствующая α.
Для вычисления оптимальной стратегии по критерию Сэвиджа требуется как платежная матрица (таблица 1), так и матрица рисков. Составим матрицу рисков (таблица 2) с учетом того, что элементы матрицы рисков определяются по формуле , где – максимально возможный выигрыш игрока А при состоянии .
Таблица 2
|
Мягкая зима П1=4 |
Обычная зима П2=5 |
Холодная зима П3=6 |
mах |
A1=4 |
= – 28–(–28) = 0 |
= – 35–(–37) = 2 |
= – 42–(–48) = 6 |
6 |
A2=5 |
= – 28–(–35) = 7 |
= – 35–(–35) = 0 |
= – 42–(–45) = 3 |
7 |
A3=6 |
= – 28–(–42) = 14 |
= – 35–(–42) = 7 |
= – 42–(–42) = 0 |
14 |
|
–28 |
–35 |
–42 |
|
Оптимальной по критерию Сэвиджа (минимаксного риска) считается чистая стратегия Аi, обеспечивающая минимум максимального риска, т. е.
.
=
6.
По критерию Сэвиджа оптимальной является первая стратегия игрока А. Данная рекомендация выработана с точки зрения крайнего пессимизма, но здесь пессимизм понимается в ином свете: рекомендуется всячески избегать большого риска при принятии решения.
Оптимальной по критерию Гурвица считается чистая стратегия, найденная из условия:
,
где коэффициент доверия γ принадлежит интервалу (0; 1) и выбирается из субъективных соображений.
Пусть в нашем случае γ = 0,8 (в позиции, близкой к крайнему пессимизму).
Вычислим каждое значение по выражению в скобках в формуле критерия Гурвица:
0,8 · (–48) + (1 – 0,8) · (–28) = –44
0,8 · (–45) + (1 – 0,8) · (–35) = –43
0,8 · (–42) + (1 – 0,8) · (–42) = –42
.
Таким образом, по критерию Гурвица оптимальной является третья стратегия игрока А.
Рассмотрим теперь примеры применения критериев первой группы.
Предположим, что известны вероятности состояний природы: вероятность наступления мягкой зимы составляет 0,5, обычной зимы – 0,4, холодной зимы – 0,1. Таким образом, становится возможным применение критерия Байеса.
Оптимальной по критерию Байеса считается чистая стратегия Аi, при которой максимизируется средний выигрыш игрока А:
–28 · 0,5 – 37· 0,4 – 48· 0,1 = –33,6
–35 · 0,5 – 35· 0,4 – 45· 0,1 = –36
–42 · 0,5 – 42· 0,4 – 42· 0,1 = –42
Таким образом, по критерию Байеса оптимальной является первая стратегия.
Оптимальной по критерию Лапласа считается чистая стратегия , обеспечивающая максимум среднего выигрыша
.
При этом считают все состояния
Пj
природы равновероятными:
,
где n – количество
стратегий.
(1/3) · (–28 – 37 – 48) = –37,67
(1/3) · (–35 – 35 – 45) = –38,33
(1/3) · (–42 – 42 – 42) = –42
.
Таким образом, по критерию Лапласа оптимальной является первая стратегия.
Подытожим наши расчеты оптимальных стратегий игрока А по критериям.
По критерию Вальда оптимальной является третья стратегия.
По критерию Сэвиджа оптимальной является первая стратегия.
По критерию Гурвица оптимальной является третья стратегия.
По критерию Байеса оптимальной является первая стратегия.
По критерию Лапласа оптимальной является первая стратегия.
Таким образом, три критерия рекомендуют первую стратегию, два критерия – третью стратегию.
