9.3. Задачи теории статистических решений
Игры с природой.
В рассмотренных выше задачах теории игр предполагалось, что в них принимают участие игроки, интересы которых противоположны.
Поэтому действия каждого игрока направлены на увеличение выигрыша (уменьшение проигрыша).
Однако во многих задачах, приводящих к игровым, неопределенность вызвана отсутствием информации об условиях, в которых осуществляется действие.
Эти условия зависят не от сознательных действий другого игрока, а от объективной действительности, которую принято называть «природой».
Такие игры называются играми с природой.
Человек А в играх с природой старается действовать осмотрительно, используя, например, минимаксную стратегию, позволяющую получить наименьший проигрыш.
Второй игрок В (природа) действует совершенно случай-но, возможные стратегии определяются как ее состояния.
В некоторых задачах для состояний природы может быть задано распределение вероятностей, в других — оно неизвестно.
Условия игры задаются матрицей
А=(aij)= .
Элемент aij равен выигрышу игрока А, если он использует стратегию Аi, а состояние природы — Pj.
В ряде случаев рассматривают матрицу риска R.
Элементы матрицы риска rij представляют собой разность между выигрышем, который получил бы игрок А, если бы знал состояние Pj, и выигрышем, который он получит в тех же условиях, применяя стратегию Аi, т. е.
rij =j - aij , где j = .
Критерии принятия решений.
Рассмотрим ряд критериев, используемых при решении игр с природой.
При известном распределении вероятностей различных состояний природы критерием принятия решения является максимум математического ожидания выигрыша (минимум математического ожидания риска).
Критерий Байеса. Если вероятности состояния природы Pj равны qj (j=1...n), =1, то выбор i-стратегии обеспечивает математическое ожидание выигрыша, равное .
Принимается решение об использовании стратегии, для которой имеет место
.
Если вопрос распределения вероятностей состояний природы не решен, то используют следующие критерии.
Максиминный критерий Вальда. Этот критерий совпадает с критерием выбора стратегии, позволяющим получить нижнюю цену игры для двух лиц с нулевой суммой
С огласно этому критерию выбирается стратегия, гарантирующая при любых условиях выигрыши, не меньше, чем
К ритерий минимального риска Сэвиджа. Этот критерий рекомендует выбирать в качестве оптимальной ту стратегию, при которой величина риска минимизируется в наихудших условиях, т.е. обеспечивается
Критерии Вальда и Сэвиджа основаны на самой пессимистической оценке обстановки.
Критерий Гурвица является критерием пессимизма-оптимизма.
За оптимальную принимается та стратегия, для которой выполняется соотношение
, где .
При =0 имеем критерий крайнего оптимизма, а при =1 — критерий пессимизма Вальда.
При желании подстраховаться в данной ситуации принимают близким к единице.
П р и м е р 1. Найти решении статистической игры, используя несколько различных критериев.
5 |
2 |
8 |
4 |
2 |
3 |
4 |
12 |
8 |
5 |
3 |
10 |
1 |
4 |
2 |
8 |
Р е ш е н и е.
|
B1 |
B2 |
B3 |
B4 |
|
A1 |
5 |
2 |
8 |
4 |
2 |
A2 |
2 |
3 |
4 |
12 |
2 |
A3 |
8 |
5 |
3 |
10 |
3 |
A4 |
1 |
4 |
2 |
8 |
1 |
|
8 |
5 |
8 |
12 |
|
Согласно критерию Вальда находим, что, поэтому
р ешением данной
матричной игры является стратегия А3.
Воспользуемся критерием Сэвиджа.
Построим матрицу рисков:
3 |
3 |
0 |
8 |
8 |
6 |
2 |
4 |
0 |
6 |
0 |
0 |
5 |
2 |
5 |
7 |
1 |
6 |
4 |
7 |
С огласно критерию Сэвиджа определяем
В соответствии с этим критерием также предполагается решение А3.
Воспользуемся критерием Гурвица.
Положим =0.5; тогда
т.е. следует принять решение A2.
Если предположить известным распределение вероятнос-тей для различных состояний природы, например считать эти состояния равновероятными (q1=q2=q3=q4=1/4), то для принятия решения следует найти математические ожидания выигрыша:
M1 =
M2 =
M3 =
M4 =
Так как максимальное значение имеет М3, то следует выбрать решение А3.
Таким образом, в большинстве случаев критерии указывают на стратегию А3, поэтому разумно принять именно ее.