- •Номер столбца соответствует стратегии , применяемой игроком номер строки соответствует номеру стратегии , применяемой игроком
- •Игрок стремится минимизировать свой проигрыш и выбирает стратегию, соответствующую минимальному проигрышу: .
- •Приведение матричной игры к задаче линейного программирования (злп).
- •Задачи теории статистических решений (тср).
- •Множество состояний природы - , отдельное состояние - . Множество решений (стратегий) статистика - , отдельное решение - .
- •Игра 2-х участников с нулевой суммой.
Приведение матричной игры к задаче линейного программирования (злп).
;
- оптимальные смешанные стратегии
игроков.
стратегия
игрока
гарантирует ему проигрыш не больше
,
если игрок
выбирает любую чистую стратегию
стратегия
игрока
гарантирует
ему выигрыш не меньше
,
независимо от выбора игроком
стратегии
Элементы
платежной матрицы всегда можно сделать
положительными, поэтому цена игры
.
Вводя новые переменные
,
,
и учитывая, что
(игрок
стремится максимизировать цену игры
),
,
(игрок B
стремится минимизировать цену игры
),
получим пару взаимно-двойственных
задач.
Прямая ЗЛП: максимизация выигрыша игрока А |
Двойственная ЗЛП: минимизация проигрыша игрока В |
|
|
|
|
решив ЗЛП, находят оптимальные смешанные стратегии |
|
|
|
Задачи теории статистических решений (тср).
Статистических игры представляют собой основную модель теории принятия решений в условиях частичной неопределенности. В задачах ТСР неизвестные условия операции зависят не от сознательно действующего противника, а от объективной реальности, называемой природой.
Множество состояний природы - , отдельное состояние - . Множество решений (стратегий) статистика - , отдельное решение - .
Элемент
- выигрыш,
если используется стратегия
при состоянии природы
(элементы
указывают на эффективность каждой
комбинации
,
на качество решения
).
Риск
игрока
при использовании им стратегии
в условии
:
разность
между выигрышем, который бы мы получили,
если бы знали условия
и выигрышем, который мы получим, не зная
их и выбирая стратегию
(если
бы игрок знал состояние природы
,
то была бы выбрана та стратегия, при
которой выигрыш максимален). Максимальный
выигрыш в столбце
:
.
.
Две постановки задачи о выборе решения:
- получить максимальный выигрыш;
- минимизировать риск.
Критерии выбора оптимального решения.
Платежная матрица |
||||||
Стратегия
статистика
|
Состояние
спроса
|
Средний |
||||
|
|
|
|
выигрыш
|
||
|
|
|
|
|
|
|
|
|
|
|
|
по
критерию Байеса
за оптимальную принимается та чистая
стратегия
,
при которой максимизируется средний
выигрыш
,
т.е. обеспечивается
|
|
-
Матрица рисков
Стратегия статистика
Состояние спроса
Средний
риск
:
за оптимальную стратегию принимается чистая стратегия , при которой минимизируется средний риск, т.е. обеспечивается
,
Если
все вероятности состояний природы
используется принцип
недостаточного основания Лапласа:
.
Оптимальна стратегия, обеспечивающая
максимум среднего выигрыша.
Критерии выбора оптимальной стратегии при неизвестных вероятностях природы |
|||
№ |
Название критерия |
Критерий эффективности |
замечания |
1 |
Максиминный критерий Вальда (совпадает с критерием выбора максиминной стратегии, позволяющей получить нижнюю чистую цену в парной игре с нулевой суммой)
|
за оптимальную принимается чистая стратегия, которая в наихудших условиях гарантирует максимальный выигрыш, т.е. |
критерии ориентируют на самые неблагоприятные состояния природы (выражают пессимистическую оценку ситуации) |
2 |
Критерий минимального риска Сэвиджа |
выбирать
в качестве оптимальной стратегии ту,
при которой величина максимального
риска минимизируется в наихудших
условиях, т.е. обеспечивается
|
|
3 |
является Критерий
|
за
оптимальную принимается та стратегия,
для которой выполняется соотношение
где
|
критерий пессимизма-оптимизма: -
при
-
при
-
при
|

.
критерий крайнего оптимизма,
критерий пессимизма Вальда.
среднее (обычно
принимают близким к единице; в общем
случае
выбирают исходя из субъективных
соображений).