
- •Оптимизация в конфликтных ситуациях. Теория игр
- •Основные объекты игры
- •Понятие о равновесной ситуации
- •Понятие о стратегически эквивалентных играх
- •Понятие седловой точки
- •Матричные игры
- •Понятие смешанной стратегии
- •Свойства цены игры и оптимальных стратегий
- •Методы решения игр Игра 22.
- •Двойственные задачи линейного программирования
- •Матричная игра и линейное программирование
- •Метод Робинсон
- •Бесконечные игры
- •Выпуклые игры
- •Элементы теории статистических игр
- •Статистические игры без эксперимента
- •Статистическая игра с единичным экспериментом
- •Статистическая игра с единичным неидеальным экспериментом
Элементы теории статистических игр
Существуют задачи принятия решения, в которых одной из оперирующих сторон является «природа». Особенностью этого «игрока» является безразличие к исходу результата операции. Сложность проблемы заключается в том, что ЛПР не может представить себе образ действия и поведение «природы». Теория статистических игр реализует такие задачи разделяя их на две группы:
Статистические игры, в которых невозможно проведение эксперимента.
Статистические игры с возможностью проведения эксперимента.
Идеальный эксперимент (эксперимент полностью определяет поведение природы).
Неидеальный эксперимент (уточняет априорную информацию).
Статистические игры без эксперимента
Ситуация с формальной точки зрения совпадает с матричной игрой, так как может быть задана в виде таблицы выигрышей ЛПР, строки которой соответствуют стратегиям ЛПР, а столбцы состояниям природы. Концептуальное отличие: природе мы не можем приписать целенаправленных осознанных действий.
Пример
П1, П2, П3, П4 – состояния «природы», х1, х2, х3 - стратегии ЛПР
x П |
П1 |
П2 |
П3 |
П4 |
x1 |
2 |
3 |
4 |
5 |
x2 |
5 |
4 |
1 |
2 |
x3 |
7 |
2 |
8 |
1 |
Это – платежная матрица
Существует другой
способ задания ситуации – задание
матрицы риска. Для этого в каждом столбце
матрицы выигрышей находится максимальное
число
,
а затем рассчитывается риск по формуле
Получим матрицу риска
.
x П |
П1 |
П2 |
П3 |
П4 |
x1 |
5 |
1 |
4 |
0 |
x2 |
2 |
0 |
7 |
3 |
x3 |
0 |
2 |
0 |
4 |
|
7 |
4 |
8 |
5 |
По отношению к тому, какой информацией мы располагаем о поведении природы возможно 3 ситуации:
Известны вероятности, с которыми наступает состояние природы,
Вероятности не известны, но можно судить с той или иной достоверностью чему они могут быть равны,
Ничего не знаем о вероятностях состояния природы.
Вероятности мы знаем, но нет возможности их уточнить. Можно поступить так: либо максимизировать средний выигрыш, либо минимизировать средний риск (n – число состояний природы). Рассчитаем средний выигрыш при условии, что ЛПР выбрал iю стратегию. Тогда средний выигрыш, полученный ЛПР за много партий составит:
,
где-
вероятность наступления состоянияПj
Очевидно ЛПР должен
выбрать такую свою стратегию i0,
чтобы величина
была
максимальна, т.е.
Важно понимать,
что результат
получим
в среднем за много партий.
Вместо максимизирования среднего выигрыша можно минимизировать средний риск, но результат будет тот же:
Вероятности неизвестны, но можно предположить, как они упорядочены. Для решения задачи значения qj , берем равные членная некоторой убывающей геометрической прогрессии. После этого мы ведем расчеты так, как будто мы точно знаем qj .
Один из подходов
(принцип недостаточности основания
Лапласа) – принять все вероятности
равными, т.е.
.
3. Критерии, характеризующие характер ЛПР:
Критерий Вальда (критерий крайнего пессимизма):
Критерий минимакса риска Сэвиджа:
Оба эти критерия предполагают злонамеренность природы
Критерий пессимизма - оптимизма Гурвица:
где α – степень пессимизма ЛПР(α=[0,1]).
Решим наш пример при следующих вероятностях
q1=1.2, q2=0.3, q3=0.4, q4=0.1;
Средние выигрыши:
a1=0.2∙2+0.2 ∙5+0.2∙7=2.8,
a2=0.3∙3+0.3∙4+0.3∙2=2.7,
a3=0.4∙4+0.4∙1+0.4∙8=5.2,
a4=0.1∙5+0.1∙2+0.1∙1=0.8;
Выбираем i0=3
Проверим по рискам:
r1=0.2∙5+0.3∙1+0.4∙4=2.9,
r2=0.2∙2+0.4∙7+0.1∙3=3.5,
r3=0.3∙2+0.1∙4=1;
Результат тот же i0’=3;
Посчитаем по Гурвицу с α=0.5;
Выбираем третью стратегию.