
- •Лабораторная работа 5. Теория игр. Парные игры,
- •Теоретические сведения. Базовые понятия
- •Классификация игр
- •Матричные игры
- •Решение матричной игры в чистых стратегиях
- •Решение игры в смешанных стратегиях
- •Пример 1
- •Пример 2. Графическое решение парной игры
- •Пример 3
- •Варианты заданий
- •Задача 1
- •Задача 2
- •Лабораторная работа 6. Теория игр. Игры с природой. Цель: освоить методы решения игр с природой. Получить представление о следующих понятиях и методах:
- •Теоретические сведения. Базовые понятия
- •Пример 1 ( [1]).
- •Пример 2. (Переработано из: [4])
- •Варианты заданий
- •Задача 1
- •Задача 2
- •Рекомендательный библиографический список
Лабораторная работа 6. Теория игр. Игры с природой. Цель: освоить методы решения игр с природой. Получить представление о следующих понятиях и методах:
Элементы теории статистических решений.
Характерные особенности игр с природой.
Платежная матрица и матрица рисков.
Критерии Лапласа, Вальда, Сэвиджа, Гурвица и др.
Теоретические сведения. Базовые понятия
На практике часто встречаются игровые ситуации, когда один из противников не оказывает сознательного противодействия, а неопределенность является следствием недостатка информации. К таким игрокам относятся так называемые «игры с природой». Они исследуются методами теории статистических решений.
«Игру с природой» можно описать с помощью матрицы:
,
(6.1)
где:
А i -
возможные варианты решения эксперта
(игрок А)
;
Пj
- возможные варианты состояния природы
(игрок В)
;
доход (выигрыш)
игрока А, если эксперт принимает
решение Аi,
а природа окажется в состоянии Пj.
Наряду с платежной матрицей
,
при исследовании «игр с природой»
используют матрицу рисков:
R=
(6.2)
где:
, где
,
.
Метод решения задачи зависит от того, какая функция берется в качестве критерия, что, в свою очередь, зависит от того, насколько эксперт информирован о поведении природы.
Случай1. Вероятности pj природы известны хорошо.
1. При критерии среднего выигрыша (математического ожидания выигрыша) в качестве оптимальной берется стратегия, которая максимизирует средний выигрыш игрока А:
Р
( А i ) =
(6.3)
2. Критерий среднего риска, равносильный критерий Р(Аi), имеет вид
R
( Ai
)=
(6.4)
Cлучай2. Вероятности состояний природы неизвестны, но есть основания считать, что все вероятности состояний природы приблизительно одинаковы.
3. Критерий Лапласа получают из критерия среднего выигрыша, если информация о pj очень скудна и предполагается самое простое, что вероятности всех состояний природы равны между собой. Тогда
L
(Аi) =
.
(6.5)
Случай3. Вероятности состояний природы неизвестны.
4. Критерий Вальда - критерий крайнего пессимизма - имеет вид:
W(Ai)
=
(6.24)
В пессимистических критериях природа рассматривается как активно противоборствующий противник.
5. Критерий Сэвиджа (также пессимистический) отличается критерия Вальда тем, что вместо матрицы платежей берется матрица рисков:
S
( Ai)
=
(6.25)
6. Критерий крайнего оптимизма представляется в виде
О(A
i) =
(6.26)
7. Критерий Гурвица отражает компромисс между W(Ai) и O(Ai):
(6.27)
где
k – коэффициент,
отражающий долю оптимизма. Его значения
лежат в интервале [0;1], т.е.
.
Коэффициент k выбирается
по субъективным соображениям: чем более
сложная ситуация необходимо застраховаться,
тем ближе k к единице.
При k =1 имеем критерий
Вальда, при k=0
критерий крайнего оптимизма.
Для игр с природой, аналогично парным играм, вводится понятие доминирования одной стратегии над другой. Говорят, что k-я строка матрицы доминирует l-ю строку, если a kj a lj и akj > alj, хотя бы для одного j. Стратегию соответствующую доминируемой строке можно не рассматривать (вычеркнуть из платежной матрицы), поскольку она заведомо не выгодна.
Ниже на примерах, будет показано, что решение, принимаемое в условиях неопределенности, существенно зависит от выбранного критерия. Возникает вопрос о применимости того или иного критерия. Этот вопрос является сложной проблемой и заслуживает отдельного исследования. Общие рекомендации: решение следует принимать с учетом практического опыта и традиций в данной предметной области. При принятии ответственных и разовых решений следует использовать критерии Вальда и Севиджа. При принятии решений в ситуациях, которые часто повторяются целесообразно применение критерия Гурвица и вероятностных критериев (математического ожидания выигрыша, критерия Лапласа и др.).