15. Понятие смешанной стратегии. Упрощение платежных матриц

Если платёжная матрица не имеет Седловой точки, то есть a<B, то поиск решения игры приводит к применению сложной стратегии, состоящей в случайном применении 2 и более стратегий с определёнными частотами. Смешанной стратегией игрока называют вектор, каждая из компонент которого показывает относительную частоту, использования игроком соответствующей чистой стратегии. Обычно смешанную стратегию игрока A обозначают как P, а второго игрока B как вектор Q. Из определения следует, что сумма компонент вектора стратегии равна 1, а сами компоненты неотрицательны.

P=(p₁, p₂, …, p_m), p_i>0, _i=1

Q=(q₁, q₂ …, q_n), q_j>0, _j=1

Основная теорема теории игр утверждает, что каждая конечная игра имеет, по крайней мере, 1 решение и возможно оно находится в области смешанных стратегий. Применение игроками оптимальных смешанных стратегий P^* и Q^* позволяет получить выигрыш равный цене игры j и a<j<ß.

Для игр с платёжными матрицами большой размерности отыскания решения можно несколько упростить, если уменьшить их размерность путём вычёркивания дублирующих и заведомо невыгодных стратегий.

1)Если в матрице игры все элементы строки (столбца) равны соответствующим элементам другой строки (столбца), то соответствующие им стратегии называются дублирующими и одна из них может быть исключена.

2)Если в матрице игры все элементы некоторой строки, определяющей стратегию игрока A не больше (<) соответствующих элементов другой строки, то стратегия игрока A называется заведомо невыгодной и может быть исключена из рассмотрения.

3)Если в матрице игры все элементы некоторого столбца, определяющего стратегию игрока B, не меньше (>) соответствующих элементов другого столбца, то данная стратегия игрока B называется заведомо невыгодной и может быть исключена из платёжной матрицы.

16. Решение статистических игр

Особенности игр с природой:

В платёжной матрице нельзя отбрасывать те или иные состояния природы
Решение достаточно найти только для игрока A.
Смешанные стратегии приобретают смысл только при многократном повторении игры.

Игра с природой задаётся платёжной матрицей, в которой строки соответствуют стратегиям сознательного игрока, а столбцы – состояниям природы. Состояние природы обозначаются как П_j. Для игр с природой часто составляют матрицу рисков. Риск – разность между максимально возможным выигрышем при данном состоянии природы и выигрышем, который будет получен при применении стратегии A_i в тех же условиях. Риск сознательного игрока A при применении им своей стратегии A_i в условиях П_j обозначается как r_ij. Величина r_ij рассчитывается по формуле:

r_ij=B_j-a_ij

r_ij>0

Определение наилучшей стратегии сознательного игрока A в игре с природой основано на применении некоторых критериев, которые делятся на 2 группы:

Критерии, основанные на известных вероятностях природы
Критерии, используемые в условиях полной неопределённости

К критериям первой группы отнесем:

Критерий Байеса

Если на основе данных статистических наблюдений известны вероятности состояний природы q_j, то оптимальной стратегией игрока A считается та чистая стратегия A_i, которая соответствует максимальному среднему значению выигрыша. a=maxa_i= max (E_j₌₁^j⁼ⁿa_ij_*gj)

Критерий Лапласа

Если игроку A представляется в равной мере правдоподобными все состояния природы, то полагают, что q₁=q₂=…=q_n=1/n. Оптимальной считают чистую стратегию A_i, которая обеспечивает максимальный средний выигрыш aj=maxa₁=max(1/n*E _j₌₁ⁿaij).

Рассмотрим критерии второй группы.

Критерий Вальда.

Оптимальной считается та стратегия игрока A, которая гарантирует в наихудших условиях максимальный выигрыш a=max*mina_ij. Критерий Вальда выражает позицию крайнего пессимизма.

Критерий Сэвиджа.

Выбирается та стратегия, которая в наихудших условиях даёт наименьший риск r=min*maxr_ij.

Критерий Гурвица.

Оптимальной считается чистая стратегия A_i

S=max(L*mina_ij) + (1-L)*maxa _ij

Критерий Гурвица называют критерием пессимизма-оптимизма.

<<< < Предыдущая 1 2 3 4 5 6 78 / 88

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
28.09.2019599.04 Кб11Экономика экзамен 1.rtf
#
05.09.2019121.34 Кб8экономика, вопрос 21,22,23,24,25.doc
#
31.08.201931.81 Кб5ЭМ для ГЭК 2012 Бух.учет 305-306Э.docx
#
30.04.2015939.52 Кб102ЭММ.doc
#
30.04.2015922.62 Кб54ЭММиМ.doc
#
07.12.201868.48 Кб15ЭМММ .docx
#
07.12.201874.04 Кб19ЭМММ.docx