Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЭМММ .docx
Скачиваний:
15
Добавлен:
07.12.2018
Размер:
68.48 Кб
Скачать

15. Понятие смешанной стратегии. Упрощение платежных матриц

Если платёжная матрица не имеет Седловой точки, то есть a<B, то поиск решения игры приводит к применению сложной стратегии, состоящей в случайном применении 2 и более стратегий с определёнными частотами. Смешанной стратегией игрока называют вектор, каждая из компонент которого показывает относительную частоту, использования игроком соответствующей чистой стратегии. Обычно смешанную стратегию игрока A обозначают как P, а второго игрока B как вектор Q. Из определения следует, что сумма компонент вектора стратегии равна 1, а сами компоненты неотрицательны.

P=(p1, p2, …, pm), pi>0, i=1

Q=(q1, q2 …, qn), qj>0, j=1

Основная теорема теории игр утверждает, что каждая конечная игра имеет, по крайней мере, 1 решение и возможно оно находится в области смешанных стратегий. Применение игроками оптимальных смешанных стратегий P* и Q* позволяет получить выигрыш равный цене игры j и a<j<ß.

Для игр с платёжными матрицами большой размерности отыскания решения можно несколько упростить, если уменьшить их размерность путём вычёркивания дублирующих и заведомо невыгодных стратегий.

1)Если в матрице игры все элементы строки (столбца) равны соответствующим элементам другой строки (столбца), то соответствующие им стратегии называются дублирующими и одна из них может быть исключена.

2)Если в матрице игры все элементы некоторой строки, определяющей стратегию игрока A не больше (<) соответствующих элементов другой строки, то стратегия игрока A называется заведомо невыгодной и может быть исключена из рассмотрения.

3)Если в матрице игры все элементы некоторого столбца, определяющего стратегию игрока B, не меньше (>) соответствующих элементов другого столбца, то данная стратегия игрока B называется заведомо невыгодной и может быть исключена из платёжной матрицы.

16. Решение статистических игр

Особенности игр с природой:

  1. В платёжной матрице нельзя отбрасывать те или иные состояния природы

  2. Решение достаточно найти только для игрока A.

  3. Смешанные стратегии приобретают смысл только при многократном повторении игры.

Игра с природой задаётся платёжной матрицей, в которой строки соответствуют стратегиям сознательного игрока, а столбцы – состояниям природы. Состояние природы обозначаются как Пj. Для игр с природой часто составляют матрицу рисков. Риск – разность между максимально возможным выигрышем при данном состоянии природы и выигрышем, который будет получен при применении стратегии Ai в тех же условиях. Риск сознательного игрока A при применении им своей стратегии Ai в условиях Пj обозначается как rij. Величина rij рассчитывается по формуле:

rij=Bj-aij

rij>0

Определение наилучшей стратегии сознательного игрока A в игре с природой основано на применении некоторых критериев, которые делятся на 2 группы:

  • Критерии, основанные на известных вероятностях природы

  • Критерии, используемые в условиях полной неопределённости

К критериям первой группы отнесем:

  1. Критерий Байеса

Если на основе данных статистических наблюдений известны вероятности состояний природы qj, то оптимальной стратегией игрока A считается та чистая стратегия Ai, которая соответствует максимальному среднему значению выигрыша. a=maxai = max (Ej=1j=naij * gj)

  1. Критерий Лапласа

Если игроку A представляется в равной мере правдоподобными все состояния природы, то полагают, что q1=q2=…=qn=1/n. Оптимальной считают чистую стратегию Ai, которая обеспечивает максимальный средний выигрыш aj=maxa1=max(1/n*E j=1 n aij).

Рассмотрим критерии второй группы.

  1. Критерий Вальда.

Оптимальной считается та стратегия игрока A, которая гарантирует в наихудших условиях максимальный выигрыш a=max*minaij. Критерий Вальда выражает позицию крайнего пессимизма.

  1. Критерий Сэвиджа.

Выбирается та стратегия, которая в наихудших условиях даёт наименьший риск r=min*maxrij.

  1. Критерий Гурвица.

Оптимальной считается чистая стратегия Ai

S=max(L*minaij) + (1-L)*maxa ij

Критерий Гурвица называют критерием пессимизма-оптимизма.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]