Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Смирнов (Восстановлен).doc
Скачиваний:
17
Добавлен:
25.09.2019
Размер:
557.57 Кб
Скачать

Решение игр в смешанных стратегиях аналитическим методом. Игра 2х2

Если в платежной матрице игры не обнаруживается седловая точка, то из этого следует что игра имеет решение, но не в чистых, а смешанных стратегиях. При этом оптимальная стратегия S*А=<P*1,P*2>

S*B=<Q*1,Q*2>

P1,P2 – вероятности использования своих первой или второй чистой стратегий

Qi – вероятность применения игроком B своих чистых стратегий B1 или В2

Пусть платежная матрица такой игры задана:

P=

В1

В2

A1

a11

a12

A2

a21

a22

Где аij – элемент матрицы, определяющий выигрыш (проигрыш) игрока А(В) в случае если игрок А примет свою стратегию iую, в ответ на которую игрок В применяет свою jую чистую стратегию. Эта игра является парной, т.к. учавствуют только 2 игрока А и В.

И в то же время игрой 2х2, т.к. у А всего две стратегии и у В тоже 2е стратегии.

В теории игр принято считать, что стратегия игрока А указывается по строка платежной матрицы, а стратегии игрока В по столбцам.

Решение такой задачи начинается с проверки наличия в платежной матрице седловой точки. Если таковая существует, то решение игры однозначно и выражается в одной из чистых стратегий игроков А и В. В этом случае всегда выигрыш одного игрока равен проигрышу другого игрока цена игры находится на пересечении строки соответствующей нижней цене игры и столбца соответствующего верхней цене игры.

Если в платежной матрице не обнаруживается седловая точка, то оптимальной стратегией игрока А будет стратегия а1 или а2 применяющиеся соответственно с вероятностями P*1 P*2.

Тогда выигрыш игрока А будет определяться V=a11*P1+a21*P2

A1

A2

P*1

P*2

Такая зацпись соответствует применением игроком B стратегии В1.

Если игрок В примет стратегию В2, то цена выигрыша игрока А будет определяться ворым столбцом матрицы V=a12*P1+a22*P2

Учитывая, что стратегий всего 2е как у А так и у В и что никаких других вариантов не существует следовательно события применения той или другой стратегии составляют полную группу событий.

Для того чтобы получить искомые значения Р*1, P*2

Система уравнений

V=a11*P1+a21*P2 <- B1

V=a12*P1+a22*P2 <-B2

P1+P2=1

P2=(a11-a12)/ (a11+a22-a12-a21)

P1=1-P2

V=(a22*a11-a12*a21)/ (a11+a22-a12-a21)

Рассуждая аналогично и применяя теорему об активных стратегиях можно точно так же рассчитать оптимальные значения Q*1 и Q*2, но по столбцам

Q*1=(a22-a12)/(a11+a22-a12-a21)

Q2=1-Q1

Задача

Поиск

Игрок А имеет возможность спрятаться в одном из убежишь I или II.

Игрок В отыскивает игрока в одном из убежишь I или II

Если игрок В отыскал игрока А, то игрок А выплачивает игроку В штраф в одну денежную единицу. Если же игрок В не отыскал игрока А, то игрок В выплачивает одну денежную единицу.

Требуется получить решение игры.

Решение:

  1. Сформулируем стратегии игроков.

Стратегия а1 – игрок А спрятался в убежище 1

Стратегия а2 – игрок А спрятался в убежище 2

Стратегия b1 –игрок В ищет в убежище 1

Стратегия b2 – игрок В ищет в убежище 2

Тогда если игрок А принял стратегия А1 и игрок В принял стратегию В1, то игрок В обнаруживает игрока А в убежище 1 и игрок А должен выплатить игроку В штраф в 1 денежную едиицу. Значит элемент платежной матрица а11 равен -1.

Если А ->a2 and B->b2 значит а22=-1

Если A->a1 and B->b2 значит a12=1

P=

-1

1

1

-1

Седловой точки не имеет альфа=-1, бетта=1

Таким образом оптимальная стратегия игрока А выбирать убежище 1 или 2 с вероятностью 0,5, а оптимальная стратегия В искать или в первом или во втором 0,5

Р1=(a22-a21)/(a11+a22-a12-a21)

P2=1-P1=0.5