Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Tema_3.doc
Скачиваний:
2
Добавлен:
04.09.2019
Размер:
93.7 Кб
Скачать

3.5. Методы решения игр.

Покажем, что любая конечная антагонистическая игра m*n может быть сведена к задаче линейного программирования и, следовательно, решена методами линейного программирования, в частности точными, например симплекс-методом.

Рассмотрим конечную игру G = (X, Y, Q) размера m*n, где множества стратегий X = {xi}, Y = {yi} и платежная матрица Q = |qij|, i Є 1,m, j Є 1,n заданы.

Поскольку в реальных ситуациях чистых стратегий не бывает, требуется найти решение игры в смешанных стратегиях (добавляется фактор вероятности), то есть цену игры vp и две оптимальные смешанные стратегии P1 = (p1i) и P2 = (p2i), где P1 и P2 – вероятностные векторы, компоненты которых удовлетворяют условиям:

(3.12)

(3.13)

Будем сначала искать оптимальную стратегию P1 игрока 1. При ее определении будем исходить из свойств оптимальной стратегии, а именно будем учитывать, что эта стратегия должна обеспечить игроку 1 выигрыш не меньший vp, при любом поведении противника, и равно vp – при его оптимальном поведении.

Цена игры vp пока неизвестна. Будем считать, что vp > 0. Чтобы это условие выполнялось, достаточно, чтобы все элементы платежной матрицы Q = |qij| были неотрицательными, то есть qij ≥ 0. Этого всегда можно добиться, прибавляя ко всем элементам qij достаточно большое число M. При этом цена игры увеличится на М, а оптимальные стратегии не изменятся.

Предположим, что игрок 1 применяет свою смешанную стратегию P1, а игрок 2 – чистую стратегию yi. Тогда средний выигрыш игрока 1, обозначенный q1j, равен

q1j = = p11q1j + p12q2j + … + p1mqmj, j Є 1,n (3.14)

Поскольку ищется оптимальная стратегия игрока 1, то его средний выигрыш q1j должен удовлетворять условию q1j ≥ vp, откуда следует n условий:

(3.15)

Введем обозначения

L1 = 1 / vp;

z1i = p1i / vp , i Є 1,m.

С использованием введенных обозначений из (3.12) и (3.15) получаем:

(3.16)

(3.17)

(3.18)

Поскольку игрок 1 стремится максимизировать свой выигрыш (доставить максимум цене игры vp), то это равносильно требованию минимизировать величину L1 = 1/vp, то есть равносильно требованию

L1 = (3.19)

Аналогичным образом можно найти оптимальную стратегию игрока 2.

13

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]