Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Материалы по курсу (часть 2).docx
Скачиваний:
49
Добавлен:
14.06.2020
Размер:
7.78 Mб
Скачать

19. Решение игр mx2

В игре mx2 мы имеем две m стратегий (A1, A2, …, Аm), а наш противник 2 стратегии (B1, B2). В игре mx2 всегда имеется решение, содержащее не более двух активных стратегий у каждого из игроков, если эти активные стратегии игроков будут найдены, то игры mx2 превращаются в игры 2x2 (описано в вопросе 18).

Правила решения игр mx2:

  1. строится графическое изображение игры;

  2. выделяется верхняя граница выигрыша, и на ней находится точка оптимума с наибольшей ординатой;

  3. определяется пара стратегий, пересекающихся в точке оптимума M. Эти стратегии являются активными стратегиями игрока B. Если в точке оптимума пересекаются более двух стратегий, то в качестве активных стратегий может быть выбрана любая пара из них;

  4. решается полученная игра 2x2.

Пример:

Дана матрица стратегий

Решение:

B1

B2

αi

A1

0,4

1,0

0,4

A2

0,5

0,5

0,5

A3

1,0

0,3

0,3

A4

0,8

0,3

0,3

βj

1,0

1,0

α= 0,5, β= 1,0. Седловой точки нет.

1. Cтроим графическое изображение игры относительно игрока В.

Если А применяет А1, то при использовании игроком В стратегии В1 выигрыш игрока А равен 0,4, а выигрыш А при стратегии В2 равен 1,0, поэтому на перпендикулярах строим такие отрезки. Видно, что стратегия А4 заведомо невыгодная по сравнению со стратегией А3 (выигрыш меньше).

2. Выделяем верхнюю границу выигрыша А3NА1′; точка с наименьшей ординатой – N.

3. В этой точке пересекаются отрезки А1А1′ и А3А3′, соответствующие активным стратегиям А1 и А3. Стратегия А2 не является активной, поэтому из матрицы исключаем вторую и четвертую строки:

4. решаем игру:

13p3 = 6; p3 = 6/13; p1 = 7/13

q2 = 6/13.

Ответ: γ = 44/65; PA = (7/13; 0; 6/13; 0); QB = (7/13; 6/13).

(γ – стоимость игры)

Примечание: Игроку А не выгодно отклоняться от спектра своих активных стратегий.

20. Решение игр mxn.

Для игр m × n геометрическая интерпретация неприменима. Здесь применяются чисто расчетные методы. Можно показать, что решение любой конечной игры m × n может быть сведено к задаче линейного программирования.

Рассмотрим игру m × n. У игрока A имеется m стратегий: A1, A2, ..., Am; у игрока B есть n стратегий: B1, B2, ..., Bn. Такая игра задается матрицей игры m × n [aij]. Нужно найти две оптимальные смешанные стратегии S*A = (p1, p2, ..., pm) и S*B = (q1, q2, ..., qn), где p1, p2, ..., pm и q1, q2, ..., qn – вероятности применения соответствующих чистых стратегий A1, A2, ..., Am и B1, B2, ..., Bn и , .

Нахождение S*A. Положим, что цена игры γ положительна, γ ≥ 0. Это всегда можно сделать, добавив ко всем членам матрицы игры достаточно большое положительное число М. При этом решение игры не изменится, а найденную величину γ нужно будет в конце также увеличить на М.

Если мы применяем S*A, а противник – чистую стратегию B j, то наш средний выигрыш будет равен

Так как мы применяем S*A, то наш средний выигрыш не может быть меньше цены игры γ, т. е. a j ≥ γ, j = 1, 2, ..., n, поэтому

(1)

Строки вышеприведенной системы пишутся по столбцам матрицы игры.

Разделим все вышеприведенные неравенства на положительную величину γ и введем обозначения

Тогда система (1) превращается в следующую:

(2)

Так как p1 + p2 + ... + pm = 1, то

Мы хотим сделать наш гарантированный выигрыш максимально возможным. При этом величина 1/ γ принимает минимальное значение.

Таким образом мы получаем следующую задачу линейного программирования: найти такие неотрицательные значения переменных x1, x2, ..., xm, которые удовлетворяли бы линейным ограничениям (2) и обращали бы в минимум линейную функцию

Решив эту задачу линейного программирования, мы можем найти оптимальную стратегию S*A игрока A.

Нахождение SB*. Оптимальная стратегия SB* находится аналогично. Разница заключается в том, что игрок B стремится не максимизировать, а минимизировать выигрыш, а значит максимизировать величину 1γ. Следовательно, вместо условий (2) должны соблюдаться условия

(3)

Требуется так выбрать неотрицательные значения переменных y1, y 2, ..., yn, чтобы они удовлетворяли условиям (3.14) и обращали в максимум линейную функцию

L = y1 + y 2 + ... + yn = 1γ

или, что то же самое, обращали в минимум линейную функцию L′ = −L:

L = y1 y 2 ... yn = 1γ.

Таким образом, любая конечная игра m × n сводится к паре задач линейного программирования.