- •Тема 3. Принятие решений в условиях неопределенности.
- •3.1. Классификация зпр в условиях неопределенности и обзор методов их решения
- •3.2. Принятие решений в условиях повторяющейся одноуровневой конфликтной ситуации (элементы теории стратегических игр)
- •3.3. Формальное описание парной антагонистической игры
- •3.4. Игры с седловой точкой
- •3.5. Методы решения игр.
3.5. Методы решения игр.
Покажем, что любая конечная антагонистическая игра m*n может быть сведена к задаче линейного программирования и, следовательно, решена методами линейного программирования, в частности точными, например симплекс-методом.
Рассмотрим конечную игру G = (X, Y, Q) размера m*n, где множества стратегий X = {xi}, Y = {yi} и платежная матрица Q = |qij|, i Є 1,m, j Є 1,n заданы.
Поскольку в реальных ситуациях чистых стратегий не бывает, требуется найти решение игры в смешанных стратегиях (добавляется фактор вероятности), то есть цену игры vp и две оптимальные смешанные стратегии P1 = (p1i) и P2 = (p2i), где P1 и P2 – вероятностные векторы, компоненты которых удовлетворяют условиям:
(3.12)
(3.13)
Будем сначала искать оптимальную стратегию P1 игрока 1. При ее определении будем исходить из свойств оптимальной стратегии, а именно будем учитывать, что эта стратегия должна обеспечить игроку 1 выигрыш не меньший vp, при любом поведении противника, и равно vp – при его оптимальном поведении.
Цена игры vp пока неизвестна. Будем считать, что vp > 0. Чтобы это условие выполнялось, достаточно, чтобы все элементы платежной матрицы Q = |qij| были неотрицательными, то есть qij ≥ 0. Этого всегда можно добиться, прибавляя ко всем элементам qij достаточно большое число M. При этом цена игры увеличится на М, а оптимальные стратегии не изменятся.
Предположим, что игрок 1 применяет свою смешанную стратегию P1, а игрок 2 – чистую стратегию yi. Тогда средний выигрыш игрока 1, обозначенный q1j, равен
q1j = = p11q1j + p12q2j + … + p1mqmj, j Є 1,n (3.14)
Поскольку ищется оптимальная стратегия игрока 1, то его средний выигрыш q1j должен удовлетворять условию q1j ≥ vp, откуда следует n условий:
(3.15)
Введем обозначения
L1 = 1 / vp;
z1i = p1i / vp , i Є 1,m.
С использованием введенных обозначений из (3.12) и (3.15) получаем:
(3.16)
(3.17)
(3.18)
Поскольку игрок 1 стремится максимизировать свой выигрыш (доставить максимум цене игры vp), то это равносильно требованию минимизировать величину L1 = 1/vp, то есть равносильно требованию
L1 = (3.19)
Аналогичным образом можно найти оптимальную стратегию игрока 2.