Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МПУР_Лекция №5.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
317.44 Кб
Скачать

5.2. Решение матричных игр симплексным методом

Пусть игра m× n задана платежной матрицей

.

Игрок A применяет стратегии A1, A2 ,..., Am , а игрок B – стратегии B1,B2 ,..., Bn.

Будем считать, что данная игра не имеет решения непосредственно в чистых стратегиях (нет седловой точки), и, значит, оптимальное решение необходимо искать в области смешанной стратегии.

Смешанными стратегиями игроков A и B называют векторы P = (p1, p2,…, pm) и Q = (q1, q2,..., qn) , координаты которых равны вероятностям применения игроками своих чистых стратегий A1, A2 ,..., Am и B1, B2,...,Bn соответственно.

События, состоящие в том, что игроки применяют какую-либо из своих чистых стратегий, образуют для каждого игрока полную группу событий. Следовательно, сумма координат векторов P и Q равна единице:

p1 + p2 + … + pm = 1,

q1 + q2 + … + qn = 1.

Кроме того, по свойству вероятности, для координат смешанных стратегий выполняются неравенства:

i=1,…, m,

j=1,…, n.

Оптимальная стратегия P* обеспечивает игроку A средний выигрыш, не меньший цены игры ν, при любой стратегии игрока B и выигрыш, равный цене игры ν, при оптимальной стратегии Q* игрока B.

Без ограничения общности полагаем далее, что ν > 0. Применяя оптимальную стратегию P* против любой чистой стратегии Qj игрока B, игрок A получает средний выигрыш или математическое ожидание выигрыша

aj = a1j p1 + a2j p2 + ... + amj pm ≥ ν.

Таким образом, вычисляя средние выигрыши игрока A для каждой из чистых стратегий игрока B, получаем систему неравенств

.

Разделив каждое из неравенств на цену игры ν и вводя новые переменные

, ,…, ,

получим систему

.

Целевую функцию для игрока A найдем, учитывая, что он стремится получить максимальный выигрыш в игре. Разделив равенство

p1 + p2 + … + pm = 1

на цену игры ν, получим

,

которое будет иметь наименьшее значение при достижении игроком A максимального выигрыша. Поэтому в качестве целевой функции можно взять функцию

F(X) = x1 + x2 + ... + xm

и задачу линейного программирования сформулировать следующим образом: определить значения переменных xi ≥ 0, i =1,…, m, так, чтобы они удовлетворяли линейным ограничениям

(5.1)

и при этом целевая функция F(X) = x1 + x2 + ... + xm имела минимальное значение.

Решая данную задачу, получаем оптимальную стратегию задачи линейного программирования для которой значение целевой функции равно

F(X*) = min F(X).

Находим цену игры ν:

.

Вычисляем координаты смешанной оптимальной стратегии P* игрока A:

pi = νxi , i =1,…, m.

Чтобы найти оптимальную стратегию игрока B , составляем двойственную к рассмотренной задачу и решаем ее. Двойственная задача, т.е. задача игрока В имеет ограничения

(5.2)

и целевую функцию Z(Y) = y1 + y2 +…+ yn max.

Решая эту задачу получаем оптимальную стратегию и вычисляем координаты оптимальной смешанной стратегии Q* игрока B:

qi = νyj , j =1,…,n.

В ходе решения двойственной задачи определяется максимальное значение целевой функции Z(Y*) = max Z(Y) , и цена игры может быть определена из равенства

.

Таким образом, найдено оптимальное решение для игры.

Поскольку задачи (5.1) и (5.2) образуют пару двойственных задач, нет необходимости решать обе задачи.

Пример 3. Торговая фирма разработала несколько вариантов плана продажи товаров на предстоящей ярмарке с учетом меняющейся конъюнктуры рынка и спроса покупателей. Получающиеся от возможных сочетаний показатели дохода представлены следующей платежной матрицей

.

Определить оптимальный план продажи товаров.

Решение. Торговая фирма может применить три стратегии продаж П1, П2, П3, а конъюнктура рынка и спрос покупателей – стратегии К1, К2, К3. Обозначим вероятность применения торговой фирмой стратегий П1, П2, П3 как р1, р2, р3, вероятность использования стратегий К1, К2, К3 как q1, q2, q3.

Для первого игрока (торговой фирмы) математическая модель задачи имеет вид:

где .

Для второго игрока (конъюнктуры рынка и спроса покупателей) математическая модель задачи имеет вид:

,

yj≥ 0, j = 1, 2, 3,

где .

Решая задачу для второго игрока симплекс-методом, получаем:

, .

Цена игры .

Так как , то , , .

Оптимальная стратегия второго игрока .

Стратегию первого игрока найдем, используя метод соответствия переменных исходной и двойственной задачи. Получаем

.

Таким образом, торговая фирма на ярмарке должна придерживаться стратегии , при этом она получит доход не менее денежных единиц.