- •Методические указания и примеры решения задач контрольной работы по мпур Графическое решение задачи лп
 - •Симплекс-метод решения задачи линейного программирования
 - •Динамическое программирование
 - •Понятие об игровых моделях.
 - •Методы и модели решения игровых задач Принцип минимакса
 - •Решения игр в смешанных стратегиях
 - •Геометрический метод
 - •Исключение доминируемых стратегий
 - •Метод линейного программирования
 - •Решение игры симплекс-методом
 - •Игровые модели в условиях риска
 - •Игры с природой
 - •Биматричные игры
 
Методы и модели решения игровых задач Принцип минимакса
Рассмотрим конечную
парную игру с нулевой суммой. Игрок I
имеет m
стратегий (А1,
А2,
..., Аm),
а игрок II
— n
стратегий (В1,
В2,
..., Вn).
Такая игра называется игрой размерностью
m
n.
Пусть каждая сторона определилась с
выбором стратегии: игрок I
— Ai
(i
= 1, 2, ..., m),
игрок II
— Bj
(j
= 1, 2, ..., n).
Выигрыши игрока I
— 
(Ai,
Bj)
и игрока II
— 
(Ai,
Bj)
удовлетворяют соотношению 
(Ai,
Bj)
+ 
(Ai,
Bj)
= 0.
Если игра состоит только из личных ходов, то выбор стратегии (Ai, Bj) однозначно определяет исход игры , т.е. выигрыш игрока I. Если игра содержит также случайные ходы, то выигрыш при паре стратегий (Ai, Bj) есть величина случайная, зависящая от исходов всех случайных ходов. В этом случае ожидаемый выигрыш — это среднее значение (математическое ожидание). Предположим, что значения aij известны для каждой пары стратегий (Ai, Bj). Построим таблицу, строки которой соответствуют стратегиям игрока I, а столбцы — стратегиям игрока II, т.е. платежную матрицу. Каждый элемент (aij > 0) матрицы определяет величину выигрыша игрока I и проигрыш игрока II. Цель игрока I — максимизировать свой выигрыш, а игрока II — минимизировать свой проигрыш. Платежная матрица имеет следующий вид:
I \ II B1 B2 ... Bj ... Bn
A1 a11 a12 ... a1j ... a1n 1
A2 a21 a22 ... a2j ... a2n 2
... ... ... ... ... ... ... ...
Ai ai1 ai2 ... aij ... ain i
... ... ... ... ... ... ... ...
Am am1 am2 ... amj ... amn m
Βj 1 2 ... j ... n
Задача состоит в определении:
наилучшей (оптимальной) стратегии игрока I из стратегий A1, A2, ..., Am;
наилучшей (оптимальной) стратегии игрока II из стратегий B1, B2, ..., Bm.
Для решения задачи применяется принцип, согласно которому участники игры одинаково разумны и каждый из них делает все для того, чтобы добиться своей цели.
Проанализируем последовательно каждую стратегию игрока I. Если игрок I выбирает стратегию А1, то игрок II может выбрать такую стратегию Bj, при которой выигрыш игрока I будет равен наименьшему из чисел a1j:
.	
Выбирая стратегию Ai, игрок I должен рассчитывать на то, что в результате разумных действий игрока II он не выиграет больше, чем i. Поэтому игрок I должен выбрать ту стратегию, для которой i максимально:
              
.	
Величина  — гарантированный выигрыш, который может обеспечить себе игрок I при любом поведении игрока II. Величина  называется нижней ценой игры или максимином, а стратегия Аi игрока I, обеспечивающая получение нижней цены игры, называется максиминной чистой стратегией. При этом игрок I при любом поведении игрока II обеспечивает себе выигрыш, не меньше : i   (i = 1, 2, ..., m).
Игрок II заинтересован в том, чтобы уменьшить свой проигрыш, т.е. обратить выигрыш игрока I в минимум. Для выбора оптимальной стратегии он должен найти максимальное значение выигрыша в каждом столбце:
.	
и среди этих
значений выбрать наименьшее:	
.
Величина  называется верхней ценой игры или минимаксом. Стратегия игрока II, обеспечивающая получение верхней цены игры, называется минимаксной чистой стратегией. Применяя ее, игрок II проиграет не больше  при любых действиях игрока I:
j   (j = 1, 2, ..., n), причем всегда справедливо неравенство   .
Таким образом, придерживаясь максиминной стратегии Ai, игрок I желает получить выигрыш не менее  не зависимо от действий игрока II, а игрок II, придерживаясь минимаксной стратегии Bj, гарантирует себе проигрыш не больше .
Принцип, диктующий игрокам соответствующих стратегий (максиминной и минимаксной), в теории игр называется принципом минимакса.
Пример 1. Дана платежная матрица. Найти решение игры: определить нижнюю и верхнюю цены игры и минимаксные стратегии:
I \ II B1 B2 B3 B4 
A1 5 3 8 2 2
A
2	1	6	4	3	1
A 3 9 5 4 7 4
Βj 9 6 8 7
Таким образом, нижней цене игры ( = 4) соответствует стратегия A3 игрока I. Выбирая эту стратегию, игрок I достигнет выигрыша не меньше 4 при любом поведении игрока II. Верхней цене игры ( = 6) соответствует стратегия игрока II — В2. Эти стратегии являются минимаксными. Если обе стороны будут придерживаться этих стратегий, выигрыш будет равен а33 = 4.
Существуют матричные игры, для которых нижняя цена игры равна верхней, т.е.  = . Такие игры называются играми с седловой точкой.
В этом случае 
= 
= 
называется чистой ценой игры, а стратегии
игроков 
и 
,
позволяющие получить это значение —
оптимальными. Пара  
называется седловой точкой матрицы,
так как элемент 
одновременно
является минимальным в i-й
строке и максимальным в j-м
столбце. Оптимальные стратегии 
и 
и чистая цена являются решением игры в
чистых стратегиях, т.е. без привлечения
механизма случайного выбора.
Пример 2. пусть задана платежная матрица. Найти нижнюю и верхнюю цены игры.
I II B1 B2 B3 
A1 5 1 2 1
A2 2 6 2 2
A3 3 4 3 3
 5 6 3
Следовательно  =  =  = 3.
Седловой точкой является пара альтернатив (А3, В3).
