 
        
        Теория игр
Джон фон Нейман, О. Монгенштерн, 1944 год
Принятие решений в условиях неопределённости, риска.
Конфликт сторон (игроков).
Стратегии – возможные действия игроков
Чистые и смешанные
Игры:
С постоянной разностью;
Кооперативные и нет.
Антагонистические, или с нулевой суммой:
Функция выигрыша ( платежная матрица)
Игрок в
Орел Решка
Орел - 1 1
A Решка 1 - 1
B1 B2 . . . . . Bn
А1 a11 a12 . . . . a1n
А2 a21 a22 . . . . a2n выигрыш А при
. стратегиях А2 и Вn
.
.
Аm am1 am2 . . . . amn
Осторожная стратегия :
Min Max Min
2 1 4 1 1
-1 0 6 0 нижняя
цена игры
Max 2 1 6
Min Max 1 верхняя цена игры
Здесь цена игры ν = 1
  Седло
              Min
    Max
Min
                         Седло
              Min
    Max
Min
  5
    6     8       5
                             5
    6     8       5
  9
    7
    8    
  7             7
                             9
    7
    8    
  7             7
7 6 6 6
Max 9 7 6
Min Max 7
Здесь цена игры ν = 7, игра решена в
Чистых стратегиях
Смешанные стратегии – применение чистых стратегий с вероятностями pi : SA(p1, p2, ...,pn).
Активные стратегии: pi > 0
Если один из игроков придерживается своей оптимальной стратегии, то другому невыгодно отступать от своей оптимальной стратегии. При этом средний выигрыш А >= ν при любой стратегии В и равен ν при оптимальной стратегии В.
Теорема фон Неймана: каждая конечная игра имеет по крайней мере одно оптимальное решение, возможно, среди смешанных стратегий.
Решение игры методом линейного программирования
Игрок В
a11 a12 a13 a14
А a21 a22 a23 a24
a31 a32 a33 a34
| A1 a11p1 a12p1 a13p1 a14p1 + + + + A2 a21p2 a22p2 a23p2 a24p2 + + + + A3 a31p3 a32p3 a23p3 a34 p3         | a11x1 a12x1 a13x1 a14x1 + + + + a21x2 a22x2 a23x2 a24 x2 + + + + a31x3 a32x3 a23x3 a34 x3  1  1  1  1 | 
| A1 A2 A3 a11p1+a21p2+a31p3   a12p1+a22p2+a32p3   a13p1+a23p2+a33p3   a14p1+a24p2+a34p3   | A1 A2 A3 a11x1+a21x2+a31x3  1 a12x1+a22x2+a32x3  1 a13x1+a23x2+a33x3  1 a14x1+a24x2+a34x3 1 | 
Здесь xi=pi/.
Вводим произвольные значения x1, x2, x3 и домножаем на них столбцы платежной матрицы. Столбец В2 игнорируем как доминируемый, т.е заведомо невыгодный игроку В при всех стратегиях игрока А.
- 
	Спрос Продукция B1 B2 B3 B4 0 A1 3 3 6 8 x1 2 A2 9 10 4 2 x2 2 A3 7 7 5 4 x3 2 Убрать как  доминируемый Целевая 6 Min aik*xi 6 12 16 18 8 4 14 10 8    38 30 28 Ограничения 1 1 1 
| Стратегии игрока А | 
 | 
 | 
 | 
| x1= | 0,074 | p1= | 0,4 | 
| x2= | 0 | p2= | 0 | 
| x3= | 0,111 | p3= | 0,6 | 
| 1/= | 0,185 | Выигрыш | 5,4 | 
