
Теория игр
Джон фон Нейман, О. Монгенштерн, 1944 год
Принятие решений в условиях неопределённости, риска.
Конфликт сторон (игроков).
Стратегии – возможные действия игроков
Чистые и смешанные
Игры:
С постоянной разностью;
Кооперативные и нет.
Антагонистические, или с нулевой суммой:
Функция выигрыша ( платежная матрица)
Игрок в
Орел Решка
Орел - 1 1
A Решка 1 - 1
B1 B2 . . . . . Bn
А1 a11 a12 . . . . a1n
А2 a21 a22 . . . . a2n выигрыш А при
. стратегиях А2 и Вn
.
.
Аm am1 am2 . . . . amn
Осторожная стратегия :
Min Max Min
2 1 4 1 1
-1 0 6 0 нижняя
цена игры
Max 2 1 6
Min Max 1 верхняя цена игры
Здесь цена игры ν = 1
Седло
Min
Max
Min
5
6 8 5
9
7
8
7 7
7 6 6 6
Max 9 7 6
Min Max 7
Здесь цена игры ν = 7, игра решена в
Чистых стратегиях
Смешанные стратегии – применение чистых стратегий с вероятностями pi : SA(p1, p2, ...,pn).
Активные стратегии: pi > 0
Если один из игроков придерживается своей оптимальной стратегии, то другому невыгодно отступать от своей оптимальной стратегии. При этом средний выигрыш А >= ν при любой стратегии В и равен ν при оптимальной стратегии В.
Теорема фон Неймана: каждая конечная игра имеет по крайней мере одно оптимальное решение, возможно, среди смешанных стратегий.
Решение игры методом линейного программирования
Игрок В
a11 a12 a13 a14
А a21 a22 a23 a24
a31 a32 a33 a34
A1 a11p1 a12p1 a13p1 a14p1 + + + + A2 a21p2 a22p2 a23p2 a24p2 + + + + A3 a31p3 a32p3 a23p3 a34 p3 |
a11x1 a12x1 a13x1 a14x1 + + + + a21x2 a22x2 a23x2 a24 x2 + + + + a31x3 a32x3 a23x3 a34 x3 1 1 1 1 |
A1 A2 A3 a11p1+a21p2+a31p3 a12p1+a22p2+a32p3 a13p1+a23p2+a33p3 a14p1+a24p2+a34p3 |
A1 A2 A3 a11x1+a21x2+a31x3 1 a12x1+a22x2+a32x3 1 a13x1+a23x2+a33x3 1 a14x1+a24x2+a34x3 1 |
Здесь xi=pi/.
Вводим произвольные значения x1, x2, x3 и домножаем на них столбцы платежной матрицы. Столбец В2 игнорируем как доминируемый, т.е заведомо невыгодный игроку В при всех стратегиях игрока А.
-
Спрос
Продукция
B1
B2
B3
B4
0
A1
3
3
6
8
x1
2
A2
9
10
4
2
x2
2
A3
7
7
5
4
x3
2
Убрать как
доминируемый
Целевая
6
Min
aik*xi
6
12
16
18
8
4
14
10
8
38
30
28
Ограничения
1
1
1
Стратегии игрока А |
|
|
|
x1= |
0,074 |
p1= |
0,4 |
x2= |
0 |
p2= |
0 |
x3= |
0,111 |
p3= |
0,6 |
1/= |
0,185 |
Выигрыш |
5,4 |