Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория игр.doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
646.14 Кб
Скачать

Теория игр

Джон фон Нейман, О. Монгенштерн, 1944 год

Принятие решений в условиях неопределённости, риска.

Конфликт сторон (игроков).

Стратегии – возможные действия игроков

Чистые и смешанные

Игры:

С постоянной разностью;

Кооперативные и нет.

Антагонистические, или с нулевой суммой:

Функция выигрыша ( платежная матрица)

Игрок в

Орел Решка

Орел - 1 1

A Решка 1 - 1

B1 B2 . . . . . Bn

А1 a11 a12 . . . . a1n

А2 a21 a22 . . . . a2n выигрыш А при

. стратегиях А2 и Вn

.

.

Аm am1 am2 . . . . amn

Осторожная стратегия :

Min Max Min

2 1 4 1 1

-1 0 6 0 нижняя

цена игры

Max 2 1 6

Min Max 1 верхняя цена игры

Здесь цена игры ν = 1

Седло Min Max Min

5 6 8 5

9 7 8 7 7

7 6 6 6

Max 9 7 6

Min Max 7

Здесь цена игры ν = 7, игра решена в

Чистых стратегиях

Смешанные стратегии – применение чистых стратегий с вероятностями pi : SA(p1, p2, ...,pn).

Активные стратегии: pi > 0

Если один из игроков придерживается своей оптимальной стратегии, то другому невыгодно отступать от своей оптимальной стратегии. При этом средний выигрыш А >= ν при любой стратегии В и равен ν при оптимальной стратегии В.

Теорема фон Неймана: каждая конечная игра имеет по крайней мере одно оптимальное решение, возможно, среди смешанных стратегий.

Решение игры методом линейного программирования

Игрок В

a11 a12 a13 a14

А a21 a22 a23 a24

a31 a32 a33 a34

A1 a11p1 a12p1 a13p1 a14p1

+ + + +

A2 a21p2 a22p2 a23p2 a24p2

+ + + +

A3 a31p3 a32p3 a23p3 a34 p3

       

a11x1 a12x1 a13x1 a14x1

+ + + +

a21x2 a22x2 a23x2 a24 x2

+ + + +

a31x3 a32x3 a23x3 a34 x3

1 1 1 1

A1 A2 A3

a11p1+a21p2+a31p3

a12p1+a22p2+a32p3

a13p1+a23p2+a33p3

a14p1+a24p2+a34p3

A1 A2 A3

a11x1+a21x2+a31x3 1

a12x1+a22x2+a32x3 1

a13x1+a23x2+a33x3 1

a14x1+a24x2+a34x3 1

Здесь xi=pi/.

Вводим произвольные значения x1, x2, x3 и домножаем на них столбцы платежной матрицы. Столбец В2 игнорируем как доминируемый, т.е заведомо невыгодный игроку В при всех стратегиях игрока А.

Спрос

Продукция

B1

B2

B3

B4

0

A1

3

3

6

8

x1

2

A2

9

10

4

2

x2

2

A3

7

7

5

4

x3

2

Убрать как

доминируемый

Целевая

6

Min

aik*xi

6

12

16

18

8

4

14

10

8

38

30

28

Ограничения

1

1

1

Стратегии игрока А

x1=

0,074

p1=

0,4

x2=

0

p2=

0

x3=

0,111

p3=

0,6

1/=

0,185

Выигрыш

5,4