Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

практика / Лабораторная работа № 4

.docx
Скачиваний:
59
Добавлен:
10.05.2016
Размер:
39.41 Кб
Скачать

Лабораторная работа №4 «Теория игр»

Задания:

1 Платежная матрица приведена в таблице 1. Здесь XYZ –последние три цифры зачетки. Решить игру. Найти нижнюю и верхнюю цену игры. Имеется ли в игре седловая точка?

F1

F2

F3

E1

-X

-Y

-Z

E2

-12

-20

-24

E3

-5

-21

-45

F1

F2

F3

Минимум

E1

-1

-4

-5

-5*

E2

-12

-20

-24

1

E3

-5

-4

-5

1

Максимум

-1

-4

-5*


Нижняя цена игры равна: α = -5

Верхняя цена игры равна: β = -5

Ответ α = β = v = -5, платежная матрица содержит седловую точку; оптимальные значения F3 и E3

2 Решить игру 3*3 в смешанных стратегиях аналитическим и графическим способом.

Вариант 1

В1

В2

В3

А1

4

4

3

А2

5

2

1

А3

4

1

4


Определим нижнюю цену игры - α

Стратегии "B"

Стратегии "A"

B1

B2

B3

Минимумы строк

A1

4

4

3

3*

A2

5

2

1

1

A3

4

1

4

1


В нашем случае нижняя цена игры равна: α = 3,  и для того чтобы гарантировать себе выигрыш не хуже чем 3 игрок "А" должен придерживаться стратегии A1

Определим верхнюю цену игры - β

Стратегии "B"

Стратегии "A"

B1

B2

B3

Минимумы строк

A1

4

4

3

3*

A2

5

2

1

1

A3

4

1

4

1

Максимумы столбцов

5

4+

4+

В нашем случае верхняя цена игры равна: β = 4, и для того чтобы гарантировать себе проигрыш не хуже чем 4 игрок "B" должен придерживаться одной из стратегий B2 , B3  α ≠ β, платежная матрица не содержит седловой точки. Это значит, что игра не имеет решения в чистых минимаксных стратегиях, но она всегда имеет решение в смешанных стратегиях. Смешанная стратегия. Смешанную стратегию игрока "А" будем обозначать

SA =

A1

A2

A3

p1

p2

p3

где A1, A2, A3 - стратегии игрока "A", а p1, p2, p3 - соответственно вероятности (частоты), с которыми эти стратегии применяются, причем p1 + p2 + p3 = 1. Аналогично смешанную стратегию игрока "В" будем обозначать

SB =

B1

B2

B3

q1

q2

q3

где B1, B2, B3 - стратегии игрока "B", а q1, q2, q3 - соответственно вероятности, с которыми эти стратегии применяются, причем q1 + q2 + q3 = 1. Для определения оптимальных стратегий игроков проведем упрощение платежной матрицы. Сравнивая стратегии B1 и B2 видим, что B1 является заведомо невыгодной относительно B2, поэтому удалим стратегию B1из платежной матрицы и получим игру представленную в таблице:

Стратегии "B"

Стратегии "A"

B2

B3

A1

4

3

A2

2

1

A3

1

4

Сравнивая стратегии A1 и A2 видим, что A2 является заведомо невыгодной относительно A1, поэтому удалим стратегию A2из платежной матрицы и получим игру представленную в таблице:

Стратегии "B"

Стратегии "A"

B2

B3

A1

4

3

A3

1

4

Из последней таблицы видно, что игроку "A" следует искать свою оптимальную стратегию, смешивая случайным образом стратегии A1 и A3, а игроку "B" стратегии B2 и B3.

Найдем оптимальную смешанную стратегию для игрока "A":

SA* =

A1

A3

p1

p3

где:  p1 , p3 - вероятности (частоты) с которыми применяются соответственно стратегии A1 и A3 В нашем случае обе стратегии активные, иначе игра бы имела решение в чистых стратегиях. Поэтому если предположить, что игрок "В" будет пользоваться чистой стратегией B2, то средний выигрыш v составит:

k12p1 + k32p3 = v    ( 1 )

где:  kij - элементы платежной матрицы. C другой стороны, если предположить, что игрок "В" будет пользоваться чистой стратегией B3, то средний выигрыш составит:

k13p1 + k33p3 = v    ( 2 )

Приравняв левые части уравнений (1) и (2) получим:

k12p1 + k32p3 = k13p1 + k33p3

А с учетом того, что p1 + p3 = 1 имеем:

k12p1 + k32(1 - p1) = k13p1 + k33(1 - p1)

Откуда несложно найти оптимальную частоту стратегии A1:

p1 = 

k33 - k32

k12 + k33 - k13 - k32

    ( 3 )

В данной задаче:

p1 = 

4

 - 

1

4

 + 

4

 - 

3

 - 

1

 = 

3

4

Вероятность р3 найдем вычитанием р1 из единицы:

p3 = 1 - p1 = 

1

 - 

3

4

 = 

1

4

Вычислим цену игры подставив р1р3 в уравнение (1) :

v = k12p1 + k32p3  = 

4

 · 

3

4

 + 

1

 · 

1

4

 = 

13

4

Найдем оптимальную смешанную стратегию для игрока "B":

SB* =

B2

B3

q2

q3

где:  q2 , q3 - вероятности (частоты) с которыми применяются соответственно стратегии B2 и B3 Из теории игр известно, что если игрок "B" использует свою оптимальную стратегию, а игрок "A" остается в рамках своих активных стратегий, то средний выигрыш остается неизменным и равным цене игры v независимо от того как игрок "А" использует свои активные стратегии. Поэтому если предположить, что игрок "A" будет пользоваться чистой стратегией A1, то средний выигрыш v составит:

k12q2 + k13q3 = v    ( 4 )

Поскольку цена игры v нам уже известна и учитывая, что q2 + q3 = 1, то оптимальная частота стратегии B2 может быть найдена как:

q2 = 

v - k13

k12 - k13

    ( 5 )

В данной задаче:

q2 = 

13

4

 - 

3

4

 - 

3

 = 

1

4

Вероятность q3 найдем вычитанием q2 из единицы:

q3 = 1 - q2 = 

1

 - 

1

4

 = 

3

4

Ответ:

Нижняя цена игры :

  α = 

3

Верхняя цена игры :

  β = 

4

Цена игры :

  v = 

13

4


Оптимальная стратегия игрока "А" :

SA* =

A1

A3

3

4

1

4

Оптимальная стратегия игрока "B" :

SB* =

B2

B3

1

4

3

4



Геометрическая интерпретация (графическое решение):

Дадим геометрическую интерпретацию рассмотренной игре. Возьмем участок оси абсцисс единичной длины и проведем через его концы вертикальные прямые a1 и a3 соответствующие нашим стратегиям A1 и A3. Предположим теперь, что игрок "B" будет пользоваться стратегией B2 в чистом виде. Тогда, если мы (игрок "A") будем использовать чистую стратегию A1, то наш выигрыш составит 4.Отметим соответствующую ему точку на оси a1. Если же мы будем использовать чистую стратегию A3, то наш выигрыш составит 1. Отметим соответствующую ему точку на оси a3 (см. Рис. 1). Очевидно, если мы будем применять, смешивая в различных пропорциях стратегии A1 и A3, наш выигрыш будет меняться по прямой проходящей через точки с координатами (0 , 4) и (1 , 1), назовем ее линией стратегии B2 (на Рис.1 показана красным цветом). Абсцисса любой точки на данной прямой равна вероятности p3 (частоте), с которой мы применяем стратегию A3, а ордината - получаемому при этом выигрышу k (см. Рис.1).

Рисунок 1. График зависимости выигрыша k от частоты р3, при использовании противником стратегии B2.

Предположим теперь, что игрок "B" будет пользоваться стратегией B3 в чистом виде. Тогда, если мы (игрок "A") будем использовать чистую стратегию A1, то наш выигрыш составит 3.Если же мы будем использовать чистую стратегию A3, то наш выигрыш составит 4 (см. Рис. 2). Аналогично, если мы будем смешивать в различных пропорциях стратегии A1 и A3, наш выигрыш будет меняться по прямой проходящей через точки с координатами (0 , 3) и (1 , 4), назовем ее линией стратегии B3. Как и в предыдущем случае, абсцисса любой точки на этой прямой равна вероятности, с которой мы применяем стратегию A3, а ордината - получаемому при этом выигрышу, но только для стратегии B3 (см. Рис. 2).

Рисунок 2. Графическое определение цены игры v и оптимальной частоты р3 для игрока "А".

В реальной игре, когда разумный игрок "В" пользуется всеми своими стратегиями, наш выигрыш будет изменяться по ломаной линии, показанной на Рис.2 красным цветом. Эта линия определяет так называемую нижнюю границу выигрыша. Очевидно, что самая высокая точка этой ломанной соответствует нашей оптимальной стратегии. В данном случае, это точка пересечения линий стратегий B2и B3. Обратите внимание, что если выбрать частоту p3 равной ее абсциссе, то наш выигрыш будет оставаться неизменным и равным vпри любой стратегии игрока "B", кроме того он будет максимальным который мы можем себе гарантировать. Частота (вероятность) p3, в этом случае, есть соответствующая частота нашей оптимальной смешанной стратегии. Кстати из рисунка 2 видна и частота p1, нашей оптимальной смешанной стратегии, это длина отрезка [p3 ; 1] на оси абсцисс. (Это потому, что p1 + p3 = 1 ) Совершенно аналогично рассуждая, можно найти и частоты оптимальной стратегии для игрока "В", что иллюстрируется на рисунке 3.

Соседние файлы в папке практика