Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пособие - ИЗ.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
1.34 Mб
Скачать

14. Решение игры с нулевой суммой сведением к задаче линейного программирования

Покажем, как игру двух лиц с нулевой суммой можно представить задачей линейного программирования и решить, например, симплекс-методом.

Пример 1:

Решить игру, заданную платежной матрицей

α= 1, β= 2 → игра без седловой точки.

Пусть (р1, р2) – смешанная стратегия игрока А, (q1, q2, q3) – смешанная стратегия игрока В.

Напомним, что суммы вероятностей равны 1.

Воспользуемся теоремой Неймана из раздела 12.

Для игрока А:

1 + р2 ≥ v

2 ≥ v

р1 + 2р2 ≥ v

F = v → max

Преобразуем ограничения, разделив все члены неравенств на v (обозначим y1 = р1/v, y2 = р2/v, заметим, что v = 1/(y1 + y2)).

Итак, задача принимает вид:

3y1 + y2 ≥ 1

3y2 ≥ 1

y1 + 2y2 ≥ 1

G = y1 + y2min (1)

Для игрока B:

3q1 + q3 ≤ v

q1 + 3q2 +2q3 ≤ v

F = v → min

Преобразуем ограничения, разделив все члены неравенств на v (обозначим х1 = q1/v, х2 = q2/v, x3= q3/v, заметим, что

v= 1/(x1 + x2+x3)).

Итак, задача принимает вид:

3x1 + x3 ≤ 1

x1 + 3x2 +2x3 ≤ 1

f = x1+x2+x3 → max (2)

Согласно моделям раздела 6 получена пара двойственных задач (1) и (2). Напомним, что, решив одну из них, например, симплекс-методом, мы автоматически найдем решение другой.

Итак, решаем задачу (2):

3x1 + x34 = 1

x1 + 3x2 +2x3 + х5 = 1

F = x1+x2+x3 → max

Базисн.

перем.

х1

х2

х3

х4

х5

вi

Оцен.

отн.

х4

3

0

1

1

0

1

1

х5

1

3

2

0

1

1

1/2

Оцен.

строка

-1

-1

-1

0

0

0

Базисн.

перем.

х1

х2

х3

х4

х5

вi

Оцен.

отн.

х4

5/2

-3/2

0

1

-1/2

1/2

1/5

х3

1/2

3/2

1

0

1/2

1/2

1

Оцен.

строка

-1/2

1/2

0

0

1/2

1/2

Базисн.

перем.

х1

х2

х3

х4

х5

вi

Оцен.

отн.

х1

1

-3/5

0

2/5

-1/5

1/5

1/5

х3

0

9/5

1

-1/5

3/5

2/5

1

Оцен.

строка

0

1/5

0

1/5

2/5

3/5

Получено оптимальное решение:

х1 = 1/5, х2 =0, х3= 2/5

v = 1/(x1 + x2 + x3) = 5/3

q1 = 1/3, q2 = 0, q3 = 2/3

Вывод: чтобы обеспечить гарантированный средний проигрыш 5/3 игроку В нужно с вероятностью 1/3 выбрать первую стратегию и с вероятностью 2/3 – третью стратегию

(или так- чередовать стратегии 1 и 3 в соотношении 1:2).

Чтобы найти оптимальную стратегию игрока А вспомним раздел 6: (в оценочной строке последней таблицы находим абсолютные значения балансовых переменных х4, х5)

у1 = 1/5, у2= 2/5

р1 = (1/5)*(5/3)=1/3, р2 = 2/3.

Пример 2: (военная игра НАТО)

На маневрах флота в средиземном море сторона В может послать подводную лодку в один из регионов моря: 1 или 2. Другая сторона А имеет 3 противолодочных корабля и должна обнаружить и уничтожить подводную лодку.

Вероятность корабля потопить лодку в регионе 1 равна 0,6, а в регионе 2 - 0,4. Командованию флота нужно разработать стратегию распределения кораблей по регионам.

Данную конфликтную ситуацию рассмотрим как игру двух игроков А и В.

У игрока В две стратегии - послать лодку в регион 1 и в регион 2. У игрока А четыре стратегии (0,3), (1,2), (2,1) и (3,0).

Например, (2,1) означает посылку двух кораблей в 1 регион и одного - во 2 регион, и т.п.

Выигрыш игрока А – вероятность уничтожения лодки.

α=0,6, β=0,784

Поясним составление платежной матрицы.

(0,3)- посылка 0 кораблей в 1 регион и 3 кораблей во второй.

При этом в первом регионе имеется лодка - ясно, что вероятность ее уничтожения 0.

Пусть игрок В направил лодку во 2 регион:

вероятность того, что хотя бы один из 3-х кораблей уничтожит лодку: р = 1 – (1- 0,4)3 =0,784.

(2,1)- посылка 2 кораблей в 1 регион и одного корабля во 2 регион. Пусть игрок В направил лодку в 1 регион:

Р = 1- (1-0,6)2 = 0,64 и т.д. (просчитать вероятности самостоятельно).

Рассуждая, так же как и в первом примере:

Для игрока А:

0,6у2 + 0,84у3 + 0,936 у4 ≥ 1

0,784у1 + 0,64у2 + 0,4 у3 ≥ 1

F = у1 + у2 + у3 + у4 → min (1)

Для игрока В:

0,784х2 ≤ 1

0,6х1 + 0,64х2 ≤ 1

0,84х1 + 0,4х2 ≤ 1

0,936х1 ≤ 1

G= x1 + x2 → max (2)

Решим задачу (1) в EXCEL. (файл игра).

у1 =0, у2= 1,48, у3=0,13, у4=0, v= 1/(у12 + у3 + у4)= 1/1,61 = 0,62

р1=0, р2 =1,48*0,62= 0,92, р3=0,13*0,62= 0,08, р4 =0

Итак, оптимальная стратегия игрока А – послать 1 корабль в 1-й регион с вероятностью 0,92 и 2- в 1 регион с вероятностью 0,08. Не следует посылать 3 корабля во 2 -й регион и 3 корабля в 1 регион!

Пример 3.

Найти решение игры, заданной платежной матрицей:

Решаем игру сведением к двойственным задачам.

Для игрока А:

1 + 3у2 + 2 у3 ≥ 1

-2у1 + 5у2 + у3 ≥ 1

1 + у2 + 5у3 ≥ 1

G = у1 + у2 + у3 → min (1)

Для игрока В:

1 – 2х2 + 2х3 ≤ 1

1 + 5х2 + х3 ≤ 1

1 + х2 + 5х3 ≤ 1

F = х1 + х2 + х3 → max (2)

Решим задачу (1) в EXCEL:

у1 = 0,03 у2 = 0,19 у3= 0,15

v= 1/ (0,03 + 0,19 + 0,15)= 2,7

р1 = 0,03*2,7=0,081

р2 = 0,19*2,7 =0,513

р3 = 0,15*2,7 =0,405

Наиболее обещающей для игрока А является 2-я стратегия.

Решим задачу (2) в EXCEL:

х1 = 0,22 х2 = 0,05 х3= 0,1

v= 1/ (0,22 + 0,05 + 0,1)= 2,7

q1 = 0,22*2,7=0,594

q2 = 0,05*2,7 =0,135

q3 = 0,1*2,7 =0,27

Пример 4.

Известный актер Том Крус (игрок А) обдумывает, где бы ему провести отпуск с молодой женой. Возможные варианты (стратегии): Монте-Карло (МК), Гавайские острова (Г), Багамские острова (Б), Канарские острова (К), Сочи (С), озеро Байкал (ОБ). Игрок В - папарацци - фотографы, которые охотятся за артистом и могут, выследив его, испортить ему отпуск. Папарацци могут выследить актера с такими вероятностями: 0,34- МК, 0,12-Г, 0,16- Б, 0,4- К, 0,5-С, 0,2- ОБ.

Выигрыш игрока А - вероятность не встречи с папарацци.

Определить оптимальную стратегию игрока А.

Платежная матрица:

Следуя вышесказанному, составим задачу линейного программирования (почему без двойственной?):

0,66у1 + у2 + у3 + у4 + у5 + у6 ≥ 1

у1 + 0,88у2 + у3 + у4 + у5 + у6 ≥ 1

у1 + у2 + 0,84у3 + у4 + у5 + у6 ≥ 1

у1 + у2 + у3 +0,6 у4 + у5 + у6 ≥ 1

у1 + у2 + у3 + у4 +0,5 у5 + у6 ≥ 1

у1 + у2 + у3 + у4 + у5 +0,8 у6 ≥ 1

G= у1 + у2 + у3 + у4 + у5 + у6 → min

Решим задачу в EXCEL.

у1= 0,11 у2= 0,32 у3= 0,24 у4= 0,09 у5= 0,07 у6= 0,19

v= 1/ ( 0,11 + 0,32 + 0,24 + 0,09 + 0,07 + 0,19)=0,98

p1= 0,11*0,98=0,108

p2= 0,32*0,98=0,313

p3= 0,24*0,98=0,235

p1= 0,09*0,98=0,088

p1= 0,07*0,98=0,068

p1= 0,19*0,98=0,186

Рекомендация - Гавайские острова.