Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пособие - ИЗ.doc
Скачиваний:
1
Добавлен:
01.05.2025
Размер:
1.34 Mб
Скачать

13. Понятие смешанной стратегии. Графический метод решения игры.

Рассмотрим игру двух лиц с нулевой суммой:

α = -1, β=1 → седловой точки нет!

Итак, гарантированный выигрыш игрока А составит -1. Можно ли его повысить?

Основатель теории игр фон Нейман предложил выбирать ходы случайным образом с определенными вероятностями. Набор этих вероятностей он назвал смешанной стратегией игрока (сумма вероятностей равна 1).

Смешанные стратегии в теории игр представляют собой модель изменчивой, гибкой тактики, когда ни один из игроков не знает, как поведет себя противник в данной партии. Такая тактика (без всяких математических обоснований) часто применяется в карточных играх.

Тем самым, выигрыш игрока станет случайной величиной. Основная характеристика случайной величины – математическое ожидание (среднее). Итак, выигрыш это математическое ожидание.

(Напомним, что в теории вероятностей М (Х) = )

Пусть в нашем примере смешанная стратегия игрока А :

Р = (1/2, 1/2). Тогда, если, например, второй игрок В сделает первый ход, то математическое ожидание выигрыша игрока А:

1* (1/2) + (-1)*(1/2) = 0 → все же лучше, чем -1!.

Итак, случайность выбора ходов повышает шансы игрока на успех, хотя бы в среднем.

Фон Нейман обобщил это в виде теоремы.

Теорема фон Неймана

Существует такое число v (цена игры), что если игрок А придерживается оптимальной смешанной стратегии, то математическое ожидание его выигрыша (т.е. средний гарантированный выигрыш) будет не меньше v. Аналогичное утверждение относительно игрока В: математическое ожидание его проигрыша будет не больше v.

Как же найти цену игры v и оптимальные смешанные стратегии?

Графический метод

Пример 1.

Решить игру:

Рис. 6

Одновременно, обоим неравенствам удовлетворяют точки нижней огибающей. Какое же значение р выбрать игроку А?

Разумеется, то, при котором нижняя огибающая достигнет максимума.

Решаем систему:

р = 1/3, 1-p = 2/3, v=5/3

Вывод: если игрок А с вероятностью 1/3 будет выбирать 1 стратегию и с вероятностью 2/3 – 2 стратегию, то при достаточно большом количестве игр с данной платежной матрицей, гарантированный средний выигрыш составит 5/3.

Другая интерпретация: чередовать стратегии в пропорции 1:2.

Чтобы найти оптимальную стратегию игрока В, воспользуемся первой строкой матрицы:

q + 3 (1-q) = v → q = 2/3, 1-q = 1/3

Пример 2.

Фирма планирует выпуск двух моделей айфонов (игрок А).

Игрок В - спрос на продукцию. Аналитики составили платежную матрицу:

Найти оптимальную стратегию игрока А.

(почему не интересует игрок В?)

Следуем теореме Неймана.

а)находим нижнюю и верхнюю цены игры

→седловой точки нет.

б) пусть (p,1-p) смешанная стратегия игрока А, (q1,q2,q3) смешанная стратегия игрока В.

Следуя теореме Неймана имеем:

2p+7(1-p)ν→-5p+7ν (1)

3p+5(1-p) )ν→-2p+5ν (2)

11p+2(1-p) )≥ν→9p+2≥ν (3)

в) графическая иллюстрация неравенств

Рис. 7

Одновременно, обоим неравенствам удовлетворяют точки нижней огибающей. Какое же значение р выбрать игроку А?

Разумеется то, при котором нижняя огибающая достигнет максимума.

Решаем систему:

-2p+5=ν

9p+2=ν

р = 3/11, 1-p = 8/11, v = 49/11

Вывод: следует порекомендовать выпускать айфоны обеих моделей в отношении 3:8.

Чтобы найти оптимальную стратегию игрока В, заметим, что в образовании цены игры участвовали только 2-я и 3-я стратегии игрока В: 3q2 + 11 (1-q2) = 49/11.

q2 = 9/11, q3 =2/11, q1=0.