Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
глава2.doc
Скачиваний:
16
Добавлен:
07.11.2018
Размер:
723.97 Кб
Скачать

2.5. Ситуации равновесия и оптимальные стратегии

Теорема о минимаксе показывает целесообразность вве­дения множества смешанных стратегий. Оказывается, что в смешанных стратегиях любая матричная игра имеет ситуацию равновесия.

Определение 2.7. Ситуация (X*, Y*) называется ситуацией равновесия матричной игры, если для любых X X, Y Y выполняются неравенства

Н(Х, Y*) ≤ H(X*, Y*) ≤ H(X*, Y). (2.36)

В ситуации равновесия ни одному из игроков не вы­годно от нее отклоняться.

Определение 2.8. Стратегия игрока называется оптимальной, если существует стратегия другого игрока, в паре с которой она образует ситуацию равновесия.

Каждый из игроков имеет хотя бы одну оптимальную стратегию. Множество всех ситуаций равновесия является прямым произведением множества оптимальных стратегий первого игрока и множества оп­тимальных стратегий второго игрока. Множество опти­мальных стратегий первого игрока равно множеству его максиминных стратегий, а множество оптимальных стра­тегий второго игрока — множеству его минимаксных стратегий в игре Г. Выигрыши во всех ситуациях равновесия одинаковы и равны значению игры.

Итак, любая матричная игра имеет значение v, а игроки в этой игре — оптималь­ные стратегии X*, Y*. Тройка (X*, Y*, v) - решение матричной игры.

Рассмотрим оптимальные стратегии игроков и значение игры:

1) Если множество V' вещественных чисел состоит из тех и только тех чисел v, для которых существует такая стратегия Y' игрока II, что справедли­вы неравенства

Н (х, Y) ≤ v1 при хх.

Тогда значение матричной игры Г равно наименьшему из чисел множества V'. (это наглядно видно при графическом решении игры – см. гл.4).

Если

Н(х, Y*) ≤ v, при хх, (2.37)

то Y* — оптимальная стратегия игрока II.

Можно показать, что Y* — минимаксная стратегия игрока II.

2) И, аналогично: если подмножество V" веществен­ных чисел состоит из таких чисел v" , что существует такая стратегия X' игрока I, для которой справедливы неравенства

Н (X1, y) ≥ v", уy

Тогда значение игры Г равно наибольшему из чисел множества V".

Если

Н(Х*,y)≥v, уy, (2.38)

то X* — оптимальная стратегия игрока I.

Пример 2.4. [3] Некто Петров идет по Невскому проспекту и видит, что на всех перекрестках на лотках продается пользующаяся большим успехом книжная новинка. Петров обдумывает две свои стратегии: покупать книгу или не покупать ее (ибо может случиться, что его жена также купит книгу). Если вечером в доме окажется одна книга, то радость от такого события можно оценить в 2 единицы. Если окажутся две книги, то досада на напрасную покупку снизит эту радость на единицу. Наконец, если книга вовсе не будет куплена, то реплика жены: «Недотепа! Был на Невском и не мог купить...» доведут радость Петрова до—2 единиц.

Итак, природа (или судьба, как угодно), избравшая своим орудием гражданку Петрову, также имеет две чистые стратегии, и нашему Петрову приходится в качестве игрока I иметь дело-с 2х2-игрой с матрицей выигрыша.

Вычисляя минимаксы, мы находим, что

, ,

так что в этой игре седловой точки в чистых стратегиях нет. Следовательно, игроки должны пользоваться смешанными стратегиями.

Пусть игрок 1 будет играть свою первую чистую стратегию с вероятностью р (и соответственно вторую — с вероятностью 1 —р). Тогда выигрыш при использовании игроком 2 его первой чистой стратегии будет равен

1р+2(1-р)=2-р,

а при использовании игроком 2 его второй чистой стратегии –

2р-2(1-р)=4р-2

Игрок 1 может рассчитывать на получение меньшего из этих двух выигрышей. Но выигрыш 4р—2 по мере изменения р от 0 до 1 возрастает от —2 до 2, а выигрыш 2-р убывает от 2 до 1. Поэтому при малых значениях р

4р-2 < 2-р

так что 4р—2 является меньшим из двух выигрышей. Значит, меньший выигрыш вместе с ростом р возрастает до тех пор, пока он не будет описываться выражением 2—р и не начнет убывать. В пограничной точке, где минимальный выигрыш оказывается наибольшим, оба выигрыша должны быть равны

2 - р = 4р - 2.

Это означает что р = 4/5. Таким образом, оптимальная стратегия игрока 1 состоит в выборе первой чистой стратегии с вероятностью 4/5 и второй чистой стратегии- с вероятностью 1/5. Значение игры при этом равно

2-р=2-4/5=1,2.

Для осуществления своей оптимальной смешанной стратегии Петрову можно посоветовать проделать следующее. Он должен достать из кармана старый трамвайный билет (номер должен содержать пять знаков), и обратить внимание на последнюю цифру его номера. Если эта цифра есть 0 или 1, то он должен воздержаться от покупки(это произойдет с вероятностью 2/10, то есть 1/5). Во всех остальных случаях ( то есть с вероятностью 4/5) он должен покупать книгу.

Говорить здесь об оптимальной стратегии не совсем уместно. Этот игрок персонифицирован в виде жены Петрова, которая в такой же мере, как и он сам, заинтересована в семейных радостях. Тем более не в ее интересах минимизировать выигрыш супруга. Однако ее действия определяются рядом обстоятельств, неизвестных размышляющему перед покупкой книги мужу; и он может считать, что эти обстоятельства являются для него наименее благоприятными.

Для того, чтобы эти неблагоприятные обстоятельства установить, предположим, что жена купит книгу с вероятностью q (и не будет ее покупать с вероятностью 1-q). Тогда «проигрыш природы» при покупке книги Петровым будет в среднем равен

1q+2(1-q) =2-q

а при непокупке им книги-

2q+(-2)(1-q)=4q-2

приравнивая эти выражения, мы получаем, что q=4/5.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]