Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МАТРИЧНЫЕ ИГРЫ.doc
Скачиваний:
33
Добавлен:
14.03.2016
Размер:
914.43 Кб
Скачать

3. Сведение матричной игры к задаче линейного программирования.

Рассмотрим mn игру с платежной матрицей А=().

Без ограничения общности будем считать, что все элементы матрицы А положительны (этого всегда можно добиться, пользуясь аффинным правилом, преобразующим заданную матрицу игры, но не изменяющим оптимальных смешанных стратегий игроков). Тогда искомая цена игры v— положительное число.

Интересы игрока А. Из теоремы о свойствах оптимальных смешанных стратегий игроков вытекает, что при любой чистой стратегии Вигрока В, k = 1, 2,.. . , n, оптимальная смешанная стратегия Р = {} игрока А обеспечивает его средний выигрыш, не меньший v. Иными словами, выполняются соотношения k=1,2,…,n,

i=1,2,…,m,

которые с учетом обозначений i=1,2,…,m, можно записать так k=1,2,…,n, i=1,2,…,m.

Поскольку игрок А стремится максимально увеличить свой гарантированный выигрыш, то задача отыскания решения матричной игры сводится к следующей задаче: найти неотрицательные величины удовлетворяющие неравенству k=1,2,…,n и такие, что их сумма минимальна

Интересы игрока В. Аналогичным образом заключаем, что оптимальная смешанная стратегия Q= {}игрока В при любой чистой стратегии Аигрока А, i = 1,2,…,m обеспечивает его средний проитрыш, не больший v. Иными словами, выполняются соотношения

i=1,2,…,m,

k=1,2,…,n, которые с учетом обозначений:

k=1,2,…,nможно записать так i=1,2,…,m,

k=1,2,…,n.

Поскольку игрок В стремится сделать свой гарантированный проигрыш минимально возможным, то задача отыскания решения матричной игры сводится к следующей задаче: найти неотрицательные величины удовлетворяющие неравенству i=1,2,…,m и такие, что их сумма максимальна Тем самым, мы получаем следующий важный результат. Теорема 3. Решение матричной игры с положительной платежной матрицей ()равносильно решению двойственных задач линейного программирования :

(А) k=1,2,…,n,

i = 1,2,…,m,

(B) i=1,2,…,m,

k = 1,2,…,n.

При этом цена игры v = гдеΘ - величина, обратная общему значению оптимальных сумм, Θ = =а оптимальные значения связаны с оптимальнымипосредством равенствi=1,2,…,m, k = 1,2,…,n.

Алгоритм решения матричной игры. 1) Ко всем элементам исходной матрицы игры прибавляется одно и то же положительное число γ так, чтобы все элементы новой матрицы были строго положительны. 2) Решаются двойственные задачи линейного программирования (А) и (В) (например, симплекс-методом, или как-нибудь иначе). Находятся наборы и числоΘ. З) Строятся оптимальные смешанные стратегии игроков А и В соответственно 4) Вычисляется цена игры

Пример 9. Рассмотрим 2 х 2 игру с матрицей . Соответствующие ей задачи линейного программирования имеют вид

Решение.

1) Все элементы платежной матрицы положительны.

2) Строим решения обеих задач линейного программирования, пользуясь графическим методом. В результате получаем, что

3)

4)

§ 4. Примеры задач, сводимых к матричным играм

Все на свете начинается грошовым делом, а смотришь,

маленькая игра как раз кончилась большой. Н. В. Гоголь «Игроки»

В чистом виде антагонистические конфликты встречаются редко (разве только в боевых действиях и в спортивных состязаниях). Однако довольно часто конфликтные ситуации, в которых интересы сторон противоположны, а множество способов действия сторон конечно, можно моделировать матричными играми.

Рассмотрим несколько конкретных ситуаций.

Пример 10. «Планирование посева». Сельскохозяйственное предприятие имеет возможность выращивать две культуры - Аи А.Необходимо определить, как сеять эти культуры, если при прочих равных условиях их урожаи зависят от погоды, а план посева должен обеспечить наибольший доход (прибыль от реализации определяется полученным объемом выращенной культуры). В зоне рискованного земледелия (а таковой является большая часть России) планирование посева должно осуществляться с учетом наименее благоприятного состояния погоды.

Таким образом, одной из сторон выступает сельскохозяйственное предприятие, заинтересованное в том, чтобы получить наибольший доход (игрок А), а другой стороной — природа, способная навредить сельскохозяйственному предприятию в максимальной степени (от нее зависят погодные условия) и преследующая тем самым прямо противоположные цели (игрок В). Принятие природы за противника в рассматриваемом примере равносильно планированию посева с учетом наиболее неблагоприятных условий; если же погодные условия окажутся благоприятными, то выбранный план даст возможность увеличить доход.

Налицо антагонистический конфликт, в котором у игрока А две стратегии - Аи А, а у игрока В три — В(засушливое лето), В(нормальное лето) и В(дождливое лето).

В качестве выигрыша игрока А возьмем прибыль от реализации и будем считать, что расчеты прибыли сельскохозяйственного предприятия (в млн. руб.) в зависимости от состояний погоды сведены в следующую матрицу . Нетрудно заметить,что седловой точки у этой матрицы нет. Поэтому оптимальная стратегия игрока А будет смешанной. Применяя графический метод, получаем Р=,.

Замечание. Здесь мы столкнулись со сравнительно редкой ситуацией, когда оптимальная смешанная стратегия одного из игроков допускает так называемую «физическую» реализацию. Полученное решение сельскохозяйственное предприятие может использовать так: на всех площадей выращивать культуруА, на всех площадей выращивать культуруАиполучать прибыль в размере,не меньшем млн. руб.

Пример11. «Переговоры о заключении контракта между профсоюзом и администрацией». Рассмотрим фирму, администрация которой ведет переговоры с профсоюзом рабочих и служащих о заключении контракта. Предположим, что платежная матрица, отражающая интересы договаривающихся сторон, имеет следующий вид

75 105 65 45 70 60 55 40 80 90 35 50 95 100 50 55

Выплаты указаны в центах в час и представляют собой среднюю зарплату служащего фирмы вместе со всеми добавками. Тем самым, заданная матрица описывает прибыль профсоюза (игрок А) и затраты администрации фирмы (игрок В).

Ясно, что профсоюз стремится максимизировать доходы рабочих и служащих, в то время как администрации хотелось бы минимизировать собственные потери.

Нетрудно заметить, что седловой точки у платежной матрицы нет. Кроме того, для дальнейшего анализа существенными являются лишь стратегии Аи Аигрока А и стратегии Ви В игрока В (в этом легко убедиться, воспользовавшись правилом доминирования стратегий). В результате соответствующего усечения получим матрицу . Элементы матрицы , связаны с элементами предыдущей матрицы соотношениями65=5•4+45, 45=5•0+45, 50=5•1+45, 55=5•2+45. Воспользовавшись графическим методом, в итоге получим Р = ,Q = ,v = 53. Тем самым, профсоюзу следует выбирать стратегию А в 20% случаев и стратегию А в 80%. Что касается администрации, то ей следует выбирать стратегию Вс вероятностью 0,4 и стратегию В с вероятностью 0,6. При этом ожидаемая цена игры равна 53.

Замечание. Следует отметить, что если процесс переговоров будет повторяться мною раз, то среднее должно сходиться к ожидаемому значению 53. Если же переговоры пройдут лишь единожды, то реальный результат получится при выборе каждым игроком некоторой своей чистой стратегии. Поэтому один из игроков, профсоюз или администрация, будет неудовлетворен.

Пример 12. «Локальный конфликт». Рассмотрим войну между двумя небольшими государствами А и В, которая ведется в течение 30 дней.

Для бомбардировки небольшого моста — важного военного объекта страны В - страна А использует оба имеющихся у нее самолета. Разрушенный мост восстанавливается в течение суток, а каждый самолет совершает один полет в день по одному из двух воздушных маршрутов, соединяющих эти страны. У страны В есть два зенитных орудия, при помощи которых можно сбивать самолеты страны А. Если самолет собьют, то некая третья страна в течение суток поставит стране А новый самолет. Страна А может послать самолеты либо по одному маршрут, либо по разным. Страна В может поместить либо обе зенитки на одном маршруте, либо по одной зенитке на каждый маршрут.

Если один самолет летит по маршруту, на котором расположена одна зенитка, то этот самолет будет сбит. Если два самолета летят по маршруту, на котором расположены две зенитки, то оба самолета будут сбиты. Если два самолета летят по маршруту, на котором расположена одна зенитка, то сбит будет только один самолет. Если самолет доберется до цели, то мост будет уничтожен.

У страны А есть две стратегии: «послать самолеты по разным маршрутам» - А,«послать самолеты по одному маршруту» - А.У страны В - также две стратегии: «поместить зенитки на разных маршрутах» - В,«поместить зенитки на одном маршруте» - В.

Если страна А выберет стратегию А,а страна В — стратегию В, то страна А получит нулевой выигрыш, так как ни один из самолетов не достигнет цели.

Если страна А выберет стратегию А,а страна В — стратегию В,то хотя бы один самолет достигнет цели и вероятность разрушения моста будет равна 1.

Если страна А выберет стратегию А,а страна В стратегию В, то вновь хотя бы один самолет достигнет цели и вероятность разрушения моста будет равна 1.

Если страна А выберет стратегию А,а страна В стратегию В, то страна А с вероятностью выберет маршрут, на котором установлены зенитки, и, следовательно, цель будет уничтожена с вероятностью .

Оформим результаты проведенного анализа в стандартной игровой форме: . При помощи графического метода получаем оптимальные смешанные стратегии игроков и цену игры Р =,,.

Это означает, что если страна А будет посылать самолеты по разным маршрутам в течение десяти дней из тридцати, отпущенных на войну (и, значит, по одному маршруту в течение двадцати дней), то в среднем страна А будет иметь 66,7% удачных случаев (мост будем находиться в нерабочем состоянии). Воспользовавшись для своих зениток предложенным выбором, страна В не позволит бомбить мост чаще, чем в 66,7% случаев.