Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
124
Добавлен:
20.06.2014
Размер:
1.15 Mб
Скачать

5.1.6. Приведение матричной игры к задаче линейного программирования

Игра т х пв общем случае не имеет наглядной геометрической интерпретации. Ее решение достаточно трудоемко при большихт xп, однако принципиальных трудностей не имеет, посколь­ку может быть сведено к решению задачи линейного программи­рования. Покажем это. Пусть играт х пзадана платежной мат­рицейр =(аij),i = 1, 2, ...,т; j = 1, 2, ...,п.ИгрокАобладает стра­тегиямиА1, А2,…, Аm, игрокВ —стратегиямиВ1, В2, ..., Bn. Необ­ходимо определить оптимальные стратегииS*A = (p*1, р*2,…,p*т) иS*B = (q*1, q*2,…,q*n), гдеp*i, q*jвероятности применения соот­ветствующих чистых стратегийАi, Вj;

Оптимальная стратегия S*Aудовлетворяет следующему требо­ванию. Она обеспечивает игрокуАсредний выигрыш, не мень­ший, чем цена игры v,при любой стратегии игрокаВи выиг­рыш, равный цене игры v,при оптимальной стратегии игрокаВ. Без ограничения общности полагаем v > 0;этого можно добиться, сделав все элементыаij  0.Если игрокАприменяет смешанную стратегиюS*A = (p*1, р*2,…,p*т) против любой чистой стратегииBj игрокаВ, то он получаетсредний выигрыш,илиматематическое ожидание выигрышааj =а1jр1 +а2jр2 + ... + аmjрm, j = 1, 2, ...,n(т.е. элементыj-го столбца платежной матрицы почленно умножаются на соответствующие вероятности стратегийА1, А2, ..., Amи резуль­таты складываются).

Для оптимальной стратегии S*Aвсе средние выигрыши не меньше цены игры v,поэтому получаем систему неравенств:

(5.1.6.1)

Каждое из неравенств можно разделить на число v > 0.Введем новые переменные:

(5.1.6.2)

Тогда система (5.6.1)примет вид:

(5.1.6.3)

Цель игрока Амаксимизировать свой гарантированный вы­игрыш, т.е. цену игрыv.

Разделив на v  0равенствор1 + p2 +...+ рm = 1,получаем, что переменныехi (i=1,2,...,m) удовлетворяют условию:х1 + х2 +...+ xт =1 /v.Максимизация цены игры vэквивалентна мини­мизации величины 1 / v,поэтому задача может быть сформулиро­вана следующим образом:определить значения переменных xi0,i = 1, 2, ...,т, так, чтобы они удовлетворяли линейным ограничени­ям (5.1.6.3)и при этом линейная функция

(5.1.6.4)

обращалась в минимум.Это задача линейного программирования. Решая задачу (5.1.6.3)—(5.1.6.4),получаем оптимальное решениеp*1, р*2,…,p*ти оптимальную стратегиюS*A.

Для определения оптимальной стратегии S*B = (q*1, q*2,…,q*n) следует учесть, что игрокВстремится минимизировать гаранти­рованный выигрыш, т.е. найти. Переменныеq1, q2,…,qnудовлетворяют неравенствам

(5.1.6.5)

которые следуют из того, что средний проигрыш игрока Вне пре­восходит цены игры, какую бы чистую стратегию не применял игрокА.

Если обозначить

(5.1.6.6)

то получим систему неравенств:

(5.1.6.7)

Переменные уj (j = 1, 2, ...,n) удовлетворяют условиюy1+ y2 + …+ yп = 1 / v.

Игра свелась к следующей задаче.

Определить значения переменных уj > 0, j = 1, 2, ..., п, которые

удовлетворяют системе неравенств (5.1.6.7) и максимизируют линей­ную функцию

(5.1.6.8)

Решение задачи линейного программирования (5.1.6.6), (5.1.6.7) определяет оптимальную стратегиюS*B = (q*1, q*2,…,q*n). При этом цена игры

(5.1.6.9)

Составив расширенные матрицы для задач (5.1.6.3), (5.1.6.4)и(5.1.6.7), (5.1.6.8),убеждаемся, что одна матрица получилась из другой транспонированием:

Таким образом, задачи линейного программирования (5.1.6.3), (5.1.6.4)и (5.1.6.7), (5.1.6.8)являются взаимно-двойственными. Очевид­но, при определении оптимальных стратегий в конкретных зада­чах следует выбрать ту из взаимно-двойственных задач, решение которой менее трудоемко, а решение другой задачи найти с по­мощью теорем двойственности.

Соседние файлы в папке Методические указания (лекции)