Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шпоры_4семестр.doc
Скачиваний:
5
Добавлен:
24.09.2019
Размер:
541.7 Кб
Скачать

46. Биматричные игры. Максиминные и минимаксные стратегии игры игроков

                                     (6.1)

с элементами

a11 = 2,       a12 = -1,     a21 = 1,       a22 = 0;                            (6.2)

b11 = 0,       b12 = -2,     b21 = -3,     b22 = 1.

           Как и в матричной игре, пара матриц (6.1) однозначно задает правила биматричной игры. Стратегиями первого и второго игроков служат соответственно номера   i = 1, 2  строк и   j = 1, 2  столбцов этих матриц. Если игроки независимо выбрали свои стратегии  i, j  и в игре сложилась ситуация  (i, j), то выигрышем первого игрока будет элемент  аi j  матрицы  A, а выигрышем второго – элемент  bi j  матрицы  B. Цель каждого игрока состоит в максимизации индивидуального выигрыша.

44. Приведение матричной антагонистической игры к задаче линейного программирования

Игра m х п в общем случае не имеет наглядной геометрич интерпретации. Ее решение достаточно трудоемко при больших m*n, однако принципиальных трудностей не имеет, посколь­ку может быть сведено к решению задачи линейного программи­рования. Покажем это. Пусть игра т х п задана платежной мат­рицей р = (aij), i =1, 2, т; j = 1,2, п. Игрок А обладает стра­тегиями А1 А2, Ат игрок В — стратегиями В1, В2, Вп. Необ­ходимо определить оптимальные стратегии S*A = 12,,,,Рm) и S*B (q1, q2, qn) где p*,q* вероятности применения соот­ветствующих чистых стратегий Ai Вj

Р12m=1 q1+ q2+ qn=1

Оптим стратегия S*A удовлетворяет след требо­ванию Она обеспечивает игроку А средний выигрыш, не мень­шим, чем цена игры v, при любой стратегии игрока В и выиг­рыш, равный цене игры v, при оптим стратегии игрока В. Без ограничения общности полагаем v> 0; этого можно добиться, сделав все элементы aij > 0. Если игрок А применяет смешанную стратегию S*A = 12,,,,Рm) против любой чистой стратегии Bj игрока B то он получает средний выигрыш, или математическое ожидание выигрыша aj = a1jp1 + a2jP2+amjPm j=1,2,..n(т.е. элементы j-го столбца платежной матрицы почленно умножаются на соотв вероятности стратегий А1,A2…Am и резуль­таты складываются).

Для оптим стратегии S*A все средние выигрыши не меньше цены игры v, поэтому получаем систему неравенств:

Каждое из неравенств можно разделить на число v > 0. Введем новые переменные:

X1=p1/v Тогда система примет вид:(9.13)

Цель игрока А — максимизировать свой гарантированный вы­игрыш, т.е, цену игры v.

Разделив на v ≠ 0 равенство Р12m=1получаем, что переменные xi,(i=1,2,…m) удовлетворяют условию: Х12 +… +хm = 1/v. Максимизация цены игры v эквивалентна мини­мизации величины 1/v, поэтому задача может быть сформулиро­вана следующим образом: определить значения переменных xi ≥ 0, i= 1, 2, т, так, чтобы они удовлетворяли лин ограничени­ям (9.13) и при этом лин функция

Z=x1 + х2+...+хm (9.14)

обращалась в минимум. Это задача лин программирования. Решая задачу (9.13)—(9.14), получаем оптим решение Р1 P2….Рm и оптим стратегию S*A.

Для определения оптим стратегии S*A - (q1,q2….qn) следует учесть, что игрок В стремится минимизировать гаранти­рованный выигрыш, т.е. найти mах 1/v. Переменные q1,q2….qn удовлетворяют неравенствам:

которые следуют из того, что средний проигрыш игрока В не пре­восходит цены игры, какую бы чистую стратегию не применял игрок А.

Если обозначить yj=qj/v j=1,2,3….n.(9.16) то получим систему неравенств(9.17):

Переменные уi (j =1, 2,..., n) удовлетворяют условию У1 + У2+.-.+Уn = 1/v.

Игра свелась к следующей задаче.

Определить значения переменных уj≥ 0, j = 1, 2, ..., п, которые

удовлетворяют системе неравенств (9.17) и максимизируют линей­ную функцию

Z' = y1+y2+…yn

Решение задачи линейного программирования (9.16), (9.17) определяет оптимальную стратегию S*в = (q1,q2….qn ).При этом цена игры

v=1/mахZ' = 1/minZ.