Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория игр.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
371.71 Кб
Скачать

§ 4. Общие методы решения конечных игр. Сведение их к задачам линейного программирования

Мы рассматривали до сих пор только самые элементарные игры типа 2хп, которые могут быть весьма просто решены и допускают удобную и наглядную геометрическую интерпретацию.

В общем случае решение игры mxn представляет довольно трудную задачу, причём сложность задачи и объём вычислений резко возрастает с увеличением т и п.

При решении игр тхп на практике удобнее пользоваться не геометрическими аналогиями, а расчётными аналитическими методами, тем более, что для решения задачи на вычислительных машинах эти методы единственно пригодны.

Решение любой конечной игры mxn может быть приведено к задаче линейного программирования.

Пусть дана игра mxn с m стратегиями А1, А2, ..., Ат игрока А и п стратегиями В1, В2, ..., Вп игрока В и задана платежная матрица ║аij║. Требуется найти решение игры, т.е. две оптимальные смешанные стратегии игроков А и В:

где р1+р2+… +рm=1, q1+q2+…+qn=1.

Оптимальная стратегия должна обеспечивать нам выигрыш, не меньшей v, при любом поведении противника, и выигрыш, равный v, при его оптимальном поведении (стратегия ). Цена игры v не известна. Будем считать, что v>0, для чего нужно, чтобы все элементы матрицы ║аij║ были неотрицательными. Этого можно добиться, прибавляя к элементам ║аij║ достаточно большую положительную величину L, при этом цена игры увеличивается на L, а решение не изменится.

Пусть мы выбрали свою оптимальную стратегию . Тогда наш средний выигрыш при стратегии Bj противника будет равен:

аj= p1a1j + p2 a2j + …+ pmamj.

Оптимальная стратегия обладает тем свойством, что при любом поведении противника обеспечивает выигрыш не меньший, чем vj, следовательно, любое из чисел aj не может быть меньше v. Получаем ряд условий:

Разделим неравенства на положительную величину v и обозначим

.

Тогда условия системы запишутся в виде

,

где - необязательные числа.

Т.к. p 1+p2 +... + pm =1, то величины удовлетворяют условию .

Мы хотим сделать свой гарантированный выигрыш максимально возможным; очевидно, при этом правая часть последнего равенства принимает минимальное значение.

Таким образом, задача нахождения решения игры сводится к следующей задаче линейного программирования: определить неотрицательные величины удовлетворяющие последней системе, так, чтобы их сумма была минимальной.

Задача второго игрока является двойственной по отношению к задаче первого игрока. Можно найти решение одного из игроков, а затем по теоремам двойственности - решение другого.

Пример. Требуется найти решение игры 3х3 с матрицей:

В

А

В1

В2

В3

А1

2

-3

4

А2

-3

4

-5

А3

4

-5

6

Решение. Чтобы сделать все аij≥0, прибавим ко всем элементам матрицы L=5. Получим матрицу:

В

А

В1

В2

В3

А1

7

2

9

А2

2

9

0

А3

9

0

11

При этом цена игры увеличится на 5, а решение не изменится.

, где .

Чтобы избавится от знаков неравенства, введем фиктивные переменные z1, z2 , z3, тогда имеем

.

Линейная форма Ф имеет вид: .

Выразим Ф через z1, z2 , z3 решая систему получим:

.

Тогда .

В выражении коэффициенты при всех z положительны, значит любое увеличение z1, z2 , z3 сверх нуля может привести к увеличению формы Ф, а нам нужно чтобы она была минимальной. Следовательно, z1=z2=z3=0. Тогда , v=5.

Находим , или умножая их на v:

Таким образом, оптимальная стратегия А найдена:

.

Зная цену игры, можно уже известными способами найти оптимальную стратегию соперника:

.

Для этого воспользуемся любыми двумя полезными стратегиями, например А2 и А3 и напишем уравнения:

,

откуда q1=q3=1/4; q2=1/2. Оптимальная стратегия противника будет такой же, как наша:

.

Теперь вернёмся к первоначальной (не преобразованной) игре. Для этого нужно только от цены игры v=5 отнять величину L=5, прибавленную к элементам матрицы. Получается цена исходной игры v=0. Следовательно, оптимальные стратегии обеих сторон обеспечивают выигрыш, равный нулю; игра в одинаковой мере выгодна или невыгодна для обеих сторон.

В рассмотренной выше задаче игра задавалась платежной матрицей, которую сводили к модели линейного программирования. И, наоборот, задача линейного программирования может быть сведена к матричной игре.

Если задача линейного программирования имеет вид F(x)= , при ограничениях: xj ≥ 0, i=1,…, m, j=1,…, n, то матричная игра определяется платежной матрицей размера (т + п + 1) вида , где А — матрица коэффициентов при неизвестных системы ограничений задачи линейного программирования; В — матрица свободных членов; С — матрица коэффициентов при неизвестных целевой функции; Аt, Вt, Сt — транспонированные матрицы А, В, С.

Если задача линейного программирования имеет вид F(x)= , при ограничениях: xj ≥ 0, i=1,…, m, j=1,…, n, то матричная игра определяется платежной матрицей размера (т + п + 1) вида .

Пример. Построить матричную игру, заданную задачей линейного программирования F(x) = 1 + 3x2 max при ограничениях:

x1, x2 ≥0.

Решение. Обозначим: , , .

Транспонированные матрицы:

, , , т + п + 1=2+2+1=5.

Ответ: Игру, определяемую данной задачей линейного программирования, можно записать матрицей:

.