Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТЕОРИЯ ИГР.doc
Скачиваний:
1
Добавлен:
01.05.2025
Размер:
1.35 Mб
Скачать

5. Методы решения матричных игр

В этом разделе изложены некоторые методы решения матричных игр в смешанных стратегиях. При этом наша цель будет состоять в поиске хотя бы одного решения игры.

I. Доминирование строк и столбцов.

Если элементы некоторой строки i1 матрицы A меньше соответствующих элементов другой строки i2, то интуитивно ясно, что строку i1 первому игроку можно не использовать. Сформулируем условия доминирования строк и столбцов матрицы игры, позволяющие уменьшить ее размеры.

Определение. Будем говорить, что вектор a = (a1, ..., al) слабо доминирует вектор b = (b1, ..., bl), если aibi, i = 1, ..., l. Будем говорить о строгом доминировании, если все нестрогие неравенства  заменены на строгие >. Заметим, что слабое доминирование возможно даже в случае равенства векторов a и b.

Определение. Для векторов a(i), i = 1, ...,m, евклидова пространства и чисел pi  0, i = 1, ...,m, , линейная комбинация называется выпуклой комбинацией векторов a(i) с коэффициентами pi.

Теорема 5.1 (О доминировании строк). Пусть некоторая строка матрицы A слабо доминируется выпуклой комбинацией остальных строк. Тогда эта строка входит с нулевой вероятностью в некоторую оптимальную смешанную стратегию первого игрока. Если указанное доминировние строгое, то эта строка входит с нулевой вероятностью в любую оптимальную смешанную стратегию первого игрока. Доминируемые строки можно вычеркнуть из матрицы игры.

Доказательство. Пусть строка матрицы A с номером i1 слабо доминируется выпуклой комбинацией остальных строк с коэффициентами pi  0, ii1 :

(5.1)

Рассмотрим матрицу , полученную из A вычеркиванием (исключением) i1-ой строки. Пусть ( , q0, ) - решение игры с матрицей . Положим p0 = ( 1, ..., , 0, , ..., ) и докажем, что тройка (p0, q0, ) - решение игры с матрицей A. Тем самым будет доказано второе утверждение теоремы и обосновано вычеркивание i1-ой строки. Действительно, решая игру с матрицей , мы находим решение исходной игры, добавляя в нулевую i1-ую компоненту.

Проверим условие (*) для тройки (p0, q0, ) в игре с матрицей A. Имеем

Пусть i = i1. Тогда, полагая p = (pi, i i1), получим

поскольку стратегия q0 второго игрока оптимальна в игре с матрицей . Итак, (p0, q0, ) - решение игры с матрицей A.

Предположим, что неравенства в (5.1) строгие. Тогда в последних выкладках первое неравенство также строгое и A(i1, q0) < . Пусть p* - произвольная оптимальная смешанная стратегия первого игрока. Тогда (p*, q0, ) - решение игры с матрицей A. Из последнего неравенства по свойству дополняющей нежесткости получаем = 0.

Отметим, что при исключении строго доминируемых строк оптимальные смешанные стратегии первого игрока сохраняются. При слабом доминировании оптимальные стратегии могут теряться. В качестве примера достаточно рассмотреть матрицу игры с равными элементами.

Следующую теорему докажите самостоятельно.

Теорема 5.1’ (О доминировании столбцов). Пусть некоторый столбец матрицы A слабо доминирует выпуклую комбинацию остальных столбцов этой матрицы. Тогда этот столбец входит с нулевой вероятностью в некоторую оптимальную смешанную стратегию второго игрока. Если указанное доминирование строгое, то этот столбец входит с нулевой вероятностью в любую оптимальную смешанную стратегию второго игрока. Доминирующие столбцы можно вычеркнуть из матрицы игры.

Пример 5.1. Решить игру с матрицей

Здесь полусумма первых двух строк слабо доминирует третью строку и ее можно вычеркнуть. В полученной матрице третий столбец слабо доминирует второй. После его вычеркивания получим циклическую матрицу с решением ( , , ) = ((1/2, 1/2), (1/2, 1/2), 2). Поэтому исходная игра имеет решение

(p0, q0, ) = ((1/2, 1/2, 0), (1/2, 1/2, 0), 2).

Упражнение 5.1. Пусть матрица A имеет седловую точку. Показать, что после исключения слабо доминируемых строк и слабо доминирующих столбцов без использования выпуклых комбинаций редуцированная матрица имеет седловую точку матрицы A.

Упражнение 5.2. Полковнику Блотто (первому игроку) поставлена задача прорыва тремя полками через два горных перевала, охраняемых двумя полками противника (второго игрока). Стратегия Блотто (k1, k2)  X = {(3, 0), (2, 1), (1, 2), (0, 3)} состоит в том, что k1 полков направляются на первый перевал, а k2 - на второй. Противник располагает аналогичными стратегиями (l1, l2)  Y = {(2, 0), (1, 1), (0, 2)}. Полки Блотто и противника, встретившись на перевале, взаимно уничтожают друг друга. Выигрышем Блотто является общее число его полков, прорвавшихся через два перевала, т.е. величина max[k1-l1, 0]+max[k2-l2, 0]. Решить матричную игру и найти оптимальную стратегию Блотто.

X \ Y

(2, 0)

(1, 1)

(0, 2)

(3, 0)

1

2

3

(2, 1)

1

1

2

(1, 2)

2

1

1

(0, 3)

3

2

1

Строка 2 слабо доминирует 1-ю строку, а строка 3 – строку 4. После их вычеркивания имеем

X \ Y

(2, 0)

(1, 1)

(0, 2)

(3, 0)

1

2

3

(0, 3)

3

2

1

Сейчас столбец 2 слабо доминирует полусумму 1-ого и 3-его столбца. После его вычеркивания, имеем:

X \ Y

(2, 0)

(0, 2)

(3, 0)

1

3

(0, 3)

3

1

В итоге решение: (p0, q0, ) = ((1/2, 0, 0, 1/2), (1/2, 0, 1/2), 2).

II. Графический метод решения игр с матрицами размеров 2 n и m 2.

Рассмотрим игру с 2 n-матрицей A. Смешанная стратегия первого игрока p = (p1, 1-p1) определяется величиной p1  [0, 1]. Значение игры, согласно следствию теоремы 4.2’, представимо в виде

Д ля нахождения значения игры и оптимальной смешанной стратегии первого игрока достаточно на отрезке [0,1] построить графики семейства линейных функций lj(p1) = a1jp1 + a2j(1 - p1) с угловыми коэффициентами kj = a1j - a2j , j = 1, ..., n, и найти точку максимума p01 функции - нижней огибающей семейства (рис. 5.1).

Найдем оптимальную смешанную стратегию второго игрока. Разберем следующие возможности.

а) 0 < < 1.

Этот случай представлен на рис. 5.1. Возьмем две прямые lj1 и lj2 , проходящие через точку ( ,) и имеющие угловые коэффициенты kj1  0, kj2  0. Рассмотрим уравнение

kj1q*+kj2(1-q*)=0. (5.2)

Оно имеет решение q*, принадлежащее отрезку [0,1]. Из (5.2) следует, что угловой коэффициент прямой lj1(p1)q* + lj2(p1)(1 – q*) равен нулю. Смешанная стратегия второго игрока

оптимальна, поскольку при всех p1  [0, 1]

A(p,q0) =lj1(p1)q*+lj2(p1)(1-q*)= .

б) = 0.

В этом случае чистая стратегия 2 первого игрока является оптимальной. Покажем, что у второго игрока также имеется чистая оптимальная стратегия. Действительно, найдется прямая lj1, проходящая через точку (0, ) и имеющая угловой коэффициент kj1  0. Выбирая чистую стратегию j1, второй игрок не позволит первому выиграть больше, чем , поскольку A(p,j1)=lj1(p1) при всех p1  [0, 1]. Итак, матрица игры имеет седловую точку (2, j1).

в) = 1.

В этом случае, аналогичном б), матрица игры также имеет седловую точку.

П ример 5.2. Решим игру с матрицей Построив три прямые (рис. 5.2)

l1(p1) = (-1)p1 + 2(1-p1) = 2-3p1,

l2(p1) = (-2)p1 + 1(1-p1) = 4-6p1,

l3(p1) = 3p1 + 1(1-p1) = 1+2p1,

найдем, что максимум нижней огибающей достигается в = 1/5 – точке пересечения прямых l1 и l3.

Значение игры = l1( ) = 7/5 и p0 = (1/5, 4/5). Здесь j1 = 3, k3 = 2, j2 = 1, k1 = -3.

Из уравнения 2q* + (-3)(1 - q*) = 0 находим q* = 3/5. Отсюда q0 = (2/5, 0, 3/5) - оптимальная стратегия второго игрока. Сделайте проверку условия (*) теоремы 4.1’ для найденного решения (p0, q0, ).

Упражнение 5.3. Найдите все оптимальные стратегии игроков в игре с матрицей

Теперь рассмотрим игру с m 2-матрицей A. Смешанная стратегия q=(q1, 1-q1) второго игрока определяется величиной q1  [0, 1]. Значение игры, согласно следствию теоремы 4.2’, представимо в виде

Поэтому необходимо построить верхнюю огибающую семейства прямых li(q1)=ai1q1+ai2(1-q1), i = 1, ...,m, и найти на отрезке [0,1] точку ее минимума. Она будет соответствовать оптимальной смешанной стратегии второго игрока. Оптимальная стратегия первого игрока строится с использованием уравнения, аналогичного (5.2).