Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ИсследОпераций

.pdf
Скачиваний:
28
Добавлен:
08.05.2015
Размер:
4.21 Mб
Скачать

Таблица 20

v j

3

4

3

4

ui

 

 

 

 

0

3

4

3

6

7

2

12

 

 

 

 

 

 

 

1

2

7

4

3

3

 

 

10

 

 

 

 

 

 

2

5

2

6

3

 

16

 

 

 

 

 

 

 

 

113

ГЛАВА 7. ЭЛЕМЕНТЫ ТЕОРИИ МАТРИЧНЫХ ИГР

§ 1. Понятие матричной игры. Ее математическая модель

Теория игр – один из наиболее быстро развивающихся разделов современной математики. Предметом этой теории служит изучение конфликтных ситуаций, которые могут возникнуть в различных областях человеческой деятельности. В последние годы была выявлена тесная связь между теорией игр и математическим программированием.

Ситуация называется конфликтной, если в ней участвуют стороны, интересы которых полностью или частично противоположны. Игра – это конфликтная ситуация между несколькими участниками (игроками), каждый из которых, стремясь к достижению собственных целей, принимает некоторое решение, определяемое заданным набором четко сформулированных правил. Кроме того предполагается, что интересы участников поддаются количественному описанию, т.е. результат игры (выигрыш) определяется некоторым числом. Задача теории игр состоит в выборе такой линии поведения данного игрока, отклонение от которой может лишь уменьшить его выигрыш.

Игры могут классифицироваться по следующим признакам:

1)по количеству участников;

2)по количеству ходов;

3)по взаимосвязи выигрышей и проигрышей. Рассмотрим эти признаки более подробно.

1. В игре могут сталкиваться интересы двух или более противников. В пер-

вом случае игра называется парной, во втором – множественной.

2.Ходом в теории игр называется выбор одного из предположенных правилами игры действий и его осуществление. Игру принято называть конечной, если каждый из участников имеет лишь конечное число возможных вариантов для любого своего хода.

3.Игра называется игрой с нулевой суммой, если сумма выигрышей всех участников при любом исходе игры равняется нулю.

Будем рассматривать лишь простейший тип игры – парную одноходовую конечную игру с нулевой суммой, т.е. игру двух участников, каждый из которых делает всего по одному ходу, выбираемому из конечного множества определенных правилами вариантов, при этом выигрыш одного игрока равен проигрышу другого. Кроме того будем считать, что ходы участники игры делают независимо, т.е. каждый из них имеет полную информацию о правилах игры и величинах возможных выигрышей, но при выполнении своего хода не знает хода, сделанного другим участником.

Пример 1. Каждый из двух участников загадывает число 1 или 2. Если оба выбранных числа одинаковы, то выигрыш первого игрока выражается суммой этих чисел, если же числа различны, то их сумме равен выигрыш второго игрока.

114

Всю информацию о данной игре сведем в следующую таблицу:

Ход I игрока

Ход II игрока

Выигрыш

Выигрыш

I игрока

II игрока

 

 

 

 

 

 

1

1

+2

–2

 

 

 

 

1

2

–3

+3

 

 

 

 

2

1

–3

+3

 

 

 

 

2

2

+4

–4

 

 

 

 

Приведенные правила игры удобно записать в виде матрицы

 

2

3

 

 

A

3

4

 

,

 

 

 

элементы которой равны возможным выигрышам первого игрока. Строки этой матрицы соответствуют различным вариантам хода первого участника, а столбцы

– вариантам хода второго.

Аналогично (при помощи матрицы) может быть задана любая другая игра, относящаяся к рассматриваемому простейшему типу. Поэтому такие игры принято называть матричными.

Перейдем теперь к определению матричной игры в общем виде. Пусть дана матрица

a

a

a

 

 

 

11

12

1n

 

 

 

A a21

a22

a2n

,

(1.1)

 

 

 

 

 

 

 

am2

 

 

 

 

am1

amn

 

 

называемая матрицей игры или платежной матрицей. Предположим, что два игрока независимо друг от друга выбирают: первый – строку, второй – столбец матрицы (1.1). Если первый игрок выбрал i -ю строку, а второй игрок – j -й стол-

бец матрицы A , то выигрыш первого игрока равен элементу aij этой матрицы (соответственно выигрыш второго участника при этом будет равен aij ).

§ 2. Основные понятия теории матричных игр

Предположим теперь, что игра повторяется много раз (играется серия партий), так что каждого игрока интересует не выигрыш в какой-либо отдельной партии, а средний выигрыш по многим партиям.

1. Понятие стратегии. Пусть дана матричная игра с платежной матрицей (1.1). Обозначим через pi ( i 1, m ) вероятности, с которыми первый игрок выби-

рает соответствующие строки матрицы игры, а через q j j 1, n вероятности, с которыми второй игрок выбирает соответствующие столбцы. Тогда векторы

115

P p1, p2, ..., pm и Q q1, q2, ..., qn

(2.1)

называются соответственно стратегиями первого и второго игроков. Очевидно, что компоненты стратегий (2.1) удовлетворяют следующим условиям

 

 

 

 

 

 

 

 

pi 0,

i 1,m;

q j 0,

j 1,n ;

 

m

n

 

 

 

 

pi q j 1.

 

 

 

 

i 1

j 1

 

 

 

Таким образом, любые векторы соответствующей размерности с неотрицательными компонентами, в сумме равными единице, могут рассматриваться как возможные стратегии участников матричной игры. Каждый игрок располагает бесконечным множеством различных стратегий и может выбирать их по собственному усмотрению.

Стратегию одного из игроков будем называть чистой, если одна из ее компонент равна единице, а все остальные компоненты равны нулю. Чистые стратегии участников матричной игры принято обозначать Pi и Q j (индекс соответ-

ствует номеру равной единице компоненты). Если первый игрок придерживается чистой стратегии Pi , то он выбирает только i -ю строку матрицы игры, т.е. выби-

рает ее с вероятностью, равной единице, а остальные строки – с вероятностями, равными нулю.

Стратегии игроков, не являющиеся чистыми, принято называть смешанными. Очевидно, что во всякой смешанной стратегии по крайней мере две компоненты отличны от нуля.

2. Понятие платежной функции. Пусть в игре с платежной матрицей (1.1) оба участника придерживаются стратегий (2.1). Так как строки и столбцы матрицы игры выбираются игроками случайно, то и выигрыш первого игрока будет дискретной случайной величиной, возможными значениями которой являются элементы матрицы (1.1). Вычислим вероятности каждого из возможных значений этой случайной величины. По правилам игры выигрыш первого игрока будет равным aij , если первый игрок выберет i -ю строку матрицы (1.1), а второй – ее

j -й столбец. Первое событие по условию имеет вероятность pi , а второе – вероятность q j . По теореме умножения вероятностей независимых событий вероятность того, что выигрыш первого игрока составит aij , будет равным произведению piq j . Таким образом, ряд распределения выигрыша первого игрока имеет вид

a11

a12

 

aij

amn

p1q1

p2q2

 

piq j

pmqn

 

 

 

116

 

 

Математическое ожидание этой случайной величины, которое при заданной матрице игры зависит только от выбранных стратегий P и Q , принято называть пла-

тежной функцией и обозначать P,Q . По определению математического ожидания

m n

 

P,Q aij piq j .

(2.2)

i 1 j 1

Таким образом, платежная функция, вычисляемая по формуле (2.2), – это математическое ожидание (среднее значение) выигрыша первого игрока при условии, что он применяет стратегию P , а его противник стратегию Q .

3. Понятия оптимальных стратегий и цены игры

Определение. Пусть P и Q – определенные стратегии первого и второго

участников матричной игры, а v – некоторое число. Если для любых стратегий P и Q справедливо неравенство

P,Q v P ,Q ,

(2.3)

то принято называть стратегии P и Q оптимальными, а число v – ценой игры.

Пара оптимальных стратегий и цена матричной игры называются решением этой игры. Справедлива так называемая основная теорема теории игр (теорема фон Неймана), согласно которой всякая матричная игра имеет решение.

Рассмотрим теперь более внимательно определение оптимальных стратегий и цены игры. Если в неравенствах (2.3) заменить произвольные стратегии P и Q

соответственно на оптимальные стратегии P и Q , то получим

P ,Q v P ,Q ,

откуда v P ,Q , т.е. цена игры равна математическому ожиданию выигрыша

первого игрока при условии, что оба игрока применяют свои оптимальные стратегии.

Кроме того из неравенств (2.3) следует, что если один из игроков применяет свою оптимальную стратегию, то для другого не выгодно отклонение от его оптимальной стратегии. Таким образом, применение оптимальной стратегии при многократном повторении игры обеспечивает игроку максимально возможный средний выигрыш (или, что то же самое, минимально возможный средний проигрыш).

За м е ч а н и е 1. Хотя цена любой матричной игры определяется однозначно, оптимальные стратегии для некоторых игр могут оказаться не единственными.

За м е ч а н и е 2. Можно доказать, что если ко всем элементам платежной матрицы прибавить одно и то же число, то оптимальные стратегии игроков не изменятся, а цена игры «увеличится» на это число.

117

§3. Игры, допускающие решение в чистых стратегиях

Вигре с произвольной платежной матрицей оптимальные стратегии игроков, как правило, являются смешанными. Однако, в одном важном частном случае матричных игр, который мы и рассмотрим в этом параграфе, среди оптимальных стратегий непременно найдутся чистые стратегии.

О п р е д е л е н и е. Пусть дана матрица (1.1). Ее элемент aij называется

седловым элементом этой матрицы, если он является наименьшим в своей строке и наибольшим в своем столбце.

Например, элемент a23 2 является седловым элементом матрицы

 

5

3

1

0

 

 

 

3

2

2

4

 

,

A

 

 

4

1

1

3

 

 

 

 

 

так как число 2 – наименьшее во второй строке и наибольшее в третьем столбце. Седловым элементом обладает не всякая матрица. Чтобы выяснить имеется

ли у данной матрицы седловой элемент, удобно использовать следующий алгоритм.

1.В каждой строке данной матрицы находим наименьший элемент, из полученных чисел выбираем наибольшее и обозначаем его через .

2.В каждом столбце данной матрицы находим наибольший элемент, из полученных чисел выбираем наименьшее и обозначаем его через .

3. Если и, то у данной матрицы нет седлового элемента. Если же, то у матрицы есть седловой элемент, равный найденным числам и .

Пример 1. Исследовать на наличие седлового элемента матрицу

 

2

3

5

4

 

 

 

 

 

 

 

A

3

1

2

5

.

 

6

3

4

2

 

 

 

Р е ш е н и е. Наименьшие значения элементов в каждой из строк данной

матрицы равны соответственно 3, 1, 2.

Выбирая наибольшее из этих чисел,

получаем, что 2 .

Наибольшие значения элементов в столбцах матрицы A равны соответственно 6, 3, 5, 5. Выбирая наименьшее из этих чисел, находим, что 3.

Так как и, то у данной матрицы нет седлового элемента.

Приведем теперь формулировку теоремы, определяющей класс игр, допускающих решение в чистых стратегиях.

Теорема 3.1. Пусть дана матричная игра с платежной матрицей A . Для того чтобы чистые стратегии Pi и Q j были оптимальными стратегиями дан-

ной игры, необходимо и достаточно, чтобы элемент aij был седловым элементом матрицы A .

118

З а м е ч а н и е. Нетрудно убедиться, что в условиях теоремы 3.1 цена игры v совпадает со значением седлового элемента aij .

Таким образом, наличие у платежной матрицы седлового элемента позволяет сразу же записать решение соответствующей матричной игры.

Пример 2. Найти решение игры с платежной матрицей

 

2

5

2

 

A

3

1

2

.

 

 

Р е ш е н и е. Сначала убедимся в наличии у матрицы A седлового элемента. Применяя описанный выше алгоритм, получаем 2 и находим седловой элемент a13 2 . Теперь из теоремы 3.1 следует, что цена данной матричной игры

v 2 , а

оптимальными стратегиями ее участников являются чистые страте-

гии P

1,0 и Q 0,0,1 .

1

3

 

§ 4. Редукция матричной игры

Как правило, отыскание решения игры, платежная матрица которой не имеет седлового элемента, тем сложней, чем больше размеры матрицы игры. Один из способов уменьшения размеров платежной матрицы и рассматривается в этом параграфе.

О п р е д е л е н и е. Если все элементы одного из рядов (строки или столбца) платежной матрицы не превосходят соответствующих элементов другого параллельного ему ряда, то принято говорить, что второй ряд доминирует над первым, и называть второй ряд доминирующим, а первый – доминируемым.

Так, например, в матрице

 

2

3

4

 

 

 

 

 

 

A

4

2

2

 

 

1

3

3

 

 

 

первая строка доминирует над третьей строкой, а третий столбец – над вторым столбцом.

Рассмотрим теперь игру, в платежной матрице которой имеются доминирующие строки и столбцы. Первый игрок, желая увеличить свой выигрыш, никогда не будет выбирать доминируемую строку при выполнении своего хода. Аналогично второй игрок, заинтересованный в меньшем проигрыше, никогда не воспользуется выбором доминирующего столбца. Следовательно, в оптимальных стратегиях игроков компоненты, соответствующие доминируемым строкам и доминирующим столбцам, будут равны нулю. Поэтому из платежной матрицы можно вычеркнуть доминируемые строки и доминирующие столбцы и рассматривать новую игру с матрицей меньших размеров.

Удаление из платежной матрицы доминируемых строк и доминирующих столбцов называется редукцией матричной игры.

119

Пример 1. Выполнить редукцию игры с платежной матрицей

 

4

2

3

4

 

 

1

2

1

4

 

A

.

 

1

3

2

3

 

 

 

 

5

3

1

3

 

Р е ш е н и е. Сравнивая строки матрицы A , замечаем, что все элементы ее второй строки не превосходят соответствующих элементов третьей строки. Вычеркивая доминируемую вторую строку, получаем новую матрицу

 

 

4

2

3

4

 

A

1 3 2

3

.

1

 

 

 

 

 

 

 

 

5

3

1

3

 

 

 

 

Сопоставим теперь столбцы матрицы A1. Нетрудно видеть, что первый столбец этой матрицы доминирует над четвертым. Исключая доминирующий

первый столбец, приходим к матрице

 

 

 

 

 

2

3

4

 

A

3

2

3 .

2

 

 

 

 

 

 

 

3

1

3

 

 

 

 

В матрице A2 первая строка доминирует над третьей. Удаляя доминируе-

мую третью строку, получаем матрицу

 

 

 

 

2

3

4

 

A3

 

2

3

,

 

3

 

в которой нет ни доминирующих строк, ни доминирующих столбцов. Итак, завершив редукцию, мы перешли от исходной игры с платежной матрицей A размера 4 4 к равносильной игре с матрицей A3 размера 2 3.

§5. Решение матричной игры

Внастоящее время разработано большое число методов решения матричных игр. Рассмотрим один из наиболее распространенных способов решения матричных игр, основанный на применении в теории игр методов линейного программирования.

 

 

Пусть

имеется

 

игра m n

без седловой точки с матрицей

 

 

 

 

 

j

 

 

 

 

 

 

i

 

, j 1,n

 

 

A

 

P , i 1,m,

Q

 

 

– чистые стратегии первого и второго игроков, соот-

ветственно).

120

Q j

Q1

Q2

Qn

Pi

 

 

 

 

P

a

a

a

1

11

12

1n

P2

a21

a22

a2n

 

 

 

 

 

Pm

am1

am2

amn

Допустим, что все выигрыши aij положительны (этого всегда можно добиться, прибавляя ко всем членам матрицы A число , от этого цена игры увеличится на , а решение P*,Q* не изменится). Если все aij положительны, то и

цена игры, т.е. средний выигрыш при оптимальной стратегии, тоже положителен: v 0.

Найдем две оптимальные смешанные стратегии

P* p , p , ..., p

m

,

Q* q , q

, ..., q

,

(5.1)

1 2

 

1 2

n

 

 

дающие каждой стороне максимально возможный для нее средний выигрыш (минимальный проигрыш).

Найдем сначала P0* . Если один из игроков (в данном случае первый) при-

меняет свою оптимальную стратегию, то другой не может улучшить свое положение, отступая от своей. Заставим противника (второго игрока) отступать от своей оптимальной стратегии, пользуясь чистыми стратегиями Q1, Q2, ..., Qn (пер-

вый игрок, придерживается стратегии P* ). В любом случае выигрыш первого игрока будет не меньше, чем v :

a11 p1 a21 p2

... a m1 pm

v,

 

a12 p1 a22 p2

... a m2 pm

 

 

 

 

v,

(5.2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a

p a

p

... a

mn

p

m

v.

 

1n

1

 

2n 2

 

 

 

 

 

 

 

 

Разделим неравенства (5.2) на положительную величину v

и введем обо-

значения:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

p1

,

x

p2

, ..., x

 

 

pm

.

(5.3)

 

 

 

 

1

 

v

2

 

v

m

 

 

v

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда условия (5.2) примут вид

121

a11x1 a21x2

... a m1xm 1,

 

a12 x1 a22 x2

... a m2 xm 1,

 

 

 

(5.4)

 

 

 

 

 

 

 

 

 

 

 

a x a

x

... a

x 1,

 

 

1n 1

2n 2

 

mn m

 

 

где x1, x2, ..., xm – неотрицательные

переменные.

В силу (5.3) и

того, что

p1 p2 ... pm 1, переменные x1, x2, ..., xm удовлетворяют условию

 

x x ... x

 

1

.

 

(5.5)

 

 

1

2

m

 

v

 

 

 

 

 

 

 

 

Но v есть не что иное, как наш гарантированный выигрыш; естественно,

мы хотим сделать его максимальным, а значит, величину 1v – минимальной. Та-

ким образом, задача решения игры свелась к математической задаче нахождения неотрицательных значений переменных x1, x2, ..., xm , удовлетворяющих линей-

ным ограничениям-неравенствам (5.4) и обращающих в минимум линейную функцию этих переменных:

z x1 x2 ... xm ,

(5.6)

и мы имеем задачу линейного программирования с n ограниченияминеравенствами и m переменными. Зная x1, x2, ..., xm , можно по формулам (5.3)

найти p1, p2, ..., pm и, значит, оптимальную стратегию P* и цену игры v .

Оптимальная стратегия второго игрока находится аналогично, с той разницей, что он стремится минимизировать, а не максимизировать выигрыш, а значит

обратить не в минимум, а в максимум величину 1v , а в ограничениях-

неравенствах вместо знаков будут стоять . Пара задач линейного программирования, по которой находятся оптимальные стратегии P*,Q* , является парой

двойственных задач линейного программирования.

Алгоритм решения матричной игры методом сведения к паре симметричных двойственных ЗЛП состоит из следующих этапов.

1. Исследование платежной матрицы на наличие седлового элемента

Если матрица A содержит седловой элемент, то находим решение данной игры в чистых стратегиях. В противном случае переходим к следующим шагам данного алгоритма.

2. Редукция исходной матричной игры

Вычеркивая в матрице A доминируемые строки и доминирующие столбцы (если они существуют), получаем платежную матрицу меньшего размера.

3. Переход к платежной матрице с положительными элементами

Если хотя бы один элемент платежной матрицы неположителен, то прибавляем ко всем ее элементам одно и то же число , выбранное так, чтобы все эле-

122