- •ВВЕДЕНИЕ
- •1. ПРИНЯТИЕ РЕШЕНИЯ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ
- •2. ПРИНЯТИЕ РЕШЕНИЯ В УСЛОВИЯХ РИСКА
- •Критерий Гурвица
- •3. АНТАГОНИСТИЧЕСКИЕ ИГРЫ
- •4. ТЕОРИЯ МАТРИЧНЫХ ИГР
- •Пример 4.1.
- •Пример 4.2.
- •5. МЕТОДЫ РЕШЕНИЯ МАТРИЧНЫХ ИГР
- •6. БИМАТРИЧНЫЕ ИГРЫ
- •Вопросы для самоконтроля по курсу "Теория игр"
- •1. ПРИНЯТИЕ РЕШЕНИЯ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ
- •2. ПРИНЯТИЕ РЕШЕНИЯ В УСЛОВИЯХ РИСКА
- •3. АНТАГОНИСТИЧЕСКИЕ ИГРЫ
- •4. ТЕОРИЯ МАТРИЧНЫХ ИГР
- •5. МЕТОДЫ РЕШЕНИЯ МАТРИЧНЫХ ИГР
- •1.Как находят смешанные оптимальные стратегии для игры 2*2? Как находят для такой игры цену игры?
- •2. Как находят графическим методом оптимальные стратегии игроков в игре 2*m? На какой теореме основана эта методика?
- •6. БИМАТРИЧНЫЕ ИГРЫ
- •Задачи для самостоятельного решения
- •Тесты по курсу "Теория игр"
- •СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ
Значение х, на котором достигается максимум, |
равно |
1 |
. Это же |
||||||
2 |
|||||||||
|
|
π(x + y) |
|
|
2 |
|
|
||
значение будет решением уравнения min |
sin |
= |
, т.к. минимум |
||||||
2 |
2 |
||||||||
0≤y≤1 |
|
|
|
|
|
||||
достигается при y = 0, и это уравнение превращается в следующее: sin π2x =
22 , откуда следует, что х = 12 .
Заметим, что если в функции выигрыша поменять местами х и y, то она не изменится, следовательно, эта функция выпукла и по y при всех х[0;1]. Поэтому у игрока 2 существует оптимальная стратегия yo, определяемая из уравнения
max sin π(x + y) |
= |
|
2 |
. |
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
||||||
0≤x≤1 |
2 |
|
|
2 |
|
|
|
|
|
|
|
|
1 |
|
||
Очевидно, |
максимум по х |
|
достигается при х = |
, и последнее |
||||||||||||
2 |
||||||||||||||||
|
|
|
|
|
|
|
1 |
|
|
|
|
|
||||
|
|
|
|
π |
+ y |
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
2 |
2 |
|
|
|
||||||||
уравнение примет вид |
sin |
|
|
|
|
|
= |
. |
|
|
||||||
|
|
|
|
2 |
|
2 |
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Решением последнего уравнения будет yo = 0. Следовательно, игрок 2 имеет оптимальную стратегию yo = 0.
4.ТЕОРИЯ МАТРИЧНЫХ ИГР
В3-й главе уже упоминались матричные игры – один из наиболее важных типов антагонистических игр. Теория матричных игр разработана более подробно по сравнению с общей теорией антагонистических игр. Известны различные алгоритмы поиска оптимальных стратегий игроков в матричной игре, они в большинстве своём наглядны и просты в применении, выбор алгоритма зачастую определяется размерностью матрицы.
Рассмотрим примеры поиска седловой точки в матричной игре. Поиск проводится так: проверяется истинность соотношения минимакса, если оно выполняется, то седловые точки – это все пары стратегий 1-го и 2-го игроков (каждой паре соответствуют номер строки и номер столбца), выигрыш при которых равен цене игры, а также минимален среди выигрышей - элементов строки и максимален среди выигрышей - элементов столбца. Если же соотношение минимакса не выполнено, то седловых точек нет.
Пример 4.1.
|
|
|
|
|
|
min aij |
|
||
|
|
|
|
|
|
j |
|
|
|
|
|
1 |
−3 |
− 2 |
|
|
|
|
|
|
|
|
−3 |
|
|||||
A = |
|
0 |
5 |
4 |
|
0 |
|
max min aij = 2 |
|
|
|
|
|||||||
|
|
2 |
3 |
2 |
|
2 |
|
i j |
|
max aij = |
|
|
|
|
|||||
|
2 |
5 |
4 |
|
|
|
|
|
|
i |
|
14243 |
|
|
|
|
|
||
|
min max aij = 2 |
|
|
|
|
||||
|
|
j |
i |
|
|
|
|
|
|
Седловой точкой является пара (3,1), при которой υ = v =v = 2.
Заметим, что хотя выигрыш в точке (3,3) также равен 2 =v =v , она не является седловой точкой, т.к. этот выигрыш не является максимальным среди выигрышей третьего столбца.
Пример 4.2.
|
|
|
|
min aij |
|
|
|
|
|
10 |
30 |
|
j→ |
10 |
max min a |
|
= 20 |
A = |
|
|
|
|
|
ij |
||
|
40 |
20 |
|
→ |
i j |
|
||
|
|
20 |
|
|
||||
max aij ↓ |
↓ |
|
|
|
|
|
|
|
i |
40 |
30 |
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
123 |
|
|
|
|
|
||
min max aij =30 |
|
|
|
|
||||
j |
i |
|
|
|
|
|
|
|
Из матрицы выигрышей видно, что v < v , т.е. данная матрица не имеет
седловой точки. Если игрок 1 выбирает свою максиминную (ту, что гарантирует ему выигрыш в размере нижней цены игры) стратегию i = 2, то игрок 2, выбрав свою минимаксную (ту, что гарантирует ему проигрыш в размере не большем, чем верхняя цены игры) стратегию j = 2, проиграет только 20. В этом случае игроку 1 выгодно выбрать стратегию i = 1, т.е. отклониться от своей максиминной стратегии и выиграть 30. Тогда игроку 2 будет выгодно выбрать стратегию j = 1, т.е. отклониться от своей минимаксной стратегии и проиграть 10. В свою очередь игрок 1 должен выбрать свою 2-ю стратегию, чтобы выиграть 40, а игрок 2 ответит выбором 2-й стратегии.
Пример 4.3.
Рассмотрим игровую матрицу, в которой один из элементов (а именно, a33) неизвестен. Обозначим этот элемент x. Установим, при каких значениях x в матрице есть седловые точки.
|
|
|
|
|
|
min aij |
|
|
|||
|
|
|
|
|
|
j |
|
|
|||
|
|
1 |
5 |
4 |
|
1 |
|
|
|
|
|
|
|
|
|
||||||||
|
|
3 |
2 |
0 |
|
0 |
|
|
|||
A = |
|
max min aij = max[1, min{5, x}] . |
|||||||||
|
|
5 |
6 |
x |
|
|
|
|
|
|
i j |
max aij = |
|
|
min{5, x} |
|
|||||||
3 |
6 |
|
max(4, x) |
|
|
||||||
i |
144424443 |
|
|
|
|
|
|||||
|
min max aij |
= 3 |
|
|
|
|
|
||||
|
j |
|
i |
|
|
|
|
|
|
|
|
Таким образом, матрица имеет седловую точку при x=3. Это точка (3,3). Других седловых точек в матрице нет. Выигрыш в точке (2,1) также равен 3, но она не является седловой точкой, т.к. этот выигрыш не является максимальным среди выигрышей первого столбца.
Можно легко найти и другие матрицы, не имеющие седловых точек (в частности, из примеров 3.1 и 3.2). Более того, можно утверждать, что и в реальной ситуации матрица, которой задается игра, чаще всего не имеет седловых точек. Таким образом, игроки не имеют оптимальных стратегий,
им нужно искать новые критерии выбора. |
|
|
|
|||||||||||
|
|
Первый игрок |
всегда |
может обеспечить |
себе |
выигрыш |
||||||||
υ = max |
min |
aij , |
а второй |
- выигрыш |
|
= |
min |
max |
aij , но в |
|||||
υ |
||||||||||||||
|
|
1 ≤ i ≤ n1 |
≤ j ≤ m |
|
|
|
|
1 ≤ j ≤ m1 ≤ i ≤ n |
||||||
общем случае υ < |
|
и, |
следовательно, создается |
неустойчивая |
ситуация, |
|||||||||
υ |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
которую один из игроков может изменить с выгодой для себя. Значит, игрокам следует искать дополнительные стратегические возможности для того, чтобы гарантировать себе больший выигрыш и меньший проигрыш соответственно. Можно более широко понимать стратегию как объект: не только как действие, но в общем случае еще и как правило, по которому выбирается действие. Таким образом, выбор игроков значительно расширяется. Один из возможных путей - выбирать свои стратегии случайно, то есть задать распределение вероятностей на множестве своих стратегий, а после этого предоставить выбор конкретной стратегии соответствующему случайному механизму.
Итак, выбор игроком своей стратегии с заранее заданной вероятностью является одним из способов действия, то есть в определенном смысле тоже стратегией. Для отличия стратегий такого вида от первоначально заданных стратегий их называют смешанными стратегиями, а первоначально заданные (то есть строки или столбцы матрицы) - чистыми стратегиями. Переход к смешанным стратегиям позволяет получить большинство важных результатов, относящихся к матричным играм. Более того, можно сказать, что только этот переход позволяет полностью решить игру.
Определение. Смешанной стратегией игрока 1 в матричной игре называется распределение вероятностей на множестве его чистых стратегий,
то есть любой векторx = (x1 ,..., xn ), обладающий свойствами:
xi ≥ 0, i =1,..., n; |
(4.1) |
n |
|
∑xi =1. |
(4.2) |
i=1
Смешанной стратегией игрока 2 в матричной игре называется распределение
вероятностей на множестве его чистых стратегий, то |
есть любой вектор |
||||||||
|
|
= ( y1 ,..., yn ), обладающий свойствами |
|
||||||
|
y |
|
|||||||
|
|
|
|
y j ≥ 0, j =1,..., m; |
(4.3) |
||||
|
|
|
|
m |
|
||||
|
|
|
|
∑ y j =1. |
(4.4) |
||||
|
|
|
|
j=1 |
|
||||
|
|
Число xi , i =1,..., n, |
представляет собой вероятность выбора i-й чистой |
||||||
стратегии игроком |
1, а |
y j , j =1,..., m - вероятность |
выбора j-й чистой |
||||||
стратегии игроком 2. |
i-й чистой стратегии игрока 1 соответствует смешанная |
||||||||
стратегия |
|
|
|
|
|
|
|
||
|
|
|
|
|
|
ei |
= (0,...,1,...,0), |
(4.5) |
|
|
|
|
|
|
|
|
|
i |
|
а j-й чистой стратегии игрока 2 - смешанная стратегия |
|
||||||||
|
|
|
|
|
|
|
= (0,...,1,...,0). |
(4.6) |
|
|
|
|
|
|
|
f j |
|||
|
|
|
|
|
|
|
|
j |
|
Таким образом, множество смешанных стратегий бесконечно. Применение смешанных стратегий превращает процесс игры в некоторое случайное испытание, исходами которого являются ситуации игры, то есть пары (i,j). Это случайное испытание называется ситуацией в смешанных стратегиях и обозначается через (x, y). Отсутствие обмена информацией
между игроками в антагонистической игре делает случайные принятия ими решения о своих стратегиях i и j независимыми. Поэтому каждая ситуация (i,j) реализуется с вероятностью хi yj. Поскольку в этой ситуации игрок 1 получает выигрыш aij, математическое ожидание его выигрыша равно
n m |
|
F (x, y) = ∑∑aij xi y j . |
(4.7) |
i=1 j=1
Определение. Матричной игрой (со смешанными стратегиями) называется тройка Г=(Х, Y, F), где Х - множество векторов,
удовлетворяющих |
условиям (4.1), (4.2), Y - множество векторов, |
|||||
удовлетворяющих |
условиям (4.3), (4.4), |
F( |
|
, |
|
) - функция, заданная |
x |
y |
|||||
формулой (4.7).
В дальнейшем под матричной игрой понимается объект, заданный именно таким определением.
ТЕОРЕМА 4.1(основная теорема теории матричных игр). Любая матричная игра имеет седловую точку в смешанных стратегиях.
Доказательство. Покажем, что в данном случае выполнены все условия теоремы 3.4.
Ограниченность Х и Y вытекает из условий (4.1)-(4.4). Докажем замкнутость и выпуклость этих множеств. Доказательство проведем для Х, для Y оно аналогично.
Покажем замкнутость Х. |
Пусть |
|
k X при всех k , |
|
|
′ = |
|
|
k . |
|||||||||||||||||||||||
x |
|
x |
lim |
x |
||||||||||||||||||||||||||||
|
|
|
|
|
|
′ X . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k → ∞ |
|
|
|||||
Докажем, |
что и |
|
|
В самом деле, x k ≥ 0 при всех k и i=1,…,n, |
||||||||||||||||||||||||||||
|
x |
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
xk ≥ 0 |
|
|
|
|
|
|
|
|
|
|
i |
|
|
|
′ ≥ 0 |
|
|
|
||||||
следовательно, |
lim |
|
при всех |
i=1,…,n, то есть |
x |
при всех |
||||||||||||||||||||||||||
|
|
|
k |
→ ∞ |
i |
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i |
n |
|
|
|
||||||
i=1,…,n. Далее, поскольку |
|
xk =1 при всех k, то и |
lim |
|
xk =1, то |
|||||||||||||||||||||||||||
∑ |
|
∑ |
||||||||||||||||||||||||||||||
n |
|
|
|
|
|
|
|
|
|
|
i =1 |
i |
|
|
|
|
|
|
|
|
|
|
|
k → ∞i =1 |
i |
|
|
|||||
x |
′ =1. Таким образом, |
|
|
′ X |
|
удовлетворяет условиям (4.1), (4.2) |
||||||||||||||||||||||||||
есть ∑ |
|
x |
|
|||||||||||||||||||||||||||||
i =1 |
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
и принадлежит Х. |
|
Итак, Х является замкнутым. |
|
|
|
|
|
|
|
|
||||||||||||||||||||||
Покажем |
выпуклость |
Х. |
Пусть |
|
1 X , |
|
2 X и0 ≤ λ ≤1. |
Так |
как |
|||||||||||||||||||||||
x |
x |
|||||||||||||||||||||||||||||||
i =1,..., n |
1 |
|
|
|
|
2 |
≥ 0, |
|
|
|
|
|
|
|
|
|
|
1 |
|
2 |
≥ 0. |
|
|
|
||||||||
xi ≥ 0, |
|
xi |
получаем: i =1,..., n λxi + (1 |
− λ)xi |
|
|
|
|
||||||||||||||||||||||||
А условия |
|
n |
1 |
|
|
|
n |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
∑ |
xi |
=1 и |
∑ |
xi =1 влекут за собой соотношение: |
|
|
|||||||||||||||||||||||||
|
|
|
i =1 |
|
|
|
|
N |
i =1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
(λx1 |
+ (1 − λ)x2 ) =1. |
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
∑ |
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
I =1 |
i |
|
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Следовательно, λ |
|
1 + (1 − λ) |
|
2 обладает свойствами |
|
(4.1), (4.2) и |
||||||||||||||||||||||||||
x |
x |
|
||||||||||||||||||||||||||||||
принадлежит Х. Таким образом, Х является выпуклым.
Непрерывность функции F (x, y) , вогнутость по x и выпуклость по y
вытекает из ее линейности.
Таким образом, матричная игра Г=(Х, Y, F) удовлетворяет всем условиям теоремы 3.4.
Следовательно, в ней существует седловая точка, что и требовалось доказать.
ЛЕММА 4.1. Справедливы равенства |
|
|||||||||
|
|
|
|
|
|
|
|
|
m |
|
F( |
ei |
, |
y |
) = |
∑ aij y j ; |
(4.8) |
||||
|
|
|
|
|
|
|
|
|
j =1 |
|
|
|
|
|
|
|
|
|
|
n |
|
F( |
x |
, |
f j |
) = |
∑ aij xi ; |
(4.9) |
||||
|
|
|
|
|
|
|
|
|
i =1 |
|
|
|
|
|
|
n |
|
|
|
|
|
m |
|
|
|
|
|
|
F( |
x |
, |
y |
) = |
∑ xi F( |
ei |
, |
y |
) = |
∑ |
y j F( |
x |
, |
f j |
). |
(4.10) |
|
|
|
|
|
|
i = |
1 |
|
|
|
|
j =1 |
|
|||||
Утверждение леммы вытекает непосредственно из соотношений (4.7), (4.5) и (4.6).
Замечание.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Если x0 , |
y0 - оптимальные стратегии, υ - |
цена |
игры, |
то |
верны |
|||||||||||||||||||||||||
равенства |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
min F( |
|
|
|
, |
|
) = max min F( |
|
|
, |
|
|
) =υ; |
|
|
|
(4.11) |
||||||||||
|
|
|
|
x0 |
y |
x |
y |
|
|
|
||||||||||||||||||||
|
|
|
|
y |
|
|
|
|
|
|
|
x |
y |
|
|
|
|
|
||||||||||||
|
|
|
|
max F( |
|
, |
|
|
) = min max F( |
|
, |
|
) =υ; |
|
|
|
(4.12) |
|||||||||||||
|
|
|
|
x |
y0 |
x |
y |
|
|
|
||||||||||||||||||||
|
|
|
|
x |
|
|
|
|
|
|
|
y |
x |
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
F ( |
|
, |
|
) =υ. |
|
|
|
|
(4.13) |
|||||||||||||
|
|
|
|
|
|
|
|
x0 |
y0 |
|
|
|
|
|||||||||||||||||
В следующей серии теорем (с номерами 4.2–4.7) выражены основные |
||||||||||||||||||||||||||||||
свойства оптимальных стратегий матричной игры. |
|
|
|
|
|
|||||||||||||||||||||||||
ТЕОРЕМА |
4.2. Пусть |
υ - цена |
игры. Для |
того, |
чтобы |
|
x0 |
была |
||||||||||||||||||||||
оптимальной стратегией игрока 1, необходимо и достаточно, чтобы выполнялось условие
|
|
|
|
|
y |
|
|
F ( |
|
x0 |
, |
y |
|
) ≥υ. |
(4.14) |
||||||||
Для того, чтобы |
|
была оптимальной стратегией игрока 2, |
необходимо и |
||||||||||||||||||||
y0 |
|||||||||||||||||||||||
достаточно, чтобы выполнялось условие |
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
F ( |
|
, |
|
) ≤υ. |
(4.15) |
|||||||||||
|
|
x |
x |
y0 |
|||||||||||||||||||
Доказательство. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
Необходимость. Если |
x0 |
и |
|
y0 |
- оптимальные стратегии, |
то ( |
x0 |
, |
y0 |
) – |
|||||||||||||
седловая точка, т.е. справедливо соотношение (3.4), из которого с учетом (4.13) вытекает выполнение условий (4.14) и (4.15).
Достаточность. Пусть υ - цена игры и при всех y F (x0 , y) ≥υ. Пусть ( x′, y′) – седловая точка, т.е. верно условие
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x, y |
|
|
|
′ |
′ |
|
′ |
|
′ |
|
|
(4.16) |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
F (x, y ) |
≤ F (x , y ) |
≤ F (x , y). |
|||||||||||||||||||||||||||||||||||||||
|
|
Покажем, что ( |
|
|
, |
|
|
) – также седловая точка. Из (4.14) и (4.16) |
имеем |
||||||||||||||||||||||||||||||||||||||
x0 |
y′ |
||||||||||||||||||||||||||||||||||||||||||||||
F ( |
|
, |
|
) ≥υ, F ( |
|
, |
|
) ≤ F ( |
|
, |
|
|
) =υ .Тогда |
F ( |
|
, |
|
) =υ . Но тогда из (4.14) |
|||||||||||||||||||||||||||||
x0 |
y′ |
x0 |
y′ |
x′ |
y′ |
x0 |
y′ |
||||||||||||||||||||||||||||||||||||||||
вытекает соотношение |
|
|
F ( |
|
, |
|
) ≥ F ( |
|
, |
|
) , а из (4.16) – соотношение |
||||||||||||||||||||||||||||||||||||
y |
x0 |
y |
x0 |
y′ |
|||||||||||||||||||||||||||||||||||||||||||
x F (x, y′) ≤ F(x0 , y′) . Эти соотношения в совокупности означают, что ( x0 , y′) – седловая точка и, следовательно, x0 - оптимальная стратегия первого игрока. То, что y0 - оптимальная стратегия второго игрока, доказывается аналогично.
ТЕОРЕМА 4.3. Множество оптимальных стратегий каждого игрока ограничено, замкнуто и выпукло.
Доказательство. Пусть Х0 – множество оптимальных стратегий игрока 1, Y0 –множество оптимальных стратегий игрока 2. Доказательство проведем для Х0.
Ограниченность Х0 вытекает из ограниченности множества Х и
включения Х0 Х.
Для доказательства замкнутости Х0 достаточно показать, что для любой последовательности стратегий на Х0 предел этой последовательности также
содержится в Х0. Пусть |
|
k X 0 |
при всех k, lim |
|
k = |
|
. По теореме |
x |
x |
x0 |
|||||
|
|
|
k → ∞ |
||||
4.2 F (x k , y) ≥υ при всех k и у. Переходя в этом неравенстве к пределу при k → ∞, с учетом непрерывности F (x, y) получаем справедливость для x0 соотношения (4.14). Таким образом, данная стратегия оптимальна.
|
|
|
Докажем выпуклость Х0. Пусть |
|
|
1 и |
|
|
2 принадлежат Х0, то есть |
||||||||||||||||||||||||||||||||
|
x |
x |
|||||||||||||||||||||||||||||||||||||||
выполнены условия: |
|
|
|
F( |
|
|
, |
|
) ≥υ, |
|
|
|
|
|
|
F( |
|
|
, |
|
) ≥υ. |
Но |
тогда |
для |
|||||||||||||||||
y |
x1 |
y |
|
|
y |
x2 |
y |
||||||||||||||||||||||||||||||||||
любого |
0 ≤ λ ≤1 |
и |
произвольного |
|
|
|
|
|
|
имеем |
|||||||||||||||||||||||||||||||
|
|
y |
|||||||||||||||||||||||||||||||||||||||
F (λ |
|
1 + (1 − λ) |
|
2 ) = λF ( |
|
1, |
|
) + (1 − λ)F ( |
|
2 , |
|
) ≥υ . |
Таким |
|
образом, |
||||||||||||||||||||||||||
x |
x |
x |
y |
x |
y |
||||||||||||||||||||||||||||||||||||
λ |
|
1 + (1 − λ) |
|
2 |
удовлетворяет |
условию |
(4.14) |
и, |
|
следовательно, |
|||||||||||||||||||||||||||||||
x |
x |
|
|||||||||||||||||||||||||||||||||||||||
принадлежит Х0. Теорема полностью доказана. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|
|
ТЕОРЕМА |
4.4. Пусть |
υ – |
цена |
игры. Для того, |
чтобы |
x0 |
|
была |
||||||||||||||||||||||||||||||
оптимальной стратегией игрока 1, необходимо и достаточно, чтобы выполнялось условие
j =1,..., m F( |
x0 |
, |
f j |
) ≥υ. |
(4.17) |
Для того, чтобы y0 была оптимальной стратегией игрока 2, необходимо и достаточно, чтобы выполнялось условие
i =1,..., n F ( |
ei |
, |
y0 |
) ≤υ. |
(4.18) |
Доказательство. Необходимость условий (4.17) |
и (4.18) вытекает |
||||
непосредственно из теоремы 4.2. Доказательство достаточности проведем
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
для |
|
x0 . Пусть для x0 справедливо (4.17). Используя (4.10) и (4.17), для |
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
m |
|
|
|
|
|
|
m |
|
|
|
|
||
любого |
y |
имеем: F( |
x0 |
, |
y |
) = |
∑ |
y |
j |
F( |
x0 |
, |
f j |
) ≥ |
∑ |
y |
j |
υ =υ. Таким образом, |
|||||
|
|
|
|
|
|
|
|
|
|
j =1 |
|
|
|
|
|
j =1 |
|
|
|
||||
для |
|
справедливо условие (4.14) и, следовательно, |
|
|
|
будет оптимальной |
|||||||||||||||||
x0 |
|
x0 |
|||||||||||||||||||||
для первого игрока. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
ТЕОРЕМА 4.5. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
Для любого фиксированного y справедливо равенство
max F( |
x |
, |
|
y |
) = max |
F( |
ei |
, |
|
y |
). |
(4.19) |
|||||||||
x |
1 ≤ i ≤ n |
|
|
|
|
|
|
|
|
|
|
||||||||||
Для любого фиксированного |
x |
справедливо равенство |
|
||||||||||||||||||
min F( |
|
, |
|
) = |
|
F( |
|
, |
|
). |
(4.20) |
||||||||||
x |
y |
min |
x |
f j |
|||||||||||||||||
y |
1 ≤ j ≤ m |
|
|||||||||||||||||||
Таким образом, соответствующие максимумы и минимумы достигаются на чистых стратегиях.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Доказательство. Фиксируем некоторую стратегию x . |
Неравенство |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
min F( |
x |
, |
y |
) ≤ |
min |
|
F( |
x |
, |
f j |
) очевидно. |
|
|
|
Докажем |
|
противоположное |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
y |
1 ≤ j ≤ m |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
неравенство. |
|
|
|
|
|
|
|
|
|
|
Для |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
любого |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
имеем |
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y |
||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
m |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
m |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
F( |
x |
, |
y |
) = ∑ yk F( |
|
x |
, |
|
fk |
) ≥ |
|
|
|
|
|
min |
F( |
x |
, |
f j |
) ∑ yk |
= |
min |
F ( |
x |
, |
f j |
) . |
||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
k=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
1 ≤ j ≤ m |
|
|
|
|
|
|
|
|
|
|
k=1 |
1 ≤ |
j ≤ m |
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||
Следовательно, min F( |
|
|
, |
|
|
) ≥ |
|
|
|
|
|
|
|
|
|
min |
F( |
|
, |
|
) |
и равенство (4.20) доказано. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||
x |
y |
|
|
|
|
|
|
|
|
|
x |
f j |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 ≤ j |
|
|
≤ m |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
Равенство (4.19) доказывается аналогично. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
Следствие. Если |
|
, |
|
|
|
|
|
|
|
|
|
|
|
- оптимальные стратегии, |
|
υ – цена игры, то |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
x0 |
y0 |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
верны соотношения |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
F ( |
|
|
|
|
, |
|
|
|
|
|
) = max |
|
|
|
F( |
|
|
, |
|
|
|
|
) =υ; |
(4.21) |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
min |
|
x |
0 |
|
|
f j |
|
|
min |
x |
f j |
|||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
1 ≤ j |
≤ m |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x 1 ≤ j ≤ m |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
F( |
|
|
, |
|
|
|
|
) = min |
|
|
F( |
|
, |
|
) =υ. |
(4.22) |
||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
max |
|
|
|
ei |
y0 |
|
max |
ei |
y |
|||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
1 ≤ i ≤ n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y |
1 ≤ i ≤ n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
ТЕОРЕМА 4.6. Пусть ( |
|
|
, |
|
) |
|
– седловая точка. Тогда, если для |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
x0 |
y0 |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
некоторого i |
x0i ≠ 0 , |
|
то |
|
|
F ( |
|
, |
|
) =υ. Аналогично, |
|
|
если для некоторого j |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
ei |
y0 |
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
y0 j ≠ 0, то |
F( |
|
, |
|
) =υ . |
|
Таким |
|
образом, |
в |
|
|
|
|
|
с положительной |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
x0 |
f j |
|
|
|
|
|
x0 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
вероятностью входят только те чистые стратегии, которые дают результат υ
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
против y0 |
и в |
|
y0 |
с положительной вероятностью входят только те чистые |
||||||||||||||||||||||||||
стратегии, которые дают результат υ против |
|
x0 |
. |
|
|
|
|
|
|
|
|
|
||||||||||||||||||
Доказательство. Из (4.18) вытекает, что |
если F ( |
|
, |
|
0 ) ≠υ для |
|||||||||||||||||||||||||
ei |
y |
|||||||||||||||||||||||||||||
некоторого |
i, |
то |
F ( |
|
|
, |
|
|
|
) <υ . Покажем, |
что неравенство |
F ( |
|
, |
|
) <υ |
||||||||||||||
ei |
y0 |
ei |
y0 |
|||||||||||||||||||||||||||
влечет за собой равенство x0i |
= 0 . В самом деле, если x0i ≠ 0, то имеем |
|||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
n |
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
υ |
= F( |
x0 |
, |
y0 |
) = ∑x0i F( |
ei |
, |
y0 |
) < ∑x0iυ =υ . |
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i=1 |
|
|
i=1 |
|
|
|
|
|
|
|
|
|
|||
Пришли |
к |
противоречию, |
доказывающему |
утверждение теоремы |
||||||||||||||||||||||||||
относительно x0 . Для y0 доказательство аналогично.
Определение. Вектор a называется выпуклой комбинацией векторов a1 ,..., al , если существуют такие числа λ1,..., λl , что λk ≥ 0 при всех k=1,…, l.
l |
|
|
l |
||
∑λk |
=1 и |
a |
= ∑λk |
ak |
. |
k=1 |
|
|
k=1 |
||
Определение. Будем говорить, что вектор a = (a1 ,..., a p ) доминирует вектор b = (b1 ,..., b p ) , если ak ≥ bk при всех k=1,…, p. Будем говорить, что вектор a = (a1 ,..., a p ) строго доминирует вектор b = (b1 ,..., b p ) , если ak > bk
при всех k=1,…, p.
ТЕОРЕМА 4.7. Если в матричной игре с матрицей А=(а ij), i=1,…,n; j=1,…,m i0-я строка строго доминируется выпуклой комбинацией других строк, то i0-я чистая стратегия игрока 2 не входит с положительной вероятностью ни в одну его оптимальную стратегию и, следовательно, при решении игры i0-я строка может быть вычеркнута из матрицы. Если j0-й столбец матрицы строго доминирует выпуклую комбинацию других столбцов, то j0-я чистая стратегия игрока 2 не входит с положительной вероятностью ни в одну его оптимальную стратегию и, следовательно, при решении игры j0-й столбец может быть вычеркнут из матрицы.
Доказательство. Пусть i0-я строка матрицы строго доминируется выпуклой комбинацией других строк, то есть существуют такие индексы
i1 ,..., i p |
и числа λi |
,..., λi |
|
, что ik |
{1,..., n}, |
λi ≥ 0, k =1,..., p, |
p |
|
λ |
|
|
=1 и |
||||||||||||||||||||||
p |
∑ |
|
i |
|
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
k |
|
|
|
|
k = |
1 |
|
k |
|
||||||||
|
|
|
|
p |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
ai |
j < |
λi |
ak j |
j=1,…,m. Положив λi |
= 0 при i {i1 ,..., i p }, |
мы можем |
||||||||||||||||||||||||||||
∑ |
||||||||||||||||||||||||||||||||||
0 |
|
k =1 |
|
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
последнее условие представить так: |
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
j =1,..., m |
ai0 j < |
λi aij . |
|
|
|
|
|
|
|
|
|
|
(4.23) |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
∑ |
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i =1 |
|
|
|
|
|
|
|
n |
|
|||||||
|
|
Вектор (λ1 ,..., λn ) |
удовлетворяет условиям: λi ≥ 0, |
i =1,..., n, |
|
λi =1, |
||||||||||||||||||||||||||||
|
|
|
∑ |
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i =1 |
|||||
то есть является смешанной стратегией игрока 1. |
Пусть |
|
y0 |
- |
оптимальная |
|||||||||||||||||||||||||||||
стратегия |
|
игрока |
2. |
Исходя |
из |
(4.23), |
|
|
|
получим |
неравенства |
|||||||||||||||||||||||
F( |
|
, |
|
|
) = |
m |
ai0 j y0 j < |
|
m |
n |
y0 j λi ai j = F( |
|
, |
|
|
) ≤υ, и по теореме 4.6 |
||||||||||||||||||
ei 0 |
y0 |
∑ |
|
∑ |
∑ |
λ |
y0 |
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
j =1 |
|
|
|
j =1i =1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
выполняется |
|
xi0 |
= 0 . Так |
как |
|
- произвольная оптимальная |
стратегия |
|||||||||||||||||||||||||||
y0 |
||||||||||||||||||||||||||||||||||
игрока |
2, |
|
|
|
не |
входит |
|
ни |
в |
какую |
оптимальную стратегию |
игрока 1. |
||||||||||||||||||||||
ei |
|
|
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Утверждение о строго доминирующем столбце доказываем аналогично.
