1smol_yakov_e_r_metody_resheniya_konfliktnykh_zadach-1
.pdfдвум следующим типам задач с фиксированной последовательностью выбора стратегий:
1 слабая дискриминация: игроку, определяющему свое поведение вторым, известна смешанная стратегия (вероятностная мера) противника;
2 сильная дискриминация: игроку, определяющему свое поведение вторым, известна не только смешанная стратегия (вероятностная мера) противника, но и реализации случайных чисел, определяемые ею.
Как будет продемонстрировано на примерах, знание игроком, реализующим свою стратегию первым, степени информированности противника о его стратегии существенно влияет на исход игры.
Определение 4.1. Задача со слабой дискриминацией это минимаксная задача вида
|
|
|
|
( |
|
|
) = Z |
|
Z |
0 |
|
= q P rQG r R Z |
|
Z |
|
0 |
|
= |
|||||||
|
|
ˆ1 |
|
q , r |
|
|
4 |
|
dq |
f dr |
|
|
min max |
dq |
|
|
f dr |
|
|||||||
|
|
J |
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
U |
|
Vq |
Z |
|
|
|
|
|
U |
Z |
Vq |
|
|
|
|
|
|
|
|
|
|
q P rQG |
r G(q) Z |
|
0 |
dr |
= q P rQG v Vq |
0 |
dq |
|
(4.11) |
||||||||||
|
|
|
|
|
|
min |
|
max |
dq |
f |
|
min |
max |
f |
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
U |
V |
|
|
|
|
|
|
U |
|
|
|
|
|
или максиминная задача вида |
0 ˆ = r P rRG q Q Z |
Z |
|
|
|
= |
|
||||||||||||||||||
|
|
|
|
|
|
(ˆ ˆ) = Z |
|
ˆZ |
0 |
|
|
||||||||||||||
|
|
|
|
ˆ2 |
q, r |
|
4 |
|
dr |
f dq |
|
|
max |
min |
dr |
f dq |
|
|
|||||||
|
|
|
J |
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
V |
|
Ur |
Z |
|
|
|
|
|
V |
Ur |
|
|
|
|
|
|
|
|
|
|
|
r P rRG |
q G(r) Z |
|
0 |
dq |
= r P rRG u Ur |
Z |
0 |
dr, |
|
(4.12) |
|||||||||
|
|
|
|
|
|
max |
|
min |
|
dr |
f |
|
max |
min |
|
f |
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
V |
U |
|
|
|
|
|
|
V |
|
|
|
|
|
ãäå |
4 |
T |
|
|
|
|
|
, |
|
|
4 |
T |
|
|
компактные множества, поскольку |
||||||||||
|
Vq = |
|
W (u) Ur = |
W (v) |
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
u Pq |
|
|
|
|
|
|
|
v Pr |
|
|
|
|
|
|
|
|
|
|
|
|
W (u) и W (v) компактные множества, а пересечение любого числа ком-
пактных множеств компактно.
Замечание 4.1. Последняя из трех эквивалентных форм математиче- ского представления минимаксной задачи со слабой дискриминацией в (4.11) основывается на том факте, что в этой задаче всегда можно ограничиться чистой стратегией игрока, реализующего свою стратегию вторым, вопервых, потому, что ему незачем хитрить, так как он знает стратегию противника (q), а тот не знает его стратегии, в связи с чем для него
подобная игра сводится к задаче
Z
max f0dq ,
v Vq
U
221
в которой если максимум достигается в нескольких точках v1 , . . . , vj ,
то он может взять любую из них, а не обязательно смесь их всех. То же
самое можно сказать в отношении задачи (4.12).
Определение 4.2. Будем говорить, что реализуется слабозависимая седловая точка в смешанных стратегиях, если на некоторой паре стратегий (q, r) достигается равенство
ˆ1 |
ˆ2 |
(q, r). |
(4.13) |
J |
(q, r) = J |
Чтобы существовала слабозависимая седловая точ- ка (q , r ), достаточно, чтобы вспомогательная задача, полученная заме-
ной в (4.1) и, соответственно, в (4.11) и (4.12) множества W на множество U Ч V , имела решение в смысле независимой седловой точки и чтобы
носитель |
4 |
оптимальной меры |
q r |
этой вспомогательной задачи |
|
P = Pq ×Pr |
|
|
содержался в W .
Доказательство следует из теоремы 2.4, если учесть, что в случае W = U × V обязательно G = Q × R.
Определение 4.3. Задача с сильной дискриминацией это задача на-
хождения |
( |
|
) = |
q Q ru R Z |
Z |
0 |
|
¯1 |
|
|
|||||
|
q , r |
4 |
min max dq |
|
f dr, |
(4.14) |
|
J |
|
|
|
U W (u:u Pq)
т.е. задача нахождения такого маргинального распределения q на множестве U и таких условных распределений ru в сечениях W (u) при всех u Pq,
которые обеспечивают достижение значения ¯1
J (q , rU ), где через rU îáî- значено согласованное семейство условных распределений ru, u Pq [91, c. 249].
Вообще говоря, в (4.14) можно вместо W (u : u Pq) взять W (u), òàê êàê âñå òå u, q-мера которых нуль, не влияют на величину двойного интеграла. Аналогичным образом рассматривается задача с обратной дискриминацией
J¯2 |
( |
V |
= r R qv Q Z |
Z |
0 |
|
|
|
q , r ) |
max min dr |
|
f |
dq. |
(4.15) |
V W (v:v Pr)
В задачах (4.14) и (4.15), в отличие от задач (4.11) и (4.12), у игрока, выбирающего свою стратегию вторым, всегда найдется стратегия в ответ на любую стратегию игрока, определяющего свое поведение первым. Что касается вопроса существования решения обоих типов задач, то он находится в прямой зависимости от вопроса существования соответствующих максиминов и минимаксов.
222
Замечание 4.2. Следует иметь в виду, что порядок интегрирования при записи интеграла (4.1) в виде повторного интеграла по q è r определяет уже
и порядок выбора стратегий, т. е. некоторую дискриминацию в игре. Поэтому применение теоремы Фубини об изменении порядка интегрирования в процессе поиска решения недопустимо. Изменять порядок интегрирования, если это вообще возможно по условию задачи, можно только тогда, когда уже извест-
ны все оптимальные интегрирующие функции, т. е. меры q è r èëè õîòÿ áû èõ
носители. Это связано с тем, что любое представление кратного интеграла в виде повторного уже определяет иерархию интегрирования в повторном интеграле, а следовательно, и вполне определенную дискриминацию в задаче.
Например, в (4.11) внутренний интеграл (по мере r) может быть вычислен только тогда, когда задана мера q или хотя бы ее носитель. А как только оптимальные стратегии q è r найдены, величина соответствующего двойно-
го интеграла уже не изменится при изменении порядка интегрирования. В то же время на этапе определения оптимальных мер изменение порядка интегрирования недопустимо, так как это приведет к замене задачи (4.11) на совершенно другую задачу (4.12). В задачах (4.14) и (4.15) изменить порядок интегрирования не представляется возможным даже после нахождения опти-
мальных мер q è r, поскольку, например, в (4.6) q ýòî ìåðà íà U, à rU ýòî некоторое согласованное семейство мер, заданное в сечениях W (u : u Pq)
Из двух поставленных типов задач наибольший прикладной интерес представляет задача со слабой дискриминацией, поскольку в ней игрок, определяющий свою стратегию вторым, получает наиболее естественную информациюинформацию о стратегии первого игрока, независимо от того, к какому классу она принадлежит, т. е. является чистой или смешанной.
Нас интересуют случаи, когда интеграл (4.1) может быть представлен в виде следующих разложений по маргинальным распределениям:
|
|
|
Z dq Z fdr = Z dq1 |
Z |
dq2 . . . dql Z f0dr =4 |
|
|||||
Z |
|
Z |
U |
Vq |
U1 |
W (u1) |
|
Vq |
|
|
|
dq1 |
dq2 . . . |
Z |
dql |
Z |
dr1 . . . |
Z |
f0drm, |
(4.16) |
|||
U1 |
W (u1) |
|
W (u1,...,ul−1) |
P rV1 Vq |
Vq(v1,...,vm−1) |
|
|
||||
где в последней форме записи мера |
q1 определяет маргинальное распреде- |
ление на U1, ìåðà r1 маргинальное распределение на P rV1 Vq, а остальные ìåðû, qi è rk (i, k 6= 1) условные распределения: например, q2 услов-
223
ное распределение на P rU2 W (u1), зависящее от реализации u1 U1; q3 условное распределение на P rU3 W (u1, u2), зависящее от реализации (u1, u2) U1 × P rU2 W (u1). Ради упрощения обозначений мы не указываем параметри- ческой зависимости qi îò (u1, . . . , ui−1), отмечая эту зависимость только для множества, на котором рассматривается qi.
Если компакт W El+m задается конечным множеством неравенств Fk(u, v) ≥ 0, k = 1, N, ãäå Fk(u, v) непрерывные и непрерывно дифференцируемые функции, то, согласно следствию из теоремы Иржина [91, с. 247], теореме об условных математических ожиданиях [91, с. 249] и теореме 6.3.1 из [8, с. 83] о разложении мер, интеграл (4.11) можно представить в виде (4.16).
Разложения вида (4.16) мы используем в нижеприведенной теореме 4.1, формулирующей некоторые свойства решений задачи (4.11). В этой теореме применяются также следующие обозначения:
Z |
Z |
||
4 |
|
|
|
L(u1, . . . , ui) = |
dql . . . dqi+1 f0dr, i = 1, l − 1; |
||
Pq(u1,...,ui) |
Vq |
Z
4
L(u1, . . . , ul) = f0dr;
Vq
Z |
Z |
|
|
|
|
|
4 |
|
|
|
|
|
|
M(v1, . . . , vk) = dq |
f0drm . . . drk+1, k = 1, m − 1; |
|||||
Pq |
Vq(v1,...,vk) |
|
Z |
|
|
|
|
M(v1, . . . , vm) =4 |
f0dq. |
||||
|
|
|
Pq |
|
|
|
Теорема 4.1. Пусть в задаче (4.11) множество W таково, что функции
L(u1, . . . , ui), i = 1, l è M(v1, . . . , vk), k = 1, m, дифференцируемы, соответ-
ственно, по |
ui |
è |
vk |
, à |
4 |
(u1), . . . , ql(ul)) |
è |
4 |
(v1), . . . , rm(vm)) |
|
|
|
q(u) = (q1 |
|
r(v) = (r1 |
пара оптимальных стратегий, определяемых парой частных (маргиналь- ных) распределений q1 è r1 и остальными, понятным образом образованными условными распределениями. Тогда i-ое уравнение
|
L(u1, . . . , ui−1, u¯i1) = L(u1, . . . , ui−1, u¯i0), |
(4.17) |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
(u1, . . . , ui−1) Pq1...qi−1 , i = 1, l, |
|
|
|||||
выполняется для любой пары точек u¯i0, u¯i1 P rUiW (u1, . . . , ui−1), u¯i0 |
6= u¯i1 |
, |
|||||||
qI-мера каждой из которых положительна, а i-ое уравнение |
|
|
|||||||
∂L(u1, . . . , ui) |
|
|
|
|
|||||
|
|
|
|||||||
|
|
|
= 0, (u1, . . . , ui−1) Pq1,...,qi−1 , i = 1, l, |
(4.18) |
|||||
|
∂ui |
|
224
удовлетворяется на каждом интервале (ˆu0i , uˆ1i ) P rUiW (u1, . . . , ui−1), в каждой точке которого мера qi
но меры Лебега; k-ое уравнение
|
|
M(v1, . . . , vk−1, v¯k1) = M(v1, . . . , vk−1, v¯k0), |
(4.19) |
||||||
|
|
(v1, . . . , vk−1) Pr1...rk−1 , k = |
1, m, |
|
|
|
|
|
|
выполняется для любой пары точек v¯k0, v¯k1 P rVk Vq(u1, . . . , ui−1), v¯k0, v¯k1 |
, rk- |
||||||||
мера каждой из которых положительна, а k-ое уравнение |
|
|
|||||||
∂M(v1, . . . , vk) |
|
|
|
|
|||||
|
|
|
|||||||
|
|
|
= 0, (v1, . . . , vk−1) Pr1...rk−1 , k = 1, m, |
(4.20) |
|||||
|
∂vk |
|
выполняется в каждой внутренней точке vk множества P rVk Vq(v1, . . . , vk−1), rk-мера которой положительна или, в частности, вся сосредоточена только в одной точке, а также на каждом интервале (¯vk0, v¯k1) P rVk Vq(v1, . . . , vk−1), в каждой точке которого мера rk
носительно меры Лебега.
Следствие 4.1. Если W = U ЧV , т. е. множества допустимых чистых
стратегий игроков не зависят одно от другого и являются компактами в El è Em, соответственно, то задача (4.11), согласно [3, с. 46], имеет ре-
шение в смысле седловой точки (4.4). При этом в теореме 4.1 следует положить Vq = V è Ur = U и дополнить ее условиями выполнения равенств (4.10) в точках ненулевой qi- меры; таким образом, необходимые условия (4.17)-(4.20) совпадают с симметричными по отношению к обоим игрокам необходимыми условиями (4.2)-(4.3). Заметим, что теорема 4.1 не изменится, если 1-й игрок будет максимизировать, а 2-й минимизировать функционал J.
Доказательство теоремы 4.1. Установим сначала справедливость уравнений (4.19) и (4.20). Поскольку 2-й игрок в задаче (4.11) не знает реализации случайных чисел противника, то свою стратегию он может определять толь-
ко на множестве Vq. Стратегия q допустима, если это множество непусто, в противном случае задача считается нереализовавшейся. При любой допу-
стимой стратегии q 1-го игрока, т. е. такой, что qrq |
G хотя бы для одной |
|||||||||
ìåðû |
4 |
|
, 2-й игрок, зная стратегию |
q |
, может искать ответную, |
|||||
|
r = r < q >= rq |
|
|
|
|
|
|
|
||
оптимальную по отношению к q, стратегию r = rq , решая задачу |
||||||||||
|
|
|
r R Z |
Z |
0 |
= Z |
Z |
0 |
|
q |
|
|
max |
dq |
f dr |
|
dq |
f |
dr , |
||
|
|
|
Pq |
Vq |
|
Pq |
Vq |
|
|
|
225
носитель меры q. Нас интересуют необходимые условия оптималь-
ности каждого распределения qi è rk, маргинального или условного, в задаче (4.11).
Для получения необходимых условий оптимальности вероятностного рас- пределения rq на множестве Vq включаем rq в параметрическое семейство rq(v, b), содержащее при b = 0 искомое оптимальное распределение rq , ïðè-
чем отображение b → rq(v, b) выбирается непрерывным и непрерывно дифференцируемым при всех v V . rq(v, b) это вероятностное распределение (или вероятностная мера) на Vq при каждом фиксированном b, |b| < ε. Параметр b мы включаем поочередно в одно из маргинальных распределений,
например в rqk, òàê ÷òî rq(v, b) = (rq1(v1), . . ., rqk(vk, b), . . ., rqm(vm)). Возможность подобного параметрического представления следует из общих теорем существования маргинальных распределений [90].
Если ищутся необходимые условия экстремальности условного распределе- íèÿ rqk, получаемого, если допустить реализацию случайных чисел v1, . . . , vk−1,
то, включив экстремальную функцию rqk |
в параметрическое семейство rqk(vk, b), |
|||||||
можем записать |
|
Z |
|
|
|
|
|
|
Jˆ1(b) =4 Z dq |
f0drqm(vm) . . . drqk(vk, b) = |
|
||||||
Z |
Pq Vq(v1,...,vk−1) |
|
|
Z |
|
|
||
drqk(vk, b) |
|
Z |
|
drqm . . . drq(k+1) |
f0dq, |
(4.21) |
||
P rVk Vq(v1,...,vk−1) |
P rVk+1...VmVq(v1,...,vk) |
|
Pq |
|
|
где изменение порядка интегрирования допустимо как в связи с тем, что множества интегрирования Pq è Vq заданы, так и в соответствии с теоремой Фубини [7, с. 353].
Непрерывно дифференцируемый по b функционал (4.21) достигает макси-
ˆ1
ìóìà ïðè b = 0. Приравнивая нулю производную от J (b) ïî b ïðè b = 0, ïî
аналогии с тем, как доказывается теорема 1.4.4 в [40, с. 49], получаем уравнения (4.19) и (4.20), справедливые при любой допустимой функции распределения q P rQG, в том числе и при q, оптимальной в смысле (4.11).
Гораздо труднее найти необходимые условия оптимальности меры q, íà
ˆ1 в задаче (4.11), поскольку которой достигается при r = rq величина J
стратегию q следует варьировать с учетом ответной стратегии 2-го игрока,
который предпочтет при каждой стратегии q выбирать свою стратегию rq оптимальным образом, т. е. с учетом равенств (4.19), (4.20). Таким образом, в общем случае при выводе необходимых условий оптимальности стратегии q
226
в задаче (4.11) следует в качестве дополнительных связей задачи учитывать необходимые условия оптимальности (4.19) и (4.20) стратегии rq 2-ãî игрока. Однако неполные необходимые условия оптимальности для 1-го игрока в задаче (4.11) можно получить и не интересуясь реакцией (а следовательно, и необходимыми условиями оптимальности) 2-го игрока на стратегию 1-го. Это возможно в том случае, когда решение q задачи (4.11) представляет собой
смешанную стратегию и носитель Pq этой стратегии уже найден из какихлибо условий, которые нас в данном случае не интересуют. Соответствующие этому случаю необходимые условия оптимальности можно получить при варьировании значений меры q на известном множестве Pq . Поиск желаемых необходимых условий облегчается благодаря возможности построения вспомогательной задачи, имеющей решение (q, r) в смысле седловой точки, совпадающее с решением задачи (4.11). Действительно, если считать множество Pq уже найденным, то, рассматривая минимакс
|
Jˆ1 |
( |
q , r |
) = |
q Q r R |
|
Z |
Z |
|
0 |
|
|
|
|
(4 |
|
22) |
||||
|
|
|
|
min max |
dq |
f dr, |
|
|
|
|
. |
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
Pq |
Vq |
|
|
|
|
|
|
|
|
|
определенный на произведении множеств |
|
4 |
¯ |
è |
Vq |
4 |
¯ , замечаем, что |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
Pq = U |
|
= V |
|
|
|
|
||||
согласно теоремам 2.1 и 2.4 имеет место равенство |
|
Z¯ |
Z¯ |
|
|
|
|
|
|||||||||||||
q Q r R Z¯ |
Z¯ |
|
0 |
dqdr |
= |
Jˆ1 |
( |
q , r |
) = |
r R q Q |
0 |
dqdr, |
|
|
|
||||||
min max |
|
f |
|
|
|
max min |
|
f |
|
|
|
||||||||||
U |
V |
|
|
|
|
|
|
|
|
|
|
|
|
|
U |
V |
|
|
|
|
|
эквивалентное равенству |
|
|
|
|
|
|
|
|
|
|
Z¯ |
Z¯ |
|
|
|
|
|
|
|||
q Q Z¯ |
Z¯ |
|
0 |
|
|
= |
( |
|
) = |
r R |
0 |
|
|
(4.23) |
|||||||
min |
|
f dqdr |
|
Jˆ1 |
q , r |
|
|
max |
|
f dqdr. |
|||||||||||
U |
V |
|
|
|
|
|
|
|
|
|
|
|
U |
V |
|
|
|
|
|
|
|
Таким образом, если носитель Pq |
оптимальной меры q в задаче (4.11) из- |
вестен, то левая задача в (4.23) позволяет найти значения оптимальной меры q на известном ее носителе. Правое равенство в (4.23) нас не интересует, по-
скольку мы уже получили необходимые условия оптимальности стратегии r в задаче (4.11). Из необходимых условий оптимальности стратегии q в задаче (4.23) нас интересуют только те, которые получаются варьированием значе-
4 ¯
íèé ìåðû q при заданном ее носителе Pq = U. Эти последние имеют вид (4.9),(4.10) и находятся совершенно так же, как и соответствующие результаты теоремы 1.4.4 из [... 40, с. 49].
Пример 4.1. (Слабая дискриминация) Пусть f0 = (u − v)2 ïëà- тежная функция в антагонистической игре, где величины u è v выбираются
227
двумя участниками из множества
W = {u, v : 0 ≤ u ≤ 1 − (3/4)v, 0 ≤ v ≤ a, a ≤ 4/3}.
Игра рассматривается в смешанных стратегиях в смысле максимина (4.12), т. е. как игра со слабой дискриминацией вида
Z |
Z |
|
max min |
dr (u − v)2dq. |
(4.24) |
r P rRG q Q
VUr
Âзадачах (4.11) и (4.12) всегда можно ограничиться чистой стратегией игрока, выбирающего свою стратегию вторым (в задаче (4.24) это 1-й игрок,
выбирающий координату u), во-первых, потому, что ему нет смысла "хит-
рить поскольку он знает стратегию противника, а тот не знает его стратегии; а во-вторых, потому, что для него игра сводится к задаче
ZZ
min dr f0dq
q Q
VUr
âкоторой в случае достижения абсолютного минимума в нескольких точках множества Ur он может взять любую из этих точек чистых стратегий, а не
обязательно смесь их. Таким образом, среди множества оптимальных стратегий 1-го игрока всегда найдется оптимальная чистая стратегия, и именно она представляет наибольший прикладной интерес.
Из Теоремы 4.1 следует, что если оптимальная чистая стратегия u 1-ãî
игрока не оказывается граничной точкой множества Ur, то она должна удо- влетворять уравнению
ZZ
(∂/∂u) (u − v)2dr = 2 |
(u − v)dr = 0, |
(4.25) |
Pr |
Pr |
|
аналогичному уравнению (4.20) для задачи (4.11). В тех случаях, когда оптимальная стратегия 2-го игрока, определяющего свою стратегию первым,
является смешанной атомической, то для каждой пары точек |
v0, v1 åå íîñè- |
|||
òåëÿ Pr должно удовлетворяться уравнение |
|
|
||
1−(3/4)v0 |
1−(3/4)v1 |
|
||
Z0 |
(u − v0)2dq = |
Z0 |
(u − v1)2dq, |
(4.26) |
аналогичное уравнению (4.17), которое в случае чистой стратегии 1-го игрока принимает вид (u − v0)2 = (u − v1)2; отсюда следует
u = (1/2)(v0 + v1), (0 ≤ u ≤ 1 − (3/4)v1).
228
Подставляя эту чистую стратегию в уравнение (4.25), имеем (1/2)(v1 + v0) = (v1r(v1) + v0r(v0)), ãäå r(vi) ýòî r-ìåðà точки vi, отсюда r(v0) = r(v1) = 1/2. Следовательно, все точки носителя оптимальной атомической r-ìåðû имеют равную меру. Поскольку уравнение
1−(3/4)v
Z
(∂/∂v) (u − v)2dq = 0,
0
аналогичное уравнению (4.18), может удовлетворяться, как легко видеть, только для конечного множества точек v, то оптимальная смешанная страте-
гия 2-го игрока может представлять собой лишь атомическую (дискретную) меру r. Если учесть полиномиальность функции (u − v)2, то отсюда следует
[3, с. 154], что оптимальная смешанная стратегия r может быть сосредоточе- на только в двух точках v0 è v1, в которых r(v0)+ r(v1) = 1. И тогда решение задачи (4.24) должно определяться парой стратегий
u = (1/2)(v0 + v1), r = (r(v0), r(v1)). |
(4.27) |
Найдем решение задачи (4.24) в зависимости от значений параметра a. Случай 1: 4/5 ≤ a ≤ 4/3. Решение задачи (4.24) в этом случае находится
элементарно, без применения теоремы 4.1. Действительно, чем ближе к точке v = a на множестве V 2-й игрок будет выбирать свою стратегию, тем больше он будет выигрывать, а множество допустимых стратегий 1-го игрока будет при этом уменьшаться. При v = a 1-му игроку следует применять стратегию u = 1 − (3/4)a.
Случай 2: 0 < a ≤ 4/5. В этом случае 2-му игроку применять чистую стратегию v = a становится уже невыгодно. Действительно, непосредствен-
ной проверкой можно убедиться, что смешанная стратегия (4.27) для него выгоднее. Найдем оптимальные стратегии игроков. Подставляя пару страте-
гий (4.27) в функционал J, имеем
Z Z
J = (1/2) (u − v0)2dq + (1/2) (u − v1)2dq =
W W
[u2 − (v0 + v1)u + (1/2)((v0)2 + (v1)2)], 0 ≤ u ≤ 1 − (3/4)a,
откуда видно, что min J достигается при u = (1/2)(v0 + v1), и этот минимум
u
равен J = J(v0, v1) = (1/4)(v1 − v0)2 .
Определим теперь max J(v0, v1). Решение этой задачи очевидно: v0 = 0,
v0,v1
v1 = a. Проверкой можно убедиться, что J = (1/4)a2 есть оптимальное зна- чение в задаче (4.24), достигаемое на паре стратегий (4.27) при v0 = 0, v1 = a.
229
Без применения теоремы 4.1 найти решение задачи (4.24) было бы гораздо сложнее.
Приведем необходимые условия оптимальности для задачи (4.6), введя предварительно следующие обозначения:
L(u1) =4 |
Z |
f0drdql . . . dq2, . . . |
|
||
|
W (u1) |
|
Z |
|
|
L(u1, . . . , ul) =4 |
f0dr, |
(4.28) |
W (u)
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Z
4
L(u, v1, . . . , vm−1) = f0dr,
W (u,v1,...,vm−1)
4
L(u, v) = f0.
Теорема 4.2. Пусть в задаче (4.14) множество G таково, что все функции L в (4.20) непрерывно дифференцируемы по последнему аргументу, а q и r пара оптимальных стратегий, задаваемых в виде частного распределения q и условных распределений q2, . . . , ql, r1, . . . , rm
функционала J в виде
J =4 |
Z |
dq1 |
Z |
f0drdql . . . dq2 = Z |
dq1 |
Z |
dq2 . . . |
|
Z |
f0drm. |
|
|||||||
|
U1 |
|
W (u1) |
|
|
U1 |
P rU2 W (u1) |
|
W (u,v1,...,vm−1) |
|
|
|||||||
Тогда i-ое уравнение |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
L(u1, . . . , ui−1, u¯i1) = L(u1, . . . , ui−1, u¯i0), |
|
|
|
|
|
|
||||||||
|
|
|
|
i = 1, l, |
(4.29) |
|||||||||||||
|
|
|
|
|
|
(u1, . . . , ui−1) Pq1...qi−1 , |
|
|
|
|
|
|
|
|
||||
выполняется для любой пары точек u¯i0, u¯i1 P rUiW (u1, . . . , ui−1), u¯i0 6= u¯i1 |
, |
|||||||||||||||||
qi-мера кождой из которых положительна, а i-ое уравнение |
|
|
||||||||||||||||
|
|
|
∂L(u1, . . . , ui) |
|
(u1, . . . , ui−1) Pq1...qi−1 , |
|
|
|
|
|
|
|
||||||
|
|
|
= 0, |
i = 1, l, |
(4.30) |
|||||||||||||
|
|
|
|
|
∂ui |
|||||||||||||
удовлетворяется на каждом интервале |
(ˆui0, uˆi1) P rUiW (u1, . . . , ui−1), â |
|||||||||||||||||
каждой точке которого мера qi |
имеет ненулевую плотность относительно |
|||||||||||||||||
меры Лебега; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
230