Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1smol_yakov_e_r_metody_resheniya_konfliktnykh_zadach-1

.pdf
Скачиваний:
4
Добавлен:
19.11.2019
Размер:
1.15 Mб
Скачать

двум следующим типам задач с фиксированной последовательностью выбора стратегий:

1 слабая дискриминация: игроку, определяющему свое поведение вторым, известна смешанная стратегия (вероятностная мера) противника;

2 сильная дискриминация: игроку, определяющему свое поведение вторым, известна не только смешанная стратегия (вероятностная мера) противника, но и реализации случайных чисел, определяемые ею.

Как будет продемонстрировано на примерах, знание игроком, реализующим свою стратегию первым, степени информированности противника о его стратегии существенно влияет на исход игры.

Определение 4.1. Задача со слабой дискриминацией это минимаксная задача вида

 

 

 

 

(

 

 

) = Z

 

Z

0

 

= q P rQG r R Z

 

Z

 

0

 

=

 

 

ˆ1

 

q , r

 

 

4

 

dq

f dr

 

 

min max

dq

 

 

f dr

 

 

 

J

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

U

 

Vq

Z

 

 

 

 

 

U

Z

Vq

 

 

 

 

 

 

 

 

 

 

q P rQG

r G(q) Z

 

0

dr

= q P rQG v Vq

0

dq

 

(4.11)

 

 

 

 

 

 

min

 

max

dq

f

 

min

max

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

U

V

 

 

 

 

 

 

U

 

 

 

 

 

или максиминная задача вида

0 ˆ = r P rRG q Q Z

Z

 

 

 

=

 

 

 

 

 

 

 

(ˆ ˆ) = Z

 

ˆZ

0

 

 

 

 

 

 

ˆ2

q, r

 

4

 

dr

f dq

 

 

max

min

dr

f dq

 

 

 

 

 

J

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

V

 

Ur

Z

 

 

 

 

 

V

Ur

 

 

 

 

 

 

 

 

 

 

 

r P rRG

q G(r) Z

 

0

dq

= r P rRG u Ur

Z

0

dr,

 

(4.12)

 

 

 

 

 

 

max

 

min

 

dr

f

 

max

min

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

V

U

 

 

 

 

 

 

V

 

 

 

 

 

ãäå

4

T

 

 

 

 

 

,

 

 

4

T

 

 

компактные множества, поскольку

 

Vq =

 

W (u) Ur =

W (v)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u Pq

 

 

 

 

 

 

 

v Pr

 

 

 

 

 

 

 

 

 

 

 

 

W (u) и W (v) компактные множества, а пересечение любого числа ком-

пактных множеств компактно.

Замечание 4.1. Последняя из трех эквивалентных форм математиче- ского представления минимаксной задачи со слабой дискриминацией в (4.11) основывается на том факте, что в этой задаче всегда можно ограничиться чистой стратегией игрока, реализующего свою стратегию вторым, вопервых, потому, что ему незачем хитрить, так как он знает стратегию противника (q), а тот не знает его стратегии, в связи с чем для него

подобная игра сводится к задаче

Z

max f0dq ,

v Vq

U

221

Утверждение 4.2.

в которой если максимум достигается в нескольких точках v1 , . . . , vj ,

то он может взять любую из них, а не обязательно смесь их всех. То же

самое можно сказать в отношении задачи (4.12).

Определение 4.2. Будем говорить, что реализуется слабозависимая седловая точка в смешанных стратегиях, если на некоторой паре стратегий (q, r) достигается равенство

ˆ1

ˆ2

(q, r).

(4.13)

J

(q, r) = J

Чтобы существовала слабозависимая седловая точ- ка (q , r ), достаточно, чтобы вспомогательная задача, полученная заме-

ной в (4.1) и, соответственно, в (4.11) и (4.12) множества W на множество U Ч V , имела решение в смысле независимой седловой точки и чтобы

носитель

4

оптимальной меры

q r

этой вспомогательной задачи

 

P = Pq ×Pr

 

 

содержался в W .

Доказательство следует из теоремы 2.4, если учесть, что в случае W = U × V обязательно G = Q × R.

Определение 4.3. Задача с сильной дискриминацией это задача на-

хождения

(

 

) =

q Q ru R Z

Z

0

 

¯1

 

 

 

q , r

4

min max dq

 

f dr,

(4.14)

J

 

 

 

U W (u:u Pq)

т.е. задача нахождения такого маргинального распределения q на множестве U и таких условных распределений ru в сечениях W (u) при всех u Pq,

которые обеспечивают достижение значения ¯1

J (q , rU ), где через rU îáî- значено согласованное семейство условных распределений ru, u Pq [91, c. 249].

Вообще говоря, в (4.14) можно вместо W (u : u Pq) взять W (u), òàê êàê âñå òå u, q-мера которых нуль, не влияют на величину двойного интеграла. Аналогичным образом рассматривается задача с обратной дискриминацией

J¯2

(

V

= r R qv Q Z

Z

0

 

 

 

q , r )

max min dr

 

f

dq.

(4.15)

V W (v:v Pr)

В задачах (4.14) и (4.15), в отличие от задач (4.11) и (4.12), у игрока, выбирающего свою стратегию вторым, всегда найдется стратегия в ответ на любую стратегию игрока, определяющего свое поведение первым. Что касается вопроса существования решения обоих типов задач, то он находится в прямой зависимости от вопроса существования соответствующих максиминов и минимаксов.

222

Замечание 4.2. Следует иметь в виду, что порядок интегрирования при записи интеграла (4.1) в виде повторного интеграла по q è r определяет уже

и порядок выбора стратегий, т. е. некоторую дискриминацию в игре. Поэтому применение теоремы Фубини об изменении порядка интегрирования в процессе поиска решения недопустимо. Изменять порядок интегрирования, если это вообще возможно по условию задачи, можно только тогда, когда уже извест-

ны все оптимальные интегрирующие функции, т. е. меры q è r èëè õîòÿ áû èõ

носители. Это связано с тем, что любое представление кратного интеграла в виде повторного уже определяет иерархию интегрирования в повторном интеграле, а следовательно, и вполне определенную дискриминацию в задаче.

Например, в (4.11) внутренний интеграл (по мере r) может быть вычислен только тогда, когда задана мера q или хотя бы ее носитель. А как только оптимальные стратегии q è r найдены, величина соответствующего двойно-

го интеграла уже не изменится при изменении порядка интегрирования. В то же время на этапе определения оптимальных мер изменение порядка интегрирования недопустимо, так как это приведет к замене задачи (4.11) на совершенно другую задачу (4.12). В задачах (4.14) и (4.15) изменить порядок интегрирования не представляется возможным даже после нахождения опти-

мальных мер q è r, поскольку, например, в (4.6) q ýòî ìåðà íà U, à rU ýòî некоторое согласованное семейство мер, заданное в сечениях W (u : u Pq)

Из двух поставленных типов задач наибольший прикладной интерес представляет задача со слабой дискриминацией, поскольку в ней игрок, определяющий свою стратегию вторым, получает наиболее естественную информациюинформацию о стратегии первого игрока, независимо от того, к какому классу она принадлежит, т. е. является чистой или смешанной.

Нас интересуют случаи, когда интеграл (4.1) может быть представлен в виде следующих разложений по маргинальным распределениям:

 

 

 

Z dq Z fdr = Z dq1

Z

dq2 . . . dql Z f0dr =4

 

Z

 

Z

U

Vq

U1

W (u1)

 

Vq

 

 

dq1

dq2 . . .

Z

dql

Z

dr1 . . .

Z

f0drm,

(4.16)

U1

W (u1)

 

W (u1,...,ul−1)

P rV1 Vq

Vq(v1,...,vm−1)

 

 

где в последней форме записи мера

q1 определяет маргинальное распреде-

ление на U1, ìåðà r1 маргинальное распределение на P rV1 Vq, а остальные ìåðû, qi è rk (i, k 6= 1) условные распределения: например, q2 услов-

223

ное распределение на P rU2 W (u1), зависящее от реализации u1 U1; q3 условное распределение на P rU3 W (u1, u2), зависящее от реализации (u1, u2) U1 × P rU2 W (u1). Ради упрощения обозначений мы не указываем параметри- ческой зависимости qi îò (u1, . . . , ui−1), отмечая эту зависимость только для множества, на котором рассматривается qi.

Если компакт W El+m задается конечным множеством неравенств Fk(u, v) ≥ 0, k = 1, N, ãäå Fk(u, v) непрерывные и непрерывно дифференцируемые функции, то, согласно следствию из теоремы Иржина [91, с. 247], теореме об условных математических ожиданиях [91, с. 249] и теореме 6.3.1 из [8, с. 83] о разложении мер, интеграл (4.11) можно представить в виде (4.16).

Разложения вида (4.16) мы используем в нижеприведенной теореме 4.1, формулирующей некоторые свойства решений задачи (4.11). В этой теореме применяются также следующие обозначения:

Z

Z

4

 

 

 

L(u1, . . . , ui) =

dql . . . dqi+1 f0dr, i = 1, l − 1;

Pq(u1,...,ui)

Vq

Z

4

L(u1, . . . , ul) = f0dr;

Vq

Z

Z

 

 

 

 

 

4

 

 

 

 

 

 

M(v1, . . . , vk) = dq

f0drm . . . drk+1, k = 1, m − 1;

Pq

Vq(v1,...,vk)

 

Z

 

 

 

 

M(v1, . . . , vm) =4

f0dq.

 

 

 

Pq

 

 

 

Теорема 4.1. Пусть в задаче (4.11) множество W таково, что функции

L(u1, . . . , ui), i = 1, l è M(v1, . . . , vk), k = 1, m, дифференцируемы, соответ-

ственно, по

ui

è

vk

, à

4

(u1), . . . , ql(ul))

è

4

(v1), . . . , rm(vm))

 

 

 

q(u) = (q1

 

r(v) = (r1

пара оптимальных стратегий, определяемых парой частных (маргиналь- ных) распределений q1 è r1 и остальными, понятным образом образованными условными распределениями. Тогда i-ое уравнение

 

L(u1, . . . , ui−1, u¯i1) = L(u1, . . . , ui−1, u¯i0),

(4.17)

 

 

 

 

 

 

 

 

 

 

 

 

(u1, . . . , ui−1) Pq1...qi−1 , i = 1, l,

 

 

выполняется для любой пары точек u¯i0, u¯i1 P rUiW (u1, . . . , ui−1), u¯i0

6= u¯i1

,

qI-мера каждой из которых положительна, а i-ое уравнение

 

 

∂L(u1, . . . , ui)

 

 

 

 

 

 

 

 

 

 

= 0, (u1, . . . , ui−1) Pq1,...,qi−1 , i = 1, l,

(4.18)

 

∂ui

 

224

имеет ненулевую плотность от-
имеет ненулевую плотность относитель-

удовлетворяется на каждом интервале (ˆu0i , uˆ1i ) P rUiW (u1, . . . , ui−1), в каждой точке которого мера qi

но меры Лебега; k-ое уравнение

 

 

M(v1, . . . , vk−1, v¯k1) = M(v1, . . . , vk−1, v¯k0),

(4.19)

 

 

(v1, . . . , vk−1) Pr1...rk−1 , k =

1, m,

 

 

 

 

 

выполняется для любой пары точек v¯k0, v¯k1 P rVk Vq(u1, . . . , ui−1), v¯k0, v¯k1

, rk-

мера каждой из которых положительна, а k-ое уравнение

 

 

∂M(v1, . . . , vk)

 

 

 

 

 

 

 

 

 

 

= 0, (v1, . . . , vk−1) Pr1...rk−1 , k = 1, m,

(4.20)

 

∂vk

 

выполняется в каждой внутренней точке vk множества P rVk Vq(v1, . . . , vk−1), rk-мера которой положительна или, в частности, вся сосредоточена только в одной точке, а также на каждом интервале (¯vk0, v¯k1) P rVk Vq(v1, . . . , vk−1), в каждой точке которого мера rk

носительно меры Лебега.

Следствие 4.1. Если W = U ЧV , т. е. множества допустимых чистых

стратегий игроков не зависят одно от другого и являются компактами в El è Em, соответственно, то задача (4.11), согласно [3, с. 46], имеет ре-

шение в смысле седловой точки (4.4). При этом в теореме 4.1 следует положить Vq = V è Ur = U и дополнить ее условиями выполнения равенств (4.10) в точках ненулевой qi- меры; таким образом, необходимые условия (4.17)-(4.20) совпадают с симметричными по отношению к обоим игрокам необходимыми условиями (4.2)-(4.3). Заметим, что теорема 4.1 не изменится, если 1-й игрок будет максимизировать, а 2-й минимизировать функционал J.

Доказательство теоремы 4.1. Установим сначала справедливость уравнений (4.19) и (4.20). Поскольку 2-й игрок в задаче (4.11) не знает реализации случайных чисел противника, то свою стратегию он может определять толь-

ко на множестве Vq. Стратегия q допустима, если это множество непусто, в противном случае задача считается нереализовавшейся. При любой допу-

стимой стратегии q 1-го игрока, т. е. такой, что qrq

G хотя бы для одной

ìåðû

4

 

, 2-й игрок, зная стратегию

q

, может искать ответную,

 

r = r < q >= rq

 

 

 

 

 

 

 

оптимальную по отношению к q, стратегию r = rq , решая задачу

 

 

 

r R Z

Z

0

= Z

Z

0

 

q

 

 

max

dq

f dr

 

dq

f

dr ,

 

 

 

Pq

Vq

 

Pq

Vq

 

 

 

225

ãäå Pq

носитель меры q. Нас интересуют необходимые условия оптималь-

ности каждого распределения qi è rk, маргинального или условного, в задаче (4.11).

Для получения необходимых условий оптимальности вероятностного рас- пределения rq на множестве Vq включаем rq в параметрическое семейство rq(v, b), содержащее при b = 0 искомое оптимальное распределение rq , ïðè-

чем отображение b → rq(v, b) выбирается непрерывным и непрерывно дифференцируемым при всех v V . rq(v, b) это вероятностное распределение (или вероятностная мера) на Vq при каждом фиксированном b, |b| < ε. Параметр b мы включаем поочередно в одно из маргинальных распределений,

например в rqk, òàê ÷òî rq(v, b) = (rq1(v1), . . ., rqk(vk, b), . . ., rqm(vm)). Возможность подобного параметрического представления следует из общих теорем существования маргинальных распределений [90].

Если ищутся необходимые условия экстремальности условного распределе- íèÿ rqk, получаемого, если допустить реализацию случайных чисел v1, . . . , vk−1,

то, включив экстремальную функцию rqk

в параметрическое семейство rqk(vk, b),

можем записать

 

Z

 

 

 

 

 

 

Jˆ1(b) =4 Z dq

f0drqm(vm) . . . drqk(vk, b) =

 

Z

Pq Vq(v1,...,vk−1)

 

 

Z

 

 

drqk(vk, b)

 

Z

 

drqm . . . drq(k+1)

f0dq,

(4.21)

P rVk Vq(v1,...,vk−1)

P rVk+1...VmVq(v1,...,vk)

 

Pq

 

 

где изменение порядка интегрирования допустимо как в связи с тем, что множества интегрирования Pq è Vq заданы, так и в соответствии с теоремой Фубини [7, с. 353].

Непрерывно дифференцируемый по b функционал (4.21) достигает макси-

ˆ1

ìóìà ïðè b = 0. Приравнивая нулю производную от J (b) ïî b ïðè b = 0, ïî

аналогии с тем, как доказывается теорема 1.4.4 в [40, с. 49], получаем уравнения (4.19) и (4.20), справедливые при любой допустимой функции распределения q P rQG, в том числе и при q, оптимальной в смысле (4.11).

Гораздо труднее найти необходимые условия оптимальности меры q, íà

ˆ1 в задаче (4.11), поскольку которой достигается при r = rq величина J

стратегию q следует варьировать с учетом ответной стратегии 2-го игрока,

который предпочтет при каждой стратегии q выбирать свою стратегию rq оптимальным образом, т. е. с учетом равенств (4.19), (4.20). Таким образом, в общем случае при выводе необходимых условий оптимальности стратегии q

226

в задаче (4.11) следует в качестве дополнительных связей задачи учитывать необходимые условия оптимальности (4.19) и (4.20) стратегии rq 2-ãî игрока. Однако неполные необходимые условия оптимальности для 1-го игрока в задаче (4.11) можно получить и не интересуясь реакцией (а следовательно, и необходимыми условиями оптимальности) 2-го игрока на стратегию 1-го. Это возможно в том случае, когда решение q задачи (4.11) представляет собой

смешанную стратегию и носитель Pq этой стратегии уже найден из какихлибо условий, которые нас в данном случае не интересуют. Соответствующие этому случаю необходимые условия оптимальности можно получить при варьировании значений меры q на известном множестве Pq . Поиск желаемых необходимых условий облегчается благодаря возможности построения вспомогательной задачи, имеющей решение (q, r) в смысле седловой точки, совпадающее с решением задачи (4.11). Действительно, если считать множество Pq уже найденным, то, рассматривая минимакс

 

Jˆ1

(

q , r

) =

q Q r R

 

Z

Z

 

0

 

 

 

 

(4

 

22)

 

 

 

 

min max

dq

f dr,

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

Pq

Vq

 

 

 

 

 

 

 

 

 

определенный на произведении множеств

 

4

¯

è

Vq

4

¯ , замечаем, что

 

 

 

 

 

 

 

 

 

 

 

Pq = U

 

= V

 

 

 

 

согласно теоремам 2.1 и 2.4 имеет место равенство

 

Z¯

Z¯

 

 

 

 

 

q Q r R Z¯

Z¯

 

0

dqdr

=

Jˆ1

(

q , r

) =

r R q Q

0

dqdr,

 

 

 

min max

 

f

 

 

 

max min

 

f

 

 

 

U

V

 

 

 

 

 

 

 

 

 

 

 

 

 

U

V

 

 

 

 

 

эквивалентное равенству

 

 

 

 

 

 

 

 

 

 

Z¯

Z¯

 

 

 

 

 

 

q Q Z¯

Z¯

 

0

 

 

=

(

 

) =

r R

0

 

 

(4.23)

min

 

f dqdr

 

Jˆ1

q , r

 

 

max

 

f dqdr.

U

V

 

 

 

 

 

 

 

 

 

 

 

U

V

 

 

 

 

 

 

 

Таким образом, если носитель Pq

оптимальной меры q в задаче (4.11) из-

вестен, то левая задача в (4.23) позволяет найти значения оптимальной меры q на известном ее носителе. Правое равенство в (4.23) нас не интересует, по-

скольку мы уже получили необходимые условия оптимальности стратегии r в задаче (4.11). Из необходимых условий оптимальности стратегии q в задаче (4.23) нас интересуют только те, которые получаются варьированием значе-

4 ¯

íèé ìåðû q при заданном ее носителе Pq = U. Эти последние имеют вид (4.9),(4.10) и находятся совершенно так же, как и соответствующие результаты теоремы 1.4.4 из [... 40, с. 49].

Пример 4.1. (Слабая дискриминация) Пусть f0 = (u − v)2 ïëà- тежная функция в антагонистической игре, где величины u è v выбираются

227

двумя участниками из множества

W = {u, v : 0 ≤ u ≤ 1 − (3/4)v, 0 ≤ v ≤ a, a ≤ 4/3}.

Игра рассматривается в смешанных стратегиях в смысле максимина (4.12), т. е. как игра со слабой дискриминацией вида

Z

Z

 

max min

dr (u − v)2dq.

(4.24)

r P rRG q Q

VUr

Âзадачах (4.11) и (4.12) всегда можно ограничиться чистой стратегией игрока, выбирающего свою стратегию вторым (в задаче (4.24) это 1-й игрок,

выбирающий координату u), во-первых, потому, что ему нет смысла "хит-

рить поскольку он знает стратегию противника, а тот не знает его стратегии; а во-вторых, потому, что для него игра сводится к задаче

ZZ

min dr f0dq

q Q

VUr

âкоторой в случае достижения абсолютного минимума в нескольких точках множества Ur он может взять любую из этих точек чистых стратегий, а не

обязательно смесь их. Таким образом, среди множества оптимальных стратегий 1-го игрока всегда найдется оптимальная чистая стратегия, и именно она представляет наибольший прикладной интерес.

Из Теоремы 4.1 следует, что если оптимальная чистая стратегия u 1-ãî

игрока не оказывается граничной точкой множества Ur, то она должна удо- влетворять уравнению

ZZ

(∂/∂u) (u − v)2dr = 2

(u − v)dr = 0,

(4.25)

Pr

Pr

 

аналогичному уравнению (4.20) для задачи (4.11). В тех случаях, когда оптимальная стратегия 2-го игрока, определяющего свою стратегию первым,

является смешанной атомической, то для каждой пары точек

v0, v1 åå íîñè-

òåëÿ Pr должно удовлетворяться уравнение

 

 

1−(3/4)v0

1−(3/4)v1

 

Z0

(u − v0)2dq =

Z0

(u − v1)2dq,

(4.26)

аналогичное уравнению (4.17), которое в случае чистой стратегии 1-го игрока принимает вид (u − v0)2 = (u − v1)2; отсюда следует

u = (1/2)(v0 + v1), (0 ≤ u ≤ 1 − (3/4)v1).

228

Подставляя эту чистую стратегию в уравнение (4.25), имеем (1/2)(v1 + v0) = (v1r(v1) + v0r(v0)), ãäå r(vi) ýòî r-ìåðà точки vi, отсюда r(v0) = r(v1) = 1/2. Следовательно, все точки носителя оптимальной атомической r-ìåðû имеют равную меру. Поскольку уравнение

1−(3/4)v

Z

(∂/∂v) (u − v)2dq = 0,

0

аналогичное уравнению (4.18), может удовлетворяться, как легко видеть, только для конечного множества точек v, то оптимальная смешанная страте-

гия 2-го игрока может представлять собой лишь атомическую (дискретную) меру r. Если учесть полиномиальность функции (u − v)2, то отсюда следует

[3, с. 154], что оптимальная смешанная стратегия r может быть сосредоточе- на только в двух точках v0 è v1, в которых r(v0)+ r(v1) = 1. И тогда решение задачи (4.24) должно определяться парой стратегий

u = (1/2)(v0 + v1), r = (r(v0), r(v1)).

(4.27)

Найдем решение задачи (4.24) в зависимости от значений параметра a. Случай 1: 4/5 ≤ a ≤ 4/3. Решение задачи (4.24) в этом случае находится

элементарно, без применения теоремы 4.1. Действительно, чем ближе к точке v = a на множестве V 2-й игрок будет выбирать свою стратегию, тем больше он будет выигрывать, а множество допустимых стратегий 1-го игрока будет при этом уменьшаться. При v = a 1-му игроку следует применять стратегию u = 1 − (3/4)a.

Случай 2: 0 < a ≤ 4/5. В этом случае 2-му игроку применять чистую стратегию v = a становится уже невыгодно. Действительно, непосредствен-

ной проверкой можно убедиться, что смешанная стратегия (4.27) для него выгоднее. Найдем оптимальные стратегии игроков. Подставляя пару страте-

гий (4.27) в функционал J, имеем

Z Z

J = (1/2) (u − v0)2dq + (1/2) (u − v1)2dq =

W W

[u2 − (v0 + v1)u + (1/2)((v0)2 + (v1)2)], 0 ≤ u ≤ 1 − (3/4)a,

откуда видно, что min J достигается при u = (1/2)(v0 + v1), и этот минимум

u

равен J = J(v0, v1) = (1/4)(v1 − v0)2 .

Определим теперь max J(v0, v1). Решение этой задачи очевидно: v0 = 0,

v0,v1

v1 = a. Проверкой можно убедиться, что J = (1/4)a2 есть оптимальное зна- чение в задаче (4.24), достигаемое на паре стратегий (4.27) при v0 = 0, v1 = a.

229

в представлении

Без применения теоремы 4.1 найти решение задачи (4.24) было бы гораздо сложнее.

Приведем необходимые условия оптимальности для задачи (4.6), введя предварительно следующие обозначения:

L(u1) =4

Z

f0drdql . . . dq2, . . .

 

 

W (u1)

 

Z

 

 

L(u1, . . . , ul) =4

f0dr,

(4.28)

W (u)

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Z

4

L(u, v1, . . . , vm−1) = f0dr,

W (u,v1,...,vm−1)

4

L(u, v) = f0.

Теорема 4.2. Пусть в задаче (4.14) множество G таково, что все функции L в (4.20) непрерывно дифференцируемы по последнему аргументу, а q и r пара оптимальных стратегий, задаваемых в виде частного распределения q и условных распределений q2, . . . , ql, r1, . . . , rm

функционала J в виде

J =4

Z

dq1

Z

f0drdql . . . dq2 = Z

dq1

Z

dq2 . . .

 

Z

f0drm.

 

 

U1

 

W (u1)

 

 

U1

P rU2 W (u1)

 

W (u,v1,...,vm−1)

 

 

Тогда i-ое уравнение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L(u1, . . . , ui−1, u¯i1) = L(u1, . . . , ui−1, u¯i0),

 

 

 

 

 

 

 

 

 

 

i = 1, l,

(4.29)

 

 

 

 

 

 

(u1, . . . , ui−1) Pq1...qi−1 ,

 

 

 

 

 

 

 

 

выполняется для любой пары точек u¯i0, u¯i1 P rUiW (u1, . . . , ui−1), u¯i0 6= u¯i1

,

qi-мера кождой из которых положительна, а i-ое уравнение

 

 

 

 

 

∂L(u1, . . . , ui)

 

(u1, . . . , ui−1) Pq1...qi−1 ,

 

 

 

 

 

 

 

 

 

 

= 0,

i = 1, l,

(4.30)

 

 

 

 

 

∂ui

удовлетворяется на каждом интервале

(ˆui0, uˆi1) P rUiW (u1, . . . , ui−1), â

каждой точке которого мера qi

имеет ненулевую плотность относительно

меры Лебега;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

230