Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Теория игр / Петросян_Теория_игр

.pdf
Скачиваний:
37
Добавлен:
13.02.2015
Размер:
6.14 Mб
Скачать

ГЛАВА V

ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ

§1. АНТАГОНИСТИЧЕСКИЕ ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ

СПРЕДПИСАННОЙ ПРОДОЛЖИТЕЛЬНОСТЬЮ

Дифференциальные игры являются обобщением многошаговых игр на случай, когда число шагов в игре становится бесконечным (континуум), и игроки 1 и 2 (будем обозначать их буквами Е и Р) соответственно имеют возможность принимать решения непрерыв­ но. В такой постановке траектории движения игроков представляют собой решения систем дифференциальных уравнений, правые части которых зависят от параметров, которые находятся под контролем игроков.

1.1. Пусть xeRn, yeR„, ueUczRk, veVczR, f(x, и), g(y, v)

вектор-функции размерности п, заданные на R" x U и R* x V соот­ ветственно. Рассмотрим две системы обыкновенных дифференци­ альных уравнений

*=/(*, и);

(1.1)

y=g(y, «О

(1.2)

с начальными условиями х0, у0. Игрок Р(Е) начинает движение из фазового состояния х0 0) и перемещается в фазовом пространстве

R" согласно (1.1) или (1.2), выбирая в каждый момент времени значение параметра ueU(veV) в соответствии со своими целями и информацией, доступной в каждом текущем состоянии.

Наиболее просто поддается описанию случай полной инфор­ мации. В дифференциальной игре это означает, что игрокам в каж­ дый момент времени t при выборе параметров ueU, veV известно время / и фазовые состояния свое и противника. Иногда требуют знание одним из игроков, например игроком Р, в каждый текущий момент / значения параметра ve V, выбранного игроком Е в этот же момент. В таком случае говорят, что игрок Е дискриминирован, а сама игра называется игрой с дискриминацией игрока Е.

Параметры ueU, veV называются управлениями игроков

230

Р и Е соответственно. Функции х (/), y(f), удовлетворяющие уравне­ ниям (1.1), (1.2) и начальным условиям, называются траекториями движения игроков Р, Е.

1.2. Цели в дифференциальной игре определяются с помощью выигрыша, который может различным образом зависеть от ре­ ализовавшихся траекторий x(t), y(t). Например, предполагается, что процесс игры продолжается некоторое заранее предписанное время Т. Пусть х (Т), у (Г) — фазовые состояния игроков РиЕв мо­ мент окончания игры Т. Тогда выигрыш игрока Е полагается равным Н(х(Т), у(Т)), где Н(х, у) — некоторая функция, заданная

на R" х Rn. В частном случае, когда

 

Н(х(Т), у(Т)) = р(х(Т), у(Т)),

(1.3)

где р(х(Т), у(Т))= /^(хДГ)—у,(Т))2—евклидово

расстояние

между точками х(Т), у(Т), игра описывает процесс преследования, в котором целью игрока Е является уклонение от игрока Р к момен­ ту окончания игры на максимальное расстояние. Во всех случаях будем предполагать дифференциальную игру антагонистической. В случае выполнения условия (1.3) это означает, что цель игрока Р — максимальное сближение с игроком Е к моменту окончания игры Т.

При таком определении выигрыш зависит лишь от конечных состояний процесса и каждому игроку не засчитываются резуль­ таты, достигнутые им в процессе игры до момента Т. Поэтому логичной является и такая постановка задачи, в которой выигрыш игрока Е определяется как минимальное расстояние между игро­ ками в процессе игры:

min p(x (t),y(t)).

Существуют игры, в которых ограничение на продолжитель­ ность игры не является существенным и игра продолжается до

достижения игроками определенного результата. Пусть вЛ" задана m-мерная поверхность F, которую будем называть терминальной. Положим

tn={mmt:(x(t),y(t))GF),

(1.4)

т. е. tn — первый момент попадания точки (/), у (/)) на F. Если при всех />0 точка (x(t), y(t))$F, то tn полагаем равным +оо. Для

реализовавшихся траекторий х (t), у (t) выигрыш игрока Е полагаем равным t„ (выигрыш игрока Р равен — /„). В частности, если F пред­ ставляет собой сферу радиуса /3s 0, заданную уравнением

231

то имеет место задача преследования, в которой целью игрока Р является скорейшее сближение с игроком Е на расстояние />0. Если 1=0, то под встречей понимается совпадение фазовых коор­ динат игроков Р и Е, при этом игрок Е стремится оттянуть момент встречи. Игры преследования этого типа будем называть играми преследования на быстродействие.

В теории дифференциальных игр рассматриваются также задачи определения множества начальных состояний игроков, из которых игрок Р может обеспечить встречу с игроком Е на расстоянии /, и определения множества начальных состояний игроков, из которых игрок Е может гарантировать, что встреча с игроком Р на расстоя­ нии / за конечное время не произойдет. Первое множество называет­

ся областью встречи или захвата и обозначается (С, Z), второе — областью убегания и обозначается (Е, Z). Очевидно, что эти об­ ласти не пересекаются, однако важным является вопрос, покрывает ли объединение замыканий областей встречи и убегания все фазовое пространство? Ответ на этот вопрос будет дан ниже, а пока заме­ тим, что для адекватного описания такого процесса достаточно определить выигрыш следующим образом. Если существует /„<оо

(см. (1.4)), то выигрыш игрока Е полагаем равным — 1. Если же t„ = оо, то выигрыш равен +1 (выигрыш игрока Р равен выигрышу

игрока Е с обратным знаком, так как игра антагонистическая). Игры преследования с таким выигрышем называются играми пре­ следования качества.

1.3. Фазовые ограничения. Если дополнительно потребовать, что­ бы в процессе игры фазовая точка (х, у) не покидала некоторого

множества FcR , то получим дифференциальную игру с фазовыми ограничениями. Частным случаем такой игры является игра с «лини­ ей жизни». Она является антагонистической игрой качества, в кото­ рой выигрыш игрока Е полагается равным +1, если ему удается достичь границы множества F («линии жизни») до встречи с игро­ ком Р. Таким образом, целью игрока Е является достижение гра­ ницы множества F до встречи с игроком Р (сближение с игроком Р на расстояние /, /^ 0), цель же игрока Р — сближение с игроком Е на расстояние /, пока последний еще находится в множестве F. Предполагается, что в процессе игры игрок Р не может покинуть множества F.

1.4. Пример 1. (Простое движение). Игра происходит на плоско­ сти. Движение игроков Р и Е описывается системой дифференциаль­ ных уравнений

х1 = и1, х2 = и2, uf + M^a2,

232

xt (0)=*?, x2 (0)=*S, у, ф)=у\, уг ф)=у°2, 0&Р.

(1.5)

С физической точки зрения уравнения (1.5) означают, что игроки Ра Еперемещаются в плоскости с ограниченными скоростями, при этом максимальные скорости а и /? постоянны по величине и мак­ симальная скорость игрока Е не превосходит скорость игрока Р.

Выбирая в каждый момент времени управление и = (и1, м2), стес­ ненное ограничением ui + ul^cr (множество U), игрок Р может изменять направление движения (направление вектора скорости). Аналогично, игрок Е, выбирая в каждый момент времени управле­ ние » = («!, v2), стесненное ограничением v] + v2^p (множество V), может также в каждый момент времени изменить направление движения. Очевидно, что если а>р", то множество захвата (С, Z) совпадает со всем пространством, т. е. игрок Р всегда может гарантировать для любого / /-встречу с игроком Е за конечное время. Для этого достаточно выбрать движение с максимальной скоростью а й в каждый момент времени t направлять вектор скорости на преследуемую точку у (t), т. е. осуществлять преследо­ вание по погонной линии. Бели а^/?, то множество убегания (Е, Z) совпадает со всем пространством игры за вычетом точек (х, у), для которых р(х, у)^1. Действительно, если в начальный момент р(х0, Уо)>1, то игрок Е всегда может гарантировать избежание захвата, удаляясь от игрока Р вдоль прямой, соединяющей начальные точки х0, у0, с максимальной скоростью р.

Здесь проявляется характерное свойство, которое будет встре­ чаться и в дальнейшем. Для формирования управления, гарантиру­ ющего игроку Е избежание захвата, достаточно знать лишь началь­ ные состояния х0, у0, в то время как игроку Р в случае а>/? для формирования управления, гарантирующего встречу с игроком Е, необходимо иметь информацию о своем состоянии и состоянии противника в каждый текущий момент времени.

Пример 2. Игроки Р и Е представляют собой материальные точки с единичными массами, которые перемещаются на плоскости под действием ограниченных по модулю сил и силы трения. Уравне­

ния движения игроков имеют вид

 

 

 

 

Х}=х3, х2

=Хд, х3 = ам1 крХ3,

 

 

 

х4 = а.и2 — кРх4.,

и\+и\^а2,

 

 

 

У1=Уз.У2=У4.'Уэ=р1>1-кЕу3,

(1.6)

 

 

У4 = Р»2-кЕУ4>

V2l+v\<P2,

 

где (xv

x2), (ylt

у2) — геометрические координаты, ъ, х4), ъ,

у4) — импульсы точек Р и Е соответственно, кРакЕ

— коэффициен­

ты трения, а и /? — максимальные силы, которые могут быть при­ ложены к материальным точка Р и Е. Движение начинается из

233

состояний х,(0) = х1, у,(0)=у1, 1=1, 2, 3, 4. Здесь под состоянием

понимается не геометрическое местоположение игроков Р и Е, а их фазовое состояние в пространстве координат и импульсов. Множе­ ства U, V представляют собой круги U—{u = (ul, и2)\и\ + и\^<х2}, F={w = («l5 v2):v]+vl^p2}. Это означает, что игроки Р и Е в каж­ дый момент времени могут выбирать направления прилагаемых сил, однако максимальные значения этих сил ограничены констан­ тами а и /?. В такой постановке, как это будет показано в даль­ нейшем, условия а>р (превосходство в силе) недостаточно для завершения преследования игроком Р из любого начального состо­ яния.

1.5. Пока не указан способ выбора управлений ие U, veV игро­ ками Р и Е в процессе игры в зависимости от поступающей инфор­ мации. Иначе говоря, не дано определение понятия стратегии в диф­ ференциальной игре.

Существует несколько разных подходов к определению этого понятия. Остановимся на тех интуитивно очевидных теоретикоигровых качествах, которыми оно должно обладать. Как уже от­ мечалось в гл. IV, стратегия должна характеризовать поведение игрока во всех информационных состояниях, в которых он может оказаться в процессе игры. В дальнейшем будем определять инфор­ мационное состояние каждого игрока фазовыми векторами x(f), y(t) в текущий момент t и временем t—t0, прошедшим с момента начала игры. Тогда естественно было бы рассматривать стратегию игрока Р(Е) как функцию и(х, у, t) (v(x, у, t)) со значениями в множестве управлений U(V). Именно таким образом определяет­ ся стратегия в [1]. Стратегии этого типа будем называть синтезиру­ ющими. Однако этот способ определения стратегии обладает рядом существенных недостатков. Действительно, пусть игроки Р и Е вы­ брали стратегии и(х, у, t), v(x, у, t) соответственно. Тогда для определения траектории движения игроков, следовательно, и выиг­ рыша (который зависит от траекторий) подставим функции и(х, у, t), v(x, у, t) в уравнения (1.1), (1.2) вместо управляющих параметров и, v и попытаемся их проинтегрировать при начальных условиях х0, у0 на отрезке времени [0, 7]. Получим следующую систему обык­ новенных дифференциальных уравнений:

x=f(x, u(x, у, /)), y=g(y, v(x, у, 0).

(1.7)

Для существования и единственности решения системы (1.7) необходимо наложить определенные условия на функции f(x, и), g(y, v) и стратегии и(х, у, t), v(x, у, t). Первая группа условий не ограничивает стратегических возможностей игроков, относится к постановочной части задачи и оправдывается физической приро­ дой рассматриваемого процесса. По-иному обстоит дело с ограни­ чениями на класс функций (стратегий) и(х, у, t), v(x, у, t). Ограниче­ ния возможностей игроков не согласуются с принятым в теории игр

234

представлением о свободе выбора поведения и приводят в ряде случаев к существенному «оскудению» множеств стратегий. Напри­ мер, если ограничиться лишь непрерывными функциями и(х, у, t), v (х, у, t), то встречаются задачи, в которых не существует решения в классе непрерывных функций. Допущение же более широкого класса стратегий приводит к невозможности обеспечить сущест­ вование единственного решения системы (1.7) на отрезке [t0, 7]. Иногда для преодоления этой трудности рассматривают множества таких стратегий и (х, у, i), v (x, у, t), при которых система (1.7) имеет единственное решение, продолжимое на отрезок [/0, Т\. Однако такой подход (помимо неконструктивности определения множества стратегий) не является достаточно обоснованным, поскольку мно­ жество всех пар стратегий и (х, у, t), v (x, у, t), при которых система (1.7) имеет единственное решение, оказывается непрямоугольным.

1.6. В качестве стратегий в дифференциальной игре будем рас­ сматривать кусочно-программные стратегии.

Кусочно-программная стратегия и() игрока Р состоит из пары

{а, а), где а — некоторое разбиение 0=t'0<t\<...<t„<...

полуоси

времени [0, оо) точками ik, не имеющими конечных точек сгущения;

а — отображение, ставящее в соответствие каждой точке 4 и фазо­

вым состояниям x(ik),

у (tk) некоторое измеримое

программное

управление u(t)eUпри

te[ik, 4+i) (измеримую функцию и(f), прини­

мающую значения из множества U). Аналогично,

кусочно-про­

граммная стратегия »(•)

игрока Е состоит из пары {т,

Ь], где

т — некоторое разбиение

0 = t"Q < t\ <... < t'„ <...

полуоси времени

[0, оо) точками tk, не имеющими конечных точек сгущения; Ъ — ото­ бражение, ставящее в соответствие каждой точке 4 и позициям x(t'k), y{tk) некоторое измеримое программное управление v(t)e V на от­ резке [4. 4+i) (измеримую функцию v{t), принимающую значения из множества V). Используя кусочно-программную стратегию, игрок реагирует на изменение информации не непрерывно во времени, а через интервал [tk, tk+l), длину которого он определяет сам.

Обозначим множество всех кусочно-программных стратегий иг­ рока Р через Р, а множество всех возможных кусочно-программных стратегий игрока Е — через Е.

Пусть u(t), v(t) — пара измеримых программных управлений игроков Р и Е (измеримых функций со значениями в множествах управлений U, V). Рассмотрим систему обыкновенных дифференци­ альных уравнений

x=f(x, и(/)), y=g(y, v(t)), t>0.

(1.8)

На правые части систем (1.8) наложим следующие ограничения. Вектор-функции f(x, и), g(y, v) непрерывны по всем аргументам и равномерно ограничены, т. е. fix, у) непрерывна на множестве

R"xU, a giy, v) непрерывна на множестве R"xV и \[f(x, u)\\<a,

235

Il^(y. «II </? (здесь ||z|| — норма вектора в R"). Кроме того, векторфункции f(x, и) и g{y, v) удовлетворяют условию Липшица по х и у соответственно независимо от и, v, т. е.

\\f(x. u)-f(x2> iOIKaJXi-XjH, ueU, h(yi.v)-g(y2,v)^piyi-y2\\.veV.

Из теорем существования и единственности Каратеодори следует, что при выполнении указанных условий для любых начальных состояний х0, у0, любых измеримых программных управлений и (/), v(t), заданных на отрезке [7\, TJ, 0^Т.<Т2, существуют единст­ венные абсолютно непрерывные вектор-функции x(i), y(i), которые удовлетворяют почти всюду (т. е. всюду, за исключением множест­ ва меры нуль) в промежутке [Т^ТД системе дифференциальных уравнений

x(t)=f(x(t), «(/)), y(t)=g(y(t),«,(/))

(1.9)

и начальному условию х (Т1)=х0, y(Tj)=y0

(см. [68, 36]).

 

1.7. Пусть (х0, у0) — пара

начальных условий для уравнений

(1.8). Система S={x0, y0; и(),

«(•)}, где м()еР, «()еЕ, называется

ситуацией в дифференциальной игре. Каждой ситуации S единствен­ ным образом соответствует пара траекторий x(t), y(f) таких, что

JC(0)=XO, у(0)=уо,

и при почти всех

fe[0,

7], Т>Ь выполнены

соотношения (1.9).

пусть и()={8,

а],

«() = {т, Ь). Пусть

Действительно,

0 = tQ<t1<...<tk<... —разбиение полуоси [0, оо), являющееся объ­ единением разбиений 8, т. Решение системы (1.9) строится следу­ ющим образом. На каждом отрезке [tk, tk+i), к=0, 1, ..., образы

отображений a, b представляют собой измеримые программные управления u(t), v(t), поэтому на отрезке [f0, tt) система уравнений (1.9) при х(0)=хо,у(0)=уо имеет единственное решение. На отрезке [tlt t2), взяв в качестве начальных условий x(t1)= lim x(t),

« - • / , - 0

y(t^)= lim y(t), строим решение (1.9), вторично используя измери-

мость управлений u(i), v(t) как образов отображений а и Ъ на отрезках [tk, tk+l), к=\, 2, ... . Полагая x(t2)= lim x(t),

у((г)= l™1 У(*)> продолжаем этот процесс, в результате чего нахо-

» - > ( j - 0

дим единственное решение x(t), y(t) такое, что х(0)=хо, у(0)=уо- Любую траекторию x(t)(y(t)), соответствующую некоторой ситу­ ации 0, у0; м(), v(•)}, будем называть траекторией игрока Р (игро­ ка Е).

1.8. Функция выигрыша. Как уже было показано, каждая ситу­ ация S=(x0, y0; и(.), «(•)} в кусочно-программных стратегиях одно­ значно определяет траектории x(t), y(t) игроков Р и Е. Степень

236

предпочтительности этих траекторий будем оценивать функцией выигрыша К, которая каждой ситуации ставит в соответствие неко­ торое вещественное число — выигрыш игрока Е. Выигрыш игрока Р равен (—К) (это означает, что игра антагонистическая, поскольку сумма выигрышей игроков Р и Е в каждой ситуации равна нулю). Будем рассматривать игры с функцией выигрыша четырех видов.

Терминальный выигрыш. Заданы некоторое число Г>0 и непре­ рывная по (х, у) функция Н(х, у). Выигрыш в каждой ситуации S={x0, y0; ы(-), «(•)} определяется следующим образом:

K(x0,y0;u(.),v(.)) = H(x(T),y(T)),

где x(T)=x(i)\t=T, y(T)=y(t)\tmT (здесь x(t), y(t) — траектории иг­ роков Р и Е, соответствующие ситуации S). В случае, когда функция Н(х, у) представляет собой евклидово расстояние между точками

х я у, имеет место задача преследования.

Минимальный результат. Пусть Н(х, у) — вещественная непре­ рывная функция. В ситуации 5={х0, у0; ы(-), «(•)} выигрыш игрока Е полагается равным min H(x(t), y(t)), где Г>0 — заданное число.

Если Н(х, у)=р(х, у), то игра описывает процесс преследования.

Интегральный выигрыш. В R"xR" заданы некоторое многооб­

разие F размерности

т и непрерывная функция Н(х,

у). Пусть

в ситуации S={x0,

y0; «(•), »(•)}> К — первый момент

попадания

траектории (x(i), y(t))

на F. Тогда

 

К(х0,

у0; «(.), «(•))=/ H(x(t),y(t)) dt

 

 

 

о

 

(если t„=ao, то К = оо), где x(t),y(t) — траектории игроков Р и Е, соответствующие ситуации S. В случае Н=\, K=t„ имеет место

задача преследования-на быстродействие.

Качественный выигрыш. Функция выигрыша АГ может принимать только одно из следующих трех значений: +1,0, — 1 в зависимости

от расположения (/„), у (/„)) в R" х R". В R" x R" заданы два много­ образия F и L размерности mY и т2 соответственно. Пусть в ситу­ ации S={x0, y0; u(), v()}t„ — первый момент попадания траек­ тории (x(t), y(t)) на F. Тогда

( + 1, если (х (tn),y (О) 6 L, К(х0, у0; и(), «(•)) = < 0, если f„ = oo,

1-1, если (/„), y(t„)) фЬ.

1.9. Определив множества стратегий игроков Р и Е и функцию выигрыша, можно определить дифференциальную игру как игру

237

внормальной форме. В. п. 1.1 гл. I под нормальной формой Г мы понимали тройку Г = <Х, Y, К), где XxY — пространство пар всевозможных стратегий в игре Г и К — функция выигрыша, опре­ деленная на 1 х У. В рассматриваемом случае функция выигрыша определена не только на множестве пар всевозможных стратегий

вигре, но и на множестве всех пар начальных позиций х0, у0.

Поэтому

каждой паре 0, y0)eRnxRn

соответствует

своя игра

в нормальной форме, т. е. фактически определяется некоторое

семейство

игр в нормальной форме,

зависящее от

параметров

(x0,y0)eR*xRn.

Определение. Под нормальной формой дифференциальной игры Г(х0, у0), заданной на пространстве пар стратегий РхЕ, будем понимать систему

Г(х0. Уо) = <хо- JV р . Е» к(хо> Уо1 «(•). «())>.

где K(xQi y0; ы(), »(•)) — функция выигрыша, определенная любым из четырех описанных выше способов.

Если функция выигрыша К в игре Г терминальная, то со­ ответствующая игра Г называется игрой с терминальным вы­ игрышем. Если функция К определяется вторым способом, то имеем игру на достижение минимального результата. Если функция К в игре Г является интегральной, то соответствующая игра Г называется игрой с интегральным выигрышем. Когда функция выигрыша в игре Г качественная, соответствующая игра Г на­ зывается игрой качества.

1.10. Естественно, что в классе кусочно-программных стратегий (ввиду некомпактности множества) оптимальных стратегий может не существовать. Однако удается показать, что в достаточно боль­ шом числе случаев для любого е>0 существуют ситуации е-равно- весия.

Напомним определение ситуации s-равновесия (см. п. 2.3 гл. II). Определение Пусть задано некоторое е>0. Ситуация S,=

= {х0, у0; и«(-)> «,(•)} называется ситуацией е-равновесия в игре Г(х0,

у0), если для всех м()еР и v()eE

имеет место неравенство

 

К(х0, у0; и(•), v,(.)) + e>K(x0, у0; «,(.), „.(•))>

(1.10)

^К(х00;и,

(•),«(•)) ~е.

 

Стратегии «,(•), ««(•), определенные в (1.10), называются Е-ОП-

тимальными стратегиями игроков Р и Е.

Следующая лемма является перефразировкой теоремы п. 2.5 гл. П для дифференциальных игр.

Лемма. Пусть в игре Г(х0, у0) для каждого е>0 существует ситуация е-равновесия. Тогда существует предел

238

lim K(x0, y0; «,(.), «.(•)).

«-•о

Определение. Функция V{x, у), определенная в каждой точке

(х, у) некоторого множества DcB?xl? по правилу

 

lim К(х, у; «.(.), «.(•))= V(x. у),

(1.11)

в-»0

 

называется функцией значения игры Г (х, у) на множестве начальных условий (х, y)eD.

Существование при любом е>0 ситуации е-равновесия в игре Г 0, у0) эквивалентно (см. п. 2.5, гл. П) выполнению равенства

sup inf

К(х0, у0; и(•), «(•))= inf sup К(х0, y0; ы(), «(•)).

«(•)еЕ и()еР

и()бР«()бЕ

Если в игре Г(х0, у0) для любого Б > 0 существуют е-оптималь- ные стратегии игроков РжЕ,то будем говорить, что игра Г (х0, у0) имеет решение.

Определение. Пусть и* (•); v* (•) — пара таких стратегий, что

К(х0, у0; «(.), v*(.))>K(x0, y0; «*(•), ••(.))>

 

£*(х0.;р0; «*(.). «О)

(112)

для всех и()еР u vQeE. Тогда ситуация S* = (x0, y0; ы*(), «*(•))

называется ситуацией равновесия в игре Г(х0, ;у0). Стратегии и*()еР и v*()еЕ из (1.12) называются оптимальными стратегиями игроков Р и Е.

Существование ситуации равновесия в игре Г 0, у0) эквивалент­ но (см. п. 3.4 гл. I) выполнению равенства

max inf K(x0, y0; и(), »(•))=

»(.)еЕи(-)еР

= min supAT(x0, y0; ы(), *(.)).

и()бЕи()еР

Очевидно, что если существует ситуация равновесия, то для любого е>0 она является и ситуацией Б-равновесия, т. е. функция V(x, у) в данном случае просто совпадает с К (х, у; и* (•), »* (•)) (см.

п.2.3 гл. II).

1.11.Рассмотрим синтезирующие стратегии.

Определение. Пара (и* (х, у, t), v* (x, у, /)) называется ситуаци­ ей равновесия в дифференциальной игре в синтезирующих стратеги­ ях, если имеет место неравенство

К(х0, у0; и(х, у, t), v*(x, у, t))^K(x0, у0; u*(x, у,

t),

v* (х, у, t))^K(x0, y0; и*(х, у, t), v(x, у, /))

0-13)

для всех ситуаций (и (х, у, t), v* (х, у, t)) и (и* (х, у, t), v {х, у, t)), для которых существует единственное, продолжимое на [О, оо) решение

239

Соседние файлы в папке Теория игр