Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Теория игр / Петросян_Теория_игр

.pdf
Скачиваний:
54
Добавлен:
13.02.2015
Размер:
6.14 Mб
Скачать

- ( '8V\

их подробно для одной из компонент йт [х, — I вектора и. Исследование остальных

компонент вектора и и компонент векторагтор v проводится аналогично. Дня простоты

предположим, что в некоторой точке (х',у',.

г)

 

.

.

I ,

8V(x',

у',

Г)\

итт[х.

 

 

j=a„

Случай 1. Существует шар в пространстве R с центром в точке х', для всех

точек х которого выполняется равенство

 

 

.

.

/

dV(x. у',

Г)\

Чт^Щп [X,

 

 

\ = а„

Функция йт на этом шаре принимает постоянное значение, поэтому в точке х' имеем

— = 0 , 1 - 1 , . . , и.

0Х{

Случай 2. Такого шара не существует. Тогда найдется последовательность хг,

шп х,=х' такая, что

г-»оо

_ / 8V(xr,y', T)\

иЛх"Тху ><W

Отсюда

8 / " 8V\

I

\ _

8um V/.i dXi\(xr, у'. Г) '\(хг. й))

8V Э/,

. _ /

Из непрерывности производных —, —

и функции и=и\х,

dxt дит

\

dV(x,y,

Т)\

дх

I следу-

)

ет, что предыдущее равенство выполняется и в точке (х', у', Т).

Таким образом, два последних слагаемых в (6.12) равны нулю, и при всех

(х, у, T)eR

х Л ж [0, оо) выполняется равенство

 

 

 

 

 

 

дБ

 

d2V

"

d2V

fi(x,

 

 

 

 

 

 

I

 

«)-

 

"

дхк

дТдхк

Ы18х,дхк

 

 

 

 

 

8V 8ft

 

" 82V

J ) = 0

'

*=1, 2, ...,«.

 

- I r r - E

— ^ '

 

 

 

imldxjdxk

 

,ш1ду,дхк

 

 

 

 

 

Пусть х (f), у (<). 'е [0, 7] — решение системы

 

 

 

.

/ . /

8V(x,y,T-t)\\

Jj,

.

/

 

_ /

dV(x,y,T-t)\\

x=f[x,u[x,

 

 

 

y-g\y..\y.

 

JJ

с начальным условием х (0)=х<ь у (0)=>>о- Вдоль решения x (f), у (l) имеем

270

 

32V (х (/), у (О, Т- о

" д2v (х (О, у (О, т-о

 

_ / чч

 

8Т8хк

1ш{

8х,3хк

 

 

 

 

 

 

_ у 8V$®>

У lb г~'> э/i (* (0. fi (0)_

 

 

,_1

 

Sxi

 

 

дхк

 

 

 

 

"

ваК(х (0,^(0. Г-О

, - „

-,чч

n

L

,

где

 

- ,ч

-f-r,

3V(x(t),y(t),

 

T-l)\

 

 

 

 

 

 

 

н (0-и ( х (0,

 

 

J,

 

 

 

-,ч

- Л / ч ^

М , *(0, г - 0 \

 

Однако,

 

 

 

 

 

 

 

 

 

 

d (dv (х (о, у (0,

г - г)\

» а»У(х(о,

у (о,

г - о

.

 

-

;

1 - 1

 

 

// (* (0, й (ОН

 

Л\

дхк

J

(._,

dxkdxj

 

 

 

 

^d*V(x{t),Ht),

T-t)

,-

_ „ ч

а»У(х(0,у(0,

Г-Q

+ 1

 

а (у (О, • (0)

 

г - —

 

 

. * - 1 , •••> и. (6-14)

Заметим, что у дважды непрерывно дифференцируемой функции можно менять порядок дифференцирования. Перепишем (6.13) с учетом (6.14) в виде

d fSV (x («), у (Г), Г - 0\) \ _ "Д ЭКarfr(0х (Г),.y(0у (г),. Г - 0 9/i (х (0, 2 (0)

л\

ах*

/

._,

Эх<

ах к

 

 

 

 

* - 1

«•

 

Аналогичным образом получим уравнения

(0, у (О, г - о fy (у (о, г (D)

d

/8V

(/), J (0,

-1)\

"ev(x

_rf

/ау(х(о, у (о,

т-»\_

_ ,

 

 

1 = 1 , ..., Л.

Так как при fe [О, Г]

К (х (0, у (О, Г - О - Я (х (Г), у (Г)),

то

 

dt\

дТ

Введем следующие обозначения:

 

, Д dV(x(t),

J (j), Г - 0

F

( 0 =

,

Зх,

271

/ A

dV(x (t), у (I), T-l) .

 

dyt

 

yx{t)={vXi{t)},

vy{i)t{vyt{t)},

„ , дэк(5(0.>М, r-i)

VT

(/)

 

В результате получим следующую систему обыкновенных дифференциальных урав­ нений для функций х (/), у (О, Vx (/), Vy (/), F r (r):

±,-/, (х, й (х, vx)i

л - Л с,; о-, к,»,

 

^ _ " „

ш * . Д(«. Ш)

^ _

"

в» (у. г (у. К,»

(6.15)

ы\

дх*

 

/-1

ЗУк

 

 

 

^Г =0, /,

fc=l

я

 

 

и, кроме того, согласно (6.6) имеем

 

 

 

 

п

 

и

 

 

 

Ут= I

V„g, (у, ; (у, К,))+ 21 VXift (х, 5 (х, Fx)).

 

f - 1

i-1

 

 

 

Для решения системы нелинейных уравнений (6.15) относительно функций х ((), .у (О, Ух (0> ^ (0> ^т(') необходимо определить начальные условия. Для функции

У(* (Of У (0. Г—0 они заданы в момент времени t=T, поэтому введем переменную

т= Г— / и запишем уравнение характеристик в регрессивной форме. Введем обозначе­ ния х= — х, у= —у. Уравнения характеристик принимают следующий вид:

*.= -/,(*. й), yt=-gi (У. v),

(6.16)

•>'

"

Щ (х, и) о

Sgl. (у, 5) о

*

,Г, *'

3xfc

 

3j>*

При задании начальных условий для системы (6.16) используется соотношение V(x, у, 1) \т-ъ=Н (х, у). Пусть х |t_o=J. У |т-о=-г'- Тогда

 

дН

 

 

ен

 

F,lt-o=—

 

 

 

'

(

*-*, y-f'.

*V. lt-0

= By, x—s, y-/i

(6.17)

Krlt-0- I ^

|t.O ft (5', S (5', К, |t-0))+ Z

VXj I,.,/, (5, U (J. K, |t_0)).

 

i - 1

 

 

 

 

 

Подробные исследования возможных путей решения системы (6.16)—(6.17) см.

в[1].

Аналогичным образом, используя уравнение (6.8), можно записать уравнение характеристик для задачи преследования на быстродействие.

272

§ 7. МЕТОДЫ ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ ДЛЯ РЕШЕНИЯ ДИФФЕРЕНЦИАЛЬНЫХ ИГР ПРЕСЛЕДОВАНИЯ

7.1. Пусть Г6 (х, у, Т) — дискретная форма дифференциальной

игры Г (х, у, Т) продолжительностью Т>0 с фиксированным шагом разбиения 8 и дискриминацией игрока Е на время <5>0 вперед. Обозначим через Vs (х, у, Т) значение игры Ts (х, у, Т)*. Тогда

\imVi(x,y,T)=V(x,y,T)

и оптимальные стратегии в игре Ts (x, у, Т) при достаточно малых 8 могут быть эффективно использованы для построения ситуаций

Еравновесия в игре Г (х, у, Г).

7.2.Идея численного метода состоит в построении алгоритма нахождения решения игры Г6 (х, у, Т). Перейдем непосредственно

к изложению метода.

Нулевое приближение. За нулевое приближение функции зна­ чения игры Vs (x, у, Т) принимаем функцию

s (х, у, Т)= max

min p (£, г\),

(7.1)

,6 СI (у)

(еСЦх)

 

где Ср (х), СЕ (У) — множества достижимости игроков Р и Е из

начальных состояний х, yeR" к моменту времени Т.

Выбор функции V\ (x, у, Т) в качестве начального приближения оправдан тем, что в достаточно широком классе игр (так называ­

емый

регулярный случай) она

оказывается

значением

игры

Г (х, у,

Т). Следующие приближения строятся по правилу:

 

 

V\ (х, у, Т)= max

min

V\ (£, i\,

T-S),

 

 

 

i,6C«(y) {eC»(x)

 

 

 

 

V\ (x, y,T)=

max

min

V\ ({, r\,

T-8),

 

 

V\ (x, y,T)=

max

min

V\ ({, q, T-S)

(7.2)

при T>8 и V\ (x, y, T)= Vl (x, y, T) при T^S, к> 1.

Как видно из формул (7.2), операция max min берется по множе­ ствам достижимости СЕ (у), Ср (х) за время 8, т. е. за один шаг дискретной игры Гй (х, у, Т).

•Вопросы, связанные с обобщениями и приложениями теоремы Хелли, подробно изложены в книге: Данцер Л., Грюнбаум Б., Кли В. Теорема Хелли. М., 1968.

273

7.3. Теорема. При фиксированных х, у, Т, 8 числовая последова­ тельность [Vg (x, у, 7)] не убывает с ростом к.

Доказательство. Докажем сначала неравенство

V\(x.y.T)>V°t(x,y,T).

Для всех £еСр (х) справедливо: С\~ь <=• СТР (х). Для любых

цеСтЕ~6 (г\), £еСР(х) имеем

min

p (I, rj)^

min о (?, г\).

Отсюда

 

 

 

Vls (х, у, Т)— max

min

max min p (5, jj)>

ueC^CO

(eC'r(x)

ijeCj-'fo) fsCj-'(f)

^ max

max min p (£, jj)=

4eC^(y)

iieC'-'O,) }ecTf{x)

= max

min p (£, n)= V° (x, у, Т).

Предположим теперь, что для l^k справедливо неравенство

V,,(x,y.T)>V'fl(x,y,T) (7.3)

и докажем его для 1=к+1. Из соотношений (7.2) и (7.3) следует, что

П+ 1 (х. у, Т)= max min V\ ({, IJ, Г-5)>

>max min Vtx &4>T-S)=V\(x.y,T\

Таким образом, в случае Т>8 по индукции утверждение те­ оремы доказано. В случае Т^д утверждение теоремы очевидно.

7.4. Теорема. Последовательность {Vg(x, у, Г)} сходится за конечное число шагов N, при этом имеет место оценка iV< - +1,

где квадратные скобки означают целую часть.

Доказательство. Пусть N=[T/6] + l. Покажем, что

VHx,y,T)=V^l(x,y,T). (7.4)

Равенство (7.4) легко получить из построения последовательности [V* (x, у, 7)]. Действительно,

Vя, (х, у, Т)= max min V?~l « \ if1, T-8) =

JeC'^ty) (leC'r(x)

= max min max ...

чЧс^Ь) {'бс;м »2бС^(чх)

274

...

max

min

V\^N~\ r,N~\ T-(N-l)

8).

Аналогично имеем

 

 

 

 

 

V$+l

(x, у, Т)=

max

min

max ...

 

 

 

4«eC^O0

f e C j W

if'eC^Oi»)

 

...

max

min

V\(f~\ r\N~\ T-(N-l)

8).

Однако Т— (N— 1) 8 = <x<8, поэтому

 

 

VsKS,

,4

,<*•)= У s\S

,4

, « ) = * ' « ( ? > 4

> ah

откуда и следует равенство (7.4).

 

 

выводится

Совпадение членов последовательности V\ при k^N

из (7.4) индукцией. Теорема доказана.

7.5. Теорема. Предел последовательности {V* (x, у, Т)} совпа­ дает со значением игры ГЙ (х, у, Т).

Доказательство. Данная теорема является, по существу, сле­ дствием теоремы п. 7.4. Действительно, обозначим

Vs(x,y, r ) = lim VI {х, У, Т).

Jt-»QO

Сходимость происходит за конечное число шагов, не превосходящее 'N=[T/8]+1, поэтому в рекуррентном уравнении (7.2) можно перей­ ти к пределу при к-*со. Предельная функция Vs (x, у, Т) удовлет­ воряет уравнению

V, (х, у, Т)= max min V, ({, п, Т-8)

(7.5)

при начальном условии

Vs {х, у, Т) |0<г<а= max min p (<!;, г\),

(7.6)

что и является достаточным условием для того, чтобы функция

Vs (х, у, Т) была значением игры Ys (х, у, Т).

1.6. Зная функцию Vs (x, у, Т), можно, используя уравнение (7.5),

построить оптимальные кусочно-программные стратегии в игре Гг (х, у, Т). С помощью стратегий, оптимальных в игре ГЙ (х, у, Т),

строятся е-оптимальные стратегии в основной игре Г (х, у, Т). Как следует из (7.4), совпадение двух последовательных прибли­

жений на шагах к и к+1 означает, что соответствующее приближе-

275

ние уже является значением игры Г6 (х, у, Т), поскольку в этом

случае все последующие приближения совпадают с к-м. приближени­ ем. Такое совпадение и является критерием прекращения вычисле­ ний. Имеются достаточные основания полагать, что в широком классе задач сходимость происходит гораздо быстрее, чем за время, указанное в теореме п. 7.4, в частности в «регулярном случае» вычисления прекращаются на 1-м шаге после вычисления функции V\ (x, у, Т) (это в то же время является критерием «регулярности»).

7.7. Приведем модификацию метода последовательных прибли­ жений, изложенного выше.

В качестве начального

приближения

возьмем функцию

s (х, у, Т) = V\ (х, у, Т), где Vbs

(x, у, Т)

определена равенством

(7.1). Следующие приближения строим по правилу:

Укб+1 (х.у, Г)=тах

max

min

V% (<!;, r\, T-iS)

16[1:Л1

ijeCjJC)

{6CJW

 

при Т>5, где N=[TI5\, и У*,*1 (х, у, Т)= V\ {х, у, Т) при Т^8.

Для последовательности функций {Р* (х, у, Т)} так же, как и для

последовательности функций {К* (х, у, Г)}, справедливы утвержде­

ния теорем п. 7.3—7.5.

 

 

 

Доказательство этих утверждений для последовательности фун­

кций { Vf (x, у, Т)} почти дословно повторяет аналогичные рассуж­

дения для последовательности функций {Vks(x,

у, Г)}. Функци­

ональное уравнение для функции значения игры Гг (х, у,

Т) прини­

мает в области {(х, у, Т) \ Т> 8} вид

 

 

 

 

Vs(x, у, Г)=тах

max

min Vs (£, t\, T-

i8),

(7.7)

 

/e[l:A1

46C»(y)

(еС*(х)

 

 

 

где N=[T/8), а начальное условие остается прежним, т. е. имеет вид

(7.6).

 

 

 

 

 

 

 

 

7.8. Докажем эквивалентность уравнений (7.5) и (7.7).

 

Теорема. Уравнения (7.5)

и (7.7)

с начальным условием (7.6)

являются эквивалентными.

 

 

Vs (x, у,

Т) удовлетворяет

Доказательство. Пусть

функция

уравнению (7.5) и начальному условию (7.6). Покажем, что она

удовлетворяет уравнению (7.7) в области {(х, у,

7)\Т>8}.

 

Действительно, справедливы следующие соотношения:

 

Vs (х, у,Т)= max

min

Vs (£,»/,

T-S)=

 

 

= max

min

max

min

Vs (2f, rj, T—28)^

 

,6C«C)

{ec;w

чбС^ч)

?GC««)

 

 

 

276

^ max

max

 

min

min

Vs (5, rj, T—2S)--

,6C«r(y)

ЦеС'^ч)

(eC'r(x)

feCf (0

 

 

= max

min Vs (£, r\, T-28)^...

цеС»(у)

{6C»(x)

 

 

 

...>

max

 

min Vs (£, rj,

T—iS)^... .

 

, б С »

{6C«(x)

 

 

 

При i= 1 имеем

 

 

 

 

 

 

V, (x, y, T)= max

min

F, (5,»?, T-5),

поэтому справедливо равенство

 

 

 

Vs (x, у, 7)= max

max

min

Vs (<!;, ?/, T—iS),

 

ie[l:N\

r,eC'(y)

(eC»(x)

 

где N= [Т/8], что и доказывает требуемое утверждение.

Пусть теперь функция Vs(x, у, Т) в области {(х, у, Т)\Т>д}

удовлетворяет уравнению (7.7) и начальному условию (7.6). Пока­ жем, что она удовлетворяет также уравнению (7.5). Предположим противное. Тогда в области {(х, у, Т)\Т>8} должно иметь место неравенство

 

Vi (х, у, Т)>

max

 

min Vs (£,t], T-S).

 

 

 

 

 

чеС'М

 

ieC'tx)

 

 

Однако

 

 

 

 

 

 

 

 

 

 

 

 

max

 

min

Vs (£, rj, T—8) =

 

 

 

цбС'С)

 

(еСЧх)

 

 

 

 

= max

min

 

max

max

min

Vs (£, rj, T— (i+l)

8)^

tieC^iy)

feC^(x) tell-.N-l]

jeC'W

JeC^K)

 

 

> max

max

max

min

min

Vs (£, rj, T— (i+l)

8)=

4eC't(y)

ie[l:N-l]

jeCjfo)

(eC^x)

JeCj«)

 

 

= max

max

max

min

min

Vs (£, rj, T— (i+l)

8) =

W-.N-l]

цеС^С)

»бС;(ч)

feC^M

JsCjJtf)

 

 

= max

max

min

Vt

(<!;, r\, T-i8)= Vs (x, у, Т).

 

 

ie\l:N\

цеС*(у)

(eCur(x)

 

 

 

 

Полученное противоречие доказывает теорему.

277

§ 8. ПРИМЕРЫ РЕШЕНИЯ ДИФФЕРЕНЦИАЛЬНЫХ ИГР ПРЕСЛЕДОВАНИЯ

8.1. Пример 4. (Простое движение). Рассмотрим дифференци­ альную игру Г (jc0, уо, Т), в которой движение игроков Р а Е проис­ ходит в евклидовом пространстве tC согласно следующим уравне­ ниям:

дляР:х=а«(/), ||м(/)К1, х (0)=х0,

 

для Е:у = р\ (О, II* (OKI, у (0)=Уо,

(8.1)

где а, /? — константы а>/?>0, х, у, и, veR". Выигрыш игрока Е равен

Н(х(Т),у(Т))=\\х(Т)-у(Т)\\.

Пусть Г* (х, у,Т) — дискретная форма дифференциальной игры

Г (х, у, Т) с шагом разбиения д>0 и дискриминацией игрока Е. Игра ts (х, у, Т) протекает в N шагов, где N= Т/8. Согласно

результатам § 2 (см. пример п. 2.3) игра Г4 (х, у, 7) имеет значение

V, (х, у, 7,)=тах {0, \\x-y\\-NS(a-P)} = =тах{0,\\х-у\\-Т(а-Р)},

а оптимальное движение игроков происходит по прямой, соединя­ ющей начальные состояния х, у.

Согласно результатам § 3 значение исходной дифференциальной

игры

 

 

V(x, у, r)=lim Vs (х, у,

Г)=тах {0, \\х-у\\-Т(а-0)}.

(8.2)

«-•о

 

 

Можно убедиться, что

 

 

V(x,y, T)= max

min \\х'—у'\\=рт(х, у),

 

где Cl(y) = S (у, рТ) — шар в R" радиуса /?Г с центром в точке у, аналогично Cp(x) = S (х, <хТ). Тем самым согласно лемме п. 5.3 у игрока Е в игре Г 0, у0, Т) существует оптимальная программная

стратегия v* (t), te[0, Г], которая приводит траекторию игрока Ев точку y*eCl(Уо), для которой

Рт(х0, Уо)= min

\\x'-y*\\.

х'еСтг0)

 

278

Очевидно,

Уо-хо

При

Уо^Хо,

v* (j)=v*-< 1л>-*о1

 

 

v при

у00,

где v eR" — произвольный вектор такой, что ||v|| = 1. Из результатов § 6 следует, что в области

Д={(х.*7):||х-:у||-Г(а-/?)>0}, где существуют непрерывные частные производные

SV__.

3V__dV_

х-у

— --(fi-P),

Jx~ ~Jy-lx_yl>

функция V (х, у, Т) удовлетворяет уравнению (6.4):

dV

.

(dV \

(dV \

,„ „ч

- - a m i n

[-,u

-/?тах i—,v

=0.

(8.3)

В уравнении (8.3) минимум и максимум достигаются при управле­ ниях

 

 

 

dV

 

 

 

-

(

dV\

дх

у-х

;

(8.4)

и I х, — =

- =

 

 

\

дх)

3V\

ly-x\'

 

 

 

 

дх

 

 

 

 

 

 

dV

 

 

 

- (

5 Л _ ду _у~х

 

(8.5)

v

у' ~д~у)~~т~1у-х\\

 

 

ду

Стратегии (8.4), (8.5) являются оптимальными в дифференциаль­ ной игре (8.1). Стратегию ы (х, у), определяемую соотношением (8.4), называют «погонной стратегией», так как в каждый момент времени вектор скорости игрока Р при использовании этой страте­ гии нацелен на преследуемого игрока Е.

8.2. Пример 5. (Игра преследования при наличии сил трения).

Преследование происходит на плоскости. Уравнения движения име­ ют следующий вид:

для игрока Р:

/о £Л

p^au.-kpp,,

i = l , 2, ||ы||<1;

279

Соседние файлы в папке Теория игр