Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Габасов Р.Ф. Оптимизация линейных систем. Методы функционального анализа

.pdf
Скачиваний:
41
Добавлен:
24.10.2023
Размер:
11.36 Mб
Скачать

где u ( t ) — кусочно-непрерывные функции, в каждый момент по

модулю

не

превосходящие единицы | u(t)

| -< 1. Предположим,

что система

(8)

управляема, т. е. выполняется условие (1.4)

для всех

g,

Il g

II > 0: g'F (tlt t) b Ф 0, 0 < t <

tv

Чтобы доказать, что принцип максимума для данной задачи является не только необходимым* но и достаточным условием оптимальности, нужно, очевидно, показать, что из каждой начальной точки XQ л и ш ь одна экстремаль Понтрягина приводит траекторию в начало координат.

Как указано в § 1, для того чтобы существовало допусти­ мое управление, переводящее траекторию из Хо в начало коор­

динат

за время tu

необходимо и достаточно, чтобы

 

 

 

 

 

 

шах

 

0) х0 +

Г min

g'F (/ь t) bu dt j <

0.

(9)

 

 

 

 

llg |l = i(

 

 

 

J U K I

 

j

 

 

 

 

Как отмечается в § 1 гл. I, функция

F(t, т)

для обыкновен­

ных систем представима в виде F (t, т) =

F(t)F~l (т). Поэтому, вво­

дя

 

в

(9)

новую переменную f'=g'F(ti) и учитывая

(§2. IV),

что для зада*чи быстродействия вид нормы || g II

не

играет ни­

какой

роли,получаем

 

 

 

 

 

 

 

 

 

 

 

 

 

шах

Г Xо -

J

I ГF Ht) b I dt

 

 

 

 

 

 

 

Il f Я= 1

 

 

о

 

 

 

 

 

 

 

 

Допустим, что управление uV:(t), 0.<Д<Д[,

удовлетворяет

принципу максимума (§ 5 гл. II), т. е. найдется /*,

||/* Ц > 1,

такой, что функция

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и* (0 = — sign/*' F~'(t)b

 

 

(11)

переводит траекторию

x*(f)

в момент t = t* в начало

коорди­

нат

X* (f*) — 0.

 

 

 

 

 

 

 

 

управ­

 

 

Предположим, что существует другое допустимое

ление

«(/), О

 

такое, что

x(t1) = 0 , tt < t\ >причем уп­

равление

uit)

удовлетворяет

принципу

максимума,

т. е. и (t) =

=

— sign f

F~l (t) bt

где. / — вектор,

доставляющий

максимум

в

(10)

при

t =

Д

 

 

 

 

 

 

 

 

 

 

 

Так. как

x*(t\)= 0, то из формулы Коши

получим

 

 

 

 

 

 

 

 

 

*

 

 

 

 

 

 

 

 

 

 

 

 

 

h

 

 

 

 

 

 

 

 

 

О = ж* (f) = F (fx) х0+ j F (f)

F~l (t) bu* (t) dt

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

или

после

умножения

обеих

частей равенства

на

обратную

матрицу

F~[ (f*)

 

 

 

«

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

l\

 

 

 

 

 

 

 

 

 

 

 

О =

х0 ф

j

F~] (t) bu* (/) dt.

 

 

 

о

Умножим скалярно обе части на вектор f* и учтем свойство (11) управления u*(t):

*

 

 

 

 

 

h

f*'

ь

I dt.

 

 

 

 

о

Г - Ѵ ' У

I

(12)

 

 

 

 

 

O

 

 

 

 

 

 

Аналогично получим

 

 

 

 

 

 

 

 

 

 

О = f~'x0 — j

\ f'F ■' (t) b

I dt.

(13)

 

 

 

 

 

 

0

 

 

 

 

 

Сравнивая (12) и (13), заключаем, что

 

 

 

 

*

 

 

 

 

 

 

т,

 

 

 

f I

 

 

 

 

 

 

 

 

о

Г

F~4t)b

I

dt = f*' х0~

С і /*' F~'(t)b I d t -

*

*o

 

 

 

 

 

 

‘о

 

 

 

 

 

 

 

 

_

77

 

 

 

- j

I

/* ’

F- '(t)b I

df <

(f) ь

I dt—

 

/' x0 -

j I

 

и

 

*

 

 

 

 

 

О

 

 

 

 

 

 

 

 

 

 

*

 

 

 

 

 

*1

 

Jp-1(/) b I

dt——j

*1

 

dt,

 

-

j

I

/*'

\ f*'F -i (t) b \

 

 

u

 

 

 

 

F

 

 

 

откуда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f*'F-'(t)b = 0, /£[7,, fl.

 

(14)

В § 1 было показано, что функция f*' / 7-1(/) b удовлетворяет

линейному

дифференциальному уравнению. Следовательно,

из

условия (14)

вытекает, что

f*' F~l(t)b = 0, /£[0,^*].

 

Последнее соотношение противоречит предположению об

управляемости системы (8).

 

 

 

является

оптимальным,

Таким

образом, управление u*(t)

т. е. принцип максимума является и достаточным условием

в

данной задаче.

 

 

 

 

 

 

 

 

 

Ко м м е н т а р и и

§1. Критерий управляемости вида (12) есть в работе [9]. Аналогичное условие для нескольких входов имеется в работе [10]. Однако лишь Р. Калманом [11] был выяснен истинный смысл этого условия. Он же дал четкое

определение нового свойства динамических систем. В дальнейшем были пред­

ложены разнообразные методы доказательства

критериев

управляемости

[12—15]. Впервые явные критерии управляемости

для систем

с запаздыва­

нием доказаны в [16, 17]. Эти результаты потом

развивались в [18—22).

Для нестационарных систем полный результат известен в

аналитическом

случае [23, 24]. Ряд критериев управляемости нестационарных систем полу­ чен в работах [25, 26].

Мы ограничились лишь основными фактами и постарались объяснить основные идеи, на которых зиждется доказательство многих результатов теории управляемости. Для ознакомления с управляемостью нелинейных си­ стем можно рекомендовать работы [27—30]. Хотя интерес к управляемости

нелинейных систем большой, тео-рия пока не получила существенного .разви­ тия.

§ 2. Четкая постановка задачи наблюдаемости впервые дана Р. Калманом [11]. Им же установлен принцип дуальности. Теория наблюдаемости мо­

жет быть развита столь же полно, как и теория управляемости.

Для нели­

нейных систем теория наблюдаемости почти не разработана.

является, вообще

§ 3.

Теория

идентификации для

линейных систем не

говоря, линейной

за

исключением

рассмотренного

здесь

случая. Один

из

взглядов

на идентификацию нелинейных систем изложен в

работе

[31].

в

§ 4.

Теоремы

существования

оптимальных

управлений

имеются

[9, 32, 33]. Важный результат принадлежит Л. В. Нойштадту [3]. Для нели­

нейных систем этапными явились работы [314—37].

 

 

ния

§ 5.

Как следует из определения обобщенного оптимального управле­

(гл.

II), с темой предыдущего параграфа тесно связан вопрос о классах

функций,

на которых реализуются оптимальные управления. Кроме статьи

[4]

теме

настоящего параграфа посвящена работа

[38].

и в [39].

 

§ 6. Единственность оптимальных

управлений

доказывается

Предположения, имеющиеся в первых

работах с применением

L-проблѳмы,

обеспечивали единственность оптимальных управлений [33, 40]. Обсуждение этих предположений содержится в работе [4].

§ 7. Первая теорема о непрерывной зависимости решений задач опти­ мизации от параметров и начальных условий доказана в [40]. Для нелиней­

ных систем подобный результат имеется в

[41, 42].

максимума для линей­

§ 8. Общая теорема

о достаточности принципа

ных систем с фазовыми

ограничениями

доказана

А. Я. Дубовицким

и

А. А. Милютиным [43]. Для нелинейных

систем используются

метод прира­

щений [44], динамическое программирование [45] и

метод В.

Ф. Кротова

[46].

 

 

 

 

 

Л и т е р а т у р а 0987654321

1.

Г а н т м а х е р

Ф. Р. Теория матриц. М., Гостехиздат, 1953.

 

 

2.

V o g t

W. ü„

Си l i e

n C. G.

The minimum

number of

inputs regul-

red for

the complete

controllability e f

a

linear

stationary

dynamical

systems.

IEEE Trans. Automat. Control, AC-12, No 3, 1967.

controls in

the

absence

3.

N e u s t a d t

L. W.

The existence of optimal

of convexity conditions. J. Math. Anal, and Appl., 7,

No 1,

1963.

управления.

4.

Л а

С а л л ь

 

Д ж . П. Принцип оптимального релейного

Труды I Международного конгресса ИФАК по автомат, управл., 2. М„ Изд-во

АН СССР, 1961.

 

А. А.

Оптимальные процессы в системах

автоматиче­

5.

Ф е л ь д б а у м

ского регулирования. Автоматика и телемеханика, 14, № 5, 1953.

уравнения.

6.

П о н т р я г и н

Л. С.

Обыкновенные

дифференциальные

М., «Наука»,

1970.

 

 

 

 

 

Б. В. Методы теории функций

ком­

7. Л а в р е н т ь е в М. А., Ш а б а т

плексного переменного. М., «Наука», 1965.

вещественной переменной.

М.,

8.

Н а т а н с о н

 

И. П. Теория функций

Гостехиздат,

1957.

 

 

Р. В. Теория оптимальных по быстродействию

про­

9. Г а м к р е л и д з е

цессов

в

линейных

системах. Изв. АН

СССР,

сер. мат.,

22, №

4,

1968.

10.

of

 

La

S а 11 е J. Р. The time

optimal

control problem. Contributions to th

theory

nonlinear

Oscillations. V. Princeton,

 

1959

 

 

 

 

 

11. К а л м а я P. Е. Об общей теории систем управления. Труды I Меж­ дународного конгресса ИФАК по автомат, управл. М., Изд-во АН СССР,

1961.

12.

К р а с о в с к и й

H. Н. Теория управления движением. М.,

«Наука»,

1967.

К а л м а н

Р., Ф а л б

П., А р б и б

М. Очерки

по математической

13.

теории систем. М., «Мир», 1971.

 

управление,

теория

и

примене­

14.

А т а н с М., Ф а л б Л. Оптимальное

ние. М., «Энергия»,

1968.

 

 

of Optimal

Control

Theory, New

15. L e e Е. В.,

М а г k u s L. Foundations

York—London—Sydney,

1967.

 

 

 

 

 

16. К и р и л л о в а

Ф. M.,

Ч у р а к о в а С. В. К проблеме управляемости1

линейных систем с последействием. Дифферент уравнения, 3, 3,

1967.

17.

К и р и л л о в а

Ф. М.,

Ч у р а к о в а

С. В. Относительная

управляе­

мость линейных динамических систем с запаздыванием. ДАН СССР, 174, № 6, 1967.

18. Г а б а с о в Р., Ч у р а к о в а С. В. К теории управляемости линейных: систем с запаздыванием. Изв. АН СССР. Техническая кибернетика, № 4, 1969..

19. Ч у р а к о в а С. В. Об относительной управляемости линейных си­ стем с переменным и распределенным запаздыванием. Дифференц. уравне­ ния, 5, № 6, 1969.

20.

Г а б а с о в

Р.,

 

К и р и л л о в а

Ф. М.,

К р а х о т к о

В. В. Управляе­

мость многоконтурных систем с сосредоточенными параметрами.

Автомати­

ка и телемеханика, № Ш, 1971.

 

полной управляемости

линейных

систем

21.

М и н ю к

С. А. К теории

дифференциальных

уравнений

с запаздывающим

аргументом.

Дифференц.

уравнения, 7, № 7, 1971.

К р а х о т к о

В. В. Относительная управляемость ли­

22.

Г а б а с о в

Р.,

 

нейных

стационарных

систем

с отклоняющимся

аргументом

нейтрального

типа. Дифференц. уравнения, 6, № 8, 1970.

 

 

of controllability. IEEE Trans­

23.

C h a n g

A. An

algebraic characterization

actions

on Autom. Control, AC-10,

No

1,

1965.

 

Controllability

and

observa­

24.

S i l v e r m a n

L. M.,

M e a d o w s H. E.

bility on time-variable

linear Systems. SIAM J. Control, 5, No 2, 1967.

 

си­

25.

З а б е л л о

Л. E. Об управляемости линейных

нестационарных

стем. Вестник БГУ, сер. мат., физ., мех., № 3, 1971.

 

 

 

 

 

 

26. 3 а б ел л о Л. Е; К вопросу об управляемости линейных нестационар­

ных систем с интегрируемыми коэффициентами. Дифференц. уравнения,

8,

№ 12, 1972.

 

 

 

 

Н.

Н.

К

проблеме

существования

оптимальных,

27.

К р а с о в с к и й

управлений. Изв. вузов, математика, № 6, 1959.

 

 

 

 

 

Диффе­

28.

К а р а с е в

И. П. О существовании области достижимости.

ренц. уравнения, 3, № 12, 1967.

управляемости

динамических

систем. Диф­

29.

Г а б а с о в

Р. К

теории

ференц. уравнения, 4, № 9, 1968.

 

 

 

задачи

теории

управляемости. Диф­

30.

П е т р о в

Н. Н. Решение одной

ференц. уравнения, 5, № 5, 1969.

 

 

 

 

 

 

 

 

 

 

 

31.

Г а б а с о в

Р.,

К о п е й к и н а

Т. Б. К

теории

идентификации

ди­

намических систем. Дифференц. уравнения, 6, № 12, 1970.

 

 

 

 

32.

B e l l m a n

R.,

G l i c k s b e r g

I., G r o s s О. On

the

„bang-bang“

control

problem. Quart. Appl. Math., 14, No 1, 1956.

 

 

 

 

 

33.

К р а с о в с к и й

H. H. К теории оптимального

регулирования. Авто­

матика и телемеханика, 18, № 11, 1957.

 

 

 

 

 

 

 

 

 

34. Ф и л и п п о в

А. Ф. О некоторых вопросах теории оптимального

ре­

гулирования. Вестник МГУ, сер. мат., мех., астр., физ., хим., № 2, 1959.

 

35. R o x i n

Е. The

existence

of optimal controls. Michigan

Math. J., 9,

No 2, 1962.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

36.

Г а м к р е л и д з е

P. В. О скользящих

оптимальных режимах. ДАН

СССР,

143, № 6,

1962.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

37. C e s a r i

L. An

existence theorem in problems of optimal

control

SIAM J. Control. A3, No 1, 1965.

principle.

38. H a 1 к i n

H.

A generalization of Lasalle's , bang-bang“

SIAM J. Control, A3, No 2, 1965.

 

39. Г и н д е с

В. Б. Об особом управлении в оптимальных системах. Изв.

вузов, матем., № 7, 1967.

 

40. К и р и л л о в а

Ф. М. О корректности постановки одной задачи оп­

тимального регулирования. Изв. вузов, математика, № 4, 1958.

 

41. К и р и л л о в а

Ф. М. О непрерывной зависимости решения одной

задачи оптимального регулирования от начальных данных и параметров. Ус­

пехи мат. наук, 17,

вып. 4

(106),

1962.

control

problems. SIAM5J. Con­

42.

С u 11u m

J. Perturbations of optimal

trol, 4, No

4, 1966.

А. Я.,

М и л ю т и н

А. А.

Некоторые оптимальные

43.

Д

у б о в и ц к и й

задачи для линейных систем. Автоматика и телемеханика, 24, № 12, 1963.

44. Р о з о н о э р

Л. И. О достаточных

условиях

оптимальности. ДАН

СССР, 127, № 3, 1959.

 

В. Г. Математические методы

оптимального

управ­

45. Б о л т я н с к и й

ления. М„ «Наука», 1970.

Б у к р е е в

В. 3.,

Г у р м а н

В. И. Новые

методы

46. К р о т о в В.

Ф.,

вариационного

исчисления в динамике

полета. М., «Машиностроение», 1969.

Г л а в а

VII.

РАЗНЫЕ ЗАДАЧИ

 

 

Эти задачи можно рассматривать как упражнения повы­ шенной трудности по материалу гл. II—V.

§ 1. Минимизация среднеквадратичной ошибки

Пусть имеется система

л: =

A{t) X - i - В {t) и,

(1)

X = {xlt

и — {«j, . . . ,u r),tçT =

[*„Л].

Допустимыми управлениями, как обычно, назовем кусочно-не­ прерывные функции u(t), iÇ T , принимающие значения из огра­

ниченного выпуклого множества

U: u ( t ) £ U . Рассмотрим

те

допустимые управления, которые переводят траектории x(t)

си­

стемы (1) из точки Хо в точку Xi:

х (t0) = х0, х(0) = х1% Качество

каждого такого управления оценим величиной

 

г,

 

 

/(«) = | \х' (0 М (0 ж(0 + и' (0 N (Z) и (01 dt,

(2)

І

 

 

где M(t) > О, АД0 > 0, tÇT (M(t), N(t) — положительные мат­ рицы) .

Пусть требуется найти допустимое управление u°(t), при котором критерий (2) принимает минимальное значение. Для решения задачи введем множество

Q(S) = {х : X = а (0, х0, u{-)),u{t)ÇU, I (и) — 8}.

Непосредственно проверяется, что Q(S) при любых 8 —вы­ пуклое множество. В терминах этого множества исходная зада­ ча формулируется таким образом: найти минимальное 8°, при котором множество Q (8) содержит точку х\. Дело, как видим, свелось к отделимости двух выпуклых множеств Q(8) и точки х\.

Для решения задачи осталось применить метод, приведен­ ный в гл. II. Отличие данной задачи состоит в том, что нужноизбавиться от ограничения /(г Д < 8. Это можно сделать, восполь­ зовавшись рассуждениями § 1. V, или с помощью множителей Лагранжа [1, 2]. В остальном вычисления не отличаются прин­ ципиально от тех, что были проведены в гл. II—IV, поболее гро­ моздки.

§ 2. Задача быстродействия для системы с запаздыванием

Рассмотрим систему с запаздыванием:

 

 

 

 

X (f) = A (t) X (t) - j- А г (t) x(t — h) -[- B (t) и (t),

( 1)

 

 

? (/), t0— h < t < t0,

 

 

 

 

*o(0

x0,

 

 

 

 

x (^o)

 

 

X =

[xv .

u = {«!,-----ur},

tÇT = [/0, y ,

detß(0 VO, tÇTy

h > 0,

t{ не фиксировано. За множество U(-)

допустимых

уп­

равлений

возьмем совокупность

интегрируемых функций

u(t)

таких,

что

 

 

 

 

и

jV (ОN (0 и (і) dt < 1(N (t) > 0).

U

Пусть среди допустимых управлений требуется найти такое

u°(t),t ÇT, которое за минимальное время /'?—to—h переводит траекторию x(t) системы (1) в начало координат и удерживает

ее там в течение времени fr. х (t) = 0,

і°\ h ^ t < t\. Для

ре­

шения задачи введем множество

 

 

 

 

= f x : x

= x(t1,x0(-),u(-)),u(-)ÇUl(-)},

 

где

— множество допустимых

управлений, перево­

дящих траектории x(t)

в начало координат и удерживающих их

там.

Непосредственно

проверяется,

что Q(t\)— выпуклое

мно­

жество.

что исходная

задача

эквивалентна

сле­

 

Нетрудно видеть,

дующей: найти наименьшее число t°\, при котором выпуклое множество Q(t\) содержит начало координат х = 0. Последняя задача решается по схеме гл. II. Новый элемент состоит в том,

чтобы явно учесть множество U\ (•)• Эта трудность, как и в предыдущем параграфе, преодолевается с помощью введения множителя Лагранжа.

§ 3. Задача оптимизации при фазовых ограничениях

Пусть задана система:

 

X = A (t) X 4 -

b (и, t), tçT — [/„, /t],

X — {Х^, . . • >Xn\, Il

(Hj, • . • . Hf}, X(^Q) — XQ,

и класс допустимых управлений — множество кусочно-непрерыв­ ных функций u(t) со значениями из ограниченного множества U: u(t)£Ü,t£T. Требуется найти такое допустимое управление u°(t),

при котором критерий

/ (и) = ф (^)) достигает минимального

значения и выполняются условия

gt (х (у))

0, i =

— 1,

где <р(х), gi{x) — квазивыпуклые

функции;

тг-— заданные

мо­

менты t(, < т, < тг < ..

. <

 

 

 

Для решения поставленной задачи в п^-мерном пространст­

ве рассмотрим два множества:

 

 

 

Q = . [ z : z = { г J , . . .

== х (т ,- ,х 0, « (• )), и (0

€ ^ . г = 1 , . . . .

 

/?(3) = { г : г = {г2, . . . , zk\,gi{zi) < 0, ? Ы < 3}.

Ясно, что оба множества выпуклы. Исходная задача будет решена, если найти минимальное 8П, при котором множества Q и R (о) пересекаются. Применяя метод, данный в гл. II, отсюда нетрудно получить необходимые и достаточные условия опти­ мальности, принцип максимума, условие скачка на сопряжен­ ные переменные в точках у.

§ 4. Об оптимизации стохастических систем

 

Рассмотрим систему:

 

x =

A(t)x-j~b (и, 0 + / (0> ж(t0) = х0,

(1)

tÇT =

х = {хг .. .,х я}, и = {иѵ .. . ,и г),

 

в которой f ( t ) — случайная функция; Хо— случайный вектор. Выбирая кусочно-непрерывные функции и(і) со значениями

из ограниченного множества U («(/)£ U) и вычисляя решение уравнения (1) в момент t= tu получим случайный вектор х(Д).

Пусть требуется найти допустимое управление u°(t), вдоль

которого математическое ожидание І(и) — М ф (х(^)) (ф (

х ) —ква­

зивыпуклая

функция) минимально.

для не­

Запишем

решение x(t)

системы (1) в момент t = î\

которых реализаций f(t), х0:

 

 

X (Ij) = с

и

 

 

j / 7 (tv t) b (u (t), t) dt,

 

t 0

где

с = F ( t v tn) x 0 - f F ( t v t ) f ( t ) d t . t„

Введем два выпуклых множества:

R (ô) = {X : /ѴІ'-р (с I х)

8).

Минимальное число 8°, при котором эти множества пересекаются, и есть решение исходной задачи. Поэтому можно опять восполь­ зоваться теоремой об отделимости выпуклых множеств (гл. II). Теперь конечный результат будет состоять в решении некоторой игры двух участников, допустимые стратегии которых — n-мер­ ные векторы.

§ 5. Решение одной дифференциальной игры

Методы, разработанные в этой книге, можно применить для исследования некоторых дифференциальных игр. Под послед­ ними понимается специфическая задача оптимизации с участи­ ем не одной, как раньше, а двух и более сторон, интересы которых могут не совпадать- В отличие от теории игр, где рас­ сматривается статическая ситуация, в теории дифференциаль­ ных .игр исследуются динамические системы, поведение которых описывается дифференциальными уравнениями, что и опреде­ лило само название теории. В данном параграфе приводятся ре­ зультаты по одной из простейших дифференциальных игр.

I. Постановка задачи. Имеется два игрока Р и Е, поведение которых описывается уравнениями:

 

Р ’

at =Л 1 ^

х + Ь* (и«*)’ *(*о) = *о-

(1)

Е

: dt

А 2=(0у

■+ Ьг (V, t ) , y (t0) = у 0,

(2)

X = {*!, . .

у =

{Ѵі, . . . , у „ } , и = К , . . . , и г},ѵ = К .

... , ѵ9).

В распоряжении игрока Р — кусочно-непрерывные функции u(t), принимающие значения из ограниченного, замкнутого мно­ жества

и (/) Ç4Jс: Ег.

(3)

Аналогичными функциями u(t) со значениями в ограниченном, замкнутом множестве V,

v(t)£ V czE q,

(4)

может распоряжаться игрок Е.

Относительно информации, доступной игрокам, можно де­ лать различные предположения. Самое естественное предполо­ жение состоит в том, что оба игрока знают возможности друг друга (уравнения (1), (2) и ограничения (3), (4)) и, кроме того, могут в каждый момент замерять положения х и у, свое и про­ тивника. Для решения исследуемой ниже задачи при такой ин­ формированности решим сначала задачу при другом типе ин­ формации (см. п. 2).

Наконец, сформулируем цели игроков. Будем считать, что

игра продолжается

в течение

заданного отрезка времени

T = [ t 0, С]- Игрок Р

по доступной

информации стремится вы­

брать допустимое управление в течение игры так, чтобы в мо­ мент t = t\ расстояние до игрока Е

/(«, ѵ) = I! x(tx) y(tx) II

(5)

было минимальным. Цель у игрока

Е противоположная: он

стремится максимизировать величину (5).

Решим

2. Решение задачи программного

преследования.

для игрока Р вспомогательную задачу: найдем допустимое уп­ равление u°(t), t £Т, которое доставляет величине (5) мини­ мальное значение при наилучшем выборе игроком Е допусти­ мого управления v(t),t£T. Такая задача представляет для игро­ ка Р задачу предварительной оценки в момент t= t0 своих воз­ можностей в расчете на наихудший для себя вариант поведения игрока Е.

Если игрок Е на отрезке Т выбрал управление v(t), то луч­ ший ответ игрока Р на этот выбор получается просто, ибо ему

нужно

решить задачу терминального управления

 

/ (V), V) = min

II X (tj) у (tx) Il

 

иШ

 

вдоль

траекторий систем (1), (2). Решим эту задачу с исполь­

зованием теоремы о минимаксе

(п. 2, § 2. I I I ) :

/ (и (ѵ), ii)=min max g' [x ( tj —y (Z,)] = max [min g' x (tx) —g'y(<x)].

ueU II g II <1

II g II <1 ueU

Подставим сюда значения x(t\), y (tx), вычисленные с помощью формулы Коши:

X (h) =

Fx (tx, Q *0 + j

F! (tv

t) b, (u (t), i) dt,

 

U

 

 

У (ti) =

F * (*i, *0) Уо -I" j

F 2 (tv

0 b a (V (t), t ) d t.

 

to

 

 

В результате получим

 

 

I (и (V), v) — max

g' Fi (*i, h) *o +

(

mg' Fx*n (tu t) bx (u, t) dt -

H£ il <i

 

V иШ

— g' Fziti^o) Уо — ^ §r F2di j ) b2(v(t),t) dt . to

Для игрока Р потенциально наихудшим ответом со стороны игрока Е являются такие управления v°(t), t£T, что

I (и (ѵ°), ѵ°) = max I {и {v), v).

veV

Найти управление u°(t) и оценить тем самым наихудшее возможное положение в момент t ~ t \ игрока Р не представляет серьезной задачи. При том соглашении об информированности, которое мы приняли, минимальное расстояние в момент t — tx между игроками при наилучшем выборе игрока Р равно

1° = I (и (ѵ°), ѵ°) = max max g'я 1(*i. g *o—g' (fi, g Уо +

иеГ Hg II <1

= max

gr Fi (h, g xog'Fi {tu g Уо + H n g '/ 7! {tu t) bx {u,t)dt

il gil <i

y ueU

(6)

Этот результат достигается на управлениях u°{t) = u{v°{t)), удовлетворяющих условиям:

g0' Ei{tut)bi{u°{t),t)=ming0' F, {tu t)bt (u,t),

ueU

g°’

=

F2{tut)b2{v,t),

 

 

veV

где g0 — вектор,

доставляющий максимум в правой части ра­

венства (6).

 

 

3. Построение стратегий. Применять полученные управле­ ния для игры в реальных условиях можно в том исключитель­ ном случае, когда игроку Р известно управление игрока Е на отрезке Т. В этом случае игры как процесса нет. Игроки могут заранее сообщить свои управления. В действительности, как правило, игроки не знают об управлениях противников в буду­ щем и могут строить свое поведение лишь по измерениям своих и чужих траекторий до текущего момента.

Однако это не значит, что вычисления, сделанные в преды­ дущем пункте, бесполезны при решении дифференциальных игр в реальных ситуациях. Интуитивно можно ожидать, что управ­ ление u°(t) игрока Р, построенное с расчетом на наихудший слу­

Соседние файлы в папке книги из ГПНТБ