книги из ГПНТБ / Габасов Р.Ф. Оптимизация линейных систем. Методы функционального анализа
.pdfгде u ( t ) — кусочно-непрерывные функции, в каждый момент по
модулю |
не |
превосходящие единицы | u(t) |
| -< 1. Предположим, |
|
что система |
(8) |
управляема, т. е. выполняется условие (1.4) |
||
для всех |
g, |
Il g |
II > 0: g'F (tlt t) b Ф 0, 0 < t < |
tv |
Чтобы доказать, что принцип максимума для данной задачи является не только необходимым* но и достаточным условием оптимальности, нужно, очевидно, показать, что из каждой начальной точки XQ л и ш ь одна экстремаль Понтрягина приводит траекторию в начало координат.
Как указано в § 1, для того чтобы существовало допусти мое управление, переводящее траекторию из Хо в начало коор
динат |
за время tu |
необходимо и достаточно, чтобы |
|
|
||||||||||
|
|
|
|
шах |
|
0) х0 + |
Г min |
g'F (/ь t) bu dt j < |
0. |
(9) |
||||
|
|
|
|
llg |l = i( |
|
|
|
„J U K I |
|
j |
|
|
||
|
|
Как отмечается в § 1 гл. I, функция |
F(t, т) |
для обыкновен |
||||||||||
ных систем представима в виде F (t, т) = |
F(t)F~l (т). Поэтому, вво |
|||||||||||||
дя |
|
в |
(9) |
новую переменную f'=g'F(ti) и учитывая |
(§2. IV), |
|||||||||
что для зада*чи быстродействия вид нормы || g II |
не |
играет ни |
||||||||||||
какой |
роли,получаем |
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
шах |
Г Xо - |
J |
I ГF Ht) b I dt |
|
|
|
|||
|
|
|
|
Il f Я= 1 |
|
|
о |
|
|
|
|
|
|
|
|
|
Допустим, что управление uV:(t), 0.<Д<Д[, |
удовлетворяет |
|||||||||||
принципу максимума (§ 5 гл. II), т. е. найдется /*, |
||/* Ц > 1, |
|||||||||||||
такой, что функция |
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
и* (0 = — sign/*' F~'(t)b |
|
|
(11) |
||||||
переводит траекторию |
x*(f) |
в момент t = t* в начало |
коорди |
|||||||||||
нат |
X* (f*) — 0. |
|
|
|
|
|
|
|
|
управ |
||||
|
|
Предположим, что существует другое допустимое |
||||||||||||
ление |
«(/), О |
|
такое, что |
x(t1) = 0 , tt < t\ >причем уп |
||||||||||
равление |
uit) |
удовлетворяет |
принципу |
максимума, |
т. е. и (t) = |
|||||||||
= |
— sign f |
F~l (t) bt |
где. / — вектор, |
доставляющий |
максимум |
|||||||||
в |
(10) |
при |
t = |
Д |
|
|
|
|
|
|
|
|
|
|
|
|
Так. как |
x*(t\)= 0, то из формулы Коши |
получим |
||||||||||
|
|
|
|
|
|
|
|
|
* |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
h |
|
|
|
|
|
|
|
|
|
О = ж* (f) = F (fx) х0+ j F (f) |
F~l (t) bu* (t) dt |
|
||||||||
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
или |
после |
умножения |
обеих |
частей равенства |
на |
обратную |
||||||||
матрицу |
F~[ (f*) |
|
|
|
« |
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
l\ |
|
|
|
|
|
|
|
|
|
|
|
О = |
х0 ф |
j |
F~] (t) bu* (/) dt. |
|
|
|
||
о
Умножим скалярно обе части на вектор f* и учтем свойство (11) управления u*(t):
*
|
|
|
|
|
h |
f*' |
(о ь |
I dt. |
|
|
|
|
|
о |
Г - Ѵ ' У |
I |
(12) |
||||||
|
|
|
|
|
O |
|
|
|
|
|
|
Аналогично получим |
|
|
|
|
|
|
|
||||
|
|
|
О = f~'x0 — j |
\ f'F ■' (t) b |
I dt. |
(13) |
|||||
|
|
|
|
|
|
0 |
|
|
|
|
|
Сравнивая (12) и (13), заключаем, что |
|
|
|||||||||
|
|
* |
|
|
|
|
|
|
т, |
|
|
|
f I |
|
|
|
|
|
|
|
|
||
о |
Г |
F~4t)b |
I |
dt = f*' х0~ |
С і /*' F~'(t)b I d t - |
||||||
* |
*o |
|
|
|
|
|
|
‘о |
|
|
|
|
|
|
|
|
|
_ |
77 |
|
|
|
|
- j |
I |
/* ’ |
F- '(t)b I |
df < |
(f) ь |
I dt— |
|
||||
/' x0 - |
j I |
|
|||||||||
и |
|
* |
|
|
|
|
|
О |
|
|
|
|
|
|
|
|
|
|
* |
|
|
|
|
|
|
*1 |
|
Jp-1(/) b I |
dt——j |
*1 |
|
dt, |
|
||
- |
j |
I |
/*' |
\ f*'F -i (t) b \ |
|
||||||
|
u |
|
|
|
|
F |
|
|
|
||
откуда |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
f*'F-'(t)b = 0, /£[7,, fl. |
|
(14) |
|||||
В § 1 было показано, что функция f*' / 7-1(/) b удовлетворяет |
|||||||||||
линейному |
дифференциальному уравнению. Следовательно, |
из |
|||||||||
условия (14) |
вытекает, что |
f*' F~l(t)b = 0, /£[0,^*]. |
|
||||||||
Последнее соотношение противоречит предположению об |
|||||||||||
управляемости системы (8). |
|
|
|
является |
оптимальным, |
||||||
Таким |
образом, управление u*(t) |
||||||||||
т. е. принцип максимума является и достаточным условием |
в |
||||||||||
данной задаче. |
|
|
|
|
|
|
|
|
|
||
Ко м м е н т а р и и
§1. Критерий управляемости вида (12) есть в работе [9]. Аналогичное условие для нескольких входов имеется в работе [10]. Однако лишь Р. Калманом [11] был выяснен истинный смысл этого условия. Он же дал четкое
определение нового свойства динамических систем. В дальнейшем были пред
ложены разнообразные методы доказательства |
критериев |
управляемости |
[12—15]. Впервые явные критерии управляемости |
для систем |
с запаздыва |
нием доказаны в [16, 17]. Эти результаты потом |
развивались в [18—22). |
|
Для нестационарных систем полный результат известен в |
аналитическом |
|
случае [23, 24]. Ряд критериев управляемости нестационарных систем полу чен в работах [25, 26].
Мы ограничились лишь основными фактами и постарались объяснить основные идеи, на которых зиждется доказательство многих результатов теории управляемости. Для ознакомления с управляемостью нелинейных си стем можно рекомендовать работы [27—30]. Хотя интерес к управляемости
нелинейных систем большой, тео-рия пока не получила существенного .разви тия.
§ 2. Четкая постановка задачи наблюдаемости впервые дана Р. Калманом [11]. Им же установлен принцип дуальности. Теория наблюдаемости мо
жет быть развита столь же полно, как и теория управляемости. |
Для нели |
|||||||
нейных систем теория наблюдаемости почти не разработана. |
является, вообще |
|||||||
§ 3. |
Теория |
идентификации для |
линейных систем не |
|||||
говоря, линейной |
за |
исключением |
рассмотренного |
здесь |
случая. Один |
из |
||
взглядов |
на идентификацию нелинейных систем изложен в |
работе |
[31]. |
в |
||||
§ 4. |
Теоремы |
существования |
оптимальных |
управлений |
имеются |
|||
[9, 32, 33]. Важный результат принадлежит Л. В. Нойштадту [3]. Для нели
нейных систем этапными явились работы [314—37]. |
|
|
|||
ния |
§ 5. |
Как следует из определения обобщенного оптимального управле |
|||
(гл. |
II), с темой предыдущего параграфа тесно связан вопрос о классах |
||||
функций, |
на которых реализуются оптимальные управления. Кроме статьи |
||||
[4] |
теме |
настоящего параграфа посвящена работа |
[38]. |
и в [39]. |
|
|
§ 6. Единственность оптимальных |
управлений |
доказывается |
||
Предположения, имеющиеся в первых |
работах с применением |
L-проблѳмы, |
|||
обеспечивали единственность оптимальных управлений [33, 40]. Обсуждение этих предположений содержится в работе [4].
§ 7. Первая теорема о непрерывной зависимости решений задач опти мизации от параметров и начальных условий доказана в [40]. Для нелиней
ных систем подобный результат имеется в |
[41, 42]. |
максимума для линей |
|||
§ 8. Общая теорема |
о достаточности принципа |
||||
ных систем с фазовыми |
ограничениями |
доказана |
А. Я. Дубовицким |
и |
|
А. А. Милютиным [43]. Для нелинейных |
систем используются |
метод прира |
|||
щений [44], динамическое программирование [45] и |
метод В. |
Ф. Кротова |
|||
[46]. |
|
|
|
|
|
Л и т е р а т у р а 0987654321
1. |
Г а н т м а х е р |
Ф. Р. Теория матриц. М., Гостехиздат, 1953. |
|
|
|||||||||||||
2. |
V o g t |
W. ü„ |
Си l i e |
n C. G. |
The minimum |
number of |
inputs regul- |
||||||||||
red for |
the complete |
controllability e f |
a |
linear |
stationary |
dynamical |
systems. |
||||||||||
IEEE Trans. Automat. Control, AC-12, No 3, 1967. |
controls in |
the |
absence |
||||||||||||||
3. |
N e u s t a d t |
L. W. |
The existence of optimal |
||||||||||||||
of convexity conditions. J. Math. Anal, and Appl., 7, |
No 1, |
1963. |
управления. |
||||||||||||||
4. |
Л а |
С а л л ь |
|
Д ж . П. Принцип оптимального релейного |
|||||||||||||
Труды I Международного конгресса ИФАК по автомат, управл., 2. М„ Изд-во |
|||||||||||||||||
АН СССР, 1961. |
|
А. А. |
Оптимальные процессы в системах |
автоматиче |
|||||||||||||
5. |
Ф е л ь д б а у м |
||||||||||||||||
ского регулирования. Автоматика и телемеханика, 14, № 5, 1953. |
уравнения. |
||||||||||||||||
6. |
П о н т р я г и н |
Л. С. |
Обыкновенные |
дифференциальные |
|||||||||||||
М., «Наука», |
1970. |
|
|
|
|
|
Б. В. Методы теории функций |
ком |
|||||||||
7. Л а в р е н т ь е в М. А., Ш а б а т |
|||||||||||||||||
плексного переменного. М., «Наука», 1965. |
вещественной переменной. |
М., |
|||||||||||||||
8. |
Н а т а н с о н |
|
И. П. Теория функций |
||||||||||||||
Гостехиздат, |
1957. |
|
|
Р. В. Теория оптимальных по быстродействию |
про |
||||||||||||
9. Г а м к р е л и д з е |
|||||||||||||||||
цессов |
в |
линейных |
системах. Изв. АН |
СССР, |
сер. мат., |
22, № |
4, |
1968. |
|||||||||
10. |
of |
|
La |
S а 11 е J. Р. The time |
optimal |
control problem. Contributions to th |
|||||||||||
theory |
nonlinear |
Oscillations. V. Princeton, |
|
1959 |
|
|
|
|
|
||||||||
11. К а л м а я P. Е. Об общей теории систем управления. Труды I Меж дународного конгресса ИФАК по автомат, управл. М., Изд-во АН СССР,
1961.
12. |
К р а с о в с к и й |
H. Н. Теория управления движением. М., |
«Наука», |
|||||
1967. |
К а л м а н |
Р., Ф а л б |
П., А р б и б |
М. Очерки |
по математической |
|||
13. |
||||||||
теории систем. М., «Мир», 1971. |
|
управление, |
теория |
и |
примене |
|||
14. |
А т а н с М., Ф а л б Л. Оптимальное |
|||||||
ние. М., «Энергия», |
1968. |
|
|
of Optimal |
Control |
Theory, New |
||
15. L e e Е. В., |
М а г k u s L. Foundations |
|||||||
York—London—Sydney, |
1967. |
|
|
|
|
|
||
16. К и р и л л о в а |
Ф. M., |
Ч у р а к о в а С. В. К проблеме управляемости1 |
||||||
линейных систем с последействием. Дифферент уравнения, 3, № 3, |
1967. |
|||||||
17. |
К и р и л л о в а |
Ф. М., |
Ч у р а к о в а |
С. В. Относительная |
управляе |
|||
мость линейных динамических систем с запаздыванием. ДАН СССР, 174, № 6, 1967.
18. Г а б а с о в Р., Ч у р а к о в а С. В. К теории управляемости линейных: систем с запаздыванием. Изв. АН СССР. Техническая кибернетика, № 4, 1969..
19. Ч у р а к о в а С. В. Об относительной управляемости линейных си стем с переменным и распределенным запаздыванием. Дифференц. уравне ния, 5, № 6, 1969.
20. |
Г а б а с о в |
Р., |
|
К и р и л л о в а |
Ф. М., |
К р а х о т к о |
В. В. Управляе |
|||||||||||
мость многоконтурных систем с сосредоточенными параметрами. |
Автомати |
|||||||||||||||||
ка и телемеханика, № Ш, 1971. |
|
полной управляемости |
линейных |
систем |
||||||||||||||
21. |
М и н ю к |
С. А. К теории |
||||||||||||||||
дифференциальных |
уравнений |
с запаздывающим |
аргументом. |
Дифференц. |
||||||||||||||
уравнения, 7, № 7, 1971. |
К р а х о т к о |
В. В. Относительная управляемость ли |
||||||||||||||||
22. |
Г а б а с о в |
Р., |
|
|||||||||||||||
нейных |
стационарных |
систем |
с отклоняющимся |
аргументом |
нейтрального |
|||||||||||||
типа. Дифференц. уравнения, 6, № 8, 1970. |
|
|
of controllability. IEEE Trans |
|||||||||||||||
23. |
C h a n g |
A. An |
algebraic characterization |
|||||||||||||||
actions |
on Autom. Control, AC-10, |
No |
1, |
1965. |
|
Controllability |
and |
observa |
||||||||||
24. |
S i l v e r m a n |
L. M., |
M e a d o w s H. E. |
|||||||||||||||
bility on time-variable |
linear Systems. SIAM J. Control, 5, No 2, 1967. |
|
си |
|||||||||||||||
25. |
З а б е л л о |
Л. E. Об управляемости линейных |
нестационарных |
|||||||||||||||
стем. Вестник БГУ, сер. мат., физ., мех., № 3, 1971. |
|
|
|
|
|
|
||||||||||||
26. 3 а б ел л о Л. Е; К вопросу об управляемости линейных нестационар |
||||||||||||||||||
ных систем с интегрируемыми коэффициентами. Дифференц. уравнения, |
8, |
|||||||||||||||||
№ 12, 1972. |
|
|
|
|
Н. |
Н. |
К |
проблеме |
существования |
оптимальных, |
||||||||
27. |
К р а с о в с к и й |
|||||||||||||||||
управлений. Изв. вузов, математика, № 6, 1959. |
|
|
|
|
|
Диффе |
||||||||||||
28. |
К а р а с е в |
И. П. О существовании области достижимости. |
||||||||||||||||
ренц. уравнения, 3, № 12, 1967. |
управляемости |
динамических |
систем. Диф |
|||||||||||||||
29. |
Г а б а с о в |
Р. К |
теории |
|||||||||||||||
ференц. уравнения, 4, № 9, 1968. |
|
|
|
задачи |
теории |
управляемости. Диф |
||||||||||||
30. |
П е т р о в |
Н. Н. Решение одной |
||||||||||||||||
ференц. уравнения, 5, № 5, 1969. |
|
|
|
|
|
|
|
|
|
|
|
|||||||
31. |
Г а б а с о в |
Р., |
К о п е й к и н а |
Т. Б. К |
теории |
идентификации |
ди |
|||||||||||
намических систем. Дифференц. уравнения, 6, № 12, 1970. |
|
|
|
|
||||||||||||||
32. |
B e l l m a n |
R., |
G l i c k s b e r g |
I., G r o s s О. On |
the |
„bang-bang“ |
||||||||||||
control |
problem. Quart. Appl. Math., 14, No 1, 1956. |
|
|
|
|
|
||||||||||||
33. |
К р а с о в с к и й |
H. H. К теории оптимального |
регулирования. Авто |
|||||||||||||||
матика и телемеханика, 18, № 11, 1957. |
|
|
|
|
|
|
|
|
|
|||||||||
34. Ф и л и п п о в |
А. Ф. О некоторых вопросах теории оптимального |
ре |
||||||||||||||||
гулирования. Вестник МГУ, сер. мат., мех., астр., физ., хим., № 2, 1959. |
|
|||||||||||||||||
35. R o x i n |
Е. The |
existence |
of optimal controls. Michigan |
Math. J., 9, |
||||||||||||||
No 2, 1962. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
36. |
Г а м к р е л и д з е |
P. В. О скользящих |
оптимальных режимах. ДАН |
|||||||||||||||
СССР, |
143, № 6, |
1962. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
37. C e s a r i |
L. An |
existence theorem in problems of optimal |
control |
SIAM J. Control. A3, No 1, 1965. |
principle. |
||
38. H a 1 к i n |
H. |
A generalization of Lasalle's , bang-bang“ |
|
SIAM J. Control, A3, No 2, 1965. |
|
||
39. Г и н д е с |
В. Б. Об особом управлении в оптимальных системах. Изв. |
||
вузов, матем., № 7, 1967. |
|
||
40. К и р и л л о в а |
Ф. М. О корректности постановки одной задачи оп |
||
тимального регулирования. Изв. вузов, математика, № 4, 1958. |
|
||
41. К и р и л л о в а |
Ф. М. О непрерывной зависимости решения одной |
||
задачи оптимального регулирования от начальных данных и параметров. Ус
пехи мат. наук, 17, |
вып. 4 |
(106), |
1962. |
control |
problems. SIAM5J. Con |
||
42. |
С u 11u m |
J. Perturbations of optimal |
|||||
trol, 4, No |
4, 1966. |
А. Я., |
М и л ю т и н |
А. А. |
Некоторые оптимальные |
||
43. |
Д |
у б о в и ц к и й |
|||||
задачи для линейных систем. Автоматика и телемеханика, 24, № 12, 1963.
44. Р о з о н о э р |
Л. И. О достаточных |
условиях |
оптимальности. ДАН |
||||
СССР, 127, № 3, 1959. |
|
В. Г. Математические методы |
оптимального |
управ |
|||
45. Б о л т я н с к и й |
|||||||
ления. М„ «Наука», 1970. |
Б у к р е е в |
В. 3., |
Г у р м а н |
В. И. Новые |
методы |
||
46. К р о т о в В. |
Ф., |
||||||
вариационного |
исчисления в динамике |
полета. М., «Машиностроение», 1969. |
|||||
Г л а в а |
VII. |
РАЗНЫЕ ЗАДАЧИ |
|
|
|||
Эти задачи можно рассматривать как упражнения повы шенной трудности по материалу гл. II—V.
§ 1. Минимизация среднеквадратичной ошибки
Пусть имеется система
л: = |
A{t) X - i - В {t) и, |
(1) |
X = {xlt |
и — {«j, . . . ,u r),tçT = |
[*„Л]. |
Допустимыми управлениями, как обычно, назовем кусочно-не прерывные функции u(t), iÇ T , принимающие значения из огра
ниченного выпуклого множества |
U: u ( t ) £ U . Рассмотрим |
те |
допустимые управления, которые переводят траектории x(t) |
си |
|
стемы (1) из точки Хо в точку Xi: |
х (t0) = х0, х(0) = х1% Качество |
|
каждого такого управления оценим величиной |
|
|
г, |
|
|
/(«) = | \х' (0 М (0 ж(0 + и' (0 N (Z) и (01 dt, |
(2) |
|
І |
|
|
где M(t) > О, АД0 > 0, tÇT (M(t), N(t) — положительные мат рицы) .
Пусть требуется найти допустимое управление u°(t), при котором критерий (2) принимает минимальное значение. Для решения задачи введем множество
Q(S) = {х : X = а (0, х0, u{-)),u{t)ÇU, I (и) — 8}.
Непосредственно проверяется, что Q(S) при любых 8 —вы пуклое множество. В терминах этого множества исходная зада ча формулируется таким образом: найти минимальное 8°, при котором множество Q (8) содержит точку х\. Дело, как видим, свелось к отделимости двух выпуклых множеств Q(8) и точки х\.
Для решения задачи осталось применить метод, приведен ный в гл. II. Отличие данной задачи состоит в том, что нужноизбавиться от ограничения /(г Д < 8. Это можно сделать, восполь зовавшись рассуждениями § 1. V, или с помощью множителей Лагранжа [1, 2]. В остальном вычисления не отличаются прин ципиально от тех, что были проведены в гл. II—IV, поболее гро моздки.
§ 2. Задача быстродействия для системы с запаздыванием
Рассмотрим систему с запаздыванием: |
|
|
|||
|
|
X (f) = A (t) X (t) - j- А г (t) x(t — h) -[- B (t) и (t), |
( 1) |
||
|
|
? (/), t0— h < t < t0, |
|
|
|
|
|
*o(0 |
x0, |
|
|
|
|
x (^o) |
|
|
|
X = |
[xv . |
u = {«!,-----ur}, |
tÇT = [/0, y , |
detß(0 VO, tÇTy |
|
h > 0, |
t{ не фиксировано. За множество U(-) |
допустимых |
уп |
||
равлений |
возьмем совокупность |
интегрируемых функций |
u(t) |
||
таких, |
что |
|
|
|
|
и
jV (ОN (0 и (і) dt < 1(N (t) > 0).
U
Пусть среди допустимых управлений требуется найти такое
u°(t),t ÇT, которое за минимальное время /'?—to—h переводит траекторию x(t) системы (1) в начало координат и удерживает
ее там в течение времени fr. х (t) = 0, |
і°\ — h ^ t < t\. Для |
ре |
|||
шения задачи введем множество |
|
|
|
||
|
= f x : x |
= x(t1,x0(-),u(-)),u(-)ÇUl(-)}, |
|
||
где |
— множество допустимых |
управлений, перево |
|||
дящих траектории x(t) |
в начало координат и удерживающих их |
||||
там. |
Непосредственно |
проверяется, |
что Q(t\)— выпуклое |
мно |
|
жество. |
что исходная |
задача |
эквивалентна |
сле |
|
|
Нетрудно видеть, |
||||
дующей: найти наименьшее число t°\, при котором выпуклое множество Q(t\) содержит начало координат х = 0. Последняя задача решается по схеме гл. II. Новый элемент состоит в том,
чтобы явно учесть множество U\ (•)• Эта трудность, как и в предыдущем параграфе, преодолевается с помощью введения множителя Лагранжа.
§ 3. Задача оптимизации при фазовых ограничениях
Пусть задана система: |
|
X = A (t) X 4 - |
b (и, t), tçT — [/„, /t], |
X — {Х^, . . • >Xn\, Il |
(Hj, • . • . Hf}, X(^Q) — XQ, |
и класс допустимых управлений — множество кусочно-непрерыв ных функций u(t) со значениями из ограниченного множества U: u(t)£Ü,t£T. Требуется найти такое допустимое управление u°(t),
при котором критерий |
/ (и) = ф (х (^)) достигает минимального |
|||
значения и выполняются условия |
gt (х (у)) |
0, i = |
— 1, |
|
где <р(х), gi{x) — квазивыпуклые |
функции; |
тг-— заданные |
мо |
|
менты t(, < т, < тг < .. |
. < |
|
|
|
Для решения поставленной задачи в п^-мерном пространст |
||||
ве рассмотрим два множества: |
|
|
|
|
Q = . [ z : z = { г J , . . . |
== х (т ,- ,х 0, « (• )), и (0 |
€ ^ . г = 1 , . . . . |
|
|
/?(3) = { г : г = {г2, . . . , zk\,gi{zi) < 0, ? Ы < 3}.
Ясно, что оба множества выпуклы. Исходная задача будет решена, если найти минимальное 8П, при котором множества Q и R (о) пересекаются. Применяя метод, данный в гл. II, отсюда нетрудно получить необходимые и достаточные условия опти мальности, принцип максимума, условие скачка на сопряжен ные переменные в точках у.
§ 4. Об оптимизации стохастических систем |
|
|
Рассмотрим систему: |
|
|
x = |
A(t)x-j~b (и, 0 + / (0> ж(t0) = х0, |
(1) |
tÇT = |
х = {хг .. .,х я}, и = {иѵ .. . ,и г), |
|
в которой f ( t ) — случайная функция; Хо— случайный вектор. Выбирая кусочно-непрерывные функции и(і) со значениями
из ограниченного множества U («(/)£ U) и вычисляя решение уравнения (1) в момент t= tu получим случайный вектор х(Д).
Пусть требуется найти допустимое управление u°(t), вдоль
которого математическое ожидание І(и) — М ф (х(^)) (ф ( |
х ) —ква |
||
зивыпуклая |
функция) минимально. |
для не |
|
Запишем |
решение x(t) |
системы (1) в момент t = î\ |
|
которых реализаций f(t), х0: |
|
||
|
X (Ij) = с |
и |
|
|
j / 7 (tv t) b (u (t), t) dt, |
|
|
t 0
где
с = F ( t v tn) x 0 - f F ( t v t ) f ( t ) d t . t„
Введем два выпуклых множества:
R (ô) = {X : /ѴІ'-р (с I х) |
8). |
Минимальное число 8°, при котором эти множества пересекаются, и есть решение исходной задачи. Поэтому можно опять восполь зоваться теоремой об отделимости выпуклых множеств (гл. II). Теперь конечный результат будет состоять в решении некоторой игры двух участников, допустимые стратегии которых — n-мер ные векторы.
§ 5. Решение одной дифференциальной игры
Методы, разработанные в этой книге, можно применить для исследования некоторых дифференциальных игр. Под послед ними понимается специфическая задача оптимизации с участи ем не одной, как раньше, а двух и более сторон, интересы которых могут не совпадать- В отличие от теории игр, где рас сматривается статическая ситуация, в теории дифференциаль ных .игр исследуются динамические системы, поведение которых описывается дифференциальными уравнениями, что и опреде лило само название теории. В данном параграфе приводятся ре зультаты по одной из простейших дифференциальных игр.
I. Постановка задачи. Имеется два игрока Р и Е, поведение которых описывается уравнениями:
|
Р ’ |
at =Л 1 ^ |
х + Ь* (и«*)’ *(*о) = *о- |
(1) |
Е |
: dt |
А 2=(0у |
■+ Ьг (V, t ) , y (t0) = у 0, |
(2) |
X = {*!, . . |
у = |
{Ѵі, . . . , у „ } , и = К , . . . , и г},ѵ = К . |
... , ѵ9). |
|
В распоряжении игрока Р — кусочно-непрерывные функции u(t), принимающие значения из ограниченного, замкнутого мно жества
и (/) Ç4Jс: Ег. |
(3) |
Аналогичными функциями u(t) со значениями в ограниченном, замкнутом множестве V,
v(t)£ V czE q, |
(4) |
может распоряжаться игрок Е.
Относительно информации, доступной игрокам, можно де лать различные предположения. Самое естественное предполо жение состоит в том, что оба игрока знают возможности друг друга (уравнения (1), (2) и ограничения (3), (4)) и, кроме того, могут в каждый момент замерять положения х и у, свое и про тивника. Для решения исследуемой ниже задачи при такой ин формированности решим сначала задачу при другом типе ин формации (см. п. 2).
Наконец, сформулируем цели игроков. Будем считать, что
игра продолжается |
в течение |
заданного отрезка времени |
T = [ t 0, С]- Игрок Р |
по доступной |
информации стремится вы |
брать допустимое управление в течение игры так, чтобы в мо мент t = t\ расстояние до игрока Е
/(«, ѵ) = I! x(tx) — y(tx) II |
(5) |
|
было минимальным. Цель у игрока |
Е противоположная: он |
|
стремится максимизировать величину (5). |
Решим |
|
2. Решение задачи программного |
преследования. |
|
для игрока Р вспомогательную задачу: найдем допустимое уп равление u°(t), t £Т, которое доставляет величине (5) мини мальное значение при наилучшем выборе игроком Е допусти мого управления v(t),t£T. Такая задача представляет для игро ка Р задачу предварительной оценки в момент t= t0 своих воз можностей в расчете на наихудший для себя вариант поведения игрока Е.
Если игрок Е на отрезке Т выбрал управление v(t), то луч ший ответ игрока Р на этот выбор получается просто, ибо ему
нужно |
решить задачу терминального управления |
|
|
/ (и (V), V) = min |
II X (tj) — у (tx) Il |
|
иШ |
|
вдоль |
траекторий систем (1), (2). Решим эту задачу с исполь |
|
зованием теоремы о минимаксе |
(п. 2, § 2. I I I ) : |
|
/ (и (ѵ), ii)=min max g' [x ( tj —y (Z,)] = max [min g' x (tx) —g'y(<x)].
ueU II g II <1 |
II g II <1 ueU |
Подставим сюда значения x(t\), y (tx), вычисленные с помощью формулы Коши:
X (h) = |
Fx (tx, Q *0 + j |
F! (tv |
t) b, (u (t), i) dt, |
|
U |
|
|
У (ti) = |
F * (*i, *0) Уо -I" j |
F 2 (tv |
0 b a (V (t), t ) d t. |
|
to |
|
|
В результате получим |
|
|
|
I (и (V), v) — max |
g' Fi (*i, h) *o + |
( |
mg' Fx*n (tu t) bx (u, t) dt - |
H£ il <i |
|
V иШ |
|
— g' Fziti^o) Уо — ^ §r F2di j ) b2(v(t),t) dt . to
Для игрока Р потенциально наихудшим ответом со стороны игрока Е являются такие управления v°(t), t£T, что
I (и (ѵ°), ѵ°) = max I {и {v), v).
veV
Найти управление u°(t) и оценить тем самым наихудшее возможное положение в момент t ~ t \ игрока Р не представляет серьезной задачи. При том соглашении об информированности, которое мы приняли, минимальное расстояние в момент t — tx между игроками при наилучшем выборе игрока Р равно
1° = I (и (ѵ°), ѵ°) = max max g'я 1(*i. g *o—g' (fi, g Уо +
иеГ Hg II <1
= max |
gr Fi (h, g xo— g'Fi {tu g Уо + H n g '/ 7! {tu t) bx {u,t)dt |
il gil <i |
y ueU |
(6)
Этот результат достигается на управлениях u°{t) = u{v°{t)), удовлетворяющих условиям:
g0' Ei{tut)bi{u°{t),t)=ming0' F, {tu t)bt (u,t),
ueU
g°’ |
= |
F2{tut)b2{v,t), |
|
|
veV |
где g0 — вектор, |
доставляющий максимум в правой части ра |
|
венства (6). |
|
|
3. Построение стратегий. Применять полученные управле ния для игры в реальных условиях можно в том исключитель ном случае, когда игроку Р известно управление игрока Е на отрезке Т. В этом случае игры как процесса нет. Игроки могут заранее сообщить свои управления. В действительности, как правило, игроки не знают об управлениях противников в буду щем и могут строить свое поведение лишь по измерениям своих и чужих траекторий до текущего момента.
Однако это не значит, что вычисления, сделанные в преды дущем пункте, бесполезны при решении дифференциальных игр в реальных ситуациях. Интуитивно можно ожидать, что управ ление u°(t) игрока Р, построенное с расчетом на наихудший слу
