![](/user_photo/_userpic.png)
книги из ГПНТБ / Васильев Ф.П. Лекции по методам решения экстремальных задач
.pdf220 |
ДОСТАТОЧНЫЕ УСЛОВИЯ |
ОПТИМАЛЬНОСТИ |
[Гл. 5 |
и, |
наконец, |
|
|
|
^ o W = f o W + « W и inf |
г0 (х) = romln + |
а ( д |
|
х£Хи |
|
отличается от r0min на постоянную а(/0). Поэтому в теоремах 1, 2
без ограничения общности можем принять ,Rmin(0 = 0 , |
|
|||
С учетом этого замечания из теорем |
1, 2 |
имеем следующие ус |
||
ловия для определения функции Кротова: |
|
|
|
|
R (х, и, 0 = (К , (х, t), f (х, |
и, t)) + K t (х, |
tj + |
/° (x, и, t) > 0, |
(13) |
(х, и) е |
Dt, t0< t < C T , |
|
|
|
ri(x) = — К(х, |
Т) - f Фх(л:) > 0 , |
х£Хт, |
(14) |
|
r0{ x ) = K ( x , t 0) + <S>0{ x ) > r min, |
x e X t„ |
(15) |
причем здесь неравенства превращаются в равенства при x = x * ( t ) ,
u = u * ( t ) в случае теоремы 1 |
(разумеется, |
в (14) и (15) равенства |
|||
должны получиться при х = х * ( Т ) |
и x = x * ( t 0) соответственно), а в |
||||
случае теоремы 2 равенства |
в (13) — (15) |
достигаются в |
пределе |
||
при k-*--)-оо в следующем смысле: |
|
|
|
||
J R (Xk (0- |
и* (0 , t)dt-*~0, rx (xk (Т)) -> 0, |
|
|||
r o (x k |
( Q ) |
omin |
( k |
o d ) . |
|
Задачу (13) — (15) |
назовем задачей Коши — Кротова. |
Эта за |
дача необычна тем, что, во-первых, здесь имеем дело не с диффе ренциальными уравнениями, а с дифференциальными неравен ствами с частными производными, во-вторых, эта задача тесно
связана с конкретной допустимой парой |
(х* (t), и* (t)) |
или после |
||
довательностью допустимых пар (Xh(t),Uh(t)), k = \ , 2, |
..., которые |
|||
подозреваются на |
оптимальность |
и |
на которых |
неравенства |
(13) — (15) должны |
превратиться |
в равенства в указанном выше |
смысле. Такие задачи на сегодняшний день почти не исследованы. Заметим также, что удобное для работы конструктивное опи сание множеств Dt, Xia, Хт часто отсутствует, что затрудняет прак
тическое использование задачи Коши — Кротова в столь |
общем |
виде (13) — (15). Поэтому полезно рассматривать задачу |
Коши — |
Кротова при некоторых упрощающих предположениях. В |
частно |
сти, в соответствии с соотношениями (9) в задаче (13) — (15) мно жества Dt, Xto, Хт можно заменить на множества G(t) X K (t) (или
даже En'XV(t)), G(t0), G(T) |
соответственно. В ряде случаев функ |
||
ция K ( x ,t ) |
может быть найдена из условий |
|
|
inf |
[(Kx (x,t), f (х, и, |
t)) + Ki(x,t) + P ( x ,u ,t )] = 0, |
(16) |
uBV-t
§ п |
Задачи с закрепленным временем |
221 |
|||
|
х £ Х и |
t0< t < T , |
|
|
|
|
К ( Х , Т ) ^ Ф 1(Х), |
х е х т, |
(17) |
||
|
К (х, t0) + Ф0 (х) > r0min, |
л: 6 Xta, |
(18) |
||
где Vt — проекция множества |
Dt на пространство Ег\ иногда мно |
||||
жество Xt здесь |
можно заменить на |
G(t) |
(или даже на Е п), мно |
||
жество Vt — на |
V(t). Следует, однако, помнить, что подобные уп |
||||
рощения задачи |
(13) — (15) могут не привести к цели, |
ибо упро |
щенная задача может не иметь решения, в то время как задача
(13) — (15) |
может оказаться разрешимой. |
|
|
|
|
|
||
Знание |
функции K(x,t) из |
(16), (17) и функции |
u ( x ,t ) ^ V t, |
|||||
на которой достигается |
нижняя |
грань в (16), |
позволяет найти оп |
|||||
тимальную |
траекторию |
задачи |
(1 )— (4): |
для |
этого |
сначала |
надо |
|
найти точку x0£Xt. из условия r0 (х0) — |
inf |
г0 (х) , |
затем решить |
|||||
|
|
|
X&xt0 |
|
|
|
|
|
задачу Коши x = f ( x , u ( x , t ) , t ) , |
|
x(t0) — x0. Оптимальность |
||||||
получающейся траектории x(t) |
и управления |
u ( t ) = u ( x ( t ) , t ) |
вы |
|||||
текает из теоремы 1. Если же нижняя грань в |
(16) или |
inf г0(х) |
||||||
не достигаются, то, зная функцию K(x,t) |
из |
(16), |
(17) |
Х^х и |
|
|||
и пользу |
ясь теоремой 2, можно построить минимизирующую последова тельность для задачи (1 )— (4).
Нетрудно видеть, что изложенный выше подход к задачам оп тимального управления тесно связан с динамическим программи
рованием и является его естественным |
обобщением. |
А именно |
||
уравнения (16), (17) при замене |
на |
V[t), Хт на GT превраща |
||
ются |
в уравнения (4.4.5—6), и в |
этом |
случае функция Кротова |
|
K(x,t) |
тождественно совпадает с функцией Веллмана |
B.(x,t). По |
вторив рассуждения §4 гл. 4 легко убедиться, что для функции
K(x,t) из |
(16), |
(17) |
справедливы утверждения теорем |
4.4.1— 4 |
||
для задачи |
(4.4.1— 4). |
|
что функция Кротова K(x,t) |
|
||
Однако следует сказать, |
опреде |
|||||
ляется из |
более широких условий (13) |
— (15), и она может суще |
||||
ствовать даже |
тогда, |
когда |
функция |
Веллмана не существует. |
Далее^ подход Кротова позволяет установить оптимальность допу стимых пар или последовательностей, не решая задачу синтеза, так как при этом подходе проводится более тонкое, чем в динамиче ском программировании, индивидуальное исследование каждой до пустимой пары или последовательности, подозрительной на опти мальность. В то же самое время, когда нужно решать проблему синтеза, связанную с задачей (4.1.1—4), метод Кротова превра щается в метод динамического программирования. Такая гибкость
метода Кротова делает его весьма привлекательным.
г
Упражнение. Минимизировать функционал J (и) = j" (и2 — хг) dt
222 ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ |Тл. 5
при |
условиях |
x — u{t), |
х(0) = х ( 7 ) = 0 . |
Показать, |
что |
пара |
|||||
* * ( 0 = 0 , ы * ( ^ ) = 0 является |
оптимальной |
при 0 < 7 < ; я . |
|
||||||||
У к а з а н и е . |
Функцию Кротова искать в виде К(х, |
t) =ф (t)x2. |
|||||||||
§ |
2. ДОСТАТОЧНЫЕ |
УСЛОВИЯ ОПТИМАЛЬНОСТИ |
ДЛЯ |
ЗАДАЧ |
|||||||
|
|
С НЕЗАКРЕПЛЕННЫМ ВРЕМЕНЕМ |
|
|
|
||||||
Рассмотрим задачу: минимизировать функционал |
|
|
|||||||||
|
т |
|
|
|
|
|
|
|
|
|
|
J(u, |
tQ, Т) = j /о (х (0, |
и (0, 0 dt + Ф0 (х (t0), g + Фх (х (7), 7 ) |
(1) |
||||||||
|
^0 |
|
|
|
|
|
|
|
|
|
|
при условиях |
|
|
|
|
|
|
|
|
|
|
|
|
|
x(t) |
= |
f ( x ( t ) <u(t), t), |
t0 < t < T , |
|
|
(2) |
|||
|
|
|
x(t)eG (t), |
t0 < t < T , |
' |
|
(3) |
||||
|
u — u ( t)^ V (t), u(t) |
кусочно-непрерывна при |
/ о ^ ^ 7 , |
(4) |
|||||||
где моменты t°, 7 в отличие от задачи |
(1.1—4) неизвестны |
п под |
|||||||||
лежат определению из условий |
|
|
|
|
|
|
|||||
|
|
|
0 |
€ То, |
7 6 |
, |
t0 |
Т , |
|
|
(5) |
то, Ti — заданные множества на числовой оси — о о < ^ < ; + оо. В ча
стности, |
если |
/ °= 1, Ф о = Ф 1= |
0 , то |
придем к задаче быстродей |
||
ствия. |
|
|
пару (x(t), u(t)), |
|
|
|
Как и в § |
1, |
удовлетворяющую |
условиям |
|||
(2) — (4), |
назовем |
допустимой |
на отрезке ^о=£г^^7, и множество |
|||
всех допустимых |
пар на этом |
отрезке обозначим через |
D[tt, 7]. |
Объединение множеств D[t0,.T] по всем to, 7, удовлетворяющим ус
ловиям |
(5), обозначим |
через D. В пространстве |
Е пх Е г введем |
|
множество Dt точек i(x, |
и) следующим образом: |
(х, |
u ) ^ D t, если |
|
существует допустимая |
пара (х(т), « ( т ) ) е О , такая, |
что x ( t ) — x, |
||
u ( t ) = u |
(в точках разрыва управления для определенности примем |
u ( t ) = u ( t —0 )). Проекцию множества Dt на пространстве Еп обоз начим через Xt, проекцию Dt на Ет— через Vt. Очевидно, Xt^ G (t ), Vt<=V(t), Dt^XtXVt.
Величины |
to в т0, |
7* 6 ту и пару ’(х* (/), |
и* (/)) 6 D j/o, 7*] назовем |
|||||
оптимальными, |
если |
|
|
|
|
|
|
|
|
V (a *(0 , й, Т*) = |
inf J (и, g |
7 ) |
= 7*, |
|
|
||
где нижняя грань берется по всем |
(х (t), и (t)) 6 D |
[ g |
7] |
при все |
||||
возможных t06 т0, 7 6 ту. |
|
|
|
|
|
|
||
Скажем, что последовательности |
|
|
|
|
|
|||
to,k 6 т0, |
Тк е тъ |
(xk (0, uk (t)) e D [ t 0,k, Tk] |
(k = |
1, |
2, |
. . . ) |
§ 2} Задачи с незакрепленным временем 223
минимизируют функционал J (и, t0, |
Т), |
если |
|
||||
|
|
J { U k , |
t 0k , Tk)->-J* |
(As-»-оо). |
|
||
Для |
формулировки |
достаточных |
условий оптимальности, как |
||||
и в § 1, |
введем функции: |
|
|
|
|
|
|
R (x, и, |
t) = (Кх (х , t), / (х, |
и, t)) + K t (х, t) + f° (х, |
и, t), |
||||
г0 (х, t0) = |
К (х, t0) + Ф0 (х, t0), |
гх (х, Т) = — К (х, Т) + |
Фх (х, Т), |
||||
где К (х, |
t) — кусочно-непрерывная |
и |
кусочно-гладкая |
функция при |
х £ |
^omln ^ ^ ^maxi |
^Omin == i^f ^0> |
Дпах = |
SUP ^ |
|
|
"to |
|
Т, |
(предполагаем, что t0mln<CTmax). |
и функция R(x{t), t) |
переменной t |
||
Если (x(t), |
u(t))^D [tQ, Т] |
|||
непрерывна и кусочно-гладка при t0^ t ^ . T , |
то, как и в лемме 1.1, |
|||
нетрудно убедиться в справедливости представления |
|
j (и(t), g |
T) = $R(х (t), U(0 , t)dt+ |
ГХ (xсг), т)+ |
Г0 ( х ( g , |
д . |
(6) |
|||
|
|
ta |
|
|
|
|
|
|
Т е о р е м а |
1. |
Для того |
чтобы |
последовательности |
|
то, |
||
Th^xi, |
(Xk(t), |
uh( t ) ) ^ D [ t 0, h, |
7V|, |
As=l, 2, ..., |
минимизировали |
|||
функционал J (и, |
t0, T), достаточно |
существования такой |
функции |
К(х, t), что:
1)формула (6) верна для любой допустимой пары (x(t),
u(t))^D[t0, Т] при всех /0^то, Т е т i;
|
|
T k |
|
|
|
Rmia (t) = |
|
R (x, и, t) = 0; |
|
||||
2) |
Пш |
Г R (xk (t), uk (t), t) dt = |
0, |
inf |
|
||||||||
|
fc-»oo |
J |
|
|
|
|
|
tx ,u )£ D f |
|
|
|
||
|
|
'oft |
|
|
|
|
|
|
|
|
|
|
|
3) |
lim rx (xk {Tk), Tk) = rlmin = |
inf |
inf |
rx {x, T), |
|
|
|
|
|||||
|
k-too |
|
|
|
Г£Т| х£Х"р |
|
|
|
|
|
|||
|
|
lim r0 (xk (tok), |
tok) = romin = |
|
inf |
inf |
rQ(x, |
t0). |
|
|
|||
|
|
ft-»°° |
|
|
|
;0£T0 |
x £ X ' t 0 |
|
|
|
|
||
(Для получения формулировки достаточных |
условий |
оптимальности |
|||||||||||
для фиксированных й 6 т0, Т* 6 тъ |
(x' (t), |
и' (/)) 6 D[t0, Т*] в |
этой тео |
||||||||||
реме надо |
принять g |
= |
fj, Tk = |
Т*, |
xk (t) = л * |
(/), |
uk (t) = |
u*(t), |
и |
||||
все предельные переходы заменить простыми равенствами.) |
|
|
|||||||||||
Д о к а з а т е л ь с т в о . |
Возьмем |
произвольные |
|
£0 6 т 0, |
Г 6 тх |
и |
|||||||
(x(t), |
u ( t ) ) e D [ t 0,T]. |
Согласно формуле |
(6) будем иметь |
|
|
||||||||
|
J ( и |
(* ) . Ч ,T) — J(u k (t), g , |
Tk) = |
j |
R {x (t), и (t), t) dt — |
|
224 ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ [/Vi. 5
— $ R(xk (0. «ft (0. О dt + |
r1 (X {Т), Т) — rx (xk (Tk), Tk) + |
*0к |
|
+ го(х ( g , д |
— r0 {xk (to k ) , д ) . i |
Так как правая часть этого равенства по условию теоремы имеет
предел при £->оо, то и левая часть имеет предел. |
Поэтому |
||||||||
J (u(t),t0,T ) — lim J ( u k (t), g, Tk) = |
т |
|
|
|
|
||||
f \R(x(t), u(t), t) — Rmin(t)]dt + |
|||||||||
|
ft-»0O |
|
*0 |
|
|
|
|
||
|
|
|
|
|
|
|
|
||
+ r i (x CO> T Y— rimin + r0 (x (g, g |
—/-omln > o, |
||||||||
откуда |
J {u (it), g T) > lim J (uk (t), g, Tk) |
|
|||||||
|
|
||||||||
|
|
|
|
f t - * oo |
|
|
|
|
|
при любых f0 Gr0, |
T £ tx, |
(x(t), |
u (t))£ D [t0,T ]. |
Следовательно, |
|||||
J* = |
in f У (a , |
g Г ) |
> l im J (uk (i), |
g , |
T ft) . |
||||
|
|
|
|
ft-»00 |
|
|
|
|
|
Однако У (г/А(г1), |
g, ТА) > У* при всех |
/г — 1, 2, . . . |
, |
поэтому |
|||||
|
|
lim J (uk (t), g , |
Г*) = |
J\ |
A |
|
|
||
|
|
ft-*00 |
|
|
|
|
|
|
|
В теореме |
1 |
множество |
Dt часто |
заменяют |
на G (i)x V (t ), |
||||
XtD— на G(t0), |
Хт— на |
G(T) |
(см. замечание к |
лемме 1.2). Дей |
ствуя по аналогии с § .4 гл. 4 и § 1 настоящей главы, предлагаем читателю самостоятельно выписать задачу Коши— Кротова, а так же рассмотреть вопросы приближенного решения проблемы синте за для задачи i(l) — (5).
П р и м е р |
1. |
Требуется |
наибыстрейшим |
образом |
перевести |
|||||||||
точку |
х — (х1, х2) |
из |
начала координат |
(0, |
0) |
в точку (1, 0) при |
||||||||
условии, когда движение точки подчиняется условиям |
[236] |
|||||||||||||
|
х1 = - |
(х2)2+ |
и2, . х2 = |
и, \ u (t)\ < l, |
0 < * < 7 \ |
|||||||||
Здесь |
G (0) |
= |
{(0, |
0)}, |
G (Г) = {(1, |
0)}, |
G (t) = |
Ел при 0< t < T |
||||||
V (0 = |
{ « : « € g , |
|ы |<1}, |
т0 = {*0 = 0}, |
т1 = |
{ Т : Т > 0 } ; |
|||||||||
|
|
|
|
|
|
|
J(u , Т) = Т. |
|
|
|
|
|
||
Построим последовательности: 1) {Tft}, где |
Tk — корень уравне |
|||||||||||||
ния |
(Т — 1)3 = 1 2 ( Т '— |
1)------, |
расположенный |
в |
пределах |
|||||||||
1 < Т < 1 + & - 2 / 3 ( £ = |
1, |
2 , . . . ) ; |
2) {uk (t)}, |
0 < ^ < Г й, Тде |
||||||||||
«ft(0 = + 1 |
при |
Y |
< t: |
|
+ ~ и ’ |
т |
= |
°, 1, |
••• I k - l , |
§ 2] |
|
|
|
|
|
Задачи |
с незакрепленным |
временем |
|
|
|
|
225 |
||||||||
И при |
|
|
|
|
|
+ |
])‘> |
“ * ( * ) = |
— 1 |
ПРИ |
|
|
|
|
|
|
|||||
|
— |
-|— — < |
г! < — + |
— , |
m = |
0 , 1 , . . . , |
k — 1, |
и при |
|||||||||||||
|
k |
|
2k |
|
k. |
|
k |
|
|
|
|
|
|
|
|
|
* |
|
|||
у - (Tk + |
1) < |
t < |
Tk\ |
3) |
{xk (t)} = |
{ ( 4 (t), |
x\ (0} — траектории, |
соот |
|||||||||||||
ветствующие |
управлению |
|
uk (t), |
0 -< t -< Tk; |
|
4 |
(0) = |
4 (0) = 0, |
|||||||||||||
4 ( 7 4 = 1 , |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
_ |
4 _ |
|
|
|
|
|
|
|
|
|
_ _ 2 _ |
|
|
|
4 ( 7 ’*) = |
0, |
( 1 — a |
3 j * < |
4 ( 0 < |
t, |
о < 4 ( 9 |
< |
* |
3 . |
|||||||||||
|
|
|
|
|
|
0 < ^ < 7 1*, |
|
k = |
l , |
2 , . . . |
|
|
|
|
|
|
|||||
Покажем, |
что |
|
1 |
= |
Г*, |
где |
Т ‘ — оптимальное время. |
Для |
|||||||||||||
этого возьмем функцию 7( (х, 9 = |
— х1. |
Тогда |
R (х, |
и, |
t) = (х2)2— |
||||||||||||||||
— и8 + |
1; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
ini |
|
inf |
R(x, и, t)= 0 , |
|
Г |
R {xk {i), |
uk {t), |
t)dt = |
1k |
(9 ? d t - |
|||||||||||
|
|
j |
14 |
||||||||||||||||||
*6£t |
1U|<1 |
|
|
|
|
|
J |
|
|
|
|
|
|
|
0 |
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
- |
j |
|
( k |
(o i2— i ) ^ = |
|
J |
i4 (o i2^-^o(yfe |
oo); |
r0(x, |
0) = |
0 |
||||||||||
|
0 |
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
при |
x 6 G (0); |
rx (x, |
T) = |
1 |
при x £ G |
(T ) , T > |
|
0. |
|
|||||||||
Кроме того, |
очевидно, формула |
(6) |
справедлива для всех до |
||||||||||||||||||
пустимых |
{x{t), |
u (t))^ D [0, |
Т], T^zO. В силу теоремы 1 |
тогда J(u h, |
|||||||||||||||||
Th) = |
ТЙ-И = |
Т* |
(Т* — оптимальное время). Минимизирующие по |
||||||||||||||||||
следовательности Th, |
xk (t), |
uk (t), |
k — l, |
2, |
..., |
для |
рассматривае |
||||||||||||||
мой |
задачи построены. |
Остается |
заметить, |
что эта |
задача |
опти |
мального решения не имеет, т. е. inf/(«, Т) не достигается, и мы имеем дело с так называемым скользящим режимом [63, 142].
Приведем еще одно достаточное условие оптимальности, ка
сающееся задачи быстродействия. |
|
|
|
|||
Т е о р е м а |
2. |
Пусть |
в задаче (1 )— (5): / °= 1, |
<p0= O i = 0 , |
||
ц = { Т : Т ^ и } , |
начальный |
момент to закреплен. Пусть имеются |
||||
последовательности |
Tk& u |
(xh(t), |
uh{t))^ D [t0, Th] (6 = 1 , |
2, ...), |
||
где Tk- + T * > t 0. Для того чтобы Т* |
было оптимальным |
временем, |
||||
достаточно существования функции К(х, t), такой, что: |
(x(t), |
|||||
1) формула |
(6) |
верна |
для любой допустимой |
пары |
||
u(t))^ D [t0, 7] при всех T ^ t Q\ |
|
|
|
8 Ф. П. Васильев
226 ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ [ Г л . 5
2) |
Нш f R(xk (t), |
uk (t), |
t)dt = |
f Rmln(t)dt, Rmin(t)= ini R(x,u,t) |
||
|
k-><x> J |
|
|
J |
|
(x ,u )e D t |
3) |
| [Rmln(t) — 1] dt< 0 |
при любых |
T, t0 <CT< 7 ” ; |
|||
4) |
lim rx (xk (Tk) , |
Tk) = rxmln = |
inf |
inf |
rx {x, T ), |
|
|
k-*oo |
|
<0< Г < Г * x £ X T |
|
||
iim rQ(Xfc (ty), t0) |
Tqm;n |
inf |
Гд(х, |
tq). |
|
|
fe->oo |
|
x£Xf0 |
|
|
|
(Для получения формулировки достаточного условия оптимально
сти для |
фиксированных T * > t 0, |
(х*(0> и* (t))^ D [t0, Т*] |
в |
этой |
|
теореме |
надо принять Th= T * , |
xk ( t ) = x * ( t ) , |
Uk(t)— u*(t) |
и |
все |
предельные переходы заменить простыми равенствами.) |
|
|
|||
Д о к а з а т е л ь с т в о . Пусть |
выполнены |
все условия теоремы, |
и пусть тем не менее Т* не является оптимальным временем. Тогда
существуют момент Т и пара |
(x(t), |
u (t))^ D [t0, Т], |
такие, |
что |
|||||||||||
Т<С.Т*. Согласно формуле (6) будем иметь |
|
|
|
|
|||||||||||
|
|
|
- |
|
|
|
|
|
|
г |
|
|
|
|
|
|
J{u , |
T ) - J ( u k (t), Tk) = |
T |
- T |
k = |
$ |
R(x (t), |
и (t), t ) d t - |
|
||||||
|
Tk |
|
|
|
|
|
|
|
to |
|
|
|
|
|
|
|
|
|
Uh (t) ,t ) d t |
+ |
rx (x (T) , T |
) - r x (xk (Tk), |
Tk) + |
|
|||||||
|
- J |
R (Xk (f), |
|
||||||||||||
|
|
|
|
|
~г r0 (x (t0) , |
t0) |
r0 (xk (t0), t0). |
7'• |
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Отсюда при |
k |
+ oo получим |
T — T* = — |
J Rmin (t) dt + |
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
*0 |
|
|
|
|
+ |
J R{x{t),u(t), |
t) dt -j- тX(x (T) , T) |
f |
-\r rQ(x (tQ), tQ) |
/'omln^’ |
||||||||||
|
to |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
T* |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
> |
- ] |
RmlA t ) d t > T - T \ |
|
|
|
|
|||||
Полученное противоречие доказывает теорему. А |
|
|
|
||||||||||||
|
П р и м е р 2. |
Пусть требуется наибыстрейшим образом переве |
|||||||||||||
сти точку х = |
(хх, х2) из положения |
(1, 0) |
в начало координат (0,0) |
||||||||||||
при условии, |
когда движение точки подчиняется условиям х х— х2, |
||||||||||||||
х2= и , \u(t) | < 1, 0 ^ < Г . |
|
|
|
|
|
|
|
|
|
||||||
|
Возьмем |
Т* = |
2; u * ( t ) = — 1 при 0'==£^И |
и м * ( 0 = |
+ 1 |
при |
|||||||||
K |
f ^ 2 ; |
соответствующую траекторию at'* ( 0 = |
1—0.5i2 при 0 ^ ^ ^ |
||||||||||||
< 4 |
и X х* |
( 0 = 0 . 5 (t—2 )2 |
при |
1й £/<2; x2* ( t ) = —t при |
|
|
и |
/
§ 3] |
Дискретные |
управляемые |
системы. |
Оценка |
погрешности |
. 227 |
||||||||||
x2*(t) =st—2 при |
1 ^ ^ 2 . |
Указанные |
управления |
и траектория |
||||||||||||
легко |
находятся |
из |
принципа |
максимума |
(см. пример 3.2.2.). |
|||||||||||
Покажем, что они являются оптимальными. Возьмем функцию |
||||||||||||||||
К(х, t ) = x l— (t— 1)х2. Тогда |
R(x, |
и, £) |
|
-х2+ /(х=-гг+К *+1 = |
||||||||||||
= _ ( i _ l )M + l t |
r0(x, |
0) s= 1 |
при |
x e G (0 ) = |
{(l, 0 )}, r,(x, |
T ) = 0 |
||||||||||
при .ie G ( r ) = {(0, |
0 )}. Очевидно, |
|
|
|
|
|
|
|
||||||||
inf |
M R {x , |
u, |
t ) ^ — \t— Y\+l = R |
ln(t)=R (x*(t), |
|
t), |
||||||||||
x € E a |u|<l |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
2 |
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
* |
|
|
[/?mln (0 — |
1 ]^ ----- JU — |
|
|
|
|
|
|||||||
|
T |
|
|
|
|
|
|
|
T |
|
|
|
|
|
|
|
при всех Г<С2, |
и формула |
(6) |
верна |
для всех допустимых пар. |
||||||||||||
В силу теоремы 2 |
момент Т* = |
2 и пара t(x*(t), u *(t))^ D [0, |
2] оп |
|||||||||||||
тимальны. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Заметим, что функция Веллмана в этой задаче име'ет разрывы |
||||||||||||||||
первой производной как раз на оптимальной траектории [24, |
195], в |
|||||||||||||||
то время как функция Кротова К(х, |
t) является |
просто много |
||||||||||||||
членом. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Упражнения. |
1. |
Решить проблему синтеза для задачи быстрей |
||||||||||||||
шего перевода точки х = (х1, х2) |
из заданного состояния |
(х),, |
х2) = |
|||||||||||||
= х 0фО в начало координат при условиях |
|
|
|
|
|
|||||||||||
а) |
х1 = |
ха, |
х2 — и (t), |
| и (*)[< 1 , |
0 < ^ < 7 ’; |
|
|
|
||||||||
б) |
хх = |
х2, |
х'2 = |
— хх + |
u{t), |
| и (*)|<1, |
0 < / < Г ; |
|
|
|||||||
в) |
х1 = |
х2 + |
их, |
х3 = |
х1 -(- и2, |
|и£(/) |< |
1 |
(t = 1, |
2), |
0 .< * < 7 \ |
||||||
2. |
|
Перевести точку х = (х1, х2, |
х8) из начала координат в то |
|||||||||||||
Xi = (а, |
0, 0) быстрейшим образом, |
если |
х1 = |
х3, х2 = |
х3, |
х8 = u(t),. |
||||||||||
| и ( 0 1 < К |
0 < |
t < Т ; |
а — const. Показать, |
что оптимальное |
время |
|||||||||||
Т* = р |
3 2 1а |. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
У к а з а н и е . В задачах 1—2 функцию Кротова искать в виде многочлена первой степени по х с коэффициентами, зависящими от времени.
§ 3. ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ д л я ДИСКРЕТНЫХ УПРАВЛЯЕМЫХ СИСТЕМ. ОЦЕНКА ПОГРЕШНОСТИ
1. Рассмотрим задачу: минимизировать функционал
N |
|
1 ([“.]) = £ Pt (xh Щ) + Ф0 (х0) ф- Ф1(xN) |
(1) |
{=0 |
|
8*
228 |
|
ДОСТАТОЧНЫЕ |
УСЛОВИЯ |
ОПТИМАЛЬНОСТИ |
\Гл. 5 |
||||||
при условиях |
|
|
|
|
0, 1, 2 , . . . , N - 1, |
|
|||||
|
|
X{+i — Fi (Xj, U;), |
£ |
(2) |
|||||||
|
|
xt 6 Gi, |
щ 6 Vit |
£ = |
0 , 1 , 2 , . |
N, |
(3) |
||||
где |
|
|
|
|
|
|
|
|
|
|
- |
x, = |
(x[, |
Xi, . . . , Xi), |
Fi = |
(Ft, |
. . . |
, F i), |
щ = |
(«i.........., |
uri): mho- |
||
жества |
GiCZEm, ViCZEr, £ = |
0, |
1, |
. . . , N, заданы; функции F{ (х, и) |
|||||||
определены при (х, |
u )^ G iX V {, |
£ = 0 , 1, |
N, |
/ = 0 , 1, |
п\ функ |
||||||
ции Ф0(х) и ФДх) |
определены при х е О 0 |
и x e G lV соответственно; |
|||||||||
£— дискретное время, |
£ = 0 , |
>1, |
|
N, момент N будем считать из |
|||||||
вестным; |
|
|
|
|
|
|
|
|
|
||
|
Как мы убедились в § |
4.1, к таким задачам приводит разност |
|||||||||
ная |
аппроксимация |
задачи |
оптимального управления с |
непрерыв |
ным временем. Задача (1) — (3) имеет также и самостоятельный интерес и возникает при описании управляемых систем с дискрет
ным временем ([6, 26, 59, 119, 196, |
231, 234] и др.). |
|
|
|
|
||||||
|
Если задать управление [и ,]= |
(ц0, |
«ь •••, |
uN) и начальное усло |
|||||||
вие х0— а, то из уравнений |
(2) однозначно |
определяется дискрет |
|||||||||
ная |
траектория [хг] = (ха, х и |
..., хк). |
Пару |
([xf], |
[цг]) |
назовем до |
|||||
пустимой, если она удовлетворяет условиям |
(2), |
(3). |
Множество |
||||||||
всех |
допустимых |
пар обозначим |
через D. |
Допустимую |
пару |
||||||
( [ * ] , |
[«*]) назовем оптимальной, |
если |
I ([«Л) = inf / ([«,-]) = !*■ П°~ |
||||||||
следовательность |
допустимых пар |
|
|
|
D |
|
|
назо |
|||
([лег,*], [г^,Л), |
/г= 1, |
2, |
..., |
||||||||
вем |
оптимальной, |
если она |
минимизирует |
функционал |
(1), |
т. е. |
|||||
|
|
П т / ( К Л ) = |
/ * . |
|
|
|
|
|
|
||
|
|
k-*oo |
|
|
|
|
|
|
|
|
2.В пространстве. Е пх Е г введем множество D, точек (х,
следующим образом: |
(х, |
u)^ D i, |
если существует допустимая пара |
|||||||||
([хт ], Ы е й |
, такая, |
что Xi = |
x, |
щ = и. Далее, |
через Xi обозначим |
|||||||
множество всех |
тех x e G i, для |
которых существует |
хотя бы |
одно |
||||||||
и^. Vi такое, |
что |
(я, u)^D i. |
|
|
|
при x ^ X it i — 0, |
|
|||||
Возьмем |
функцию К Д х), |
определенную |
1, ..., |
|||||||||
..., АТи положим |
|
|
|
|
|
|
|
|
|
|
|
|
R t (х, и) = К с+1 (Е; (х, |
и)) — Ki {х) + |
F°i{x, и), |
£ |
= |
0, |
1, . . . , N — 1, |
||||||
Г0(х) = Ко (х) -(- Ф0 (х), |
Г2 (X, |
и) = |
К.И (х) 4- |
Фх (х) |
-j- F^j (х, |
и). |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
(4) |
С помощью э т т |
функций значение функционала |
(1) |
на любой до |
|||||||||
пустимой паре можно представить в виде |
|
|
|
|
|
|||||||
|
|
N —1 |
|
|
|
|
|
|
|
|
|
|
|
I ([«Л) = |
£ |
Яг (Xj, |
Щ) + Гх (xN, uN) + |
rQ(х0). |
( 5 ) |
1=0
§ |
3] |
|
Дискретные управляемые |
системы. |
Оценка |
погрешности |
229 |
|||||||||
В |
самом деле, |
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
£ |
|
( * t, “ ;) |
= |
£ |
I K i+ i (A'i+i) — |
K i |
( * ;) ] |
+ |
£ |
F ? |
(x £, u t) = |
||||
|
1=0 |
|
|
|
i=0 |
|
|
|
|
|
£=0 |
|
|
|
||
|
|
|
|
Ко( x ‘o) " T |
JV—1 |
|
|
|
|
|
Гl ( X j V , |
|
|
|||
|
— /^ . W (-*-j v ) |
|
/ * £ ( - ' - i , |
W ; ) — / ( [ ^ i ] ) |
|
^ v ) ' |
/ о ( ^ o ) , |
|||||||||
|
|
|
|
|
|
|
t= 0 |
|
|
|
|
|
|
|
|
|
что равносильно |
(5). |
|
|
|
|
|
|
|
|
|
|
|||||
|
Т е о р е м а 1. Для оптимальности последовательности допусти |
|||||||||||||||
мых пар |
([x£ift], [«г, d ), |
k — \, 2, |
достаточно существования функ |
|||||||||||||
ции Ki(x), |
i = 0 , 1, |
|
N, такой, |
что: |
|
|
|
|
|
|
|
|||||
|
1) |
lim Ri(xik, |
uik) = R imin= |
inf Rt (x, u), |
i = |
0, |
1 , . . . , Л/-— I; |
|||||||||
|
|
f t - » o o |
|
|
|
|
{ x , u ) £ D ^ |
|
|
|
|
|
|
|
||
|
2) |
lim /y^fc, |
uNk) ' = r lmln= |
inf |
гх (х, |
u)\ |
|
|
|
|||||||
|
|
f t - » o o |
|
|
|
|
|
( Л , u ) £ D n |
|
|
|
|
|
|
||
|
|
lim r0 (xok) = |
r0mln =t inf r0 (x). |
|
|
|
|
|
|
|
||||||
|
|
k -*o o |
|
|
|
|
x £ X 0 |
|
|
|
|
|
|
|
|
|
{ Для |
получения |
формулировки |
достаточного |
условия оптимально |
||||||||||||
сти для |
фиксированной пары |
([х*], |
[«*])££) |
здесь |
надо |
принять |
||||||||||
|
|
|
|
Хц, |
= |
х\, |
uik = |
и\, |
i = |
0, |
|
, N, |
|
|
||
и все предельные переходы заменить равенствами.) |
|
|
||||||||||||||
|
Д о к а з а т е л ь с т в о . |
Возьмем |
произвольную допустимую па |
|||||||||||||
ру ({*,•], [«г]). С помощью формулы (5) имеем |
|
|
|
|
||||||||||||
|
|
|
|
|
|
N —I |
|
|
|
|
|
|
|
|
|
|
|
^ ([“ (•]) |
|
^ ([Uift]) = |
^ [Ri(Xi, |
«;)— |
R i ( x ik, |
U,-ft)I+ |
гг (xN, |
UN) — |
|||||||
|
|
|
|
|
|
i=0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
— rx (xNk, |
uNk) + |
r0 (x0) — r0 (x0lft) , |
k = 1, |
2, . . . |
|
В этом равенстве можно переходить к пределу при k-^-oo, так как правая часть по условию имеет предел. Получим
/ ([££;]) — lim / ([uik]) = |
N — I |
[Ri (xh щ) — Rtmin] + |
|||
V |
|||||
fcM0 |
i=0 |
|
|
||
-f- 1 \ (XjV, |
U ]\i) 1 \ min ~T |
! o (X a) |
r 0 min ^ 0 • |
||
Следовательно, |
|
|
|
|
|
/* = inf / ([u£]) > |
lim |
/([«i,ft]). |
|||
|
D |
|
k-bOQ |
|
|
Однако / ([«г,*]) > Г , |
k — \, 2, . . . |
|
, |
поэтому lim /([uift]) = Г . |
k - *o a