доступных данных о состоянии системы. Для этого представим уравнение (10-4) в дискретном виде:
|
|
|
|
|
|
|
|
u(t)=ii,[z(t0 |
+ iàt); |
t = 0, |
1, . . . , / ; x (to)], |
(10-18) |
где-* = *о + /А*; / = 0, |
1, . . . . N— 1. |
|
|
|
|
Эквивалентная |
задача |
|
|
|
|
|
Для заданного |
значения |
Л/ задача, |
описываемая |
уравнениями (10-5), |
(10-9), (10-15) и (10-18), в которой |
требуется определить управляющую |
последовательность |
{u(t)\ t — tc + jàt; |
/ = 0, 1, |
N—1}, |
минимизирующую |
значение JN, В ТОЧНОСТИ совпадает с задачей |
дискретного |
стохастического |
линейного |
регулятора |
из гл. 9. |
|
В то же время в пределе при At—>-0 и Л/ таком, что |
Л/А/ = /і—to, она |
является |
задачей непрерывного |
стоха |
стического линейного регулятора, поставленной в § 10-1. Следовательно, теперь к этой задаче можно приме
нить результаты гл. 9 и рассмотреть предельное |
поведе |
ние полученного алгоритма управления. |
|
|
|
|
10-3. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ |
|
|
|
|
|
Для заданного N |
и любого |
t = t0 + jAt; |
/ = 0, |
1, |
|
А/—1 применение результатов гл. 9 к поставленной |
здесь дискретной задаче приводит к следующей |
системе |
уравнений |
оптимального управления: |
|
|
|
|
|
|
u(t)=S(t)x{t |
|
|
\ t); |
|
|
(10-19) |
W (t + At) = |
M (t - f At) + A (t + |
Д/) Д^; |
(10-20) |
S(t) = |
— \W (t -f- At, t) W (t + |
Ai) W(t |
+ |
At, t) - f |
|
-\-B(i)At]-1W'(t-]-At, |
|
t)W(t |
+ |
At)U>(t + At, t); |
(10-21) |
M (t) = Ф' (t - f |
t)W(t |
+ |
At) Ф(* + |
Af, t) — |
|
|
- Ф'(/ + A f , t)W(t |
+ At)4r(t + |
At, t)[4F'(t |
+ |
At, t)W(t |
+ |
|
+ At)W{t |
+ |
At, t) + |
B(t) Аі]~1хР'(і |
+ |
|
|
|
- f At, t) W (t - f At) Ф(і-{- |
At, |
t). |
|
(10-22) |
При составлении этих уравнений использованы урав |
нения (9-46) —(9-48), |
(9-80), (10-16) и |
(10-17). |
|
|
Значения / при |
вычислении |
|
S(t), |
как это видно |
из |
уравнений |
(10-20) —(10-22), |
равны t = t0 |
+ (N-l)At, |
|
t0 + |
+ (N—2)At, |
to+At, |
U. |
|
|
|
|
|
|
|
|
Вычисления начинаются с граничного условия
W(to+№t)=W(t1)=A+A(ti)At, |
(10-23) |
полученного из уравнения (10-16). Последовательность
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
вычислений, |
разумеется, |
совпадает |
с |
последователь |
ностью вычислений в гл. 9. |
|
|
|
|
|
|
|
|
|
|
|
|
|
Из уравнения |
(10-20) |
имеем: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
M(t)=W(t)—A(t)At. |
|
|
|
|
|
|
(10-24) |
|
Подставляя этот результат в левую часть (10-22) и |
решая |
полученное уравнение относительно W(t), |
имеем: |
|
|
|
W (t) = |
Ф' (t + |
Д*, t)W(t |
+ |
At) Ф (t + |
At, t) |
- |
|
|
|
- |
Ф'(^ + |
Д ^ |
t)W(t |
+ At)W(t |
+ |
At, |
t)[W'(t |
+ |
At, t)W(t |
+ |
|
|
+ |
At)W(t |
+ |
At, t) + |
B(t) At}~lW |
(t + At, t)W (t |
+ |
|
|
|
|
|
|
|
|
+ |
At) Ф (t + |
|
t) + |
A (t) At. |
|
|
|
|
(10-25) |
|
Подставляя |
соотношения |
(10-6) — (10-8) |
|
в |
уравнение |
(10-25) и раскрывая скобки, получаем: |
|
|
|
|
|
|
|
|
|
|
|
W (t) = |
[/ + F (t) At + |
О (At2)}' |
W(t + |
At) [I |
+ |
|
|
|
- f |
F (t) At + |
О {At2)] - |
|
[I + F (t) At + |
О (At2)}' |
W (t |
+ |
|
+ |
At) [C (t) At + |
O (At2)} |
{[C (t) At + О (At2)]' |
W {t |
+ |
|
|
|
|
|
+ At) [C (t) At + О (At2)} |
-\-B(t) |
At}'1 |
[C(t) At |
+ |
|
|
|
+ |
О (At2)}' |
W(t |
+ At) [I + |
F (t) At + O (At2)] |
+ |
A (t) At |
|
= |
= |
W{t+At) |
|
+ |
F' (t) W (t + |
At) At + |
W{t-[- |
At) F (t) At |
|
- |
|
- |
W (t + |
At) С (t) [C (t) W(t-{- |
At) С (t) At2 |
+ |
В (t) At |
+ |
|
+ |
О (At3)} -1 С |
(t) At2W (t + |
At) + |
A (t) At + |
O (At2) = |
|
|
= |
W{t + |
|
At) + |
F'{t)W(t |
|
+ |
At) At + W (t + |
At) F (t) At |
- |
-W(t |
|
+At) |
|
С (t) [C (t) W (t+Af) |
С (t) At + ß (t)} -1С |
(t) W ( 4 - |
|
|
|
|
|
|
+ |
At) At + |
A (t) At + |
O {At*). |
|
|
|
|
(10-26) |
|
Полагая, |
что |
предел |
W(t+At) |
при At—>-0 |
сущест |
вует, из уравнения (10-26) |
имеем: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
l\vaW{t |
+ |
At) = W(t). |
|
|
|
|
|
|
|
|
|
Тогда, |
переписывая уравнение (10-26) в виде |
|
|
|
|
|
W(t) |
— W(t + |
At) = |
F' (t) W{t + At) At + |
W (t |
+ |
|
|
|
+ |
At) F (t) At — W (t+ |
At) С (t) [С (t) W(t + At) С (t) At |
+ |
|
|
|
+ В (t)} -1С |
(t) W(t |
+ |
At) At + |
A (t) At + |
O |
(Af), |
|
|
деля обе его части на Al и переходя к пределу при At—>-0, получаем матричное дифференциальное урав нение
— W(t) = F' (t) W(t) + |
W (t) F |
(t)~ |
|
- W(t)C{t)B-4t)C'{t)W{t) |
+ |
A(t), |
(10-27) |
где t теперь обозначает непрерывное |
время, |
причем |
fo<:f<*i .
Из уравнения (10-23) следует, что граничное усло вие, соответствующее уравнению (10-27), имеет вид:
№ ( 0 ) = Л .
Это условие получается в результате предельного перехода в выражении (10-23) при At—>-0.
Теперь рассмотрим предельное поведение уравнения (10-21). Подставляя в него соотношения (10-6) и (10-8), имеем:
|
S(t)= |
— {{С (t) At + О (At2)]' W(t + At) [С (t)"At + |
|
+ |
О (M2)} |
- f В (t) At} - 1 |
[C (t) At A-О (At2)}' W(t |
+ |
bt)\I |
+ |
|
+ F (t) At + О (At2)] |
== - [С (t) W (t A- ДО С (t) At2 |
+ |
|
-f- B (t) At A- О (ДО] - 1 [ С (0 W (t -f- ДО At - f О (At2)} |
= |
= - |
[С (0 W(t + ДО С (0 |
At А-В |
(t) А-О (At2)]'1 |
[С |
(t) W (t - f |
|
|
+ |
д/) + |
о ( д о ] . |
|
|
|
|
В пределе при At—>-0 отсюда следует, что |
|
|
|
|
S(i)=—B-i(t)C,(t)W(t) |
|
(10-28) |
ДЛЯ tos^ts^.ti. |
|
в пределе при А^—*-0 остает |
|
Вид уравнения (10-19) |
ся |
прежним: |
|
|
|
|
|
|
|
|
u(t) |
= |
S (t)x (t\ t) |
|
(10-29) |
для to<cZ-t<£Zti. Оптимальное управление для задачи не прерывного стохастического линейного регулятора опи сывается уравнениями (10-27) — (10-29).
|
|
|
Для определения матрицы передачи обратной |
связи |
S(t) |
требуется решить систему обыкновенных диффе |
ренциальных уравнений первого порядка (10-27) |
при |
граничном условии № ( 0 ) = Л . Ясно, что вычисления |
сле |
дует |
проводить в обратном времени, начиная с 0. Урав |
нение (10-27) является матричным дифференциальным уравнением Риккати, точно таким же, какое было рас-
смотрено |
ранее |
в непрерывной |
задаче |
оптимальной |
фильтрации. |
|
|
|
|
Матрица W(l) |
симметрическая |
и в силу этого, как и |
в задаче |
фильтрации, |
содержит |
п(п+\)/2 |
различных |
элементов. |
|
|
|
|
|
Теперь |
из уравнений |
(10-27) и |
(10-28) |
очевидна при |
чина требования положительной определенности матри
цы |
B(t) |
в критерии качества |
(Ю-З) для / о < І ^ Л - |
|
Как и следовало ожидать, здесь также получен прин |
цип |
разделения. Из уравнений |
(10-27) и (10-28) видно, |
что S (г) |
не зависит от статистических |
параметров задачи, |
а именно от P(to), Q(t) и R(t). |
Если |
все переменные со |
стояния можно измерить точно, уравнение (10-29) прини
мает вид u{t) =S(t)x{t). |
Ясно, |
что способ |
определения |
S(t) не зависит от наличия или отсутствия |
неопределен |
ности в системе. |
|
|
|
|
|
Для |
стохастической |
задачи |
в оптимальном |
фильтре |
должно |
быть |
учтено влияние |
управляющего |
воздейст |
вия. Поэтому |
уравнение |
фильтра здесь |
принимает вид: |
|
x = F (t) x + К (t) [г {t) - |
H (t),x] + |
С (t) и (t) |
для to^t^ti, где все обозначения были введены ранее.
10-4. КРИТЕРИЙ КАЧЕСТВА |
|
|
|
|
|
|
|
Возвращаясь |
вновь |
к |
эквивалентной |
дискретной |
задаче |
|
и полагая, |
что |
t |
обозначает |
дискретное |
время |
t = to+>k>M\ |
k — 0, |
1, |
|
N—1, из |
уравнений |
|
(9-84) и |
(9-85) |
имеем: |
|
|
|
|
|
|
|
|
|
|
|
|
|
V(ti—t) |
= Е[х' |
(t)M(t)x{t)]+a(4); |
|
|
(10-30) |
a(t) |
= |
a(t |
+ At) -f- E [w' (t) Г" (r + |
At, t)W (t + |
At) Г (t + |
+ |
At, t)w(t)\- |
E[x'(t |
|
I *)Ф'(/ + |
Д*, t)W{t |
+ |
|
|
|
+ At)W(t-y-At, |
t)S(t)x(t |
I t)]. |
|
|
(10-31) |
В уравнении (10-30) |
V(ti—t) |
соответствует |
величи |
не VN-k |
из уравнения |
(9-84) |
и является значением кри |
терия |
качества оптимального |
управления на |
интервале |
[t, ti], |
|
где |
t — дискретное |
время, |
определенное |
выше. |
Согласно § 9-3 граничное условие для уравнения |
(10-31) |
имеет вид а(/і) =0. |
|
|
|
|
|
|
|
|
|
|
Подставляя уравнение (10-24) в уравнение (10-30), получаем выражение
V(h-t)=E{x'(t)[W(t)-A(t)St]x(t)} |
+ a(t), |
которое в пределе при At—>0 принимает вид
V(ti—t) =E[x'{t)W(t)x(t)] |
+ a(t) |
(10-32) |
В предположении, что существует предел lima(/).
В уравнении (10-32) t является непрерывной пере менной, определенной на интервале [to, ti].
Поскольку в первую очередь обычно требуется полу чить значение критерия качества для всего интервала
управления, |
то, положив |
в уравнении |
(10-32) |
t = t0, |
по |
лучим: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
V(ti-t0)=E[x/(io)W(to)x(t0)] |
|
|
|
+ |
a(to). |
|
|
|
|
Отсюда |
следует, что |
|
|
|
|
|
|
|
|
|
|
|
|
|
ѵ(*. - g=s P £ [ и ? ( д ( g ] |
+ |
|
|
|
|
|
|
|
+ a (t0) = |
Sp [W (/„) P (t0)) |
+ |
a (t0), |
|
|
( 10-33) |
где матрица |
W(t0) |
является решением уравнения |
(10-27), |
а P (t0)—корреляционная |
|
матрица |
начального |
состоя |
ния. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Теперь |
исследуем |
предельное |
поведение |
уравнения |
(10-31) |
при |
At—>-0. Вначале |
запишем |
это |
уравнение |
в виде |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a (/) = |
a (t + M) - f E {S? [Г' |
|
(t-\-At,t)W(tA~ |
|
|
- f |
At) Г (t + |
Д*. /) w (t) w' (t)]}- |
E {Sp [Ф' (t - f Д*. 0 W (t |
+ |
+ |
Д ^ У ^ + Д/, |
|
|
I t)x'{t |
I 01} = a |
+ Д0 + |
|
|
+ |
S? [ P |
(* + |
Д*. t)W (t -\- At)Y(t |
+ |
|
|
|
|
|
- |
|
— Sn [Ф' (t A- At, |
t) W (t + |
ДО ЧГ (* + |
Д*, 0 5 (t) P (t \ t)}, |
где использованы |
соотношения |
|
|
|
|
|
|
|
(10-34) |
|
|
|
|
|
|
|
|
|
|
|
|
|
E[w(t)w'(t)] |
= |
Q(t)/At; |
|
|
|
|
|
|
|
|
|
|
E[x(t\t)x'(t\t)\ |
|
= |
P(t\t). |
|
|
|
|
|
Последняя матрица представляет собой корреляцион ную матрицу ошибки фильтрации.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Подставляя |
в |
(ІО-34) |
уравнения |
(10-6) — (10-8) и |
группируя |
члены, получаем: |
|
|
|
|
|
|
|
|
a (t) = |
a (t + At) -f Sp -J [G' (t) At A-О {At2)] W (t + |
|
|
+ |
ДО [G (0 At Ar О (At2)} Ш. |
\ ~ So {[/ + F (t) At + |
|
|
+ |
О (At2)} W (tArAt) |
[C (t) At Ar О (At )} S (t) P (t | 0} |
= |
= |
a (t Ar At) Ar Sp [G' (t) W (t + At) G (t) Q(t) + 0 (At)} At |
- |
|
|
- |
Sp [W (t Ar At) С (0 S(t)P(t |
I t)-\-0 |
(At)} At. |
( 10-35) |
Из (10-35) ясно, |
что l\m a. (t-{-At) —a. (t). |
Перенеся |
a(t |
+ At) |
в левую часть уравнения и разделив |
обе части |
на At, в пределе при At—й) |
получим: |
|
|
|
|
|
|
|
|
- * |
= |
|
Sp[G'(t)W(t)G(t)Q(t)]~ |
|
|
|
|
|
|
|
|
- |
Sp [w (о с (о s (о P (t I 01 |
|
(10-36) |
для |
U^t^ti, |
где использовано |
существование |
извест |
ных пределов |
|
lim S (0; |
lim P (t | 0- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Здесь |
|
первый |
предел |
|
определяется |
уравнением |
(10-28), |
а |
второй |
является |
корреляционной |
матрицей |
ошибки оптимальной непрерывной линейной фильтрации. Из уравнения (10-28) следует:
C'(t,)W(t)=-B(t)S(t).
Транспонируя обе части этого соотношения и учиты вая симметричность матриц W(t) и В(і), имеем:
W(t)C(l)=—S'(t)B(t).
Используя этот результат, можно представить урав нение (10-36) в виде
a = - S p [G'(t)W(t)G(t)Q(t)} |
- |
|
|
-~Sp[S'(t)B(t)S(t)P{t |
\t)} |
(10-37) |
для to^t^ti. |
Напомним, что этому |
уравнению |
соответ |
ствует граничное условие а(0 ) =0. |
|
|
Решение |
уравнения (10-37) позволяет получить з н а |
чение a (/о), |
необходимое для вычисления |
V (0—to) |
28—85 |
|
|
425 |
Ö помоидью уравнения (ІО-33). Как можно |
видеть, вы |
ражение для а(7) состоит из двух |
слагаемых, |
аналогич |
ных слагаемым |
a(k) |
в дискретной |
задаче. Первое сла |
гаемое связано |
с |
возмущением |
системы, |
а |
второе — |
с ошибкой фильтрации. Поэтому возможна |
интерпрета |
ция уравнения (10-33), аналогичная интерпретации кри терия качества дискретного стохастического линейного
регулятора |
(см. пример 9-4). |
|
|
|
|
|
|
|
Сформулируем полученные результаты в виде сле |
дующей теоремы. |
|
|
|
|
|
|
|
|
|
Теорема |
10-1. Оптимальное |
управление |
|
для |
задачи |
непрерывного |
стохастического |
линейного |
|
регулятора |
описывается |
соотношениями |
|
|
|
|
|
|
|
|
|
|
u(t)=^S(t)x(t |
I t); |
|
|
|
(10-38) |
|
|
|
S(t)=—B-l(t)C'(t)W(t); |
|
|
|
|
(10-39) |
W=-F' |
(t)\W - |
WF (t) -4rWC(t)Bi |
|
(t) С |
(t) |
W — A (t); |
|
|
|
|
|
|
|
|
|
|
|
(10-40) |
|
x = |
F(t)x + 'K (t)[z{t)-H |
{t)x]4rC(t)u(t) |
|
(10-41) |
для t0<t<tl, |
где |
W(tt) = A, |
a |
x^=x(t |
\t) |
— |
опти |
мальная |
текущая |
оценка |
состояния |
системы. |
|
|
Значение |
критерия качества |
для |
оптимального |
управ |
ления составляет: |
|
|
|
|
|
|
|
|
|
|
|
V (ti—to) = Sp [W (to) P(to)] |
+ a(t0), |
|
(10-42) |
где |
a(t0) |
—решение |
дифференциального |
уравнения |
|
|
|
k = |
|
-Sp[G'(t)W(t)G(t)Q(t)]- |
|
|
|
|
|
—Sp [S'(t)B(t)S(t)P(t\t)] |
|
|
|
|
(10-43) |
для |
to^t^ti |
при |
условии |
a(ti)=0. |
|
Здесь |
P(t\t) |
явля |
ется корреляционной |
матрицей |
ошибки |
фильтрации. |
|
Структурная схема оптимальной системы управления |
изображена |
на рис. 10-3. |
|
|
|
|
|
|
|
|
Принцип |
разделения |
для задачи |
стохастического ли |
нейного регулятора получен Поттером [Л. 10-18] в 1964 г. Результаты Уонхэма [Л. 10-22], полученные в 1968 г., позволили применить принцип разделения к значительно
более широкому классу |
задач. В частности, доказано, |
что для справедливости |
принципа |
разделения критерий |
качества не |
обязательно |
должен |
быть квадратичным, |
а управление |
линейным |
относительно состояния или его |
оптимальной |
оценки. |
|
|
C(t)
z(t) =^Ф=^\ Kit) x(t\t) S(t) U LL(t)
F(t)
Н(і)
Рис. 10-3. Оптимальная система управления для задачи непрерыв ного стохастического линейного регулятора.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Пример 10-1. Рассмотрим класс |
задач, |
в которых |
все |
компо |
ненты вектора состояния системы x=F(t)x+G(t)w |
(t) + |
G(t)u(t) |
можно |
измерить |
точно при Г о ^ ^ і , |
а |
критерий |
|
качества |
описы |
вается уравнением (10-3). |
|
|
|
|
|
|
|
|
|
Поскольку |
переменные состояния можно'измерить |
точно, x (г | г) = |
Il x (t) с нулевой |
ошибкой, |
так что |
P(t\t) |
— 0 |
для |
г 0 ^ / < ^ . |
Оптимальное управление имеет вид u(t) |
=S(t)x(t), |
|
где S(t) |
опре |
деляется с помощью уравнений (10-39) |
и (10-40). |
|
|
|
|
Для |
вычисления |
критерия |
качества |
рассмотрим первое |
равен |
ство в |
(10-33). Поскольку x{to) |
можно |
измерить |
точно, |
то |
|
|
|
Vitt—to) |
=Sp E{W ito)xita)x' |
іЩ+aito) |
|
= |
|
|
|
|
|
=SplWit0)x(lo)x'it0)] |
|
+ |
aiU) |
|
|
|
|
или, что то же самое, |
|
|
|
|
|
|
|
|
|
|
|
|
|
Vid—to) =x'it0) |
Wito)xito)+a(to). |
|
|
(10-44) |
Так |
как Pit\t)=0 |
для ^о=£^=£^і, |
то |
уравнение |
(10-43) |
примет |
вид |
|
|
à=-Sp |
[G'(t)W(t) |
G(t)Q(t)] |
|
|
|
|
|
|
|
|
|
|
|
для ttt^t^ti, |
где а(^і)=0, |
а |
матрица |
W(r) является |
решением |
уравнения (10-40). Интегрируя последнее уравнение, получаем соот ношение
|
U |
|
|
|
|
а (*„) = |
Sp J G' {t) W it) |
G {t) Q it) |
dt, |
|
(10-45) |
|
h |
|
|
|
|
которое определяет составляющую критерия качества, |
обусловлен |
ную возмущением системы. Очевидно, |
что если |
возмущение |
системы |
отсутствует, то задача |
становится детерминированной |
при |
<х(го)=0 |
иVih—to)=Jc'(to)W{to)x{tQ).
Рассмотрим в качестве |
частного случая скалярную систему х = |
= w(t)+u(t) для O s g / s s r , |
где 7" = const>0. |
Предположим, что Q (t) = |
> |
0. |
Выберем критерий качества |
вида |
|
|
|
|
|
|
|
т |
|
|
|
|
/ = |
£ J |
[Y2 *2 |
(0 |
+«2 |
(01 |
Л . |
где у — положительная |
постоянная. Этот |
критерий качества являет |
ся комбинацией взвешенного квадрата ошибки и управляющего уси лия.
|
Для |
этого |
случая F(/)=0; |
G ( / ) = C ( 0 = 1; |
A(t)=y2; |
B(t) = l; |
|
Л = 0 . Следовательно, уравнение |
(10-40) |
принимает вид |
|
|
|
|
|
|
|
|
117= W 2 — Y 2 |
|
|
|
|
|
|
|
|
|
для О ^ ^ Г при |
W(T)=0. |
Решением |
этого |
уравнения |
является: |
|
|
|
|
|
|
|
|
U7(r)=Yth у(Т—t). |
|
(10-46) |
|
|
|
|
|
|
Поскольку |
B(t)=C(t)=\, |
из |
урав- |
|
|
|
|
|
еения (10-39) |
следует, что 5 ( 0 = — W ( t ) . |
|
|
|
|
|
Коэффициент |
обратной |
связи |
изображен |
|
|
|
|
|
на |
рис. 10-4 в |
виде |
функции |
времени. |
|
-у thy |
|
|
|
Заметим, что максимум модуля коэффи |
|
|
|
|
циента |
обратной |
связи |
приходится |
на |
|
Рис. 10-4. |
Коэффициент |
момент |
t=0, |
где 5 ( 0 ) = —Y th уТ, а |
за" |
|
тем он монотонно убывает до нуля. Так |
|
передачи |
обратной |
свя |
|
как |
0<th Y |
^ |
^ |
I |
для всех уТ>0, |
то от |
|
зи как функция |
времени. |
сюда |
следует, |
что |
всегда |
|S(f)|<!Y- |
|
|
|
|
|
Очевидно |
чем больше |
вес ошибки |
по |
сравнению с весом управляющего усилия в критерии качества, тем больше пиковая амплитуда коэффициента обратной связи.
Из уравнения (10-45) имеем:
что приводит к соотношению а(0) = а ^ 1 п с И 7 \
Подставляя этот результат вместе с соотношением W(Q)=ythyT в уравнение (10-44), получаем:
Ѵ(Т) = fx2 (0) th чТ + °l In ch Y7\
Если у выбрать настолько большим, чтобы уТ^>\, то
V (Т) % у*2 (0) + < & Y7" = у [x2 (0) + *%Т].
Здесь видно, что воздействие возмущения системы на критерий качества прямо пропорционально интервалу времени управления.
З А Д А Ч И К ГЛ. 10
10-1. Рассмотрим задачу непрерывного детерминированного линейного регулятора, определяемую соотношениями
|
|
к = F {() x + С (t) |
и (t); |
|
|
|
|
|
|
t, |
|
|
|
|
|
|
I |
= x' (t,) |
Ах (tt) |
+ J \x' (t) |
A (t) x (t) + |
u' (t) В (t) и (t)] |
dt, |
|
|
|
to |
|
|
|
|
|
|
где to^t^t,, в |
предположении, |
что x(to) |
известно, x(t) |
можно |
измерить точно и требуется определить |
управление |
u(t) для t0cZ |
^t^ti, |
минимизирующее /. |
|
|
|
|
|
|
а) |
Для данного te[t0, ti] |
и x{t)=x |
определить |
значение |
|
V (x, t) = min |
I x' (t,) |
Ax (t,) -f |
( [x' (t) A (x) x (x) |
+ |
|
|
"(x) |
[ |
|
} |
|
|
|
|
+« ' ( x ) ß ( x ) M ( x ) ] r f x j
и, используя принцип оптимальности, показать, что функция V(x, t) должна удовлетворять уравнению
|
|
|
|
|
|
|
|
|
|
|
|
дѴ |
|
min [х'Ах -4- и'Ви + (ѵхѴ) х] |
|
|
|
|
-щ- |
= |
|
|
|
для всех t^to, t\\ при |
граничном |
условии |
V(x, ti) |
|
=x'(ti)Ax(ti). |
Здесь |
ѴхѴ означает |
градиент |
V |
по х, т. е. вектор-строку |
вида |
[дѴ/дХі |
. . . дѴ/дХп]. |
При решении задачи |
разделить интервал |
[t, h] |
на два интервала [t, t+At] |
и {t+At, |
tt], |
а затем |
использовать |
принцип оптимальности, |
полагая, |
что функция V(x, |
t) |
непрерывна |
и непрерывно дифференцируема для любых значений х |
и t, |
ta-^t^ |
^ti. |
(Приведенное уравнение в частных |
производных |
является ча |
стным случаем функционального уравнения динамического програм мирования для оптимального управления. После минимизации полу
чается |
уравнение, |
называемое |
уравнением |
Гамильтона—Якоби — |
Беллмана). |
|
|
|
|
|
|
б) Проделав указанную операцию минимизации, показать, что |
оптимальное управление u(t) имеет вид: |
|
|
|
|
|
|
« (0 = - 4- в-1 |
(О С (t) [VxV |
(x, t)]' |
|
и получить уравнение Гамильтона — Якоби, которому |
должна удов |
летворять функция V(x, t). |
|
|
|
|
|
в) |
В |
качестве |
возможного |
решения |
уравнения |
Гамильтона — |
Якоби |
из |
п. «б» принять V(x, |
t)=x'W(t)x, |
|
где |
W(t) — симметри |
ческая матрица, и показать, что матрица |
W(t) |
должна удовлетво |
рять уравнению (10-40): |
|
|
|
|
|
|
W = |
— F'(t)W |
— WF (t) + |
WC(t)B~' |
(t) С (t)W — A (t), |