Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Медич Д. Статистически оптимальные линейные оценки и управление

.pdf
Скачиваний:
70
Добавлен:
25.10.2023
Размер:
13.81 Mб
Скачать

доступных данных о состоянии системы. Для этого представим уравнение (10-4) в дискретном виде:

u(t)=ii,[z(t0

+ iàt);

t = 0,

1, . . . , / ; x (to)],

(10-18)

где-* = *о + /А*; / = 0,

1, . . . . N— 1.

 

 

 

 

Эквивалентная

задача

 

 

 

 

 

Для заданного

значения

Л/ задача,

описываемая

уравнениями (10-5),

(10-9), (10-15) и (10-18), в которой

требуется определить управляющую

последовательность

{u(t)\ t — tc + jàt;

/ = 0, 1,

N—1},

минимизирующую

значение JN, В ТОЧНОСТИ совпадает с задачей

дискретного

стохастического

линейного

регулятора

из гл. 9.

 

В то же время в пределе при At—>-0 и Л/ таком, что

Л/А/ = /і—to, она

является

задачей непрерывного

стоха­

стического линейного регулятора, поставленной в § 10-1. Следовательно, теперь к этой задаче можно приме­

нить результаты гл. 9 и рассмотреть предельное

поведе­

ние полученного алгоритма управления.

 

 

 

 

10-3. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ

 

 

 

 

 

Для заданного N

и любого

t = t0 + jAt;

/ = 0,

1,

 

А/1 применение результатов гл. 9 к поставленной

здесь дискретной задаче приводит к следующей

системе

уравнений

оптимального управления:

 

 

 

 

 

 

u(t)=S(t)x{t

 

 

\ t);

 

 

(10-19)

W (t + At) =

M (t - f At) + A (t +

Д/) Д^;

(10-20)

S(t) =

— \W (t -f- At, t) W (t +

Ai) W(t

+

At, t) - f

 

-\-B(i)At]-1W'(t-]-At,

 

t)W(t

+

At)U>(t + At, t);

(10-21)

M (t) = Ф' (t - f

t)W(t

+

At) Ф(* +

Af, t) —

 

 

- Ф'(/ + A f , t)W(t

+ At)4r(t +

At, t)[4F'(t

+

At, t)W(t

+

 

+ At)W{t

+

At, t) +

B(t) Аі]~Р'(і

+

 

 

 

- f At, t) W (t - f At) Ф(і-{-

At,

t).

 

(10-22)

При составлении этих уравнений использованы урав­

нения (9-46) —(9-48),

(9-80), (10-16) и

(10-17).

 

 

Значения / при

вычислении

 

S(t),

как это видно

из

уравнений

(10-20) —(10-22),

равны t = t0

+ (N-l)At,

 

t0 +

+ (N—2)At,

to+At,

U.

 

 

 

 

 

 

 

 

420

Вычисления начинаются с граничного условия

W(to+№t)=W(t1)=A+A(ti)At,

(10-23)

полученного из уравнения (10-16). Последовательность

вычислений,

разумеется,

совпадает

с

последователь­

ностью вычислений в гл. 9.

 

 

 

 

 

 

 

 

 

 

 

 

 

Из уравнения

(10-20)

имеем:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M(t)=W(t)—A(t)At.

 

 

 

 

 

 

(10-24)

 

Подставляя этот результат в левую часть (10-22) и

решая

полученное уравнение относительно W(t),

имеем:

 

 

 

W (t) =

Ф' (t +

Д*, t)W(t

+

At) Ф (t +

At, t)

-

 

 

 

-

Ф'(^ +

Д ^

t)W(t

+ At)W(t

+

At,

t)[W'(t

+

At, t)W(t

+

 

 

+

At)W(t

+

At, t) +

B(t) At}~lW

(t + At, t)W (t

+

 

 

 

 

 

 

 

 

+

At) Ф (t +

 

t) +

A (t) At.

 

 

 

 

(10-25)

 

Подставляя

соотношения

(10-6) — (10-8)

 

в

уравнение

(10-25) и раскрывая скобки, получаем:

 

 

 

 

 

 

 

 

 

 

 

W (t) =

[/ + F (t) At +

О (At2)}'

W(t +

At) [I

+

 

 

 

- f

F (t) At +

О {At2)] -

 

[I + F (t) At +

О (At2)}'

W (t

+

 

+

At) [C (t) At +

O (At2)}

{[C (t) At + О (At2)]'

W {t

+

 

 

 

 

 

+ At) [C (t) At + О (At2)}

-\-B(t)

At}'1

[C(t) At

+

 

 

 

+

О (At2)}'

W(t

+ At) [I +

F (t) At + O (At2)]

+

A (t) At

 

=

=

W{t+At)

 

+

F' (t) W (t +

At) At +

W{t-[-

At) F (t) At

 

-

 

-

W (t +

At) С (t) [C (t) W(t-{-

At) С (t) At2

+

В (t) At

+

 

+

О (At3)} -1 С

(t) At2W (t +

At) +

A (t) At +

O (At2) =

 

 

=

W{t +

 

At) +

F'{t)W(t

 

+

At) At + W (t +

At) F (t) At

-

-W(t

 

+At)

 

С (t) [C (t) W (t+Af)

С (t) At + ß (t)} -1С

(t) W ( 4 -

 

 

 

 

 

 

+

At) At +

A (t) At +

O {At*).

 

 

 

 

(10-26)

 

Полагая,

что

предел

W(t+At)

при At—>-0

сущест­

вует, из уравнения (10-26)

имеем:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

l\vaW{t

+

At) = W(t).

 

 

 

 

 

 

 

 

 

Тогда,

переписывая уравнение (10-26) в виде

 

 

 

 

 

W(t)

— W(t +

At) =

F' (t) W{t + At) At +

W (t

+

 

 

 

+

At) F (t) At — W (t+

At) С (t) [С (t) W(t + At) С (t) At

+

 

 

 

+ В (t)} -1С

(t) W(t

+

At) At +

A (t) At +

O

(Af),

 

 

421

деля обе его части на Al и переходя к пределу при At—>-0, получаем матричное дифференциальное урав­ нение

— W(t) = F' (t) W(t) +

W (t) F

(t)~

 

- W(t)C{t)B-4t)C'{t)W{t)

+

A(t),

(10-27)

где t теперь обозначает непрерывное

время,

причем

fo<:f<*i .

Из уравнения (10-23) следует, что граничное усло­ вие, соответствующее уравнению (10-27), имеет вид:

№ ( 0 ) = Л .

Это условие получается в результате предельного перехода в выражении (10-23) при At—>-0.

Теперь рассмотрим предельное поведение уравнения (10-21). Подставляя в него соотношения (10-6) и (10-8), имеем:

 

S(t)=

{{С (t) At + О (At2)]' W(t + At) [С (t)"At +

 

+

О (M2)}

- f В (t) At} - 1

[C (t) At A-О (At2)}' W(t

+

bt)\I

+

 

+ F (t) At + О (At2)]

== - [С (t) W (t A- ДО С (t) At2

+

 

-f- B (t) At A- О (ДО] - 1 [ С (0 W (t -f- ДО At - f О (At2)}

=

= -

(0 W(t + ДО С (0

At А-В

(t) А-О (At2)]'1

(t) W (t - f

 

 

+

д/) +

о ( д о ] .

 

 

 

 

В пределе при At—>-0 отсюда следует, что

 

 

 

 

S(i)=—B-i(t)C,(t)W(t)

 

(10-28)

ДЛЯ tos^ts^.ti.

 

в пределе при А^—*-0 остает­

 

Вид уравнения (10-19)

ся

прежним:

 

 

 

 

 

 

 

 

u(t)

=

S (t)x (t\ t)

 

(10-29)

для to<cZ-t<£Zti. Оптимальное управление для задачи не­ прерывного стохастического линейного регулятора опи­ сывается уравнениями (10-27) — (10-29).

Для определения матрицы передачи обратной

связи

S(t)

требуется решить систему обыкновенных диффе­

ренциальных уравнений первого порядка (10-27)

при

граничном условии № ( 0 ) = Л . Ясно, что вычисления

сле­

дует

проводить в обратном времени, начиная с 0. Урав­

нение (10-27) является матричным дифференциальным уравнением Риккати, точно таким же, какое было рас-

422

смотрено

ранее

в непрерывной

задаче

оптимальной

фильтрации.

 

 

 

 

Матрица W(l)

симметрическая

и в силу этого, как и

в задаче

фильтрации,

содержит

п(п+\)/2

различных

элементов.

 

 

 

 

 

Теперь

из уравнений

(10-27) и

(10-28)

очевидна при­

чина требования положительной определенности матри­

цы

B(t)

в критерии качества

(Ю-З) для / о < І ^ Л -

 

Как и следовало ожидать, здесь также получен прин­

цип

разделения. Из уравнений

(10-27) и (10-28) видно,

что S (г)

не зависит от статистических

параметров задачи,

а именно от P(to), Q(t) и R(t).

Если

все переменные со­

стояния можно измерить точно, уравнение (10-29) прини­

мает вид u{t) =S(t)x{t).

Ясно,

что способ

определения

S(t) не зависит от наличия или отсутствия

неопределен­

ности в системе.

 

 

 

 

 

Для

стохастической

задачи

в оптимальном

фильтре

должно

быть

учтено влияние

управляющего

воздейст­

вия. Поэтому

уравнение

фильтра здесь

принимает вид:

 

x = F (t) x + К (t) [г {t) -

H (t),x] +

С (t) и (t)

для to^t^ti, где все обозначения были введены ранее.

10-4. КРИТЕРИЙ КАЧЕСТВА

 

 

 

 

 

 

 

Возвращаясь

вновь

к

эквивалентной

дискретной

задаче

 

и полагая,

что

t

обозначает

дискретное

время

t = to+>k>M\

k — 0,

1,

 

N—1, из

уравнений

 

(9-84) и

(9-85)

имеем:

 

 

 

 

 

 

 

 

 

 

 

 

 

V(ti—t)

= Е[х'

(t)M(t)x{t)]+a(4);

 

 

(10-30)

a(t)

=

a(t

+ At) -f- E [w' (t) Г" (r +

At, t)W (t +

At) Г (t +

+

At, t)w(t)\-

E[x'(t

 

I *)Ф'(/ +

Д*, t)W{t

+

 

 

 

+ At)W(t-y-At,

t)S(t)x(t

I t)].

 

 

(10-31)

В уравнении (10-30)

V(ti—t)

соответствует

величи­

не VN-k

из уравнения

(9-84)

и является значением кри­

терия

качества оптимального

управления на

интервале

[t, ti],

 

где

t — дискретное

время,

определенное

выше.

Согласно § 9-3 граничное условие для уравнения

(10-31)

имеет вид а(/і) =0.

 

 

 

 

 

 

 

 

 

 

423

Подставляя уравнение (10-24) в уравнение (10-30), получаем выражение

V(h-t)=E{x'(t)[W(t)-A(t)St]x(t)}

+ a(t),

которое в пределе при At>0 принимает вид

V(ti—t) =E[x'{t)W(t)x(t)]

+ a(t)

(10-32)

В предположении, что существует предел lima(/).

В уравнении (10-32) t является непрерывной пере­ менной, определенной на интервале [to, ti].

Поскольку в первую очередь обычно требуется полу­ чить значение критерия качества для всего интервала

управления,

то, положив

в уравнении

(10-32)

t = t0,

по­

лучим:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

V(ti-t0)=E[x/(io)W(to)x(t0)]

 

 

 

+

a(to).

 

 

 

 

Отсюда

следует, что

 

 

 

 

 

 

 

 

 

 

 

 

 

ѵ(*. - g=s P £ [ и ? ( д ( g ]

+

 

 

 

 

 

 

 

+ a (t0) =

Sp [W (/„) P (t0))

+

a (t0),

 

 

( 10-33)

где матрица

W(t0)

является решением уравнения

(10-27),

а P (t0)—корреляционная

 

матрица

начального

состоя­

ния.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Теперь

исследуем

предельное

поведение

уравнения

(10-31)

при

At—>-0. Вначале

запишем

это

уравнение

в виде

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a (/) =

a (t + M) - f E {S? [Г'

 

(t-\-At,t)W(tA~

 

 

- f

At) Г (t +

Д*. /) w (t) w' (t)]}-

E {Sp [Ф' (t - f Д*. 0 W (t

+

+

Д ^ У ^ + Д/,

 

 

I t)x'{t

I 01} = a

+ Д0 +

 

 

+

S? [ P

(* +

Д*. t)W (t -\- At)Y(t

+

 

 

 

 

 

-

 

— Sn [Ф' (t A- At,

t) W (t +

ДО ЧГ (* +

Д*, 0 5 (t) P (t \ t)},

где использованы

соотношения

 

 

 

 

 

 

 

(10-34)

 

 

 

 

 

 

 

 

 

 

 

 

 

E[w(t)w'(t)]

=

Q(t)/At;

 

 

 

 

 

 

 

 

 

 

E[x(t\t)x'(t\t)\

 

=

P(t\t).

 

 

 

 

 

Последняя матрица представляет собой корреляцион­ ную матрицу ошибки фильтрации.

424

Подставляя

в

(ІО-34)

уравнения

(10-6) — (10-8) и

группируя

члены, получаем:

 

 

 

 

 

 

 

 

a (t) =

a (t + At) -f Sp -J [G' (t) At A-О {At2)] W (t +

 

 

+

ДО [G (0 At Ar О (At2)} Ш.

\ ~ So {[/ + F (t) At +

 

 

+

О (At2)} W (tArAt)

[C (t) At Ar О (At )} S (t) P (t | 0}

=

=

a (t Ar At) Ar Sp [G' (t) W (t + At) G (t) Q(t) + 0 (At)} At

-

 

 

-

Sp [W (t Ar At) С (0 S(t)P(t

I t)-\-0

(At)} At.

( 10-35)

Из (10-35) ясно,

что l\m a. (t-{-At) —a. (t).

Перенеся

a(t

+ At)

в левую часть уравнения и разделив

обе части

на At, в пределе при At—й)

получим:

 

 

 

 

 

 

 

 

- *

=

 

Sp[G'(t)W(t)G(t)Q(t)]~

 

 

 

 

 

 

 

 

-

Sp [w с s P (t I 01

 

(10-36)

для

U^t^ti,

где использовано

существование

извест­

ных пределов

 

lim S (0;

lim P (t | 0-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Здесь

 

первый

предел

 

определяется

уравнением

(10-28),

а

второй

является

корреляционной

матрицей

ошибки оптимальной непрерывной линейной фильтрации. Из уравнения (10-28) следует:

C'(t,)W(t)=-B(t)S(t).

Транспонируя обе части этого соотношения и учиты­ вая симметричность матриц W(t) и В(і), имеем:

W(t)C(l)=—S'(t)B(t).

Используя этот результат, можно представить урав­ нение (10-36) в виде

a = - S p [G'(t)W(t)G(t)Q(t)}

-

 

 

-~Sp[S'(t)B(t)S(t)P{t

\t)}

(10-37)

для to^t^ti.

Напомним, что этому

уравнению

соответ­

ствует граничное условие а(0 ) =0.

 

 

Решение

уравнения (10-37) позволяет получить з н а ­

чение a (/о),

необходимое для вычисления

V (0—to)

28—85

 

 

425

Ö помоидью уравнения (ІО-33). Как можно

видеть, вы­

ражение для а(7) состоит из двух

слагаемых,

аналогич­

ных слагаемым

a(k)

в дискретной

задаче. Первое сла­

гаемое связано

с

возмущением

системы,

а

второе —

с ошибкой фильтрации. Поэтому возможна

интерпрета­

ция уравнения (10-33), аналогичная интерпретации кри­ терия качества дискретного стохастического линейного

регулятора

(см. пример 9-4).

 

 

 

 

 

 

 

Сформулируем полученные результаты в виде сле­

дующей теоремы.

 

 

 

 

 

 

 

 

 

Теорема

10-1. Оптимальное

управление

 

для

задачи

непрерывного

стохастического

линейного

 

регулятора

описывается

соотношениями

 

 

 

 

 

 

 

 

 

 

u(t)=^S(t)x(t

I t);

 

 

 

(10-38)

 

 

 

S(t)=—B-l(t)C'(t)W(t);

 

 

 

 

(10-39)

W=-F'

(t)\W -

WF (t) -4rWC(t)Bi

 

(t) С

(t)

W — A (t);

 

 

 

 

 

 

 

 

 

 

 

(10-40)

 

x =

F(t)x + 'K (t)[z{t)-H

{t)x]4rC(t)u(t)

 

(10-41)

для t0<t<tl,

где

W(tt) = A,

a

x^=x(t

\t)

опти­

мальная

текущая

оценка

состояния

системы.

 

 

Значение

критерия качества

для

оптимального

управ­

ления составляет:

 

 

 

 

 

 

 

 

 

 

 

V (ti—to) = Sp [W (to) P(to)]

+ a(t0),

 

(10-42)

где

a(t0)

—решение

дифференциального

уравнения

 

 

 

k =

 

-Sp[G'(t)W(t)G(t)Q(t)]-

 

 

 

 

 

—Sp [S'(t)B(t)S(t)P(t\t)]

 

 

 

 

(10-43)

для

to^t^ti

при

условии

a(ti)=0.

 

Здесь

P(t\t)

явля­

ется корреляционной

матрицей

ошибки

фильтрации.

 

Структурная схема оптимальной системы управления

изображена

на рис. 10-3.

 

 

 

 

 

 

 

 

Принцип

разделения

для задачи

стохастического ли­

нейного регулятора получен Поттером [Л. 10-18] в 1964 г. Результаты Уонхэма [Л. 10-22], полученные в 1968 г., позволили применить принцип разделения к значительно

426

более широкому классу

задач. В частности, доказано,

что для справедливости

принципа

разделения критерий

качества не

обязательно

должен

быть квадратичным,

а управление

линейным

относительно состояния или его

оптимальной

оценки.

 

 

C(t)

z(t) =^Ф=^\ Kit) x(t\t) S(t) U LL(t)

F(t)

Н(і)

Рис. 10-3. Оптимальная система управления для задачи непрерыв­ ного стохастического линейного регулятора.

Пример 10-1. Рассмотрим класс

задач,

в которых

все

компо­

ненты вектора состояния системы x=F(t)x+G(t)w

(t) +

G(t)u(t)

можно

измерить

точно при Г о ^ ^ і ,

а

критерий

 

качества

описы

вается уравнением (10-3).

 

 

 

 

 

 

 

 

 

Поскольку

переменные состояния можно'измерить

точно, x (г | г) =

Il x (t) с нулевой

ошибкой,

так что

P(t\t)

— 0

для

г 0 ^ / < ^ .

Оптимальное управление имеет вид u(t)

=S(t)x(t),

 

где S(t)

опре­

деляется с помощью уравнений (10-39)

и (10-40).

 

 

 

 

Для

вычисления

критерия

качества

рассмотрим первое

равен­

ство в

(10-33). Поскольку x{to)

можно

измерить

точно,

то

 

 

 

Vitt—to)

=Sp E{W ito)xita)x'

іЩ+aito)

 

=

 

 

 

 

 

=SplWit0)x(lo)x'it0)]

 

+

aiU)

 

 

 

 

или, что то же самое,

 

 

 

 

 

 

 

 

 

 

 

 

 

Vid—to) =x'it0)

Wito)xito)+a(to).

 

 

(10-44)

Так

как Pit\t)=0

для ^о=£^=£^і,

то

уравнение

(10-43)

примет

вид

 

 

à=-Sp

[G'(t)W(t)

G(t)Q(t)]

 

 

 

 

 

 

 

 

 

 

 

для ttt^t^ti,

где а(^і)=0,

а

матрица

W(r) является

решением

уравнения (10-40). Интегрируя последнее уравнение, получаем соот­ ношение

 

U

 

 

 

 

а (*„) =

Sp J G' {t) W it)

G {t) Q it)

dt,

 

(10-45)

 

h

 

 

 

 

которое определяет составляющую критерия качества,

обусловлен­

ную возмущением системы. Очевидно,

что если

возмущение

системы

отсутствует, то задача

становится детерминированной

при

<х(го)=0

иVih—to)=Jc'(to)W{to)x{tQ).

28*

427

Рассмотрим в качестве

частного случая скалярную систему х =

= w(t)+u(t) для O s g / s s r ,

где 7" = const>0.

Предположим, что Q (t) =

>

0.

Выберем критерий качества

вида

 

 

 

 

 

 

 

т

 

 

 

 

/ =

£ J

[Y2 *2

(0

2

(01

Л .

где у — положительная

постоянная. Этот

критерий качества являет­

ся комбинацией взвешенного квадрата ошибки и управляющего уси­ лия.

Для

этого

случая F(/)=0;

G ( / ) = C ( 0 = 1;

A(t)=y2;

B(t) = l;

Л = 0 . Следовательно, уравнение

(10-40)

принимает вид

 

 

 

 

 

 

 

117= W 2 Y 2

 

 

 

 

 

 

 

 

для О ^ ^ Г при

W(T)=0.

Решением

этого

уравнения

является:

 

 

 

 

 

 

 

U7(r)=Yth у(Т—t).

 

(10-46)

 

 

 

 

 

Поскольку

B(t)=C(t)=\,

из

урав-

 

 

 

 

еения (10-39)

следует, что 5 ( 0 = — W ( t ) .

 

 

 

 

Коэффициент

обратной

связи

изображен

 

 

 

 

на

рис. 10-4 в

виде

функции

времени.

-у thy

 

 

 

Заметим, что максимум модуля коэффи­

 

 

 

циента

обратной

связи

приходится

на

Рис. 10-4.

Коэффициент

момент

t=0,

где 5 ( 0 ) = Y th уТ, а

за"

тем он монотонно убывает до нуля. Так

передачи

обратной

свя­

как

0<th Y

^

^

I

для всех уТ>0,

то от­

зи как функция

времени.

сюда

следует,

что

всегда

|S(f)|<!Y-

 

 

 

 

Очевидно

чем больше

вес ошибки

по

сравнению с весом управляющего усилия в критерии качества, тем больше пиковая амплитуда коэффициента обратной связи.

Из уравнения (10-45) имеем:

что приводит к соотношению а(0) = а ^ 1 п с И 7 \

Подставляя этот результат вместе с соотношением W(Q)=ythyT в уравнение (10-44), получаем:

Ѵ(Т) = fx2 (0) th чТ + °l In ch Y7\

Если у выбрать настолько большим, чтобы уТ^>\, то

V (Т) % у*2 (0) + < & Y7" = у [x2 (0) + *%Т].

Здесь видно, что воздействие возмущения системы на критерий качества прямо пропорционально интервалу времени управления.

428

З А Д А Ч И К ГЛ. 10

10-1. Рассмотрим задачу непрерывного детерминированного линейного регулятора, определяемую соотношениями

 

 

к = F {() x + С (t)

и (t);

 

 

 

 

 

 

t,

 

 

 

 

 

 

I

= x' (t,)

Ах (tt)

+ J \x' (t)

A (t) x (t) +

u' (t) В (t) и (t)]

dt,

 

 

 

to

 

 

 

 

 

 

где to^t^t,, в

предположении,

что x(to)

известно, x(t)

можно

измерить точно и требуется определить

управление

u(t) для t0cZ

^t^ti,

минимизирующее /.

 

 

 

 

 

 

а)

Для данного te[t0, ti]

и x{t)=x

определить

значение

 

V (x, t) = min

I x' (t,)

Ax (t,) -f

( [x' (t) A (x) x (x)

+

 

 

"(x)

[

 

}

 

 

 

 

+« ' ( x ) ß ( x ) M ( x ) ] r f x j

и, используя принцип оптимальности, показать, что функция V(x, t) должна удовлетворять уравнению

 

дѴ

 

min [х'Ах -4- и'Ви + хѴ) х]

 

 

 

 

-щ-

=

 

 

 

для всех t^to, t\\ при

граничном

условии

V(x, ti)

 

=x'(ti)Ax(ti).

Здесь

ѴхѴ означает

градиент

V

по х, т. е. вектор-строку

вида

[дѴ/дХі

. . . дѴ/дХп].

При решении задачи

разделить интервал

[t, h]

на два интервала [t, t+At]

и {t+At,

tt],

а затем

использовать

принцип оптимальности,

полагая,

что функция V(x,

t)

непрерывна

и непрерывно дифференцируема для любых значений х

и t,

ta-^t^

^ti.

(Приведенное уравнение в частных

производных

является ча­

стным случаем функционального уравнения динамического програм­ мирования для оптимального управления. После минимизации полу­

чается

уравнение,

называемое

уравнением

Гамильтона—Якоби —

Беллмана).

 

 

 

 

 

 

б) Проделав указанную операцию минимизации, показать, что

оптимальное управление u(t) имеет вид:

 

 

 

 

 

 

« (0 = - 4- в-1

С (t) [VxV

(x, t)]'

 

и получить уравнение Гамильтона — Якоби, которому

должна удов­

летворять функция V(x, t).

 

 

 

 

 

в)

В

качестве

возможного

решения

уравнения

Гамильтона —

Якоби

из

п. «б» принять V(x,

t)=x'W(t)x,

 

где

W(t) — симметри­

ческая матрица, и показать, что матрица

W(t)

должна удовлетво­

рять уравнению (10-40):

 

 

 

 

 

 

W =

— F'(t)W

— WF (t) +

WC(t)B~'

(t) С (t)W — A (t),

429

Соседние файлы в папке книги из ГПНТБ