Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

afanasev_v_n_optimalnye_sistemy_upravleniya_ana

.pdf
Скачиваний:
20
Добавлен:
29.03.2016
Размер:
1.77 Mб
Скачать
R(t)u(t) T (t)B(t);
Q(t)x(t) T (t)A(t);

Оптимальное управление, учитывая полученные результаты, существует, единственно и определяется уравнением

u(t) R 1(t)BT (t)K(t)x(t), (5.25)

где K(t) – симметричная матрица, являющаяся решением дифференциального уравнения типа Риккати (5.22) с граничным условием (5.24).

Состояние оптимальной системы есть решение линейного дифференциального уравнения

d x(t) A(t) B(t)R 1(t)BT (t)K(t) x(t),

(5.26)

dt

x(t0 ) x0 .

Покажем теперь, что экстремальное управление (5.25) является по крайней мере локальным минимумом критерия качества J(x,u). Напомним, что если матрица

2H(x,u, ,t)

 

2 H(x,u, ,t)

 

 

 

 

 

 

 

 

 

 

 

x

2

(t)

 

x(t) u(t)

(5.27)

 

 

 

 

2H(x,u, ,t)

 

2 H(x,u, ,t)

 

 

 

 

 

 

 

 

 

 

 

u(t) x(t)

 

u

2

(t)

 

 

 

 

 

 

положительно определена, то управление, при котором H(x,u, ,t)/ u(t) 0, должно быть оптимальным, хотя бы локально.

Из уравнения, определяющего гамильтониан в рассматриваемой задаче (5.6), получим

H(x,u, ,t)

x(t)

2H(x,u, ,t) Q(t);

x2(t)

H(x,u, ,t)

(5.28)

u(t)

2H(x,u, ,t) R(t);

u2(t)

2H(x,u, ,t) 0.

x(t) u(t)

Подставляя (5.28) в (5.27), получим матрицу

Q(t)

0

(5.29)

 

0

.

 

R(t)

 

Так как матрица R(t) положительно определена, а матрица Q(t) положительно полуопределена, то матрица (5.29) тоже положительно полуопределена. Однако, так как высшие производные H(x,u, ,t)по u(t) равны нулю, то для данной задачи предположение о положительной полуопределенности матрицы (5.29) является достаточно сильным, чтобы гарантировать, что управление (5.25) минимизирует критерий качества, по крайней мере локально.

93

Найдем значение функционала качества, принимаемое при оптимальном управлении и соответствующей ему оптимальной траектории. Для этого в подынтегральную часть функционала качества (5.5) добавим

выражение

d

[xT (t)K(t)x(t)],

компенсировав

вне интеграла

выражением

 

 

 

dt

 

 

 

xT (t0 )K(t0 )x(t0 ) xT (T)K(T)x(T).

Принимая во

внимание, что

K(T) F , и

учитывая уравнение (5.22), получим

 

 

J0 (x,u)

1

xT (t0 )K(t0 )x(t0 ).

 

 

(5.30)

 

 

 

2

 

 

 

 

Таким образом, оптимальное (минимальное) значение функционала зависит как от начального состояния объекта x(t0), так и от его структурно – параметрической характеристики, сосредоточенной в полученном выражении значения матрицы K(t0).

Доказывая положительную определенность матрицы K(t), допустим, что при t=t1<T матрица K(t) не является положительно определенной. Тогда

существует x(t ) такое, что

1

xT (t

)K(t

)x(t

) 0. При этом, очевидно,

2

1

1

1

1

 

нарушается положение: если u(t) 0,то J(x,u)>0, которое следует из положительной полуопределенности матриц F и Q(t) и положительной определенности матрицы R(t). Поэтому матрица K(t) должна быть положительно определенной.

Покажем, что J0(x,u) является решением дифференциального уравнения в частных производных Гамильтона – Якоби и что оно удовлетворяет граничным условиям.

Заметим, что при t=T уравнение (5.30) запишется в виде

J0 (x,T)

1

xT (T)Fx(T).

(5.31)

 

2

 

 

Уравнение Гамильтона – Якоби для системы (5.4) и функционала (5.5) имеет вид

J0 (x(t),t)

t

 

 

 

 

1

xT (t)Q(t)x(t)

1

uT (t)R(t)u(t)

(5.32)

min

2

 

 

u(t)

 

 

 

2

 

 

 

 

J

0

(x(t),t)

 

 

 

 

 

 

 

 

 

[A(t)x(t) B(t)u(t)] 0.

 

 

 

 

 

 

 

 

 

x(t)

 

 

 

 

 

 

 

 

 

 

Стоящее в скобках выражение минимизируется управлением

T

u(t) R 1(t)BT (t) J0 (x(t),t) . (5.33)

x(t)

Подставляя соотношение (5.33) в уравнение (5.32), получим

94

 

 

J0 (x(t),t)

1

 

x

T

(t)Q(t)x(t)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 J0(x(t),t)

 

 

 

 

1

 

 

 

T

 

 

J0 (x(t),t) T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

B(t)R

 

(t)B

 

(t)

 

 

 

 

 

 

 

 

 

 

 

 

x(t)

 

 

 

 

 

 

 

 

x(t)

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(5.34)

 

 

 

 

0

(x(t),t)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J

 

 

A(t)x(t)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x(t)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J0 (x(t),t)

 

 

 

 

1

 

 

 

T

 

 

J0 (x(t),t) T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

B(t)R

 

(t)B

 

(t)

 

 

 

 

0.

 

 

x(t)

 

 

 

 

 

x(t)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Но если J0 (x(t),t)

1

xT (t)K(t)x(t), то

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J0(x(t),t)

1

 

T

 

 

d

 

 

 

 

 

 

 

 

и

 

J

0 (x(t),t)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

(t)

 

 

 

K(t) x(t)

 

 

 

 

 

 

 

K(t)x(t).

 

t

 

 

 

 

2

 

 

 

 

 

 

 

 

x(t)

 

 

 

 

 

 

 

 

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

С учетом последнего уравнение (5.34) принимает вид

xT (t) d K(t) K(t)A(t)dt

K(t)B(t)R 1(t)BT (t)K(t)

AT (t)K(t)

(5.35)

Q(t) x(t) 0.

Таким образом, K(t) удовлетворяет решению уравнения Риккати (5.22).

Заметим, что функция J0 (x(t),t)

1

xT (t)K(t)x(t) является

решением

 

2

 

 

,T]. При t=t дает

уравнения Гамильтона – Якоби при любых x(t) Rn , t [t

0

 

 

 

 

0

оптимальное значение критерия качества

J0 (x,u) 1 xT (t0 )K(t0 )x(t0 ), 2

что совпадает с полученными ранее результатами.

Отметим, что оптимальная система с обратной связью, полученная в данном разделе, линейна, но имеет переменные параметры. Это справедливо и в том случае, когда матрицы A(t), B(t), Q(t), R(t) не зависят от времени, а интервал [t0,T] конечен.

Предположим, что указанные матрицы не зависят от времени (постоянные на всем интервале управления системой), матрица F=0 и интервал управления T . Таким образом, задача формулируется в следующем виде. Дан объект

d x(t) Ax(t) Bu(t),

(5.36)

dt

x(t0 ) x0

и задан функционал качества

J(x,u) 1

 

 

xT (t)Qx(t) uT (t)Ru(t) dt ,

(5.37)

2 0

где матрицы Q и R положительно определены.

95

Требуется построить управление, минимизирующее функционал (5.37) на объекте (5.36) при условии, что на управление не наложены ограничения.

Очевидно, что матрица K(t) будет являться решением уравнения Риккати, которое должно удовлетворять граничному условию K(T)=0.

Оптимальное управление существует, единственно и определяется уравнением

 

(5.38)

u(t) R 1BT K x(t),

где K - постоянная положительно определенная матрица размера n x n, являющаяся решением нелинейного матричного алгебраического уравнения:

 

 

 

 

(5.39)

K A AT K KBR 1BT K Q 0 .

Можно показать, что из предположения об управляемости системы

(5.36) и из F=0 следует существование lim K(T), его единственность, а также

T

равенство

lim K(T) K,

T

где K - положительно определенная матрица, являющаяся решением алгебраического уравнения (5.39).

Оптимальная траектория определяется решением линейного инвариантного однородного дифференциального уравнения

d

 

 

 

x(t) A BR 1BT K

x(t),

(5.40)

dt

 

 

x(t0 ) x0 .

Минимальное значение функционала качества равно

 

1

 

(5.41)

J0 (x,u)

xT (t0 )Kx(t0 ).

 

2

 

 

Отметим, что собственные значения матрицы G A BR 1BT K должны иметь отрицательные действительные части и поэтому оптимальная система (5.40) устойчива. Только в этом случае значение функционала качества (5.41) будет принимать конечное значение.

§ 5.3. Задача о регуляторе выхода

Рассмотрим задачу о регуляторе выхода. Пусть наблюдаемый и управляемый объект описывается следующими выражениями:

d x(t) A(t)x(t) B(t)u(t), dt

x(t0 ) x0 ,

 

 

(5.42)

y(t) C(t)x(t).

 

 

 

Здесь x(t) Rn , u(t) Rr , y(t) Rm ,

0 m r n .

 

Пусть задан функционал качества

 

J(x,u)

 

 

 

 

1

 

1

T

 

(5.43)

 

yT (T)Fy(T)

yT (t)Q(t)y(t) uT (t)R(t)u(t)dt,

 

 

 

2

2

t0

 

 

 

 

 

 

 

 

96

где матрицы F и Q(t) положительно полуопределенные, матрица R(t) положительно определена, u(t) не ограничено, время окончания переходного Т процесса задано.

Требуется построить управление, доставляющее минимум функционалу (5.43) на объекте (5.42).

Подставим выражение для y(t) в функционал (5.43). Будем иметь

J(x,u)

 

1

 

1

T

(5.44)

 

xT (T) (T)x(T)

xT (t) (t)x(t) uT (t)R(t)u(t)dt,

 

 

 

2

 

2

t0

 

где

 

 

 

 

(t) CT (T)Q(t)C(T).

(5.45)

(T) CT (T)FC(T),

Так как матрицы F и Q(t) симметричные, то и матрицы Ф(Т) и Р(t) симметричные. Если система наблюдаема, то матрица C(t) не может быть равной нулю ни при каком t [t0 ,T].

Используя результаты, полученные в предыдущем параграфе (§ 5.2), можно заключить, что оптимальное управление существует, единственно и определяется соотношением

u(t) R 1(t)BT (t)K(t)x(t),

(5.46)

где K(T) – положительно определенная матрица размера n x n есть решение уравнения Риккати:

d K(t) K(t)A(t) AT (t)K(t) dt

K(t)B(t)R 1(t)B(t)K(t) CT (t)Q(t)C(t) 0,

(5.47)

 

K(T) CT (T)FC(T).

 

Оптимальная траектория есть решение уравнения

 

 

d

x(t) [A(t) B(t)R 1(t)BT (t)K(t)]x(t),

(5.48)

 

 

 

dt

x(t0 ) x0.

Значение функционала качества при оптимальном управлении и соответствующей этому управлению траектории будет иметь вид

J0 (x,u) 1 xT (t0 )K(t0 )x(t0 ). 2

Отметим, что оптимальное управление есть функция состояния объекта, а не его выхода (измеряемых координат), даже если функционал качества является функцией выхода.

В стационарном случае, когда система управления описывается уравнением

d x(t) Ax(t) Bu(t), dt

x(t0 ) x0 ,

(5.49)

y(t) Cx(t),

97

функционал имеет вид

 

1

 

 

J(x,u)

yT (t)Qy(t) uT (t)Ru(t)dt ,

(5.50)

 

2

0

 

 

 

 

где матрицы Q и R – положительно определенные, оптимальное управление определяется соотношением

 

(5.51)

u(t) R 1BT K x(t).

 

 

Положительно определенная симметричная матрица

K является решением

алгебраического уравнения

 

 

 

 

 

(5.52)

K A AT K K BR 1BT K CT QC 0.

§ 5.4. Задача слежения

Пусть задана линейная наблюдаемая и управляемая система

d x(t) A(t)x(t) B(t)u(t), dt

x(t0 ) x0 ,

(5.53)

y(t) C(t)x(t).

 

Пусть вектор z(t) - желаемый выход системы, причем размерности вектора z(t) и вектора выхода y(t) одинаковы, т.е. z(t), y(t) Rm .

Задача заключается в том, чтобы отыскать управление, минимизирующее функционал качества

J(e,u)

 

1

 

1

T

(5.54)

 

eT (T)Fe(T)

eT (t)Q(t)e(t) uT (t)R(t)u(t) dt,

 

 

 

2

2

t0

 

 

 

 

 

 

где матрицы F и Q(t) положительно полуопределены, матрица R(t) – положительно определена, u(t) – не ограничено, Т – задано,

e(t) z(t) y(t).

(5.55)

Подставляя (5.55) в (5.54), выразим J(e,u) J(x,z,u). Гамильтониан для задачи слежения запишется в виде

H(x,z,u, ,t) 1 z(t) C(t)x(t) T Q(t) z(t) C(t)x(t)

2

(5.56)

 

1

 

 

uT (t)R(t)u(t T (t) A(t)x(t B(t)u(t)

 

2

 

 

Из условия H(x,z,u, ,t)/ u(t) 0

получим

u(t) R 1(t)BT (t) (t).

(5.57)

Так как R(t) положительно определена, то управление (5.57) минимизирует гамильтониан (5.56).

.

Условие d (t) H(x,z,u, ,t)/ x(t) T дает

d

dt

 

(t) CT (t)Q(t)C(t)x(t) AT (t) (t) CT (t)Q(t)z(t).

(5.58)

 

dt

 

Из уравнений (5.53) и (5.57) получим

98

d x(t) A(t)x(t) B(t)R 1(t)BT (t) (t). dt

Уравнения (5.58) и (5.59) объединим в каноническую систему

d

 

 

 

 

 

 

 

 

 

 

 

 

x(t)

 

 

A(t)

B(t)R 1(t)BT (t) x(t)

 

dt

 

 

 

 

 

 

T

 

T

 

 

 

d

(t)

C

 

(t)Q(t)C(t)

A (t)

(t)

 

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

T

 

z(t),

 

 

 

 

 

 

C

 

(t)Q(t)

 

 

 

 

 

 

(5.59)

(5.60)

краевые условия 2n линейных дифференциальных уравнений (5.60) заданы

при t=t0 x(t0 ) x0

и определяются при t=T из условия

 

 

1

 

T

T

 

(T)

 

e

 

(T)Fe(T)/ x(T) ,

(5.61)

2

 

 

 

 

 

 

т.е.

 

 

 

 

(5.62)

(T) CT (T)FC(T)x(T) CT (T)Fz(T).

Пусть (t,t0 ) фундаментальная матрица решений системы (5.60). Тогда

x(T)

x(t)

T

(T)

(T,t) (t)

t

 

 

 

 

 

 

 

0

 

(5.63)

(T, )

T

 

z( )d .

C

 

( )Q( )

 

Так же, как в § 5.2, разделив матрицу (t,t0 )на четыре блока, получим x(T) 11(T,t)x(t) 12 (T,t) (t)

T

(5.64)

12 (T, )CT ( )Q( )z( )d ,

 

t

 

(T) 21(T,t)x(t) 22 (T,t) (t)

(5.65)

T

22 (T, )CT ( )Q( )z( )d .

 

t

 

С другой стороны, (T)определяется выражением (5.62). Подставляя в (5.62) уравнение (5.64) и приравнивая правые части полученного выражения и уравнения (5.65), после алгебраических преобразований будем иметь

(t)

22 (T,t) CT (T)FC(T) 12 (T,t) 1{[CT (T)FC(T) 11(T,t)

21(T,t)]x(t)

(5.66)

T

 

CT (T)FC(T) 12 (T, ) 22 (T, ) CT ( )Q( )z( )d

t

 

СT (T)Fz(T)},

 

или

(5.67)

(t) K(t)x(t) g(t),

где

 

1

 

K(t) 22 (T,t) CT (T)FC(T) 12 (T,t)

CT (T)FC(T) 11(T,t) 21(T,t) ,

99

g(t) 22 (T,t) CT (T)FC(T) 12 (T,t) 1

T

CT (T)FC(T) 12 (T, )

t

 

22

(T, ) CT ( )Q( )z( )d CT (T)Fz(T)

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Установим свойства матрицы K(t) и вектора g(t). Для этого

продифференцируем выражение (5.67)

 

 

 

 

 

 

 

 

 

 

 

 

 

d

(t)

d

 

K(t)x(t) K(t)

 

d

x(t)

d

g(t).

 

 

 

 

 

 

 

 

(5.68)

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

dt

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

(5.59) и учитывая (5.67), получим

Подставляя в (5.68) выражение для x(t)

 

d

 

 

 

 

d

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

T

 

 

 

 

 

 

 

 

(t)

 

 

K(t) K(t)A(t) K(t)B(t)R

 

(t)B

 

(t)K(t) x(t)

 

 

dt

 

 

 

 

 

 

 

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

K(t)B(t)R 1(t)BT (t)g(t)

d

g(t).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

d

 

 

 

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

С другой стороны,

(t)

 

 

определено

 

 

было ранее выражением

(5.58).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Приравнивая полученное выражение к (5.58), будем иметь

 

d

 

 

K(t) K

(t)A(t) A

T

(t)K(t) K(t)B(t)R

1

(t)B

T

(t)K(t)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T

 

 

 

 

 

 

 

 

d

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

T

 

(5.69)

C

 

 

(t)Q(t)C(t) x(t)

 

 

 

g(t) [K(t)B(t)R

 

 

(t)B

 

(t)g(t)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.

 

 

 

 

 

 

 

 

 

 

 

 

AT (t)]g(t) CT (t)Q(t)z(t)

 

 

 

 

 

 

 

 

 

 

 

 

Поскольку оптимальное управление существует, то уравнение (5.69) должно выполняться при любых x(t), z(t), t [t0 ,T] . Следовательно:

1) матрица K(t) размера n x n удовлетворяет матричному уравнению типа Риккати:

d K(t) K(t)A(t) AT (t)K(t)

(5.70)

dt

K(t)B(t)R 1(t)BT (t)K(t) CT (t)Q(t)C(t) 0,

2)n – мерный вектор - столбец g(t) должен удовлетворять векторному дифференциальному уравнению

d g(t) [K(t)B(t)R 1(t)BT (t) AT (t)]g(t)

(5.71)

dt

CT (t)Q(t)z(t) 0.

Граничные условия получим следующим образом. Из уравнения (5.67) получаем

(T) K(T)x(T) g(T).

(5.72)

Приравнивая (5.62) и (5.72), получим

(5.73)

[K(T) CT (T)FC(T)]x(T) [g(T) CT (T)Fz(T)] 0.

Так как уравнение (5.73) должно выполняться при любых x(T) и z(Т), то

100

K1(t) K1(t)G(t) AT (t)K1(t)

K(T) CT (T)FC(T),

(5.74)

g(T) CT (T)Fz(T).

(5.75)

Таким образом, граничные условия дифференциальных уравнений (5.70) и (5.71) полностью определены в заданный конечный момент времени

Т.

Оптимальное управление, учитывая полученные результаты, существует, единственно и определяется уравнением

u(t) R 1(t)BT (t)[g(t) K(t)x(t)],

(5.76)

где K(t) – действительная, симметричная, положительно определенная матрица есть решение матричного дифференциального уравнения типа Риккати (5.70) с граничными условиями (5.74) и вектор - столбец g(t) – решение линейного векторного дифференциального уравнения (5.71) с

граничными условиями (5.75).

 

Оптимальная траектория, начинающаяся из исходного

состояния

x(t0 ) x0 , есть решение дифференциального уравнения

 

 

d

x(t) [A(t) B(t)R 1(t)BT (t)K(t)]x(t)

(5.77)

 

 

 

dt

B(t)R 1(t)BT (t)g(t).

 

Иногда желаемый выход системы представляют как решение некоторого вполне определенного дифференциального уравнения, например,

d

z(t) G(t)z(t), z(t

0 ) z0.

(5.78)

 

dt

 

 

Задачу построения управления, доставляющего минимум функционалу (5.54) на решения системы (5.53) с желаемым выходом (5.78), обычно называют задачей вывода и сопровождения объекта по желаемой траектории.

Найдем свойства вектор - столбца g(t), положив

 

g(t) K1(t)z(t).

 

 

 

(5.79)

Продифференцировав (5.79), будем иметь

 

 

d

d

 

 

 

 

(5.80)

 

 

g(t)

 

 

K1(t) K1

(t)G(t)

 

z(t) 0.

 

 

 

 

dt

dt

 

 

 

 

 

Из уравнений (5.71) и (5.80) получим d

dt (5.81)

K(t)B(t)R 1(t)BT (t)K1(t) CT (t)Q(t) 0.

Краевое условие для дифференциального уравнения (5.81) получим, рассмотрев (5.79) при t=T и сравнив полученное с условием (5.75). Будем иметь

K1(T) CT (T)F.

(5.82)

Оптимальное управление в рассматриваемом случае имеет вид u(t) R 1(t)BT (t)[K1(t)z(t) K(t)x(t)],

где матрица K1(t) определяется решением матричного линейного дифференциального уравнения (5.81) с краевым условием (5.82).

101

Оптимальная траектория, начинающаяся из исходного состояния x(t0 ) x0 , есть решение дифференциального уравнения

d x(t) A(t)x(t) B(t)R 1(t)BT (t)[K(t)x(t) K1(t)z(t)]. dt

В заключение данного параграфа рассмотрим задачу слежения для линейных инвариантных во времени систем. В этом случае матрицы A, B, C, G постоянны и известны, время окончания переходного процесса неограниченно возрастает, матрицы Q и R постоянны и положительно определены. Все результаты будут приближенными и справедливыми лишь для очень больших значений времени окончания переходного процесса Т.

Уравнения (5.53) и (5.78) будут иметь вид

d x(t) Ax(t) Bu(t), x(t0 ) x0 , dt

y(t) Cx(t)

d z(t) Gz(t), z(t0 ) z0. dt

Запишем функционал качества

T

J(e,u) 1 eT (t)Q(t)e(t) uT (t)R(t)u(t) dt,

2t0

где u(t) – не ограничено, Т – задано, e(t) z(t) y(t).

Оптимальное управление для рассматриваемой задачи имеет вид

u(t) R 1BT [K1 z(t) K x(t)],

где матрицы K и K1 являются решениями алгебраических уравнений

 

 

 

 

K A AT K KBR 1BT K CTQC 0,

 

 

 

 

K1 G [AT K BR 1BT ]K1 CTQ 0.

§ 5.5. Задача с фиксированными значениями некоторых переменных состояния в заданный момент окончания переходного процесса

Сформулируем задачу § 5.2 следующим образом: найти управление, минимизирующее критерий

 

 

 

1

T

 

 

J(x,u)

xT (t)Q(t)x(t) uT (t)R(t)u(t) dt

(5.83)

 

2

t0

 

на объекте

 

 

 

 

d

x(t) A(t)x(t) B(t)u(t)

(5.84)

 

 

 

dt

 

 

при терминальных ограничениях

 

 

x(t0 ) x0 ,

xi (T) 0 i 1,...,q .

(5.85)

Здесь Q(t), R(t) – положительно определенные симметричные матрицы, моменты t0, T –заданы.

102

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]