Теория автоматического управления. Волков В.Д., Смольянинов А.В
.pdfРешение второго уравнения (5.203) ищется в виде
(t,x ) |
1 |
xT K(t )x , |
(5.206) |
|
|||
2 |
|
|
|
где K(t) – неизвестная симметричная матрица (n n) (матрица коэффициентов обратных связей).
Задачей синтеза является определение матрицы коэффициентов ОС по состоянию К, доставляющей минимум функционалу (5.191). Минимизация функционала при динамических ограничениях в виде дифференциальных уравнений объекта дает условную экстремаль.
Подставляя (5.206) во второе уравнение (5.203), приравнивая к нулю квадратичные формы с использованием правила (5.202), получим уравнение Риккати в виде:
|
T |
(t )K(t ) K(t )A(t ) K(t )B(t )Q |
1 |
(t )B |
T |
|
|
K(t ) A |
|
|
(t )K(t ) S(t ), |
(5.207) |
|||
K(t2 ) |
|
|
|
|
|
||
|
|
|
|
|
|
||
Решая (5.207), находим матрицу обратных связей и явный вид опти-
мального управления (5.205) с полной обратной связью
|
|
|
|
|
|
|
|
u* ( t , x ) Q 1 ( t )BT ( t )K ( t )x . |
|
|
|
|
(5.208) |
||||||||||||||||||||
Минимальная величина функционала |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
min |
|
I(d ) (t |
|
,x |
|
) |
1 |
xT K( t |
|
|
)x |
|
|
x |
|
Rn |
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
d D( t1 ,x0 ) |
|
|
|
|
|
|
|
|
1 |
|
0 |
|
|
2 |
|
0 |
|
1 |
|
|
0 |
|
|
0 |
. |
|
||||||
Уравнения (5.207) и (5.208) могут быть представлены в эквивалентной |
|||||||||||||||||||||||||||||||||
форме, если обозначить P(t)=-K(t) при Б (t,x ) |
1 |
xT P(t )x. Тогда |
|
||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
T |
(t )P(t ) P(t )A(t ) |
K(t )B(t )Q |
1 |
(t )B |
T |
(t )P(t ) S(t ) |
|
|||||||||||||||||||||||
P(t ) A |
|
|
|
|
|
||||||||||||||||||||||||||||
P(t2 ) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
u* (t,x ) Q 1(t )BT (t )P(t )x F(t )x |
|
|
|
|
|
|
|
|
|
|
|
.(5.209) |
|||||||||||||||||||||
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
T |
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|||
min |
I(d ) |
|
x |
0 |
P(t |
1 |
)x |
0 |
x |
0 |
R |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
d D( t |
,x ) |
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
1 |
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Уравнения такого вида решаются численно.
Синтезированная оптимальная система с полной обратной связью изобра571
жена на рис. 5.40.
|
В /105/ показано, что если |
|
|
выполняется условие |
полной |
|
управляемости, уравнение Рикка- |
|
|
ти имеет единственное решение, к |
|
Рис. 5.40. Система оптимального управления с которому стремятся все |
другие |
|
полной обратной связью |
решения в обратном времени. Ко- |
|
|
||
личество операций на один шаг численного интегрирования матричного уравнения Риккати при большой размерности n имеет порядок (4 16)n3 в за-
висимости от метода численного интегрирования. Поэтому большее практи-
ческое применение линейно-квадратические способы синтеза систем стаби-
лизации находят в стационарных и квазистационарных задачах.
Если t2 =+ , матрицы A, B, S, Q не зависят от времени, система являет-
ся вполне управляемой, то оптимальный регулятор в задаче
|
|
|
|
x( |
t ) Ax(t ) Bu(t ), |
|
||
|
1 t2 |
T |
|
|
T |
|
|
|
I |
|
x |
|
(t )Sx(t ) u |
|
(t )Qu(t ) dt min |
|
|
2 |
|
|
, |
|||||
|
t1 |
|
|
|
|
|
||
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
определяется соотношением |
|
|
|
|
||||
|
|
u* ( x ) Q 1 BT Px Fx , |
(5.210) |
|||||
где P – положительно определенная матрица, удовлетворяющая алгебраиче- |
||||||||
скому уравнению Риккати |
|
|
|
|
|
|
||
|
AT P PA PBQ 1 BT P S 0 . |
(5.211) |
||||||
Решение этого уравнения, удовлетворяющее критерию Сильвестра,
единственно, а замкнутая система, описываемая уравнением
x( |
t ) A BQ 1BT P x(t ), |
x(0 ) x |
0 |
, |
|
|
|
|
|
||
является асимптотически устойчивой, т.е. стремится к нулю при t .
Проблема синтеза оптимального управления с квадратичным функцио-
налом качества управления получила название задачи Летова – Калмана ана-
572
литического конструирования оптимальных регуляторов (АКОР).
Необходимо также отметить существование альтернативного подхода к проблеме синтеза оптимальных линейных регуляторов, предложенного А.А.
Красовским: аналитическое конструирование по критерию обобщенной ра-
боты. Основное отличие от ранее рассмотренной задачи АКОР заключается в применении полуопределенного функционала
|
|
|
1 t2 |
xT (t )S(t )x(t ) |
|
|
1 |
|
|
|
|
|
|
|||
I |
ор |
|
|
|
T |
|
|
dt |
|
xT (t |
2 |
) x(t |
2 |
) |
, (5.212) |
|
|
|
|
||||||||||||||
|
|
|
(t )Q(t )u(t ) |
|
2 |
|
|
|
|
|||||||
|
|
|
2 t1 |
u |
|
(t,x(t )) |
|
|
|
|
|
|
|
|||
где функция (t,x) определяется только после решения задачи.
Такой подход обосновывается тем, что лишь в отдельных случаях удачного выбора матриц S(t), Q(t), первое найденное решение при класси-
ческом подходе удовлетворяет требованиям практики. Чаще после нахожде-
ния первого решения и моделирования синтезированной системы приходится корректировать минимизируемый функционал и вновь находить решение.
Применение критерия обобщенной работы облегчает однократное решение задачи.
Можно показать, что оптимальное по критерию обобщенной работы управление имеет вид
|
u* (t,x ) Q 1(t )BT (t ) |
(t,x ) |
|
|
|
||||||||||||||||
|
|
, |
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|||
где (t,x) – решение линейного уравнения в частных производных |
|
||||||||||||||||||||
|
(t,x ) |
(t,x ) |
|
|
1 |
|
T |
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
A(t )x |
|
|
|
x |
|
S(t )x 0 |
|
||||
|
|
|
x |
2 |
|
|
|||||||||||||||
|
t |
|
|
|
|
|
|
|
|
(5.213) |
|||||||||||
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
||
(t,x ) |
x |
T |
x |
|
|
|
|
|
|
|
|
|
|
|
|||||||
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
При этом функция (t,x), доопределяющая функционал, находится по |
|||||||||||||||||||||
формуле |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
(t,x ) T |
|
1 |
|
|
|
|
|
T |
|
(t,x ) |
|
|||||||||
(t,x ) |
|
|
|
|
|
|
B(t )Q |
|
(t )B |
|
(t ) |
|
|
|
|||||||
|
x |
|
|
|
|
x . |
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
573 |
|
|
|
|
|
|
|
|
|
|
|
K |
|
(t ) |
(T t )3 |
d |
|
(T t )2 |
d |
|
|
3 |
d 2 |
d |
|
|
||||
11 |
|
|
2 |
1 |
|
1 |
|
|||||||||||
|
3 |
|
|
|
|
|
3 |
2 |
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
2 |
|
|
|
|
|
|
2 |
|
|
|
|
|
|
K12 |
(t ) |
(T t ) |
d2(T t ) |
|
|
d |
2 |
|
|
|||||||||
|
|
|
|
|||||||||||||||
|
|
|
|
|
||||||||||||||
|
|
2 |
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|||
K22(t ) (T ) d2 d2 |
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
,
где =(T-t) –время, оставшееся до конца процесса управления.
|
|
Определитель матрицы K(t) равен |
4 |
|
d |
|
3 |
d |
d |
d |
. |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
12 |
|
|
2 |
|
3 |
|
1 |
1 |
|
2 |
|
|
|
|
|
|
|
|
|
|
|||
|
|
Тогда |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P |
|
|
P |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
P(t ) K 1(t ) |
11 |
|
12 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P12 |
|
|
P22 , |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
где |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
d |
2 |
|
|
2 |
2d |
|
|
|
|
|
|
|
3 3d 2 |
3d |
1 |
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
P ( t ) |
|
|
, P (t ) |
|
|
|
2 |
|
, |
P ( t ) |
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|||||||||||||||||||
|
|
|
|
11 |
|
|
|
|
12 |
|
|
|
2 |
|
|
|
|
22 |
|
|
|
|
|
|
3 |
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
В результате |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
u* ( t,x ) Q 1( t )BT ( t )P( t )x P ( t )x |
1 |
P ( t )x |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
12 |
|
|
22 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
2 |
2d |
2 |
|
3 3d 2 |
3d |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
x1 |
|
2 |
|
|
x2 |
|
|
|
|
|
|
|
|
|
|
* |
|
|
|
|
|
|
x2 |
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
2 |
|
|
|
|
|
3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
u (t,x) |
|
|
|
|
|
|
|
1 |
|
x1 |
|||||
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
Структурная схема системы управления бу- |
|
|
|
|
|
|
|
|
|
s |
|
|
|
|
|
s |
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
дет иметь вид, представленный на рис. 5.41. Оче- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
P22(t) |
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
видно, что в установившемся режиме u* (t,x ) 0 , |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
поскольку x2=0 и P12(t)=0. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P12(t) |
|
|
|
|
|
|
|
|
||||||||||||||
|
|
Изложенные методы синтеза алгоритмов оп- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
тимального |
управления |
подразумевают |
их |
аппа- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
Рис. 5.41. Структурная схема |
|
|||||||||||||||||||||||||||||||||
ратную реализацию аналоговыми или цифровыми |
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
оптимальной системы |
|
|||||||||||||||||||||||||||||||
средствами для непосредственного управления объектом или процессом. Вместе с тем,
очевидно, что в процессе эксплуатации возможно изменение свойств или характеристик управляемых объектов и, следовательно, синтезированный ранее закон управления может стать существенно не оптимальным в новых условиях.
Объединение этапов синтеза законов (алгоритмов) управления, разработки алго-
ритмов адаптации законов управления по режимам функционирования объекта и реализа-
576
ции полученных законов с помощью современных средств цифрового управления позво-
ляет создать управляющую систему, осуществляющую синтез оптимального управления и само управление практически одновременно в процессе функционирования объекта. По-
добный совмещенный синтез законов управления, реализуемый с использованием различ-
ного рода моделей объектов, является основным в решении задачи оптимизации управле-
ния «в большом» для достижения конечной цели этапа или режима функционирования системы.
5.5.7. Синтез линейных непрерывных детерминированных систем
с прогнозирующей моделью и функционалом обобщенной работы
Алгоритмы с прогнозирующими моделями предполагают возможность использования в ускоренном времени (или в аналитическом виде) динамиче-
ских моделей управляемого процесса. Как отмечалось ранее, речь идет лишь о процессах, модели которых известны априорно с точностью до конечного числа параметров (коэффициентов). В сочетании с программным восстанов-
лением информации о характеристиках объекта идентификация является ос-
новой для реализации беспоисковой параметрической адаптации в практиче-
ских задачах управления.
Прогнозирующую систему управления следует рассматривать как один из вариантов адаптивных оптимальных систем управления. Она представляет собой совокупность взаимосвязанных алгоритмов оценивания (частично про-
граммного восстановления) параметров α управляемого объекта, оценивания его состояния и собственно алгоритмов формирования управления. Послед-
ние реализуются в форме совмещенного синтеза оптимального управления
/32/, т.е. синтеза, связанного с решением оптимизационной задачи непосред-
ственно в процессе функционирования системы управления. При этом синтез осуществляется на основе прогнозирующих моделей, воспроизводящих в ус-
коренном времени неуправляемое, или «свободное», движение объекта.
Пусть процесс описывается дифференциальным уравнением
x |
f ( x,t ) ( x,t )u, |
(5.216) |
|
577 |
|
а критерий качества управления задан в виде функционала обобщенной ра-
боты (ФОР)
t2
I V3 [ x(t2 )] Q3 [ x( ), ]d
|
t1 |
|
|
|
. |
(5.217) |
|||
t2 |
|
|
|
|
|
|
|
||
* |
|
* |
|
|
|||||
|
|
|
|||||||
U3 u( ), U3 u ( ), |
d |
|
|||||||
t1 |
|
|
|
|
|
|
|
|
|
где |
|
|
|
|
|
|
|
|
|
V3 |
[ x(t2 )] |
1 |
xT (t2 ) x, |
|
|
||||
|
|
|
|||||||
|
2 |
|
|
1 |
|
|
|
|
|
Q3 |
[ x( ),( )] |
|
xT x, |
|
|
||||
2 |
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
U3 |
[u( ),( )] |
|
1 |
uT R 1u, |
|
|
|||
|
2 |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
, , R-1 – заданные квадратные матрицы параметров (последние две могут |
|||||||||
быть матричными функциями текущего времени ), причем заданные ска-
лярные функции векторных аргументов |
U 3 [ u( ),( )], |
U 3* [ u* ( ),( )] (функ- |
||||||
ции |
затрат |
на |
|
|
управление) |
таковы, |
что |
функция |
U3 ( u, ) U3* ( u* , ) [ |
|
|
U3 ( u* , )]u |
является положительно-определен- |
||||
u |
* |
|||||||
|
|
|
|
|
|
|
|
|
ной относительно u при любом , принимающей минимальное значение при
u=u*.
Тогда оптимальное в смысле минимума ФОР управление определяется выражением /32/
|
|
U |
|
( u* , ) |
V |
( x,t ) 0, |
(5.218) |
|
u* |
3 |
|
||||
|
|
|
x |
|
|||
где полная производная V |
Q3 ( xc ,t ) |
вычислена в силу уравнения свобод- |
|||||
ного движения объекта |
|
|
|
|
|
|
|
|
|
|
|
xc f ( xc ,t ). |
(5.219) |
||
Из (5.218) с учетом граничных условий для V следует |
|
||||||
|
|
|
|
|
578 |
|
|
