Теория автоматического управления
..pdfконечной (терминальной) ошибки ев (/п), учитываемой с помощью критерия оптимальности вида (11.21).
Обращаем внимание на то, что оптимальные коэффициенты об ратных связей в задачах стабилизации не зависят от параметров рассматриваемого случайного возмущения z (/) типа белый шум. Но от этих параметров зависит минимально достижимое при опти мальном управлении значение критерия (11.127). Так, если г (() — векторный белый шум, то минимальное значение Q* критерия
(11.127) определяется выражением
Qn = tr (DSzo), |
(11.131) |
где tr (•) — обозначение следа матрицы, который по определению равен сумме диагональных элементов матрицы, записанной внутри скобок; S z0 — матрица интенсивностей компонент вектора г (/), имеющая размер п х п.
Оптимальная передаточная функция замкнутой системы стаби
лизации (см. рис. 11.11), связывающая медленные |
изменения за |
дания Хв. 3 с ВЫХОДОМ Х в при | = 0 и Кп = 1, |
|
Ф (р) = Хв (р)/хв. з (р) = Св (p i— А + ВКо. с)-1 В. |
(11.132) |
Ей соответствует характеристическое уравнение |
|
\ Ы - А + ВКо.с\ = 0. |
(11.133) |
Так же, как в задачах фильтрации и оценивания (см. 8.6 и 8.7) коэффициенты обратных связей можно определять не по выраже ниям (11.129), (11.130), а использовать различные методы модаль ного синтеза, с помощью которых коэффициенты обратных связей выбирают таким образом, чтобы придать характеристическому полиному (11.133) замкнутой системы определенные требуемые свойства, например, заранее предписанное расположение ее собст венных значений на комплексной плоскости.
Пример 1. Определим для стационарного объекта
ГС'о (Р) = *в (Р)/У (Р) = |
kol(T0P + О |
|
|
<11Л34) |
|||
оптимальное |
управление, стабилизирующее скалярный |
выход |
объекта |
||||
Хв (t) = х |
(t) |
в начале координат хв, 3 = 0 при помощи отрицательной об |
|||||
ратной связи |
по единственной переменной состояния |
(t) |
= х (t) |
и обеспе |
|||
чивающее |
минимум |
функционалу |
|
|
|
||
|
|
'к |
|
|
|
|
|
<?п= |
Km |
— |
f M |
( 0 + '»2(0 ]d*’ |
|
|
(11Л35) |
|
К |
|
0 |
|
|
|
|
где qB и г — заданные весовые коэффициенты. Уравнение состояния объекта (11.134) имеет вид
x(t) = ax(t) + by(t) + z(t), |
(11Л36) |
где а = — 1/Го, b = k j T 0.
Очевидно, что в данном примере А = а, В = Ь, Св = 1, и матричное уравнение Риккати принимает вид
do -|“ od -f“ (JB — db — bd = 0» |
|
|
(11.137) |
|||||
|
|
|
r |
|
|
|
|
|
Положительное решение этого уравнения |
|
|
|
|||||
d = {ar + |
<\/а2г2+ |
&2<7вГ )/b 2, |
|
|
(11.138) |
|||
а соответствующий оптимальный коэффициент |
обратной связи |
|
|
|||||
K>.c = r |
'bd = (а + V “2 + b^ J r ) l b = ( — 1 + V 1+ % f l J r )/*0 - |
|
||||||
|
|
|
|
|
|
|
(11.139) |
|
Пример 2. Определим для стационарного объекта |
|
|
||||||
|
(р) = |
*в (Р)/У (Р) = kelp (ТоР + 1) |
|
(11.140) |
||||
оптимальное управление, стабилизирующее выход объекта хв (t) = |
х в, 3 = |
0 |
||||||
при |
помощи |
обратных |
связей |
по |
переменным |
состояния х х (t) = |
хв (t) |
и |
х 2 (t) |
= х х (/) (см. рис. |
11.11, б) |
и |
обеспечивающее минимум функционалу |
(11.135).
Запишем уравнения состояния и выхода объекта и минимизируемый
функционал |
в |
матричной форме. Очевидно, |
что |
|
||
|
|
|
|
|
|
(11.141) |
где а = |
а 22 = |
— 1/Г0; |
Ь — 622 = k j T 0. |
|
|
|
Матричное уравнение (11.130) в данном случае принимает вид |
||||||
dn |
dtf |
] t: :м: n [i |
|
|
||
[d<Li |
do2 |
|
|
|||
|
|
£ |
] |
z |
n i |
: * ]■ • [ £ |
Перемножив матрицы в уравнении (11.142), и учтя, что всегда d12 = d2i* получим равносильную ему систему трех алгебраических уравнений:
Явг |
b dyy —0; |
“Ь 0^12 ~ 0» |
(11.143) |
||
Ь^22 ~г 2rdj2 “Г 20Г^22 = О* |
|||||
|
|||||
С учетом |
условий |
положительной определенности |
матрицы D |
||
dn > 0 и |
dnd22 — d2l2> 0 |
(11.144) |
|||
решения |
системы (11.143) следующие: |
|
|||
du = |
V aV + 26/6; |
dl2 = du = л/д вг/Ь; |
(11.145) |
||
d22 = г {а |
V « 2 + |
26 V 9 B/T)/62. |
|||
|
тическим ожиданием и известной матрицей-столбцом интенсивно
стей |
т. |
е. |
|
|
|
|
|
|
|
|
x 3(t) = A 3x 3(t) + l(t), |
|
|
|
|
|
|
(11.151) |
|||
а вектор требуемых значений выходных |
переменных х в. 3 (0 пред |
|||||||||
ставляют |
в |
форме (11.124): |
|
|
|
|
|
|
|
|
лгв.з (0 = |
С,. **„(/). |
|
|
|
|
|
|
(11.152) |
||
Теперь можно записать объединенную (расширенную) систему |
||||||||||
уравнений состояния объекта |
(с |
г (() = |
0) и задающего фильтра: |
|||||||
|
НJ Loл |
\* |
if) |
1 + |
Г в 1 ^ ( о + |
Г |
|
(11.153) |
||
L - м о |
0А з 11\ \ Lx 3(t) |
J |
L o |
J |
L |
»° |
1 |
|||
|
|
|
|
|
|
|
|
m |
\ |
|
или |
|
|
|
|
|
|
|
|
|
|
x (t) = А х (t) + |
By (t) + |
|
|
|
|
|
|
(11.154) |
||
|
|
|
c « : ]• |
|
|
|
|
|
||
где х(() == \x{t)\ |
x 3 (t) ]r — расширенный вектор |
состояния. |
Соответственно критерий (11.126) принимает для расширенной
системы |
(11.154) |
следующий вид: |
|
|
|
||
|
|
|
К |
|
|
|
|
Qn = |
Игл -j— f |
[xl (0 qBx B(t) + у т(t) ry (f)]d/ = |
|
||||
|
к |
|
о |
|
|
|
|
= lim — |
f — |
[л:т (0 Cj q BCBx (t) + y T (t) r y |
(*)] d t, |
(11.155) |
|||
C-*°° |
J |
2 |
|
|
|
|
|
где лгв(t) |
= CBx |
(t) |
= [CB; — CB. 3] x |
(t). |
(11.155) для рас |
||
Очевидно, |
что задача минимизации |
критерия |
ширенной системы (11.154) эквивалентна задаче синтеза оптималь ной по критерию (11.127) системы стабилизации объекта (11.123), т. е. задача синтеза следящей системы оказалась сведенной к за даче стабилизации. Решение задачи (11.154), (11.155) в соответствии
со структурой вектора х (t) находят в виде
у * ( 0 = — K * x (t)= |
— К*Г |
1 |
(11.156) |
|
L Хз (0 J ’ |
|
|
где К* = 1К‘0С; — /С*]. |
|
|
|
Уравнение Риккати |
(11.130) |
для расширенных |
матриц А, В, |
Св распадается на четыре уравнения, и его общее решение также можно рассматривать как расширенную (блочную) матрицу
D = |
(11.157) |
Таким образом, задача синтеза следящей системы оказалась сведенной к задаче синтеза стабилизирующей системы уравнения этим же объектом,
решенной в примере 1.
Оптимальное управляющее воздействие в следящей системе состоит из двух слагаемых:
/ ( 0 = - * а ( 0 - £ с*(0- |
|
(11Л69) |
Оптимальный коэффициент обратной связи в выражении (11.169) будет |
||
таким же, как в стабилизирующей системе, т. е. (см. пример |
1) |
|
*0. с = ( — 1 + V 1 + *°<?в/Г )/*о- |
|
(11Л7°) |
Согласно (11.159) уравнение для коэффициента d12 имеет вид |
||
di2a3 + [а — Ь г -Ш п ] d12 — qB = 0. |
|
(11.171) |
Из него получаем |
|
|
<*12= “ ^ o /O V la + V 1+ * & / ' ' ) |
<11Л72) |
|
и соответствующий коэффициент прямой цепи |
|
|
*„ = — bdl2/r = qBk J r ( T 0a3 + ' s j \ + k2Qq J r \ |
(11.173) |
|
Передаточная функция замкнутой |
системы между входом х3 и выхЬдом |
|
*в (О |
|
|
Ф (р) = knk0/ ( r 0p + д / l + k20q j r |
). |
(11.174) |
Стабилизирующие и следящие системы при неполном и неточном наблюдении объекта. Перейдем теперь к задачам АКОРдля объектов
с н е п о л н о й и (или) н е т о ч н о й и н ф о р м а ц и е й о текущем состоянии, т. е. для таких объектов, у которых переменные состоя ния x ( t ) не поддаются полному и точному наблюдению. В этих случа ях для построения замкнутых систем управления вместо сигналов
х (/) используют их оценки х (t), полученные из наблюдаемых пе ременных х н (0 при помощи специальных устройств оценивания состояния (УОС) объекта (см. 8.7). Методика АКОР для объектов с неполным и неточным наблюдением состояния основана на так называемом принципе разделения, согласно которому задача син теза оптимальной системы управления при неполных и неточных измерениях может быть разделена на две независимые друг от друга задачи — оптимального оценивания состояния объекта управле
ния и оптимального управления объектом по оценкам x ( t ) f кото рые рассматриваются как истинные значения переменных состоя ния х (t). Соответственно, оптимальное управляющее устройство в целом должно состоять из последовательно соединенных опти мального устройства оценивания и регулятора, оптимального при полных и точных измерениях. Причем, параметры этих двух ча
стей управляющего |
устройства могут быть определены раздельно |
и независимо друг |
от друга. |
*ф. 3 = - аз + V a3 + S|o /5go • |
(11.183) |
Оптимальные коэффициенты обратных связей по оценкам х[ (/) и х 2 (t) выдаваемым устройством УОС0, полностью определяются матрицей D, !’
элементы которой были получены в |
примере |
2 для |
стабилизации объекта |
|||
(11.140) [см. (11.145)]. |
|
|
|
|
||
Оптимальный коэффициент пропорциональности между сигналами х3 (/) |
||||||
и Уп (0 согласно |
формуле (11.162) |
|
|
|
v; |
|
|
|
|
|
|
|
(11.184) |
Обозначения |
k для элементов матрицы D 12 = |
/С12 введены для того, |
||||
чтобы отличать их от элементов матрицы D ll9 |
полученных в примере 2. |
|||||
Для определения коэффициента kn запишем матричное уравнение вида |
||||||
(11.159): |
|
|
|
|
|
|
К12А3+ [ А - |
B r - 'B TD 11]T K n - |
CjgBC, , = 0. |
|
(11.185) |
||
После перемножения матриц в уравнении (11.185) и решения эквива |
||||||
лентной системы скалярных уравнений получим: |
|
|
||||
*22 = °; |
*21 = ?в/( —*'V ?в/г — «3 + аз л |
/ “2 + 26 V 4 J r ) |
||||
|
|
|
|
|
|
(11.186) |
Отсюда искомый коэффициент |
|
|
|
|
||
*п1 = — **21/' = 9в*о//' (,*0 |
+ “зТо + аз Х |
|
||||
X ^ / l |
+ 2 k j 0 л/ g j r ). |
|
|
|
(11.187) |
|
Согласно (11.175) передаточная функция системы между входом х3.н (t) |
||||||
и выходом хв (/) |
|
|
|
|
|
|
Ф (р ): |
____ £ф. 3____ |
1/^0. с |
|
|
||
|
Р + |
а з + ^ф. 3 |
, |
1 + * 0 * 0 . с2 „ |
||
|
|
kokn |
• Рг Ч |
— |
|
р • |
|
|
|
«о«о. cl |
(11.188) |
||
|
|
|
|
|
|
Она включает в себя передаточную функцию устройства У0С3, которое
определяет оптимальную оценку *3 (/) задающего воздействия х3<н (0» иска женного помехой g3 (£), и эквивалентно в данном примере инерционному звену первого порядка. Кроме того, общая передаточная функция оптималь ной следящей системы содержит масштабирующий коэффициент &пи сящий от параметров задающего воздействия, объекта и от весовых коэффи
циентов критерия. Основная |
часть |
синтезируемой системы эквивалентна |
в данном случае инерционному |
звену |
второго порядка. |