Емельянов С.В. Новые типы обратной связи
.pdf2.2. Стабилизация объекта с неопределенным оператором |
101 |
При использовании в обратной связи конечных коэффициентов пе
редачи |
(именно это является признаком прочной системы) в теории |
адаптивного управления регулятор R конструируют в виде двух ком |
|
понент |
_ |
|
Д = Д + ДД, |
где выбор первой компоненты R направляют на стабилизацию опре деленного объекта Р, тогда как вторая компонента ДД должна ком пенсировать (устранить) влияние неопределенности Д Р на поведение системы.
Это соображение приводит к схеме системы, представленной на рис. 2.49, где часть системы, обведенную контуром, обычно называют обобщенным объектом. Оператор
^""TTPR
этого обобщенного объекта выбором регулятора Д наделяется всеми требуемыми в постановке задачи стабилизации свойствами, в том чи сле и асимптотической устойчивостью. Поэтому фактически про блема стабилизации сводится к взаимной компенсации на входе объ екта сигналов с контуров обратной связи ДД и Д Р соответственно (рис. 2.50). Идеальным решением задачи был бы выбор оператора ДД
|
ДК |
|
|
|
, |
^ |
AR |
|
R |
|
|
|
|
|
|
у |
Р |
Q>-- |
Ф |
|
|||
|
\ |
|
|
|
АР |
|
АР |
|
|
|
|
|
Рис. 2.49 |
|
Рис. 2.50 |
на основе тождества AR-\-AP = О, но оператор Д Р неизвестен, и по этому следует позаботиться о получении его асимптотической оценки ДР, так чтобы
Д Р ->• Д Р |
t-^oo. |
Тогда, полагая, точнее говоря, осуществляя настройку оператора обратной связи ДД по правилу
Д Д = - Д Р , |
(2.35) |
102 Глава 2. Некоторые принципы построения нелинейных регуляторов
можно рассчитывать на асимптотическое решение задачи стабилиза ции, так как в этом случае справедлива асимптотика
AR + AP = -AP + AP-^0, t-^oo.
В теории адаптивного управления получение оценки АР возлага ется на специальный измеритель с оператором D, а реализация "на стройки" (2.35) — на "адаптатор" с оператором А. В результате получается схема, представленная на рис. 2.51. Такой адаптивной си стеме стабилизации можно дать содержательную интерпретацию в терминах основных принципов регулирования.
Описанный выше способ компенсации операторного возмущения АР похож на способ косвенной компенсации координатного возмуще ния /(f) с помощью принципа регулирования по возмущению. Дей ствительно, по доступной информации о параметрах объекта Р, его входах и выходах вырабатывается оценка возмущения Р, которая за
тем используется для компенсации АР |
= —АР. Все так, как и при |
|
D |
|
|
|
Ж |
|
AR |
R |
|
D |
||
|
||
-9 |
Р+АР |
|
АР |
-f |
|
|
||
Рис. 2.51 |
Рис. 2.52 |
компенсации неизмеряемого прямо возмущения /(<). Это наблюдение позволяет сделать вывод о том, что адаптивная стабилизация осно вана на сочетании двух основных принципов регулирования:
•принципа обратной связи при управлении свободным движением;
•принципа регулирования по нагрузке для компенсации оператор ного возмущения А Р (рис. 2.52). На рисунке двойными тонкими линиями обозначен контур регулирования по нагрузке.
Данный вывод является принципиальным для любых схем адаптив ного управления и по существу может считаться неотъемлемым при знаком адаптации. Хотя, разумеется, возможны вариации в реализа ции идеи адаптации. Приведем некоторые уточняющие замечания.
2.2. Стабилизация объекта с неопределенным оператором |
103 |
Замечание 1. Имеются варигщии описанной выше схемы адаптгщии. Например, для выполнения условия компенсации
Д Л + Д Р = 0
можно менять не только (а может быть и не столько) оператор регулятора AR, но и оператор объекта Д Р . Для этого, разумеется, должна иметься соответствующая возможность представления Д Р в виде суммы
Д Р = Д Р ' + Д Р " ,
где Д Р ' — неизвестная, а Д Р " — настраиваемг1Я часть. В этом случгке го ворят о методе нгкстраивг1емого объекта, в отличие от предыдущего случая, когда мы имели дело с настргкиваемой обратной связью.
Замечание 2. Поскольку оценка Д Р вырабатывается по измерениям координат объекта р или системы Рс, а также их входов, то понятно, что наиболее просто это делается тогда, когда изменения Д Р происходят "мед леннее" изменений этих переменных. В этом смысле говорят о квазиста ционарном изменении оператора Д Р , а фгжтически при расчете обратной связи ориентируются на стационарный оператор Д Р . Бели построенная та ким образом адгиггивная система прочна, то она сохраняет работоспособ ность и при "медленных" изменениях в силу устойчивости прочных систем по отношению к постоянно действующим возмущениям.
Замечание 3. Нг1личие внешнего воздействия / на неопределенный объект упргшления (рис. 2.53) еще более усложняет ситуацию, так как при этом вносится дополнительн£1Я неустранимая погрешность в оценку Д р , если только Д / -/^ О при t —¥ оо. Поэтому вместо требуемого условием компенсгщии ргшенства
Д Д + Д Р = 0 имеем смещенное на некоторую величину Д ^ рг1венство
ДД + Д Р = Д(г,
и проблема, следовательно, состоит только в том, насколько оператор Д ^ искажает поведение объекта Рс (рис. 2.54). Если возмущение исчезающее.
|
AQ |
Г |
Г |
Р+АР |
У |
Рс |
|
Рис. 2.53 |
Рис. 2.54 |
т.е. / —> О, а вместе с этим и ДQ —> О при t —^ оо, то в установившемся режиме проблемы не возникг1ет. Если же возмущение не исчезающее, т.е. Д / 7^ О при t -)• оо, но, нгшример, огргшиченное, т.е. (/| < /о = const, то
104 Глава 2. Некоторые принципы построения нелинейных регуляторов
из-за использования ограниченных коэффициентов передачи в регуляторе можно рассчитывать, вообще говоря, только на диссипативность замкнутой системы упргюления с радиусом диссипативности порядка /о.
Замечание 4. При определенных условиях адаптивный подход поро ждает стабилизаторы универсального действия, т.е. тгисие регуляторы, для применения которых нет необходимости точно знать не только параметры объекта, но даже и его порядок. Подобные регуляторы называются уни версальными. Для успешного их использования требуется выполнение сле дующих условий:
•МС-условия (условия согласованности);
•минимальной фазовости объекта Р.
Действительно, в этом случае можно применить глубокую обратную связь вида kR с коэффищ1ентом усиления к и оператором R (рис. 2.55). Такая обратнёкя связь при к -^ оо обеспечивгъет стгъбилизгщию, если асим-
kR
1'
У |
Р |
• |
f S |
|
|
Y |
|
|
АР |
|
|
Рис. 2.55 |
|
птотически устойчиво уравнение предельного движения |
|
РЯу = 0. |
(2.36) |
Последнее уравнение при А; ^ оо следует из уравнения движения замкнутой системы
(1 -I- kPR)y = (Рг + ДРг)/ + РАРу, соответствующего рис. 2.55.
Рассмотрим условие асимптотической устойчивости для уравнения (2.36) подробнее. Пусть объект Р стационарен. Тогда его можно представить передаточной функцией
Wp{s) I3m(s) an{s) '
Аналогично, оператору регулятора R поставим в соответствие пере даточную функцию
2.2. Стабилизация объекта с неопределенный оператором |
105 |
где /3, а, S, f — полиномы комплексной переменной s, а индексы т,
п, I я г — степени соответствующих полиномов. |
Тогда уравнение |
предельного движения |
|
PRy = Q |
|
эквивалентно уравнению |
|
p,r^{s)Si{s)Y(s) = 0, |
(2.37) |
где Y{s) = С[у] — одностороннее преобразование Лапласа функции y{t). Из (2.37) видно, что полином /?m(s) должен быть гурвицевым, что и означает минимальную фазовость объекта Р.
Непрочность рассматриваемой системы с глубокой обратной свя зью в универсальном стабилизаторе преодолевается тем, что коэффи циент обратной связи зависит от переменных состояния, например, от выхода объекта
к = |
к{у,...), |
и монотонно увеличивается до тех пор, пока не наступает, при указан ных выше условиях, устойчивость (при / —> 0) или диссипативность (при 1/1 < /о) следующего уравнения:
+ PRjy = {P2 + ДРз)/ + РАРу.
(.Щ^'")
Пример 13. Синтез адаптивной системы управления. Рассмо трим на примере стабилизации в нуле объекта второго порядка
Х2 = axi +bu, |
\ • I |
с неопределенными коэффициентами а и Ь > О, одну из наиболее распро страненных методик синтеза адаптивного управления.
Замкнем объект (2.38) обратной связью
U = —fclXl — ^2^2
и сформируем алгоритмы адглтации Л переменных ^i, ^2:
* : i = 6 , ^ 2 = 6 , |
(2.39) |
т.е. г1лгоритмы настройки параметров ki, /сг, таким образом, чтобы пове дение замкнутой системы Е*:
XI = Х2,
Х2 = —{bki — a)xi — bfcjxa,
было бы подобно (может быть, даже близко) поведению некоторой эталон ной системы Е-,:
«1 = 22, 22 = - 7 1 2 1 - 7222.
106 Глава 2. Некоторые принципы построения нелинейных регуляторов
Здесь 71 и 72 — назначенные положительные числа; Е.у-систему будем также называть моделью. После введения обозначений
bAfci = bki — а — 711 ЬАк2 = bfcj — 72
замкнутую адаптируемой обратной связью Е;ь-систему можно представить в стандартном виде
XI = |
1 2 , |
|
Х2 = |
—71^1 — 721^2 — b/\kixi |
— ЬАк2Х2. |
в условиях гипотезы квазистационарности |
Aki = ki, А^г = ^2, и по |
этому формально удобно считать, что адаптируются не сами коэффици енты ki и ^2, а их отклонения от требуемых значений, т.е. згккон адаптации А можно згшисать в обобщенном виде Aki = ^1, ДЛг = ^2-
Для получения конкретного алгоритма адгштации Л используем квадра тичную форму t)(x) = (х, Нх) с положительно определенной (2 х 2)-матрицей Н = [hi,h2]'*', тгисую, что при некотором (желаемом) положительном числе Л > О, определяющем степень устойчивости Е-^-системы (модели поведения замкнутой системы), ее производная в силу Е-^-системы имеет вид
I) 1 = -2Xv.
Is.,
Поскольку выбор параметров модели 7i, 72 ничем не огргшичен, такие мат рица Н и число А существуют.
Введем теперь в рассмотрение квадратичную форму V{x,k) в расши ренном простргшстве переменных {х, к} выражением
,^ ,, |
, , |
bfAkj |
Akl\ |
Vix,k) = |
vix)+-i^-^+^j, |
где Pi, 132 — некоторые положительные числа. Ее производная в силу Е*- системы с алгоритмом адглтации Л дается выражением
^ U = ^ U - ( ^ - . ( г )>(А^1-1 +А.2Х2)-ЬЬ ( ^ + ^ ) =
= -2\{х,Нх) |
-Ь |
Aki(xia-^\-\-Ak2(x2(T-^\ |
, (2.40) |
где "• = ( Нх, ( 1 |
) ) = |
{^2,х). Теперь ясно, что если правые части алго |
ритма адаптации выбрать в виде
$1 = /?lXl<T, ^2 = /32Х2<Т,
то производнскя (2.40) принимает вид
V = -2Х{х, Нх)
и становится знгикоотрицательной в простргшстве {х, к}, откуда и следует стабилизируемость рассматриваемой системы.
2.3. Стабилиза1щя регулятором переменной структуры |
107 |
Заметим, что сходимость погрешностей оценок Afci, Д^г к нулю при этом не гарантируется, поскольку для такой сходимости требуется опре деленная отрицательность v в расширенном фазовом пространстве {х, к}. Заметим также, мто при нгшичии координатноговозмущения / , т.е. при стабилизации объекта Р' :
XI = Х2,
Х2 = —ахх -\-Ьи + f
указгшным выше способом, в итоговом выражении для производной v по явится дополнительное слагёкемое, пропорционгшьное возмущению
v = -2\{xi,Hx) + b(Tf,
которое при неизвестном / нарушает знакоотрицательность v и Хфи ограни чении 1/1 < /о ведет к диссипативности системы по основным переменным, т.е. задача стабилизации не решс1ется точно.
В заключение приведем структурную схему адаптивной системы стабилизации, синтезированной в Примере 13. Она представлена на
рис. 2.56, на котором /i2i и Лгг — компоненты вектора Лг = |
i^^ |
|
"22 |
Рис. 2.56
В даьнейшем эта структурнг1я схема потребуется нам для сравнения.
108 Глава 2. Некоторые принципы построения нелинейных регуляторов
2.3.Стабилизация регулятором переменной структуры
Рассмотрим теперь еще одну попытку окончательного решения рас сматриваемой в монографии проблемы путем использования регуля торов с переменной структурой.
Идея принципа переменности структуры состоит в скачкообрг13ном изменении связей между функционгшьными элементами регуля тора в зависимости от фазового состояния замкнутой системы упра вления, которую в таком случае называют системой управления пе ременной структуры (СПС). Если рассматриваются линейные объект и функциональные элементы регулятора, то соответствующую СПС можно интерпретировать как совокупность линейных подсистем и правил перехода от одного элемента этой совокупности к другому при пересечении фазовой точкой разделительных гиперплоскостей в фа зовом пространстве системы, которые называют поверхностями ргизрыва. Если же объект или функциональные элементы нелинейны, то речь идет о совокупности нелинейных подсистем и, соответственно, о нелинейных поверхностях или многообразиях разрыва.
И в первом и во втором случае СПС — нелинейная динамическая система — описывается дифференциальными уравнениями с разрыв ными правыми частями. Синтез СПС сводится к выбору поверхно стей разрыва и исходной совокупности подсистем, гарантирующих решение поставленной задачи управления. Мы не излагаем здесь те орию СПС, просто хотим подчеркнуть, что СПС предназначены для робастного управления объектом со структурированной неопределен ностью (рис. 2.57), где S — задатчик, Р — известный оператор объ екта, АР — неизвестная компонента оператора объекта, приведен ная к управляющему входу, Rvss — регулятор переменной структуры. Особенности синтеза Rvss поясним на примерах.
Н2>- Rv
н»-
АР
Рис. 2.57
2.3. Стабилизация регулятором переменной структуры |
109 |
2.3.1. Астатическая следящая система
Рассмотрим простейшую следящую систему с дробно-рациональной передаточной функцией объекта вида W(s) — l/a(s), где a(s) — по лином степени п = deg a(s) > 1 (рис. 2.58). Если регулятор R в схеме
-9 R
W(s)
Рис. 2.58
на рис. 2.58 выбран таким образом, что ошибка слежения е = у' — у асимптотически стремится к нулю при < —>• оо, то такую следящую систему называют астатической, в противном случае система стати ческая.
Для пояснения основных проблем, связанных с построением аста тической следящей системы в рамках линейной теории, запишем урав нение движения системы, изображенной на рис. 2.58, относительно ошибки слежения в операторном виде, после чего имеем уравнения
a(s)e = a(s)y' — и |
= a(s)y' |
- Re |
u=Re |
|
|
или, после приведения подобных, получаем уравнение |
||
[a{s) + R{s)]e |
= a{8)y'. |
(2.41) |
Стоит подчеркнуть, что в (2.41) R{s), вообще говоря, — тоже дробно-рациональная функция,
R{s) = к |
lis) |
(2.42) |
|
4s)' |
|||
|
с коэффициентом усиления к и полиномами 7(*)> '^(*)i удовлетворяю щими условию физической осуществимости
deg S{s) > deg 7(*)-
Положим для определенности, что deg S(s) > 1. С учетом этого заме чания уравнение (2.42) можно преобразовать к следующему виду:
[ a{s) 6{s) + к 7(s) ] е = a{s) S{s) / . |
(2.43) |
Из (2.43) видно, что теоретически данная следящг1я система будет астатической тогда и только тогда, когда полином a(s) S{s)+'f(s) гурвицев и полином a(s)<J(s) содержит множитель /C(s), аннулирующий
110 Глава 2. Некоторые принципы построения нелинейных регуляторов
функцию задания, т.е. такой, что |
|
|
K{s)y' |
= О, |
(2.44) |
либо, если такого множителя K{s) |
нет, то: |
|
1)полином 7(e) должен быть гурвицев;
2)в пределе при к —¥ оо поведение системы описывается асимптоти чески устойчивым уравнением
l{s)e = 0. |
(2.45) |
Впрочем, так как большие коэффициенты усиления приводят к не грубым системам, то реально при синтезе астатических систем при ходится ориентироваться на конечные коэффициенты передачи, а зна чит, и на гурвицевость полинома a{s) 5{s) + 7(5) и условие (2.44).
Если аннулирующий полином IC{s) является гурвицевым, то выпол нение указанных выше условий не вызывает принципигшьных ослож нений. Другое дело, когда полином /C(s) — неустойчивый, например /С(в) = s^ — а^, о = const > 0. Тогда мы сталкиваемся с серьезными проблемами. В самом деле, полином S{s) не может быть неустойчи вым, ибо в противном случае неустойчива собственная динамика ре гулятора (2.42) и его выход u{t) экспоненциально нарастает со всеми вытекаюпщми отсюда негативными последствиями: выходом за пре делы зоны линейности и т.п. Следовательно, неустойчивые компо ненты (множители) аннулирующего оператора K{s) должны быть од новременно множителями полинома a(s), что, конечно, неве{)оятно. Это рассуждение показывает, что
•в рамках линейной теории управления, предполагающей исполь зование только ограниченных коэффициентов передачи в регуля торе, построить гютатическую систему слежения за экспоненци ально растущим сигналом у' невозможно.
Мы рассмотрели две грубые ситуации: экспоненциально устойчи вые и экспоненциально неустойчивые K{s). Проанализируем теперь пограничную ситуацию, когда задание j / ' — полиномиально рги;тущая функция времени, т.е.
у' = Cm+l^ + С^*'" - Ч ... +С1,
где с,- — некоторые константы, (t = 1, ... , m -(- 1), а число m — по рядок полинома, т.е. Cm+i ф 0. Простейшим оператором, аннулиру ющим полином (2.45), очевидно, является оператор ( т -I- 1)-кратного дифференцирования K{s) = s"*'^^. Естественно предполагать, что в систему слежения он привносится регулятором, т.е.
S{8) = 5-+1 S'{S),
где S'(s) — некоторый устойчивый полином. Но в таком случае, в силу необходимого условия устойчивости, для обеспечения гурвицевости