Емельянов С.В. Новые типы обратной связи
.pdf10.6. Методы теории бинарного управления |
313 |
Если ввести индекс субоптимальности (относительные потери в опти мальности) по формуле
1 =
AJ
^opt
ТО МОЖНО наглядно продемонстрировать достоинства того или иного из рассмотренных методов стабилизации (рис. 10.4). На этом рисунке
Рис. 10.4
jS < /В rpg^j^ j^aK при одних и тех же значениях коэффициентов а и к потери в оптимальности меньше для скользящего режима 2-го по рядка. Знаком "~" обозначена степень роста индекса субоптималь ности при увеличении "степени" неопределенности.
Перейдем теперь к рассмотрению общей теории, следуя при этом работам [29, 30, 43].
10.7.Сведение проблемы субоптимальной стабилизации
к проблеме асимптотической инвариантности
Обобщением изложенных выше результатов служит подход к суб оптимальной стабилизации, основанный на сведении исходной задачи к проблеме асимптотической инвариантности. Теория асимптотиче ской инвариантности является универсальным инструментом решения различных задач управления в условиях неопределенности, и такой пе реход позволяет расширить область применимости уже рассмотрен ных идей и подходов.
314 |
Глава 10. Субоптимальная стабилизация |
10.7.1.Основные понятия теории асимптотической инвариантности
Пусть А — компактное множество и пара функций {х, Uopt} Для каж дого элемента а Е А минимизирует функционал в форме Лагранжа
J{u,a)= |
1 L{t,x,u,a)dt |
+ |
l{xo,xi) |
|
to |
|
|
|
|
при ограничениях |
|
|
|
|
X = f{t, X, и, а), |
x{to) = хо, |
x{ti) |
= xi, |
UEU. |
Пусть, кроме того, оптимальное значение функционала не зависит от элемента а € А, т.е.
J{uopt, а) = J(«opt) для любого а е А.
Здесь и далее х £ R", и — скалярное управление. Предполагается, что функции / , i , / и классы А и U таковы, что решение задачи оптимизации существует. Из сделанного предположения следует, что оптимальное управление зависит от а, т.е. «opt = Uopt(t,x,a), и его реализация, если возмущение а неизвестно, невозможна. Поэтому уме стен вопрос о приближении оптимального управления «opt в классе допустимых обратных связей. Для оценки качества такого прибли жения используем индекс субоптимальности (относительные потери в оптимальности)
, |
, _ |
7(ц,а)-J(«opt) |
|
'^"•''^- |
/(«opt) |
• |
Понятие о качестве приближения вводится следующим определением: если для любого е > О существует такая допустимая обратная связь
и £ и, что sup/(и, а) < е, то замкнутая система субоптимальна в
аел
классе управлений U.
Понятие субоптимальной системы стабилизации можно связать с понятием асимптотической инвариантности.
Пусть е и 7 — произвольные положительные числа. Для некоторой
функции h{t, х) введем обозначения: |
|
Ли,а = h(t, x{t;to,Хо,и, а)), |
а^ = hu,ai — Лц.а,- |
Динамическую систему х = f{t,x,u,a) |
назовем (е,7)-экспоненциально |
Л-инвариантной относительно возмущений а G Л в клг1ссе управлений и, если найдется обратная связь и £11 я положительная при всех х фО функция р(х) (р(0) = 0) такие, что при любых элементах ai, 02 € А тл каждого Хо ё R"
К|<£р(а;о)е-1'('-'°>, t>tQ.
10.7. Асимптотическая инвариантность |
317 |
а оптимальное значение функционала находится по формуле
•^jpt = XQ RXQ.
Для того чтобы получить оптимальную систему стабилизации, не обходимо реализовать обратную связь
«opt = -кх - а, к = k + d^,
что, разумеется, невозможно. Вместо этой нереализуемой обратной связи используем обратную связь вида
и = —кх + Uj,
где для генерации компоненты щ воспользуемся методами бинарного управления и изложенными выше принципами субоптимального упра вления и экспоненциальной инвариантности.
Пусть в схеме на рис. 10.2 динамический задатчик Sx определен уравнением поля экстремалей задачи
х^=АкХ^, |
х'^(0) = аго, |
Ак=А-Ьк. |
Известно, что спектр ar{Ait) матрицы Л* расположен в левой от крытой комплексной полуплоскости, т.е. существует число 7о > О такое, что для любого А £ (т{Ак) выполнено условие ReA < —уо- Сле довательно, при некотором N > 1
В качестве Ли,а возьмем функцию
L = x'^Px + Q{uc + af.
При помощи достаточных условий экспоненциальной инвариант ности, сформулированных в предыдущем разделе, находим, что упра вляемая система будет экспоненциально L-инвариантна в рассматри ваемом классе обратных связей, если существует обратная связь Ug такая, что
lim L{t)-x'^it){P |
+ k'^Qk)x(t) = 0. |
t-foo |
|
Положим
щ = -ко\\х\\ц, /i = - asgn[(r + /i|(r|],
где fco и а — положительные параметры, а функция сг является реше нием системы дифференциальных уравнений
& + l<T = a-ko\\x\\ft |
/i =-asgn[(T4-/i|<T|], |/<(<о)| < 1- |
Здесь I — произвольно назначаемое положительное число. Очевидно, что функция (т{1) нам также неизвестна, но если пока отвлечься от
318 Глава 10. Субоптимлдьиая стабилизация
этого обстоятельства, то ясно, что надлежащим выбором ко, а не сложно обеспечить выполнение следующих неравенств:
к1 < s|ko||e-^S t > О, |
\&\ < e?i||xo||e-^'. t > Г, |
Var <r < е||го||, |
sup \&\ < дгН^оН, |
о |
[0,0 |
при некоторых положительных константах е, qi, дг и 7- Из этих неравенств и уравнения
X = АкХ + Ь{& + 1<г)
следует асимптотическая инвариантность системы, а вместе с ней и ее субоптимальность. Таким образом, все свелось к оценке функции (т(<), и для этого годится асимптотический наблюдатель вида
? = с^х — ^,
i = c'^AkX + l(c'^x-0,
где с^б = 1. Нетрудно установить, что ошибка оценивания е = <т — ? удовлетворяет уравнению ё + 1е = О и, следовательно, функция ? экс поненциально (с произвольно назначаемым показателем /) сходится к функции <т. Отсюда следует, что свойство субоптимальности сохрг1нится, если вместо сг в обратной связи использовать ее оценку а, т.е.
и = -кх - A!o||a;||/i,
it = -asgn[a + fi\a\], |;i(0)| < 1.
Таким образом, использование методов асимптотической инвари антности для оптимальной стабилизации при неопределенности по зволяет синтезировать обратные связи, робастно стабилизирующие неопределенные объекты с качеством, сколь угодно близким к опти мальному. Решение задач оптимального управления в рамках теории асимптотической инвариантности (ввиду универсальности последней) позволяет рги:ширить классы неопределенных объектов, подлежащих оптимизации.
В общем случае, задача оптимальной стабилизации в условиях не определенности не решается классическими методами, но их сочета ние с теорией новых типов обратной связи и идеей асимптотической инвариантности позволяет решать задачу для достаточно широкого класса неопределенных объектов. Этот факт и подтверждается в на стоящей главе. Развитие и обобщение этих положений дг^тся в рабо тах, ссылки на которые даны на стр. 133.
Заключение
Обратная связь "пронизывает" окружающую нас действительность: она служит ключевым элементом биологической эволюции и естествен ного отбора; она обеспечивает регуляторный механизм в равновесных системах, в частности в природных экосистемах, и является необхо димым элементом работоспособных экономических конструкций; на конец, она составляет основу саморегулирующихся и самоподдержи вающихся биосистем. Этот список легко продолжить. Но до сих пор мы очень мало знгюм о механизме обратной связи, так как фактиче ски он никогда не являлся самостоятельным объектом исследования. И на то есть причины.
Действительно, идея обратной связи почти очевидна, легко воспри нимается и в простых ситуациях ее применение не вызывает проблем. Однако синтез обратной связи в нестандартной ситуации, как пра вило, дается нелегко и требует нешаблонных решений. Это обусло влено отсутствием теории, объясняющей механизмы формирования обратной связи. Как правило, эти механизмы ускользают от исследо вателя, поскольку они довольно сложны. Здесь ситуация аналогична ситуации с другими законами естествознания. 6 свое время физик Ри чард Фейнман сказал о законе тяготения: "Закон действует сложно, но его коренная идея проста. Это обстоятельство роднит все н£Ш1и законы" [89].
Справедливости ради следует заметить, что регулярные попытки изучения обратной связи предпринимаются и в теории автоматиче ского управления, и в бионике, и в экономических теориях. Однако в этих дисциплинах почти всегда упор делается на использование обрат ной связи, а не на механизм ее формирования. Это естественно, ибо, по мнению Энона, предметная наука вырабатывает правила решения задачи, но не способы выбора этих правил.
Отсутствие правил второго уровня принуждает нас к необходимо сти угадывания закона обратной связи всякий раз, когда мы имеем дело с нестандартной задачей, но новые идеи и принципы придумы вать очень трудно, ибо для этого требуется богатое воображение. Недаром в истории теории управления зафиксировано совсем немного подобных откровений. В результате теория управления содержит, по
320 |
Заключение |
сути дела, протоколы решения стандартных задач, тогда как жела тельно иметь правила синтеза, распространяемые на новые ситуации.
Вмонографии впервые предпринята попытка развития гипотезы
оструктуре механизма формирования обратной связи. Эта гипотеза базируется на "иерархии" сложности обратной связи. Подобное пред ставление о структуре обратной связи кажется вполне естественным, ибо позволяет свести проблему синтеза сложного нелинейного регуля тора к решению последовательности однотипных и хорошо изученных задач. Иначе говоря, видимая сложность проблемы рекуррентно по рождается невидимой внутренней простотой.
Для реализации принципа иерархии потребовалось введение нового для теории управления понятия сигнала-оператора. Этот термин от ражает двойственную природу сигналов в нелинейных динамических системах. В сочетании с принципом обратной связи сигнал-оператор предоставляет необходимые возможности для перехода от непосред ственного решения задачи к нахождению сначала г1Лгоритма решения задачи, а если потребуется, то и к гшгоритму, определяющему ал горитм решения задачи, и т.д. Получаемая таким образом "иерар хическая структура" обратной связи примечательна еще и тем, что на каждом иерархическом уровне управляющие механизмы просты, однотипны и могут быть получены стандартными для классической теории регулирования способами.
Обратим внимание читателя на то, что идея о двойственной при роде переменных величин обычна для естествознания и весьма плодо творна. Так, например, Макс Борн ввел понятие оператора физиче ской величины, которое оказалось очень продуктивным в квантовой механике, имеющей дело с объектами дуальными в первооснове, а по нятие оператора-времени, введенное Ильей Пригожиным, оказалось очень полезным в физике необратимых процессов.
Авторы уверены, что появление принципа бинарности и новых ти пов обратных связей довольно естественно для современного этапа развития общей теории обратной связи. Для обоснования этого те зиса авторы подробно рассмотрели эволюцию важнейших принципов и методов теории регулирования по мере роста факторов неопреде ленности в задачах управления, что представляет самостоятельный интерес и может служить кратким введением в классическую теорию обратной связи.
Заметим также, что с математической точки зрения предложен ный подход можно рассматривать как способ синтеза нелинейных ди намических систем с заранее предписанными свойствами их решений, такими, например, как устойчивость, малая чувствительность по от ношению к вариациям параметров задачи и т.п. Разумеется, приме-