Емельянов С.В. Новые типы обратной связи
.pdf10.1. Постановка задачи оптимальной стабилизации |
301 |
ситуаций, в которых возможно получить оптимальное или сколь угод но близкое к оптимальному (субоптимгшьное) решение задачи ста билизации при значительной неопределенности в описании объекта управления или внешних сил. Здесь и далее под значительной не определенностью понимается наличие информации лишь о мажоран тах функций, описывающих возмущения, и, быть может, о каналах их воздействия на объект.
В этом разделе ограничимся рассмотрением задач оптимальной стабилизации в следующей постановке: для конечномерного объекта
х = f{t,x,u,a), |
t>to, |
содержащего компактную неопределенность
а£А,
требуется синтезировать реализуемую оптимальную обратную связь по состоянию, переводящую объект из любого начального положения хо в наперед заданное состояние хх к моменту времени ti > <о, удер живающую объект в положении xi при всех < > <i и минимизирующую функционал
- J .
J{a)= I F{t,x,u,a)dt.
Здесь X G R" — фазовый вектор, u G R — управление. Функции / , F таковы, что гарантируется существование оптимальной обратной связи для каждого а Е А. Суть рассматриваемой проблемы заключа ется в том, что возмущение а точно не известно и не может быть иден тифицировано. Необходимо описать класс объектов и функционалов, для которых сформулированная постановка задачи оптимальной ста билизации допускает физически осмысленное решение. Положитель ный ответ на этот круг вопросов и составляет главное содержание раздела.
Кратко суть предлагаемого подхода можно пояснить следующим образом. Пусть возмущение а известно. Тогда функция
Uopt(<, X, а) = argmin J(a)
и
определяет оптимальную обратную связь, и уравнение поля экстрема лей принимает вид
iopt = /opt(<,a;opt) = f{t, lopt, u{t,Xopt,a), a).
Первая очевидная возможность реализации оптимальной системы имеет место тогда, когда Uopt не зависит от возмущения а. Вторая возможность менее тривигшьна и возникает тогда, когда поле экс тремалей не зависит от возмущения а. В этом случае, конечно, Uopt зависит от возмущения и не может быть реализовано точно. Исполь-
304 |
Глава 10. Субоптимальная стабилизация |
Все величины в предыдущем уравнении известны, т.е. ситуация полностью определена, и, следовательно, его можно решить. Сначала находим, что
•fk
2 Далее подставляем найденное выражение в уравнение оптимальности
и определяем параметр усредненной функции Беллмана
Тогда окончательный вид оптимальной обратной связи определяется выражением
•X,
поле экстремгией подчинено дифференциальному уравнению
а минимальное значение усредненного функционала задается форму лой
7 - /iT^^o
Итак, в методе усреднения оптимальная обратная связь детерми нирована, поле экстремалей зависит от_неопределенного параметра, а оптимальное значение функционала Jopt превосходит минимально возможное значение Jopt, так как
AJ — Jopt — Jopt =
Это неравенство и определяет потери в оптимальности при стабили зации "в среднем".
10.4. Минимаксная оптимальная стабилизация
Если информация о плотности распределения отсутствует, то сведе ние рассматриваемой задачи с неопределенностью к задаче без не определенности возможно с помощью идеи гарантированного резуль тата, когда минимизации подлежит "наихудшее" значение функционг1ла. Формально эта процедура сводится к известной проблеме минимакса и поиску седловой точки. Сохраним приверженность прин ципу оптимальности Беллмана и для определения функции Беллмана
306 |
Глава 10. Субоптим&льиая стабилизация |
10.5.Стабилизация с использованием эталонной модели и глубокой обратной связи по ошибке
Хорошо известно, что глубокая обратная связь является эффектив ным средством подавления возмущений. Прямое ее использование в рассматриваемой задаче, однако, ничего не дает. Поэтому прежде всего обратим внимание на то, что поле экстремалей не зависит от фактора неопределенности и, следовательно, соответствующее диф ференциальное уравнение можно принять за уравнение эталонной мо дели. Тогда глубокая обратная связь может быть введена по сигналу ошибки
е= X — Xopt
ииспользована для ее обнуления, в соответствии со схемой рис. 10.1. Пусть, например, глубокая обратная связь линейна и реализуется уве-
Xopt
Модель
flJ
X
Глубокая
ОС
Рис. 10.1
личением коэффициента усиления к > О до бесконечности, т.е.
и = —ке, Л —> 00 .
Тогда уравнение системы в отклонениях имеет вид
е = -(7 + *;)е + {а + 'у)х.
При Л -> 00 ошибка уменьшается до нуля и поведение замкнутой си стемы ничем не отличается от оптимального.
Формально найденное решение полностью исчерпывает рассматри ваемую проблему, так как потери в оптимальности равны нулю. Но если интересоваться решением, имеющим прагматический смысл, то приходится учитывать наличие физических ограничений и исследо вать грубость такой оптимальной системы по отношению к регуляр ным и сингулярным возмущениям.
Хорошо известно, что системы с большим коэффициентом усиле ния в обратной связи негрубы по отношению к сингулярным возму щениям, и потому запрещено использовать коэффициенты усиления, превосходящие некоторое критическое значение ксг- Но если к < к^,
10.5. Стабилизация с использованием эталонной модели |
307 |
то ошибка е ^ О и возникают потери в оптимальности, для оценки которых запишем уравнение в отклонениях
ё = —к^е + а.уХ,
где Ц = Л + 7i а-у = о + 7- Поскольку е(0) = О, то для всех t > О верна оценка
| е | < ^ | а : | , Ау=А + г
Из этого соотношения и следующего очевидного неравенства
к1 < kopt| + |e|
при достаточно большом значении к (т.е. к > А) следует необходимая для дальнейшего оценка
к.
\x\<m\xopt\, "^=•f:ГJ^•
Интегрант функционала задачи
J
F = x^+ •^{ах - ке)^
7'
оценивается неравенством
F<Mx\ М=1 + 1 Г л + ^ ) .
Поскольку на экстремали интегрант определен равенством
то при t > О имеет место неравенство
_ ^ гг?М _
Р< —2—^орь
ипотому абсолютные потери в оптимальности удовлетворяют нера венству
Разумеется, эта оценка завышена. Для получения более "деликат ного" результата следует ввести в рассмотрение функцию ^{i) как решение дифференциального уравнения
i = -{k^-\-a)(, + k(^-\-a^,
отвечающее тривиальному начальному условию ^(0) = 0.
308 |
Глава 10. Субоптимальная стабилизация |
Теперь ошибка е определяется равенством е = ^ж, а интегрант функционала удовлетворяет оценке
где
М( = max 1 + —(а - Ц)^
Если т ? = m a x [ l / ( l — ^)^], то окончательная оценка абсолютных
потерь имеет установленный выше вид, но с более "точными" кон стантами:
AJ^-''opt^ =~ •'optJ^Jli -J...<r^-l]<.
Эта оценка примечательна тем, что при Аг —> оо она убывает до нуля. Заметим, что это свойство не выполнено для предыдущей оценки.
Таким образом, увеличение коэффициента усиления в обратной связи повышает качество системы управления, но только до опреде ленного предела, зависящего от критического коэффициента усиления кет- При этом, конечно, по-прежнему актуален вопрос о существова нии иных методов, уменьшающих потери в оптимальности или устра няющих их вовсе. Если а = const, то некоторые надежды можно связать с идеями идентификации и адаптации. Процесс идентифи кации параметра вызывг1ет потери в оптимальности, сопоставимые с потерями предыдущих методов, и, следовательно, не приводит к качественно новому результату. Ограничивает возможности этого подхода и тот факт, что параметр а должен быть фиксирован.
10.6.Стабилизация методами теории бинарного управления
Для методов теории бинарного управления характерно принципиаль но отличное, например, от метода большого коэффициента усиления использование независимости поля экстремалей задачи от фактора не определенности.
Если при стандартной обратной связи сначала определяется за кон управления и затем выясняется влияние его параметров на каче ство решения задачи, то при бинарном управлении форма обратной связи не фиксируется, а определяется автоматически с помощью но вого типа обратной связи по ошибке.
Задачей нового контура обратной связи является обеспечение сов падения качественного поведения объекта управления и некоторого динамического звена (задатчика динамических свойств), определяю щего такое поведение. Обратная связь при этом, конечно, нелинейна.
