Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Емельянов С.В. Новые типы обратной связи

.pdf
Скачиваний:
1070
Добавлен:
02.05.2014
Размер:
4.58 Mб
Скачать

10.1. Постановка задачи оптимальной стабилизации

301

ситуаций, в которых возможно получить оптимальное или сколь угод­ но близкое к оптимальному (субоптимгшьное) решение задачи ста­ билизации при значительной неопределенности в описании объекта управления или внешних сил. Здесь и далее под значительной не­ определенностью понимается наличие информации лишь о мажоран­ тах функций, описывающих возмущения, и, быть может, о каналах их воздействия на объект.

В этом разделе ограничимся рассмотрением задач оптимальной стабилизации в следующей постановке: для конечномерного объекта

х = f{t,x,u,a),

t>to,

содержащего компактную неопределенность

а£А,

требуется синтезировать реализуемую оптимальную обратную связь по состоянию, переводящую объект из любого начального положения хо в наперед заданное состояние хх к моменту времени ti > <о, удер­ живающую объект в положении xi при всех < > <i и минимизирующую функционал

- J .

J{a)= I F{t,x,u,a)dt.

Здесь X G R" — фазовый вектор, u G R — управление. Функции / , F таковы, что гарантируется существование оптимальной обратной связи для каждого а Е А. Суть рассматриваемой проблемы заключа­ ется в том, что возмущение а точно не известно и не может быть иден­ тифицировано. Необходимо описать класс объектов и функционалов, для которых сформулированная постановка задачи оптимальной ста­ билизации допускает физически осмысленное решение. Положитель­ ный ответ на этот круг вопросов и составляет главное содержание раздела.

Кратко суть предлагаемого подхода можно пояснить следующим образом. Пусть возмущение а известно. Тогда функция

Uopt(<, X, а) = argmin J(a)

и

определяет оптимальную обратную связь, и уравнение поля экстрема­ лей принимает вид

iopt = /opt(<,a;opt) = f{t, lopt, u{t,Xopt,a), a).

Первая очевидная возможность реализации оптимальной системы имеет место тогда, когда Uopt не зависит от возмущения а. Вторая возможность менее тривигшьна и возникает тогда, когда поле экс­ тремалей не зависит от возмущения а. В этом случае, конечно, Uopt зависит от возмущения и не может быть реализовано точно. Исполь-

302

Глава 10. Субоптимальная стябнлизация

зование новых типов обратной связи и методов теории бинарного управления дает возможность сколь угодно точного приближения к оптимальному закону управления. Общему рассмотрению проблемы предпошлем иллюстративный пример, демонстрирующий особенности развиваемого подхода.

10.2.Пример задачи оптимальной стабилизации при неопределенности

Рассмотрим для простоты скалярный объект

X = ах + и, t >0,

с неизвестным параметром а, удовлетворяющим ограничению

где А — известная константа. Оптимальная обратная связь должна переводить объект из произвольного состояния го G R- в нуль за бесконечное время, доставляя минимум квадратичному функционалу "полной энергии"

00

J{a)=l(^x'+^x'^dt.

Здесь 7 — известный положительный параметр. Следуя традиции, при расчете «opt используем функцию Беллмана

оо

 

v{t) = f (х^ + \хЛ

dr, t>0.

в соответствии с принципом оптимальности функция v(t) удовле­ творяет дифференциальному уравнению Беллмана

"1?Ч^''''"'^^'} = °-

Полагая v = кх^/2, находим выражение для оптимального управления в следующем виде:

«opt = —ах —X.

Подстановка последнего в уравнение Беллмана позволяет определить параметр функции Беллмана

Л= 2/7,

ивместе с ним — окончательный вид оптимальной обратной связи

«opt = -(7 + а)а;.

10.3. Оптимальная стабилизация среднем"

303

Поле экстремалей в этой задаче порождается дифференциальным уравнением, не зависящим от параметра а:

iopt + 7^opt = О,

а минимальное значение функционала J(a) также не зависит от а и определяется равенством

1 -

"Opt —

7 Реализация найденной обратной связи, разумеется, невозможна,

поэтому следует изыскать способы ее приближенной реализации. Рги:- смотрим те из них, которые основаны на устранении неопределен­ ности в рассматриваемой задаче еще на начальной стадии. Первая возможность, которую мы рассмотрим, связана с идеей усреднения и предполагает наличие информации о плотности распределения пара­ метра а.

10.3. Оптимальная стабилизация "в среднем"

Пусть для определенности плотность распределения параметра а рав­ номерна на отрезке [—А, Л], т.е.

р(.) = 5^.

Тогда минимизации подлежит среднее значение функционала

А

J{A)= j p{a)J{a)da,

и в соответствии с этим нужно рассматривать усредненную функцию Беллмана

А

v= I v{t)p{a)i}da,

если, конечно, для синтеза обратной связи используется принцип опти­ мальности Беллмана. В таком случае уравнение оптимальности имеет

вид

mm {^-^-И-"-

U

Если положить V = кх'^/2 и провести усреднение, то уравнение опти­ мальности примет вид

^2^2 „2

mm

304

Глава 10. Субоптимальная стабилизация

Все величины в предыдущем уравнении известны, т.е. ситуация полностью определена, и, следовательно, его можно решить. Сначала находим, что

•fk

2 Далее подставляем найденное выражение в уравнение оптимальности

и определяем параметр усредненной функции Беллмана

Тогда окончательный вид оптимальной обратной связи определяется выражением

•X,

поле экстремгией подчинено дифференциальному уравнению

а минимальное значение усредненного функционала задается форму­ лой

7 - /iT^^o

Итак, в методе усреднения оптимальная обратная связь детерми­ нирована, поле экстремалей зависит от_неопределенного параметра, а оптимальное значение функционала Jopt превосходит минимально возможное значение Jopt, так как

AJ — Jopt — Jopt =

Это неравенство и определяет потери в оптимальности при стабили­ зации "в среднем".

10.4. Минимаксная оптимальная стабилизация

Если информация о плотности распределения отсутствует, то сведе­ ние рассматриваемой задачи с неопределенностью к задаче без не­ определенности возможно с помощью идеи гарантированного резуль­ тата, когда минимизации подлежит "наихудшее" значение функционг1ла. Формально эта процедура сводится к известной проблеме минимакса и поиску седловой точки. Сохраним приверженность прин­ ципу оптимальности Беллмана и для определения функции Беллмана

10.4. Минимаксная оптимальная стабилизация

305

V = кх^/2 воспользуемся уравнением дифференциального минимакса

min max < кх(ах + tx) Н—^(ах + и)^ + х^ > = 0.

Непосредственный анализ выражения в скобках позволяет устанавить, что его максимум по а £ А достигается при

а* = Asgn (?"'+"0I —^х их -

Поэтому выбор оптимальной обратной связи надлежит проводить те­ перь на основе минимизации полностью определенной функции, т.е.

vin<ll + -jjx^+A

кх^+ ^2- + — + кхи> = 0.

mm

 

Отсюда находим оптимальную обратную связь в виде

«opt = fk ^Х,

где коэффициент функции Беллмана

, 2 /, А2

т.е. оптимальная по принципу минимакса обратная связь линейна и дается выражением

«opt = -Vl^ + А'^х.

Поле экстремалей описывается дифференциальным уравнением

iopt + {уу"^ + А^ - aj lopt = О,

а минимаксное значение функционала дается выражением

Абсолютные потери в оптимальности при таком подходе к синтезу обратной связи определяются равенством

^J - Jopt - ^pt - W1 + ^ —.

306

Глава 10. Субоптим&льиая стабилизация

10.5.Стабилизация с использованием эталонной модели и глубокой обратной связи по ошибке

Хорошо известно, что глубокая обратная связь является эффектив­ ным средством подавления возмущений. Прямое ее использование в рассматриваемой задаче, однако, ничего не дает. Поэтому прежде всего обратим внимание на то, что поле экстремалей не зависит от фактора неопределенности и, следовательно, соответствующее диф­ ференциальное уравнение можно принять за уравнение эталонной мо­ дели. Тогда глубокая обратная связь может быть введена по сигналу ошибки

е= X — Xopt

ииспользована для ее обнуления, в соответствии со схемой рис. 10.1. Пусть, например, глубокая обратная связь линейна и реализуется уве-

Xopt

Модель

flJ

X

Глубокая

ОС

Рис. 10.1

личением коэффициента усиления к > О до бесконечности, т.е.

и = —ке, Л —> 00 .

Тогда уравнение системы в отклонениях имеет вид

е = -(7 + *;)е + {а + 'у)х.

При Л -> 00 ошибка уменьшается до нуля и поведение замкнутой си­ стемы ничем не отличается от оптимального.

Формально найденное решение полностью исчерпывает рассматри­ ваемую проблему, так как потери в оптимальности равны нулю. Но если интересоваться решением, имеющим прагматический смысл, то приходится учитывать наличие физических ограничений и исследо­ вать грубость такой оптимальной системы по отношению к регуляр­ ным и сингулярным возмущениям.

Хорошо известно, что системы с большим коэффициентом усиле­ ния в обратной связи негрубы по отношению к сингулярным возму­ щениям, и потому запрещено использовать коэффициенты усиления, превосходящие некоторое критическое значение ксг- Но если к < к^,

10.5. Стабилизация с использованием эталонной модели

307

то ошибка е ^ О и возникают потери в оптимальности, для оценки которых запишем уравнение в отклонениях

ё = —к^е + а.уХ,

где Ц = Л + 7i а-у = о + 7- Поскольку е(0) = О, то для всех t > О верна оценка

| е | < ^ | а : | , Ау=А + г

Из этого соотношения и следующего очевидного неравенства

к1 < kopt| + |e|

при достаточно большом значении к (т.е. к > А) следует необходимая для дальнейшего оценка

к.

\x\<m\xopt\, "^=•f:ГJ^•

Интегрант функционала задачи

J

F = x^+ •^{ах - ке)^

7'

оценивается неравенством

F<Mx\ М=1 + 1 Г л + ^ ) .

Поскольку на экстремали интегрант определен равенством

то при t > О имеет место неравенство

_ ^ гг?М _

Р< —2—^орь

ипотому абсолютные потери в оптимальности удовлетворяют нера­ венству

Разумеется, эта оценка завышена. Для получения более "деликат­ ного" результата следует ввести в рассмотрение функцию ^{i) как решение дифференциального уравнения

i = -{k^-\-a)(, + k(^-\-a^,

отвечающее тривиальному начальному условию ^(0) = 0.

308

Глава 10. Субоптимальная стабилизация

Теперь ошибка е определяется равенством е = ^ж, а интегрант функционала удовлетворяет оценке

где

М( = max 1 + —(а - Ц)^

Если т ? = m a x [ l / ( l — ^)^], то окончательная оценка абсолютных

потерь имеет установленный выше вид, но с более "точными" кон­ стантами:

AJ^-''opt^ =~ •'optJ^Jli -J...<r^-l]<.

Эта оценка примечательна тем, что при Аг —> оо она убывает до нуля. Заметим, что это свойство не выполнено для предыдущей оценки.

Таким образом, увеличение коэффициента усиления в обратной связи повышает качество системы управления, но только до опреде­ ленного предела, зависящего от критического коэффициента усиления кет- При этом, конечно, по-прежнему актуален вопрос о существова­ нии иных методов, уменьшающих потери в оптимальности или устра­ няющих их вовсе. Если а = const, то некоторые надежды можно связать с идеями идентификации и адаптации. Процесс идентифи­ кации параметра вызывг1ет потери в оптимальности, сопоставимые с потерями предыдущих методов, и, следовательно, не приводит к качественно новому результату. Ограничивает возможности этого подхода и тот факт, что параметр а должен быть фиксирован.

10.6.Стабилизация методами теории бинарного управления

Для методов теории бинарного управления характерно принципиаль­ но отличное, например, от метода большого коэффициента усиления использование независимости поля экстремалей задачи от фактора не­ определенности.

Если при стандартной обратной связи сначала определяется за­ кон управления и затем выясняется влияние его параметров на каче­ ство решения задачи, то при бинарном управлении форма обратной связи не фиксируется, а определяется автоматически с помощью но­ вого типа обратной связи по ошибке.

Задачей нового контура обратной связи является обеспечение сов­ падения качественного поведения объекта управления и некоторого динамического звена (задатчика динамических свойств), определяю­ щего такое поведение. Обратная связь при этом, конечно, нелинейна.

JO.б. Методы теории бинарного управления

309

Схема системы управления, в которой реализуется эта идея, по­ казана в обобщенном виде на рис. 10.2, на котором Р — объект, Sy и Sx — основной и вспомогательный задатчики с выходными зада-

с

I *

 

 

/ •

 

 

 

 

 

 

 

Ох

 

' W

 

 

Сд

 

 

 

 

 

 

1

1

 

 

^\(t

 

X

^

 

 

Sy

 

Сц

 

 

i r '

 

 

 

'V

 

 

 

 

 

 

у

и

1

 

 

 

 

р

 

 

 

 

 

 

 

1

 

 

 

 

 

• ^

Рис. 10.2

ющими воздействиями у^ и х'^ соответственно, Си и С,^ — операторы основной и бинарной обратной связи, х и а — ошибки регулирова­ ния основного и координатно-операторного контура обратной связи, и W. fj, — координатный и операторный сигналы управления. В этой структуре выбору подлежат оператор Сft и бинарная операция в Си, при которых обнуляется ошибка координатно-операторного контура обратной связи и.

Конкретно для рассматриваемой задачи эта схема принимает вид, представленный на рис. 10.3. Структура системы управления на этом рисунке для удобства и простоты отражает тот выбор оператора Сц

Xopt ^) - ^

Сд 1

 

i^

м

-Y

 

-

J

-^>—

1—.

g

1

Рис. 10.3

310

Глава 10. Субоптимальная стабилизация

ибинарной операции, при котором

и= цх.

Втакой бинарной системе управления выбору подлежит только оператор С^ из условий оптимальности всей системы, что имело бы место тогда, когда ошибка о- = 0. Уравнение движения относительно этой ошибки имеет вид

& = уа — а-уХ — fix, (т(0) = О,

и проблема состоит в "правильном" задании алгоритма изменения операторной переменной /i. Рассмотрим имеющиеся для этого воз­ можности.

10.6.1.Система переменной структуры

Вклассической теории систем переменной структуры используется разрывная обратная связь, обеспечивающая скользящий режим на по­ верхности разрыва. В нашем случае эта идея приводит к использова­ нию релейной координатно-операторной обратной связи

fi = ksgn {(тх), к = const > 0.

В результате при выполнении неравенства

к> А^

взамкнутой системе управления, описываемой уравнением

&= —JO-а.уХ — к\х\ sgn <т,

на "поверхности" разрыва <г = О возникает скользящий режим, и с начального момента (так как <г(0) = 0) уравнения движения системы управления неотличимы от уравнения движения оптимальной системы при любом а. Но следует ли отсюда, что свойства такой системы управления инвариантны и по отношению к параметру а?

Для измерения качества системы управления естественно исполь­ зовать функционгш задачи

. = /(,4ii>).,.

Если действовать формально и не обращать внимания на разрывность X, то для подсчета функционала J в интегрант вместо

X = ах + k\x\sgn сг

следует подставить

Х = ах+ k\x\sgn (Teq.