Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Теория автоматического управления

..pdf
Скачиваний:
7
Добавлен:
12.11.2023
Размер:
16.96 Mб
Скачать

Рис. 11.6. Разомкнутая (а) и замкнутая (б) системы, оптимальные по быстро­ действию

действительные числа, то каждая из составляющих у*, (t) оптималь­

ного вектора управления у * (t) в задаче (11.88) — (11.90) имеет не более п интервалов постоянства своих предельных значений ууМ [т. е. не более (п—1) переключений с одного предельного значения на другое], где п — порядок системы уравнений объекта.

Алгоритмы оптимального управления, найденные как вектор — функции времени у * (/), могут быть реализованы при помощи ра­ зомкнутой системы (рис. 11.6, а), состоящей из задающего, вычис­ лительного и исполнительного устройств. Задающее устройство ЗУ формирует программу управления х 3 (/), как функцию сигнала времени /, вырабатываемого специальным датчиком (таймером). Вычислительное устройство ВУ в зависимости от известных на­ чальных условий х (0) и задания х 3(/), эквивалентного желаемому конечному состоянию дгк, определяет моменты переключения tjs каждого управляющего воздействия Далее вычислительное устройство выдает в рассчитанные моменты времени ts команды у п на переключение исполнительного устройства ИУ из одного край­ него положения в другое.

Моменты переключения зависят также от возмущения 2 , и поэ­ тому при его наличии управление в разомкнутой системе может быть осуществлено лишь в том случае, если возмущение заранее известно как функция времени г (t).

В заключение надо отметить, что определение моментов пере­ ключения в общем случае является весьма сложной задачей, и поэтому системы с максимальным быстродействием предпочтитель­ ней конструировать как замкнутые.

Синтез алгоритмов замкнутого управления. При синтезе замкну­

той системы управления (рис. 11.6, б), дополнительно к принципу максимума используют метод фазовых траекторий, с помощью которого определяют уравнения поверхностей переключения

т

 

 

т

 

£ M>t = 0,

/ = 1;

2;

(11.100)

i=1

 

 

 

 

и так называемые переключающие функции

 

*/„/(•*)= Е

bifti,

/ = 1; 2;

т,

(11.101)

i=i

 

 

 

 

принимающие нулевые значения на поверхности переключения. Поверхность (линия) переключения в силу непрерывной зави­

симости оптимальной траектории x*(t) от начальных условий х (0) представляет собой непрерывную кусочно-гладкую поверхность (линию), которая разделяет пространство состояния х на две об­ ласти, соответствующие разным знакам управляющего воздейст­ вия. Форма и положение поверхности переключения зависят как от вида и параметров уравнений объекта, так и от вида и парамет­ ров внешних воздействий х 3 (/) и z (t). Если в качестве переменных состояния приняты отклонения ег (/) = x3i (/) — х ( (/), то поверх­ ность переключения обязательно проходит через начало коорди­ нат, в котором заканчивается переходный процесс, начавшийся из любого начального состояния е(0). Если порядок внешнего воздействия в виде степенной функции (см. 4.4) меньше порядка астатизма объекта, то поверхность переключения кососимметрична относительно указанного начала координат.

Некососимметричная линия переключения АОВ для объекта второго порядка (рис. 11.7) разделяет фазовую плоскость х хх 2 на две области (заштрихованы под разным наклоном), соответст­ вующие различным знакам управляющего воздействия: ниже ли­ нии + Ум и выше — ум. Причем, ветвь АО соответствует — ум, а ветвь ОВ + ум. Очевидно, что в зависимости от начального со­ стояния объекта могут иметь место следующие варианты управ­ ляющих последовательностей, переводящих объект в начало ко­ ординат. Если точка начального состояния расположена выше линии переключения, например, точка M lt то вначале управляю­ щее воздействие должно быть отрицательным, а затем в точке М 2, расположенной на линии переключения, управляющее воздейст­ вие должно стать положительным. Если же начальная точка рас­ положена ниже линии переключения, например, точка N lt то уп-

392

А

Рис. 11.7. Линия переключения для объекта второго порядка

равление вначале положительное, а затем в точке N 2 на линии переключения должно стать отрицательным. В частных случаях, когда начальная точка сразу оказывается на одной из ветвей ли­ нии переключения (точки А или В), изменять знак управления в те­ чение переходного процесса вообще не требуется.

Знак управляющего воздействия на первом интервале опреде­ ляется знаком переключающей функции уп в начальной точке. Переключающую функцию стремятся обычно записать так, чтобы ее знак по обе стороны линии переключения совпадал с знаком управляющего воздействия, т. е.

( 11. 102)

Таким образом, задача синтеза оптимальной по быстродействию замкнутой системы сводится к отысканию в пространстве состояния переключающей функции у п(х) и к ее реализации в вычислитель­ ном устройстве. Оптимальные управляющие воздействия, равные согласно выражениям (11.96) и (11.101)

Iу) (0 = UiMsign г/п/ (*), / = 1 ; 2;

/72,

(11.103)

окончательно формируются двухпозиционным

исполнительным

устройством, выходные переменные которого принимают только максимальные значения + у;М и — yjw.

Отыскание уравнений поверхностей переключения и переклю­ чающих функций является в общем случае довольно сложной за­ дачей, особенно при наличии внешних (задающих или возмущаю­

щих) воздействий. В таких

случаях приходится либо

заранее учи­

тывать эти воздействия в

уравнении объекта, либо

измерять их

и вводить соответствующие

сигналы в вычислительное устройство,

реализующее переключающую функцию. При этом поверхность переключения и переключающая функция оказываются нестацио­ нарными, «плавающими» в пространстве состояния.

Сравнительно просто переключающие функции можно найти лишь для некоторых частных случаев, когда объект описывается уравнением не выше второго порядка, а внешние воздействия пред­ ставляют собой степенные функции с порядком, не превышающим порядок объекта.

Пример 1. Пусть дан объект, описываемый линейным дифференциальным уравнением второго порядка

(t) = k0y (t)

 

(11.104)

или системой двух уравнений первого порядка

 

*1

=

x2(t) =

k0y(t),

(11.105)

где х г =

хв.

Уравнения

(11.104), (11.105) соответствуют

широкому классу

механических объектов, в которых происходят процессы перемещения боль­ ших масс без трения. Применительно к таким объектам переменная хв озна­

чает линейное или угловое перемещение, а переменные х в и х в — соответст­ венно линейные (угловые) скорости и ускорения. Управляющим воздейст­

вием у является сила

или момент, создаваемые

приводом. Коэффициент k0

в таком случае равен единице, деленной на массу или момент инерции.

Требуется найти алгоритм разомкнутого управления у (t), обеспечиваю­

щий перевод

объекта

из

заданного

начального

состояния

х (0) = х н =

= [*1Н, * 2н17

в заданное

конечное

состояние

х (tK) = х к = [х1н, х 2к \ Т за

минимальное

время tK и

при ограниченном

управляющем

воздействии

\У\

Заметим, что применительно к рассматриваемому объекту ограни­

чение управления эквивалентно ограничению ускорения:

 

I * B I <

* O J / M

( 11- 106)

И Л И

 

 

 

 

(п -107)

где хы и Ум — заданные максимально допустимые по технологическим ус­

ловиям значения ускорения и момента.

 

Для удобства решения задачи целесообразно начало координат про­

странства состояний выбрать в точке хк, т. е. полагать, что х 1к =

0 и х 2К = 0,

а под начальными

значениями х 1н и х 2Н понимать уже начальные коорди­

наты в этой новой

системе отсчета.

СЬгласно теореме об п интервалах оптимальное управление у* (t) для данного объекта второго порядка должно иметь два интервала постоянства и одно переключение. Таким образом, задача сводится к отысканию моментов реверса tn и отключения tK управляющего воздействия.

Для этого запишем решения системы уравнений (11.105) для двух ин­ тервалов времени:

при 0 ^

 

tn

Х2 (0 =

-- k0yMt 4~ Сц,

xi (0 =

 

(11.108)

( ЬоУм^/2) Cut -f- Cl2;

при tu

^

х2 (/) =

k0yMt + С12,

M 0 =

( W

(11.109)

2/2) + C12/ + C 22.

Используя граничные условия х х (0) = х1н; х г (0) = х ги; х, (/к) = 0; *2 (/к) = °> находим следующие значения постоянных интегрирования:

Сп = х 2н;

С21=дс1н;

С ,,= — kQy J K;

Cn

= k0y j l l 2 .

(11.110)

Моменты

времени

и tK определим

по

методу «сшивания»

решений.

Условия «сшивания» решений уравнений (11.108) и (11.109) в момент

t = tn

имеют вид

 

 

 

 

--ЬоУм^П4" ^11 = ЬоУм^П4" ^12*>

 

( 11. 111)

(

koyutj2) + C\\tn4-

= (^м^п^) 4- ^12^п 4- ^22

 

Решая совместно систему (11.111) с учетом значений постоянных (11.110),

окончательно

получим

 

 

 

 

= (*2н/^о^м) 4" "\j(^2H^^O^M) 4“ х\н!А>^м »

(11.112)

 

=

х2н1^оУм ~ (*2н/^о^м) 4“

(*2н/^о^м ) 4" *1н/^о^м

(11* 113)

На рис. 11.8 приведены

 

 

«3*

оптимальные для данного объекта переходные

процессы при

произвольных

начальных

условиях х 1н > 0 и х 2Н>

0.

Пример 2. Определим для объекта (11.104), рассмотренного в предыду­

щем

примере,

оптимальный

алгоритм

замкнутого управления у* (х) или

у* (е), обеспечивающий за минимальное время перевод объекта в режим слежения выходной величины хв (t) за некоторым задающим воздействием

*з (0-

Структура управляющего устройства,

реализующего алгоритм у* (е),

зависит

от

вида воздействия х3 (/).

простой

случай,

когда воздействие х3

Рассмотрим

вначале

наиболее

является ступенчатым, т. е. х3 (t) = х13 (t) =

х1к1 (t), а начальные условия

нулевыми: хх(0) = 0, х2(0) = 0.

Тогда в качестве

переменных состояния

объекта

можно

принять

сигнал

ошибки

е = ех = х3хв = х3х1=

= х1кхх и его производную е =

е2 = х3—х2 = х2%для которых урав­

нения объекта (11.105) также справедливы:

 

 

е1 = е2,

е2=

— k0y.

 

 

 

(11.114)

Для определения переключающей функции и синтеза управляющего устройства применим метод фазовых траекторий.' Исключая из уравнений (11.114) величину dt, найдем дифференциальное уравнение фазовых траек­ торий

e2de2= — k0y d z x.

(11.115)

Интегрируя выражение (11.115), получим уравнения фазовых траекто­ рий в плоскости ех—е2:

при у = + ум

*1 ------(е|/2 *„< /„)+ С,;

(1Ы16)

при у =

— ум

 

е , = + {

4 № 0Уы) + С2.

(Н-117)

На фазовой плоскости (рис. 11.9) уравнению (11.116) соответствует се­ мейство парабол с ветвями, направленными влево, а уравнению (11.117) — семейство парабол с ветвями, направленными вправо. Смещение вершин па­ рабол по оси ег определяется постоянными интегрирования Сх и С2, завися­ щими от начальных условий ех (0) и е2 (0).

Так как по условию примера процесс должен закончиться в начале ко­ ординат е = 0, то на последнем этапе процесса изображающая точка будет

Рис. 11.9. Фазовые траектории и линии переключения для объекта, описываемого уравнением (11.104)

Рис. 11.8. Оптимальные переход­ ные процессы для объекта описы­ ваемого уравнением (11.104)

Рис. 11.10. Оптимальная по быстродействию замкнутая система управления объектом, описываемого уравнением (11.104)

двигаться обязательно по одной из двух парабол, проходящих через начало координат. Причем, согласно общему свойству фазовых траекторий (см. 9.3) движение к началу координат может происходить лишь по одной ветви каж­ дой параболы: при е2 > 0 — по ветви АО, и при е2 < 0 — по ветви ВО.

Эти две ветви, принадлежащие параболам из разных семейств, можно описать одним общим уравнением

® l= - 82 signe2/260</M= — е21 е2 |/2*о^м-

(11.118)

Если в начальном состоянии изображающая точка е (0) расположена выше линии АОВ (как, например, точка С), то под воздействием управления У = + ум система будет двигаться к завершающему участку ВО по траекто­ рии CDt подчиняющейся уравнению (11.116). Если же точка расположена ниже линии АОВ у то у = — г/м, и движение происходит по одной из траекто­ рий (11.117) до ее пересечения с ветвью АО.

В обоих случаях при попадании изображающей точки на линию АОВ происходит переключение управляющего воздействия с одного предельного значения на другое. Таким образом, линия АОВ является линией переклю­ чения.

Теперь, зная уравнение линии переключения, можно синтезировать вычислительное устройство (рис. 11.10), которое реализует переключающую

функцию

 

 

 

 

 

 

 

Уп(е1 , е2) = 8, + е2 1eg |/2£0Ум>

 

 

 

 

(11.119)

равную нулю на линии переключения (11.118).

элемента

НЭу

входящего

Статическая

характеристика

нелинейного

в ВУ, соответствует второму слагаемому переключающей функции.

 

Исполнительное устройство ИУ описывается функцией

 

 

 

У = Ум sign у п.

 

 

 

 

 

(11.120)

Очевидно, что

в точках, расположенных правее линии

переключения,

функция уп >» 0 и управляющее воздействие согласно (11.120)

равно +

*/м»

а в точках, расположенных левее, функция уп <

0 и у =

— */м-

вре­

Для случая,

когда задающее

воздействие х3 является

функцией

мени, переключающая функция становится сложнее. Причем, воздействие х3 должно удовлетворять определенному условию: максимальное значение его

второй производной х3, м в установившемся режиме не должно превышать допустимое ускорение объекта, т. е. \х3, м| < k0yм.

Уравнения состояния объекта при наличии меняющегося воздействия принимают вид

е1 = е2» б2 =

Хэ ЬоУм‘

(11.121)

Исключая из них время, можно аналогично получить

переключающую

функцию

 

 

Уп (81, 82) =

81 -f- 82 | е2 |/(2ft0yM) -f- х3 181 \lk0yK.

(11.122)

Вычислительное устройство в данном случае содержит еще дополнитель­ ные элементы, которые формируют сигнал, соответствующий третьему сла­ гаемому в выражении (11 .122).

Полная структура ВУ будет оптимальной и для частного случая, когда задающее воздействие меняется ступенчато.

11.4. Системы, оптимальные по квадратичным критериям

Методика синтеза замкнутых линейных систем управления, оптимальных по квадратичным критериям типа (11.20), была раз­ работана советским и американским учеными А. М. Летовым и Р. Калманом и получила название методики аналитического кон­ струирования оптимальных регуляторов (АКОР).

Рассмотрим сущность методики АКОР вначале применительно

к таким

объектам, у которых

переменные состояния поддаются

п о л н о

м у и т о ч н о м у

н а б л ю д е н и ю . Пусть объект

управления стационарен и задан матричным дифференциальным уравнением состояния

x{t) = A x{t) + By(t) + z(t)

 

 

(11.123)

и алгебраическим

уравнением

выхода

 

 

х в (/) =

Свх (/),

 

 

 

 

(11.124)

где x { t) — «-мерный

вектор

состояния

с

компонентами x 1 (t),

х 2 (0.

х п (0; У (0 — m-мерный вектор управляющих воздейст­

вий у х (/),

t/2 (/),

,

ут (/);

z (/) — «-мерный вектор возмущаю­

щих воздействий z x (t), z2 (/),

. , z„ (/) типа белый шум с извест­

ными

интенсивностями

S2/0;

х в (/) — /-мерный вектор выходных

(управляемых) переменных хВ1 (/), хвг (/),

.

, хв1 (/), к значениям

которых предъявляются определенные требования при формули­

ровке

цели

и задачи управления; А = {aiy}nx/„

В = {bij}nXm,

Св =

{cij}ixn — постоянные матрицы, элементы которых являются

параметрами

объекта.

 

Полагаем,

что управляющие воздействия y(t)

не ограничены,

и между размерностями указанных векторов выполняются сле­ дующие соотношения

Стабилизирующие системы при полном и точном наблюдении объекта. Простейшей задачей управления является задача стабили-

зации выходных переменных х „(/) на заданных уровнях лгв.3о= const. Для удобства решения эти уровни принимают за начало отсчета переменных х в (t), тогда задача стабилизации будет заключаться в удержании вектора х „(/) в смещенном начале координат х в. 30 = О с наименьшим среднеквадратичным отклонением ев (/) = х в(/) —

x B. Bo = x B(t). Причем, по технико-экономическим соображе­ ниям всегда желательно, чтобы при этом среднеквадратичные зна­ чения управляющих воздействий у (t) были также минимальны. Такой формулировке цели управления соответствует минимизация квадратичного функционала

Qn = lim - J -

f 4 " [-«I (0 Я*хв (0 + yT (0 ry (/)] d /,

(11.126)

tK-+°°

*4

J 2

 

 

 

K

 

0

 

 

 

где qB= {qa}nxn и

/* = {гц}тхт диагональные

матрицы ве­

совых коэффициентов

qa > 0 и гц > 0,

учитывающих «штрафы»

за отклонения

компонент векторов х в (t)

и у (/) от нуля.

Весовые коэффициенты qa и гц подбирают обычно эксперимен­ тально путем последовательных итераций и сравнений процессов управления, вычисляемых на цифровой модели системы. Успеш­ ность такого подбора зависит от интуитивно-эвристического по­ нимания разработчиком системы сложного механизма влияния ве­ совых коэффициентов на показатели качества процесса управления. Главные закономерности влияния таковы: чем больше значения коэффициентов qa, тем шире полоса пропускания замкнутой си­

стемы управления

и,

следовательно, лучше ее быстродействие;

чем больше значения

коэффициентов гц, тем инерционнее система.

Задача стабилизации выходных координат x B(t) по

критерию

(11.126) эквивалентна задаче стабилизации переменных

состояния

х (/) по

критерию

 

 

 

 

Qn =

lim

Г —

[лгт (/)

(0 + >»т (/) ry(t)]dt,

(11.127)

 

'к-**

J

2

 

 

 

где q = CJ^BCb.

Согласно теоретическим положениям, разработанным А. М. Ле­

товым и Р.

Калманом,

(рис. 11.11,

а),

работающей

в режиме

в системе

управления

стабилизации (т. е. при х 3 (t) =

0),

оптимальные

управляю­

щие воздействия у* (/),

соответствующие минимуму

функцио-

399

Рис. 11.11. Замкнутая система управления, оптимальная по квадратичному критерию:

а — общая структура; б — система стабилизации

нала (11.126) или (11.127), являются линейными функциями пе­ ременных состояния:

\у ( ( ) = - & . cx(t),

(11.128)

где к ; с ( ш х п)-матрица коэффициентов обратных связей между п переменными состояния и т управляющими воздействиями,

К*0.с= r~ lBTD.

(11.129)

Матрица D в формуле (11.129) является симметричной положи­ тельно определенной размера п х п и находится как решение не­ линейного матричного алгебраического уравнения Риккати:

DA + ArD + C lqBCB— D Br~xB TD = 0.

(11.130)

В задачах программного управления, в которых требуется за конечное заданное время tK осуществить перевод объекта из неко­ торого исходного положения лгв(0) в начало координат лгв (/к) = 0, в решении вместо алгебраического уравнения (11.130) участвует дифференциальное уравнение Риккати с такой же левой частью,

но с производной

D (/) в правой части. При этом

матрицы D

и Ко. с становятся

функциями времени, зависящими

от заданных

начальных условий л:в(0), длительности управления /к и стоимости

400