книги / Теория автоматического управления техническими системами
..pdfи новые матрицы
А1= [о о]' в1= [?]’ Rl= S’ Q‘= [or]-
В новых переменных уравнение (9.40) и критерий (9.41) со ответственно примут вид
z-AiZ±BtV, z(f0)-*°; |
|
(9.42) |
00 |
|
(9.43) |
I [Z(g. V. <„]=$ [v’R.v+ zTQz]dt. |
|
|
ta |
|
уравнениями |
На рис. 9.4 показана система, описываемая |
||
(9.42). Применим в этой системе теорию оптимального регули- |
||
!----------------------------- |
! |
|
Ряс. 9.4. Структурная схема ПИ*регулятора рования, предварительно проверив условия управляемости и
наблюдаемости. В результате получим |
схему регулирования |
(рис. 9.5). Эта схема с безынерционным |
регулятором может |
Рис. 9.Б.Преобразованная схема ПИ-регулятора
..РР—объект регулирования; БР —блок регуляторов
Итак, найдем минимум функционала (9.43) при условии (9.42) . Предварительно заметим, что для существования зако на регулирования и конечности функционала (9.43), а также для асимптотической устойчивости замкнутой системы необхо димо принять два дополнительных допущения:
пара ГА„ В,] полностью управляема;
пара (A,, Dj] полностью наблюдаема для любой D,T, удов летворяющей условию D1DtT=Q1. При выполнении этих допу щений можно использовать результаты, полученные ранее, согласно которым оптимальный закон регулирования имеетвид
v*=—R^B^Pz
и
/*И*о), *o]=zT(*o)Pz(*o). Здесь
P= limP(*. Г)= 11тР(*, Т). Т-+ОЭ i-t-00
Причем Р есть решениеуравнения Риккати: —P=PA1+A1TR—PBiRj^B^P-fQ,
Р (Г, Т)=0.
Первое предположение обеспечивает существование Р, а вто рое определяет асимптотическую устойчивость замкнутой си стемы
z= (Ai—BjR^B^PJz.
Можно показать, что оба предположения эквивалентны до
пущениям, которые ранее делались для уравнений |
(9.40), |
(9.42) , и что оптимальные значения показателей качества ре гулирования, согласно уравнениям (9.41) и (9.43), одинаковы.
Перейдем теперь к интерпретации результатов минимиза ции расширенной системы, для того чтобы получить решение задачи минимизации для первоначальной системы. Как это бы ло замечено ранее, оптимальное управление и* для модифици рованной проблемы регулирования удовлетворяет равенству
ii=v при u*(^o)=u(/0). Минимальное значение /* одинаково для обеих задач:
/*[х(*0)> и(*„), fo]=/*N*o), *oL
Оптимальное управление и* и минимальное значение 7* можно выразить через параметры модифицированной задачи
следующим образом. Пусть
Оптимальное регулирование
U=V*, и*(£о)=и0
определяют выражением |
|
= -S-'P21x~S-ip22u*, |
|
т. е. оптимальное регулирование и* имеет вид |
|
ii*=KiTx+K2Tu* и u*(/0)=u°. |
(9.44) |
Здесь
KT= _s-,p21;
KJ=-S-'P22.
Минимальное значение показателя качества /: /[x(g, uw. g=/*[z(g. g = zT(gpz(g=
= [хт(^о)* «т «1 [p2i р22j [u(g] = хТ М puX(t0)+
-j-2uT(tQ) РдХ (^0) = UT(if)P22^ (^o)* Необходимо заметить, что при u(^0)=0
/*=хт(/0)Р„х(/о).
Матрицы Pu, P2i, Р22, входящие в оптимальный закон ре гулирования и в минимальное значение /, можно найти как пределы Pllf Р21и Р22при t-+00, причем
-Ph=Pi,A+AtP11-P 21tS"1P21+Q; Ри{Т)=0;
-Р 21- Р21А+BTPu-P^S-1Р21; Р21(Т)=0;
-P 22=P21B+BTP21t -P 22S ‘P22+R; Р(Т)=0.
Итак, получено решение задачи оптимального регулирова
ния при наличии производной и от регулирующего воздей ствия и.
Полученным результатам можно придать несколько другуюформу, сви детельствующуюо том, что регулятор действительно являтся ПИ-регулято- ром.Согласно уравнению(9.40),
и=В-1(х-Ах)= (ВТВ)-1Вт(х-Ах). |
перепишем |
Полагая, что ВТВположительно определена, уравнение (9.44) |
|
в следующем виде: |
(9.45) |
и'*=Кзтх+К4тх; u*(M=u°. |
|
Здесь |
|
Кзт=К2т(ВтВ)-1Вт? К4т=К!т-КзтА. |
|
Интегрируя уравнение (9.45),получим |
|
t |
(9.46) |
u*(t =kJx(£ +JkJx(t dt-f-u {U)—K[x(t0). |
Из уравнения (9.46) видно, что оптимальное регулирование реализовано в виде ПИ-регулятора. Таким образом, схема оптимального регулятора имеет вид, показанный на рис. 9.7 или рис. 9.8.
Рассматривая расширеннуюсистему (9.42) как первоначальнуюи при меняя ту же процедуру, можно получить решение задачи оптимального ре гулирования при наличии вторых производных от управления и.
9.7. Понятие о принципе максимума
Принцип максимума может рассматриваться как обобще ние классического вариационного исчисления на случай, когда управляющие воздействия и (0 принадлежат к замкнутому множеству, т. е. их значения ограничены определенными пре делами, что всегда имеет место на практике.
Принцип максимума дает изящный способ решения задачи детерминированного оптимального управления. Он позволяет только в общем случае найти необходимые условия оптимума, а в отдельных случаях —необходимые и достаточные условия, как например в задачах с квадратичным критерием и линей ными уравнениями объекта. Однако использование этого прин ципа, так же как и вариационных методов, затруднено реше нием двухточечных краевых задач. Кроме того, он не позво ляет определить оптимальное управление как функцию и(х) переменных состояния и поэтому остается открытым вопрос о реализации системы управления как замкнутой системы с об
ратной связью.
Принцип максимума Понтрягина. Ранее была рассмотрена задача Лагранжа и сформулировано необходимое условие оп тимальности. Оно состоит в том, что оптимальное управление должно быть стационарной точкой функции Гамильтона (9.14), т. е. удовлетворять векторному уравнению
Основное предположение, сделанное при решении задачи Ла гранжа, состояло в том, что управление может принадлежать всему пространству U, т. е. на управление не налагалось ни каких ограничений. В практических задачах, однако, необхо димые условия, определенные ранее, естественно, не пригодны.
Согласно теореме Понтрягина, получившей название «принцип максимума», оптимальное управление должно обес
печивать функции Гамильтона максимальное значение. |
|||
Введем понятие допустимого управления. Вектор управле |
|||
ния будет допустимым, если каждая |
его |
компонента |
|
ной |
£=1,2,..., т является ограниченной |
кусочно-непрерыв |
|
функцией, такой, что и(0^И для всех t, |
Началь |
||
ный |
момент времени t%предполагают фиксированным, а ко |
нечный t2 может быть как фиксированным, так и нефиксиро ванным.
Чтобы проиллюстрировать понятие, допустимого управления, рассмотрим систему с двумя управляющими входами иД*) и
и2(0» на которые наложено ограничение
где М0—некоторая положительная константа.
Множество U, т. е. щ, и2,..., иг, состоит из внутренней ча сти и границы круга радиусом М„ (рис. 9.8). В данном случае управляющий вектор на плоско
Рис. 9.8. Область допустимого управления
u=u-fôu uGU
сти U\, и2может иметь любое на правление, но его значение огра ничено М0. Таким образом, уп равление и (О как функцию вре мени t будем искать в классе кусочно-непрерывных функций.
Единственное затруднение, которое возникает по сравнению
сзадачей Лагранжа, заключается
впоявлении нового условия до
пустимости управлений. В связи с этим допустимые вариации управления должны удовлетво рять уравнению
(9.47)
т. е. вариации управления не могут быть произвольными, они должны удовлетворять заданным ограничениям.
Если х, и реализуют минимум |
/(х, и), то |
необходимо, что |
||
бы вариации (9.15) функционала |
(9.7) |
были |
неотрицательны |
|
б/(х, и, бх, ôu)>0 |
|
|
|
|
для любых допустимых вариаций ôx, ôu. |
задачу |
оптимального |
||
Постановка задачи. Сформулируем |
||||
управления в виде, удобном для |
последующего |
изложения |
принципа максимума и его приложений, а также уточним ряд
понятий и определений. |
характеризуется |
Пусть состояние управляемой системы |
n-мерным вектором состояния х(/). Целенаправленное воздей ствие на процесс можно осуществлять с помощью т-мерного вектора управления u (t). На векторы управления и состояния могут накладываться ограничения:
u(*)eU,x(f)€X,
где U и X —области допустимых управлений и состояний соот
ветственно.
Будем считать допустимыми управляющими воздействиями
кусочно-непрерывные функции на отрезке управления |
U] с |
точками разрыва первого рода. Между и(/) и x(f) существует
зависимость, записываемая в виде системы дифференциальны* уравнений
^ |
i=l. 2......п, |
(9.48) |
где Xi —i-я координата (переменная) вектора |
состояния. |
|
Заданы |
граничные условия: начальное состояние управля |
|
емой системы х(/о)=х0 и конечное состояние |
х(/к)=хв в |
m-мерном фазовом пространстве. Момент времени Uполагаем не зафиксированным, а характеризующим только момент пе
рехода в конечное состояние х”. Цель управления описывают |
||
функционалом (9.7) при |
равенстве нулю терминальной |
части, |
т. е. |
|
|
t, |
|
(9.49) |
/ = $/„(х, и, t)dt. |
|
|
Теперь постановку задачи оптимального управления можно |
||
сформулировать следующим образом. |
точки |
|
В n-мерном фазовом |
пространстве X6R” даны две |
xt и х2. Среди всех допустимых управлений, для которых фа зовая траектория, исходя в момент Uиз точки х,, приходит в точку х2в U, найти такое управление, при котором функ ционал / типа уравнения (9.49) принимает наименьшее воз можное значение (о минимуме функционала речь идет только дляопределенности). Такоеуправлениеназывают оптимальным, а соответствующую ему фазовую траекторию —тоже оптималь
ной.
Постановку задачи можно видоизменить, введя в рассмот рение еще одну координату вектора состояния, характеризу
ющую текущее значение функционала:
х0У)=» § Л (х, u, 0 dt |
(9.50) |
Дифференцируя уравнение (9.50), получаем уравнение от |
|
носительно новой координаты вектора состояния |
|
^ и ) |
(9.51) |
с граничными условиями |
(9-52) |
*o(*i)=0, x0(t2)=I. |
Теперь речь будет идти о (п+1)-мерном фазовом пространстве (для пространства состояния сохраним обозначение X6Rn+1).
Приведем новую постановку задачи, эквивалентную преды дущей [6]. В (гс+1)-мерном пространстве X заданы: точка с координатами (0, xt) и прямая П, проходящая параллельно оси х0через точку с координатами (0, х2). Среди всех допусти мых управлений, для которых соответствующая фазовая траек
тория, исходящая в момент времени из точки (0, х,), пересечет
прямую Я, найти управление и (0, |
обеспечивающее наимень |
шее возможное значение координаты |
пересечения прямой Я |
вдоль оси х0. |
интерпретирована для |
Постановка задачи геометрически |
|
случая рис. 9.9. |
|
Рис. 9.9. Постановка задачи оптимального управления
Основная теорема—принцип максимума. Кроме основной
системы уравнений (9.48) и (9.51) с граничными условиями (9.52)
/, (X, и), i= о, 1,2......я, |
(9.53) |
введем в рассмотрение дополнительную систему дифференци
альных уравнений |
относительно |
вспомогательной |
вектор- |
|
функции |
|
|
|
|
Чг— 2твг,* 1'=0,Ь2......"• |
|
(954) |
||
/=0 1 |
|
|
более удоб |
|
Целесообразно записать уравнения (9.53), (9.54) в |
||||
ной форме. Для этого введем функцию Гамильтона в |
следу |
|||
ющем виде: |
|
|
|
|
п |
|
|
|
(9.55) |
Н(х, ф, u)= 2/y(x, u)4»;=4»Tf(х, и). |
|
|||
y-о |
(9.53) и (9.54) |
теперь можно |
объединить |
|
Системы уравнений |
записью в форме так называемой системы Гамильтона (кано нических уравнений Гамильтона):
dt <%’ dt |
dxi |
г=о, 1.2...... л, |
(9.56) |
|
|
' |
7 |
где ф,-т—элемент функции Фт=:(фо, фь . ..,ф„)т размерности /t+1; Т —знак транспонирования з уравнении (9.55).
Из системы канонических уравнений (9.56) |
следует, что |
функция Гамильтона есть непрерывная функция 2(л+1)+т переменных х0, хи..., хп\ ф„, фь•.., фп; uu...,Um. При фикси рованных х и ф функция Гамильтона Я есть функция только
управления и и времени t. |
интерсным |
свой |
Система Гамильтона (9.56) обладает |
||
ством: частная производная от функции |
Я по переменной ф< |
равна скорости изменения переменной хи а частная производ ная от функции Я по переменной Xi —скорости изменения пе ременной ф(.
Обозначим через М(х,ф) максимальное значение (точную верхнюю грань) функции Гамильтона Я:
(9.57)
Формулировка основной теоремы. Пусть вектор u(ÿ) на от резке (*„, U) —допустимое управление, удовлетворяющее усло вию задачи. Тогда для оптимальности управления и(/) необхо димо, чтобы существовала ненулевая вектор-функция ф(/)»
такая, что:
1) для всех t на отрезке (tlt t2) функция Гамильтона как функция и, uGU достигала максимума, определяемого выраже-
нием (9.57):
Н[х(0, »!(/), Ф(0]=М[х(0, Ф(01; |
(9.58) |
2) в конечный момент времени t=t2выполнялись соотноше ния
Ф(/2)<0, M[x(t2), Ф(*2)]=0. |
(9.59) |
Ввиду важности п. 1теорема названа принципом максиму ма. Подчеркнем, что этот принцип в общем случае дает необ ходимые условия для определения оптимального управления
ц(0- Таким образом, имеет2 (п+1)+/я соотношений (9.53), (9.54)
и (9.58) (т соотношений дает п. 1принципа максимума) меж ду 2(n-f-l)-fm координатами векторов х(/), ф(*) и и(/), Так как т соотношений —недифференциальные, то решение систем (9.53), (9.54) и (9.58) зависит от 2(я+1) неизвестных пара
метров; кроме того, (или U—^=7*) является параметром. Один из параметров несущественен, так как ф(f) определяется с точностью до общего множителя в силу однородности Я отно
сительно ф.
Итак, для нахождения 2(/г+1) параметров имеем 2(п+1) граничных условий на функцию x(f) и уравнение (9.59).
Применение принципа максимума для синтеза системы, оп
тимальной по быстродействию. Линейное оптимальное быстро действие. Важным для технических приложений является класс
задач на оптимальное быстродействие: требуется найти управ ление u(t), переводящее точку в фазовом пространстве из со стояния k в момент ti в состояние kr за минимальное время. Поэтому функционал (9.7) в данном случае
/=^ <#= <,-<„ /0[х,и]= 1.
Функция Гамильтона принимает вид
я
Я(х, <!>, u)=2 //(х- u)4>/='h+/A(x' “)' 7-0
где
л
Н\ (х, <М)=2/;(Х’ и) ^
ф0<0—неположительная постоянная, полученная на основании
п. 2 принципа максимума.
Значение ф0влияет не на и(0, а только на значение мак симума. В случае принципа максимума при нахождении опти
мального быстродействия |
имеем |
функции |
Я,(х, ф,и) |
и |
М{х,ф,и)=шахЯ1(х,ф,и); |
поэтому |
равенства |
(9.58) и (9.59) |
»6и основной теоремы представим соответственно в виде:
^[x(0,iK0,u(0J=-^[x(0^(0]; ^(/i)]=—ф0>0.
Сформулируем задачу на линейное оптимальное быстродей ствие. Применим принцип максимума для нахождения опти мального быстродействия САР, которую описывают системой линейных дифференциальных уравнений с постоянными коэф фициентами:
= 2 aijxj+ 2 iu7 (^= Ь 2, ,n). |
(9.60 |
Полагаем, что управляющие воздействия подчинены ограниче ниям вида
|ц,(*)|<Л^, М)>0, /—1, 2, ... т. |
(9.61) |
Требуется, минимизировать время перехода системы (9.60) из состояния х° в х1, т. е.
1т—11--to.
Составим функцию Гамильтона |
п |
т |
|
|
п |
п т |
|
||
//i(x, ф» и )= 2//Ф /= 2^2 |
i-l |
7-1 |
(9-62) |
|
*“1 |
/*=1 7=1 |
|