книги / Теория автоматического управления техническими системами
..pdfУравнения гамильтоновой системы (9.55) относительно вспомо гательной функции a|)(f) будут иметь вид
п |
‘= Ь2......Я. |
(9.65) |
|
у-1 |
|||
|
|
||
Эта система уравнений является однородной; |
следовательно, |
||
общее решение можно записать в виде |
|
||
п |
|
|
|
^/(0= 2 |
для всех *= Ь2......я, |
(9.66) |
|
У-1 |
|
|
где Я,- —совокупность корней характеристического уравнения или собственные значения матрицы А.
Полагаем, что /= 1, 2, .... л. являются простыми вещест венными корнями. Тогда каждая из функций ф<(0 как сумма монотонных функций не более (п—1) раз пересекает ось t.
Так как функция Cj(t)= 2 Ьмф|(?) является суммой п моно
тонных функций, то можно сформулировать 2-е свойство опти мального управления u(f).
В случае задачи на линейное оптимальное быстродействие систем п-го порядка, корни (9.66) характеристического уравне ния которых вещественны, управляющие воздействия имеют не более п промежутков знакопостоянства или не более (п—1) переключений.
Пример. Пусть управляемая система представляет собой двойное инте грирующее звено, т. е.
d*x
7F=“(*)•
а ограничение на управляющее воздействие имеет вид |и(/)|^1. Требуется найти управление u{t), переводящее фазовуюточку из х° в начало коорди нат фазового пространства за минимальное время.
1. Введем фазовые координаты
|
dx, |
|
тогда в |
нормальной форме корни уравнения системытипа |
(9.53) запишем в |
виде |
dxt |
|
dxJ |
|
|
i r = *«, т г =и- |
|
|
2. |
Всоответствии с (9.55) выражение для функции Гамильтона |
|
Н(х, ф, и) =ф|Х2-И>аЫ. |
вспомогательной |
|
Система уравнений Гамильтона (9.56) относительно |
||
вектор-функции (9.66) имеет вид |
|
|
<*Ф1 |
dyh |
|
dt |
■гг-- |
|
Отсюда
3. На основании свойств управления, согласно закону (9.64),
a(0=sg"%W=sgn(C,f+C,)=f '• b|t+Cj<0.
Число переключений управления u(t)—не более одного. Уравнения семейст ва фазовых траекторий при u(t)=l, x22/2=xl4-С, и при «(/)=*—1, х22/2= Xi+C2показаны на рис. 9.11а и рис. 9.116 соответственно. Под действи-
Рнс. 9.11. Фазовые траектории
емуправления ц=±1 фазовая точка может попасть в начало координат только по выделенной траектории; для того чтобыфазовая точка попала в начало координат не более чем за одно переключение,движение должно быть организовано, как показано на рис. 9.12. Систему, реализующуюподобное оптимальное по быстродействиюдвижение, можно реализовать в соответ ствии с рис. 9.13.
Рнс. 9.12. Фазовые траектории н оптимальный процесс
Рис. 9.13. Схема системыоптимального управления при и=М sgnч(»1
Задача оптимального управления линейным процессом. Рас смотрим простой линейный процесс, характеризуемый уравнени ем (9.60):
х=-ах-{-^и,
где а и ^ —положительные постоянные.
Начальное состояние процесса х(/о)=*°» а управляющее воздействие ограничено: |и|^Л1 Определим управляющее воз действие u{t), которое обеспечивает минимум показателя каче
ства (9.7), т. е.
1{и) = ^ я2(«, t)dt.
Положим, что xi=x, и пусть новой координатой будет t,
x2=^xi*dt.
Тогда дифференциальные уравнения системы (9.60) примут вид *1= —й\Хх^и\ х2= х{г.
Задача сводится теперь к определению управляющего воз действия u{t), минимизирующего критерий J. Функция Гамиль тона (9.14) для этой системы имеет вид (9.62)
H=bh+bÎ2—b (—axx+w)+^*i2-
Для применения принципа максимума необходимо найти максимум функции Гамильтона по отношению к и. Очевидно, что функция Гамильтона имеет максимум, если знак управляю щего воздействия п, согласно (9.64), совпадает со знаком ty, а его значение равно максимально допустимому значению М, т. е.
u=Msgntyt
где
1. |
%>0; |
Sgn% = 0, |
\j)i —0; |
-1, %<0.
Канонические уравнения Гамильтона (9.56) имеют вид:
*=—ап+КИ»
Ь = ~ |
Мл= —2л'2ф2. ip2=0. |
Начальные условия для х: х,(/0)=х°=х,о, х2(/0)=0.
Граничные условия для яр:
ipi(^i)=0, гр2(М——^2=—1, ipi(^o)=^io. Так как
гр2(0=0, гр2(^0 = —I,
то
ярг(0 =const=—1.
Подставляя условия (9.65) максимума функции Гамильтона в канонические уравнения (9.56), получим
Х\=-—axi+Y-Msgiitpi, ф|=аф1—2xii|)2==ûnpi+2;ti.
Известные из условия задачи граничные условия для этих двух дифференциальных уравнений имеют вид:
xx(to)=x°i tpi(^) =0.
Это и есть задача с граничными значениями в двух точках, так как граничные условия заданы для обоих концов траекто рии. Теперь приведенные ранее два дифференциальных уравне ния необходимо решить относительно ххи ipi при этих двух граничных условиях. Процедура решения заключается в выбо ре наугад значения iM*o)=/> и в нахождении значений ххи фь при которых удовлетворяется другое граничное условие
M*i)=0. После того как определено tyi(*o), находят управляю щее воздействие M=Afsgntpi, которое переключается согласно знаку функции tpi (/). Следовательно, ipi (/) —требуемая функ ция переключения. Стратегия оптимального управления и= =Afsgni|)i может быть легко реализована (рис. 9.14).
Иногда легче определить ipi(0 при помощи аналоговой мо делирующей установки. Из рис. 9.15 следует, что управляющее воздействие образуется посредством подачи переменной состоя ния в схему, отмеченную пунктирной линией и известную под названием сопряженной системы. Последнее понятие будет рас смотрено в дальнейших разделах. Оптимальное управляющее
Рис.9Л4. Структурная схема оптимальной ОАР
воздействие является нелинейной функцией переменной состоя ния. Следует отметить, что закон управления не может быть выражен аналитически как функция переменной состояния. Такую схему оптимального управления иногда называют релей ным вариантом оптимального управления.
Задача оптимального управления конечным состоянием. При отсутствии ограничений на вектор управления в задаче Майера классического вариационного исчисления определяют значение функции от координат состояния в конечный момент t—t,, т. е. /= Ф[х(/,)].
Пусть управляемую систему описывают системой дифферен циальных уравнений л-го порядка
Чт= fl (X, и)= /, (х)+ 2 d„Uj. 1 = 1,2...... |
т |
(9.67) |
7-1 |
|
|
с граничными условиями x(f0)=x°; x(f1)=x1.
Эти уравнения линейны относительно m-мерного вектора управ ления u(f). На управляющие воздействия накладываются огра ничения вида
(Mj>0), /=1, 2, ..., т. |
(9.68) |
Требуется определить вектор управления, |
минимизирующий |
функционал |
|
/ = Ф[JCj (t), X2(t), .... *„(*)]<-<!■ |
|
1. Введем новую координату |
|
x0(t)=q>[x{t)l |
|
Дополнительное дифференциальное уравнение относительно x0(t) запишем в виде
|
л |
££»= V dy dXj |
|
dt |
dxi dt |
сграничными условиями *о(^о)=ф[хо], xQ{t)=1.
2. Функция Гамильтона (9.14) для системы (9.67)
И(х, ф. и)= ifo2 |
$■'дЦ + 2 bfi (X.и). |
1=0 |
1=1 |
Выполняем ряд несложных .преобразований функции Я(х,ф, и): Щх, ф, u)= 2(i|),-^)/,(x, и)—
= 2 |
(♦< - Й |
/« w + 2(% ~Й 2<*<л= |
” 2 |
(♦< ~ й |
/* w 2 а/2 (ф<-щ)лч- |
При выполнении |
преобразований, в силу ф{=0, tpo(^i) = —1. |
полагаем ф0(/)= —1.
3.На основании принципа максимума при введенных огра
ничениях оптимальное управление конечным состоянием для данной системы определяют выражением
я |
|
uj{t)=M,sgn2(*<-a£)rf''’ 1=12......... |
(969) |
Таким образом, управление Uj{t) является кусочно-постоян |
|
ной функцией. |
|
Оптимальная функция переключения |
|
Су(0= 2(ф1 —
может быть вычислена после решения гамильтоновой системы уравнений при заданных граничных условиях.
Задача управления на минимум расхода энергии. Это —за дача оптимального управления, имеющая большое практическое значение. Расход энергии, затраченной на управление, пропор ционален интегралу по времени от квадрата управляющего воз действия. Если расход энергии по всем входам брать с одина ковыми весовыми коэффициентами, то функционал (9.7) можно записать в виде
/ - т ? 2 ^ ( о л . oJy-i
где 1/2 —коэффициент, введенный для удобства последующих
выкладок. |
|
уравнениями |
Система, описываемая дифференциальными |
||
л-го порядка: |
т |
|
п |
(9.70) |
|
d-7ï='2iai}Xj+'2AbijUj, i=~n. |
||
/=1 |
у~1 |
|
Рассмотрим два случая определения оптимального управления по расходу энергии на управление: 1-й, когда на вектор управ
ления не накладывается ограничений; |
2-й, когда управляющие |
воздействия подчиняются ограничениям |
вида |
|«Л01<А1,(М,>0),/=ТГЯ |
|
Введем новую координату |
|
•*ь(0“ 4" (ол-
Соответствующее этой координате диффзренииалыое ураза» ние
dxо dt
при граничных условиях Хо(А))=0, Xo(^i)=/. Функция Гамиль тона для этой системы имеет вид (9.70)
Я(х, ф, и)= ф ьт2а/ + 2 ^ 2 аЛ + 2 ^ 2 М у У=1
Меняем порядок суммирования в последней группе слагаемых и полагаем, как и прежде, что ф0= —1.
п |
п |
т |
п |
т |
я(х, ф, и ) = 2 ^ 2 з д + 2 |
^ 2 ^ ^ у “ т 2 мЛ (9-71> |
|||
i=i |
у*1 |
у=1 |
г=1 |
у=1 |
1-й случай. На вектор и(0 не накладывается ограничений. Макси,мум функции Гамильтона (9.71) относительно и может быть найден на основании необходимого условия экстремума функции из классического анализа:
дН (х, ф, и) du
Дифференцируем по щ\
С/(0-«/(0=0, /=ЛГ£
где
Отсюда оптимальное управление
и/(0=С/(0, H U
2-й случай. Управляющие воздействия подчиняются ограничению:
\u,(t)\<Mh (M,>0)J=CZ. |
функция Гамильтона |
|
Из |
1-го случая ясно, что если |Су(0|^;Л4/, то |
|
(9.71) |
максимальна при «,-(/) =С/(/). Сдругой стороны, для таких /, для ко |
|
торых \Cj(t)\>MIt с учетом ограничения на £//(/) функция Гамильтона мак |
||
симальна, если |
(9.72) |
|
^(0=^/SgnC/(0. |
||
Отсюда заключаем, что оптимальное управление (9.72) |
может быть записано |
|
в виде |
|
|
7 |
l^ysgh Су (О- |Cy(OI>Afy- |
|
Для определения С/(/) необходимо решить систему уравнений Гамильтона.
L _ /r _ ^ 2 т
Рис. 9.16. Схема САР с управлением по минимум расхода энергии: 1—сопряженная система; 2—управляющее устройство; 3—объект
Систему, реализующую управление по минимуму расхода
энергии, схематично можно представить в виде блок-схемы (рис. 9.16). Если начальное состояние сопряженной системы опреде лено, то нахождение последующих векторов ясно из схемы.
9.8.Формулировка и классификация методов математического программирования
Пусть I —целевая функция векторах переменных хи х2, ...,
..., хп. Необходимо, чтобы вектор х удовлетворял ограничениям в виде равенств
02Axj)=0, /=1, 2, или в векторной форме
С?2(х)=0.
Задачу математического программирования4можно сформу
4 См.: Бсллман Р. Динамическое программирование / Пер. с англ. И.М.Андреевой и др.; Под ред. H. Н. Воробьева, М.: Изд-во иностр. лит,, 1960. 400 с.
лировать следующим образом: найти экстремум функции (функ ционала) 1{х) при условии
(?,(х)>0; G2(x)=0,
или, кратко, найти
extr{/(х); G,(x)>0; G2(x)=0}.
Если вместо определения экстремума функции /(х) ограни читься, например, определением ее минимума, то задача не те ряет общности, так как минимизация функции /(х) эквивалент на максимизации функции /(х). Это же замечание справедливо и дляограничений.
Действительно, если например, заданы ограничения
GH(xKо,
то, определив множество функций G<=—Gu,
вновь получим ограничения в виденеравенств.
Если /(х), Gi(x) и G2(x) являются линейными функциями
от х, то задача математического |
программирования формули |
|
руется как задача линейного программирования, т. е. |
||
п |
|
|
1 (х)= 2 |
=сТх- |
(9-73) |
2-1 |
|
|
Если целевая функция квадратичная, в то время как все огра ничения линейны, то имеем задачу квадратичного программиро вания, для которой
ял
I (Xj, . . хп)= 2 |
CiXi-1* 2 XidtjXj, |
(9-74) |
2=1 |
2,У-1 |
|
или |
|
|
/(х)=cTx+xTDx.
Вформуле (9.74) через dt) обозначены элементы симметрич
ной (так как xixj=xjxi матрицы D размерностью (пХп).
К нелинейному программированию относят те задачи, в ко торых целевая функция нелинейна и (или) имеется по крайней мере одно нелинейное ограничение на переменные xt.
Задачи линейного программирования, описываемые выраже нием (9.73), в которых переменные принимают лишь дискретные целочисленные значения, относят к целочисленному программи рованию.
Если параметры, входящие в ограничения или в целевую функцию, являются случайными переменными, то в этом случае приходим к задачам стохастического программирования.