Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Теория автоматического управления техническими системами

..pdf
Скачиваний:
18
Добавлен:
12.11.2023
Размер:
15.06 Mб
Скачать

и новые матрицы

А1= [о о]' в1= [?]’ Rl= S’ Q‘= [or]-

В новых переменных уравнение (9.40) и критерий (9.41) со­ ответственно примут вид

z-AiZ±BtV, z(f0)-*°;

 

(9.42)

00

 

(9.43)

I [Z(g. V. <„]=$ [v’R.v+ zTQz]dt.

 

ta

 

уравнениями

На рис. 9.4 показана система, описываемая

(9.42). Применим в этой системе теорию оптимального регули-

!-----------------------------

!

 

Ряс. 9.4. Структурная схема ПИ*регулятора рования, предварительно проверив условия управляемости и

наблюдаемости. В результате получим

схему регулирования

(рис. 9.5). Эта схема с безынерционным

регулятором может

Рис. 9.Б.Преобразованная схема ПИ-регулятора

..РР—объект регулирования; БР —блок регуляторов

Итак, найдем минимум функционала (9.43) при условии (9.42) . Предварительно заметим, что для существования зако­ на регулирования и конечности функционала (9.43), а также для асимптотической устойчивости замкнутой системы необхо­ димо принять два дополнительных допущения:

пара ГА„ В,] полностью управляема;

пара (A,, Dj] полностью наблюдаема для любой D,T, удов­ летворяющей условию D1DtT=Q1. При выполнении этих допу­ щений можно использовать результаты, полученные ранее, согласно которым оптимальный закон регулирования имеетвид

v*=—R^B^Pz

и

/*И*о), *o]=zT(*o)Pz(*o). Здесь

P= limP(*. Г)= 11тР(*, Т). Т-+ОЭ i-t-00

Причем Р есть решениеуравнения Риккати: —P=PA1+A1TR—PBiRj^B^P-fQ,

Р (Г, Т)=0.

Первое предположение обеспечивает существование Р, а вто­ рое определяет асимптотическую устойчивость замкнутой си­ стемы

z= (Ai—BjR^B^PJz.

Можно показать, что оба предположения эквивалентны до­

пущениям, которые ранее делались для уравнений

(9.40),

(9.42) , и что оптимальные значения показателей качества ре­ гулирования, согласно уравнениям (9.41) и (9.43), одинаковы.

Перейдем теперь к интерпретации результатов минимиза­ ции расширенной системы, для того чтобы получить решение задачи минимизации для первоначальной системы. Как это бы­ ло замечено ранее, оптимальное управление и* для модифици­ рованной проблемы регулирования удовлетворяет равенству

ii=v при u*(^o)=u(/0). Минимальное значение /* одинаково для обеих задач:

/*[х(*0)> и(*„), fo]=/*N*o), *oL

Оптимальное управление и* и минимальное значение 7* можно выразить через параметры модифицированной задачи

следующим образом. Пусть

Оптимальное регулирование

U=V*, и*(£о)=и0

определяют выражением

 

= -S-'P21x~S-ip22u*,

 

т. е. оптимальное регулирование и* имеет вид

 

ii*=KiTx+K2Tu* и u*(/0)=u°.

(9.44)

Здесь

KT= _s-,p21;

KJ=-S-'P22.

Минимальное значение показателя качества /: /[x(g, uw. g=/*[z(g. g = zT(gpz(g=

= [хт(^о)* «т «1 [p2i р22j [u(g] = хТ М puX(t0)+

-j-2uT(tQ) РдХ (^0) = UT(if)P22^ (^o)* Необходимо заметить, что при u(^0)=0

/*=хт(/0)Р„х(/о).

Матрицы Pu, P2i, Р22, входящие в оптимальный закон ре­ гулирования и в минимальное значение /, можно найти как пределы Pllf Р21и Р22при t-+00, причем

-Ph=Pi,A+AtP11-P 21tS"1P21+Q; Ри{Т)=0;

-Р 21- Р21А+BTPu-P^S-1Р21; Р21(Т)=0;

-P 22=P21B+BTP21t -P 22S ‘P22+R; Р(Т)=0.

Итак, получено решение задачи оптимального регулирова­

ния при наличии производной и от регулирующего воздей­ ствия и.

Полученным результатам можно придать несколько другуюформу, сви­ детельствующуюо том, что регулятор действительно являтся ПИ-регулято- ром.Согласно уравнению(9.40),

и=В-1(х-Ах)= (ВТВ)-1Вт(х-Ах).

перепишем

Полагая, что ВТВположительно определена, уравнение (9.44)

в следующем виде:

(9.45)

и'*=Кзтх+К4тх; u*(M=u°.

Здесь

 

Кзт=К2т(ВтВ)-1Вт? К4т=К!т-КзтА.

 

Интегрируя уравнение (9.45),получим

 

t

(9.46)

u*(t =kJx(£ +JkJx(t dt-f-u {U)—K[x(t0).

Из уравнения (9.46) видно, что оптимальное регулирование реализовано в виде ПИ-регулятора. Таким образом, схема оптимального регулятора имеет вид, показанный на рис. 9.7 или рис. 9.8.

Рассматривая расширеннуюсистему (9.42) как первоначальнуюи при­ меняя ту же процедуру, можно получить решение задачи оптимального ре­ гулирования при наличии вторых производных от управления и.

9.7. Понятие о принципе максимума

Принцип максимума может рассматриваться как обобще­ ние классического вариационного исчисления на случай, когда управляющие воздействия и (0 принадлежат к замкнутому множеству, т. е. их значения ограничены определенными пре­ делами, что всегда имеет место на практике.

Принцип максимума дает изящный способ решения задачи детерминированного оптимального управления. Он позволяет только в общем случае найти необходимые условия оптимума, а в отдельных случаях —необходимые и достаточные условия, как например в задачах с квадратичным критерием и линей­ ными уравнениями объекта. Однако использование этого прин­ ципа, так же как и вариационных методов, затруднено реше­ нием двухточечных краевых задач. Кроме того, он не позво­ ляет определить оптимальное управление как функцию и(х) переменных состояния и поэтому остается открытым вопрос о реализации системы управления как замкнутой системы с об­

ратной связью.

Принцип максимума Понтрягина. Ранее была рассмотрена задача Лагранжа и сформулировано необходимое условие оп­ тимальности. Оно состоит в том, что оптимальное управление должно быть стационарной точкой функции Гамильтона (9.14), т. е. удовлетворять векторному уравнению

Основное предположение, сделанное при решении задачи Ла­ гранжа, состояло в том, что управление может принадлежать всему пространству U, т. е. на управление не налагалось ни­ каких ограничений. В практических задачах, однако, необхо­ димые условия, определенные ранее, естественно, не пригодны.

Согласно теореме Понтрягина, получившей название «принцип максимума», оптимальное управление должно обес­

печивать функции Гамильтона максимальное значение.

Введем понятие допустимого управления. Вектор управле­

ния будет допустимым, если каждая

его

компонента

ной

£=1,2,..., т является ограниченной

кусочно-непрерыв­

функцией, такой, что и(0^И для всех t,

Началь­

ный

момент времени t%предполагают фиксированным, а ко­

нечный t2 может быть как фиксированным, так и нефиксиро­ ванным.

Чтобы проиллюстрировать понятие, допустимого управления, рассмотрим систему с двумя управляющими входами иД*) и

и2(0» на которые наложено ограничение

где М0—некоторая положительная константа.

Множество U, т. е. щ, и2,..., иг, состоит из внутренней ча­ сти и границы круга радиусом М„ (рис. 9.8). В данном случае управляющий вектор на плоско­

Рис. 9.8. Область допустимого управления

u=u-fôu uGU

сти U\, и2может иметь любое на­ правление, но его значение огра­ ничено М0. Таким образом, уп­ равление и (О как функцию вре­ мени t будем искать в классе кусочно-непрерывных функций.

Единственное затруднение, которое возникает по сравнению

сзадачей Лагранжа, заключается

впоявлении нового условия до­

пустимости управлений. В связи с этим допустимые вариации управления должны удовлетво­ рять уравнению

(9.47)

т. е. вариации управления не могут быть произвольными, они должны удовлетворять заданным ограничениям.

Если х, и реализуют минимум

/(х, и), то

необходимо, что­

бы вариации (9.15) функционала

(9.7)

были

неотрицательны

б/(х, и, бх, ôu)>0

 

 

 

 

для любых допустимых вариаций ôx, ôu.

задачу

оптимального

Постановка задачи. Сформулируем

управления в виде, удобном для

последующего

изложения

принципа максимума и его приложений, а также уточним ряд

понятий и определений.

характеризуется

Пусть состояние управляемой системы

n-мерным вектором состояния х(/). Целенаправленное воздей­ ствие на процесс можно осуществлять с помощью т-мерного вектора управления u (t). На векторы управления и состояния могут накладываться ограничения:

u(*)eU,x(f)€X,

где U и X —области допустимых управлений и состояний соот­

ветственно.

Будем считать допустимыми управляющими воздействиями

кусочно-непрерывные функции на отрезке управления

U] с

точками разрыва первого рода. Между и(/) и x(f) существует

зависимость, записываемая в виде системы дифференциальны* уравнений

^

i=l. 2......п,

(9.48)

где Xi —i-я координата (переменная) вектора

состояния.

Заданы

граничные условия: начальное состояние управля­

емой системы х(/о)=х0 и конечное состояние

х(/к)=хв в

m-мерном фазовом пространстве. Момент времени Uполагаем не зафиксированным, а характеризующим только момент пе­

рехода в конечное состояние х”. Цель управления описывают

функционалом (9.7) при

равенстве нулю терминальной

части,

т. е.

 

 

t,

 

(9.49)

/ = $/„(х, и, t)dt.

 

Теперь постановку задачи оптимального управления можно

сформулировать следующим образом.

точки

В n-мерном фазовом

пространстве X6R” даны две

xt и х2. Среди всех допустимых управлений, для которых фа­ зовая траектория, исходя в момент Uиз точки х,, приходит в точку х2в U, найти такое управление, при котором функ­ ционал / типа уравнения (9.49) принимает наименьшее воз­ можное значение (о минимуме функционала речь идет только дляопределенности). Такоеуправлениеназывают оптимальным, а соответствующую ему фазовую траекторию —тоже оптималь­

ной.

Постановку задачи можно видоизменить, введя в рассмот­ рение еще одну координату вектора состояния, характеризу­

ющую текущее значение функционала:

х0У)=» § Л (х, u, 0 dt

(9.50)

Дифференцируя уравнение (9.50), получаем уравнение от­

носительно новой координаты вектора состояния

 

^ и )

(9.51)

с граничными условиями

(9-52)

*o(*i)=0, x0(t2)=I.

Теперь речь будет идти о (п+1)-мерном фазовом пространстве (для пространства состояния сохраним обозначение X6Rn+1).

Приведем новую постановку задачи, эквивалентную преды­ дущей [6]. В (гс+1)-мерном пространстве X заданы: точка с координатами (0, xt) и прямая П, проходящая параллельно оси х0через точку с координатами (0, х2). Среди всех допусти­ мых управлений, для которых соответствующая фазовая траек­

тория, исходящая в момент времени из точки (0, х,), пересечет

прямую Я, найти управление и (0,

обеспечивающее наимень­

шее возможное значение координаты

пересечения прямой Я

вдоль оси х0.

интерпретирована для

Постановка задачи геометрически

случая рис. 9.9.

 

Рис. 9.9. Постановка задачи оптимального управления

Основная теорема—принцип максимума. Кроме основной

системы уравнений (9.48) и (9.51) с граничными условиями (9.52)

/, (X, и), i= о, 1,2......я,

(9.53)

введем в рассмотрение дополнительную систему дифференци­

альных уравнений

относительно

вспомогательной

вектор-

функции

 

 

 

 

Чг— 2твг,* 1'=0,Ь2......"•

 

(954)

/=0 1

 

 

более удоб­

Целесообразно записать уравнения (9.53), (9.54) в

ной форме. Для этого введем функцию Гамильтона в

следу­

ющем виде:

 

 

 

 

п

 

 

 

(9.55)

Н(х, ф, u)= 2/y(x, u)4»;=4»Tf(х, и).

 

y-о

(9.53) и (9.54)

теперь можно

объединить

Системы уравнений

записью в форме так называемой системы Гамильтона (кано­ нических уравнений Гамильтона):

dt <%’ dt

dxi

г=о, 1.2...... л,

(9.56)

 

'

7

где ф,-т—элемент функции Фт=:(фо, фь . ..,ф„)т размерности /t+1; Т —знак транспонирования з уравнении (9.55).

Из системы канонических уравнений (9.56)

следует, что

функция Гамильтона есть непрерывная функция 2(л+1)+т переменных х0, хи..., хп\ ф„, фь•.., фп; uu...,Um. При фикси­ рованных х и ф функция Гамильтона Я есть функция только

управления и и времени t.

интерсным

свой­

Система Гамильтона (9.56) обладает

ством: частная производная от функции

Я по переменной ф<

равна скорости изменения переменной хи а частная производ­ ная от функции Я по переменной Xi —скорости изменения пе­ ременной ф(.

Обозначим через М(х,ф) максимальное значение (точную верхнюю грань) функции Гамильтона Я:

(9.57)

Формулировка основной теоремы. Пусть вектор u(ÿ) на от­ резке (*„, U) —допустимое управление, удовлетворяющее усло­ вию задачи. Тогда для оптимальности управления и(/) необхо­ димо, чтобы существовала ненулевая вектор-функция ф(/)»

такая, что:

1) для всех t на отрезке (tlt t2) функция Гамильтона как функция и, uGU достигала максимума, определяемого выраже-

нием (9.57):

Н[х(0, »!(/), Ф(0]=М[х(0, Ф(01;

(9.58)

2) в конечный момент времени t=t2выполнялись соотноше­ ния

Ф(/2)<0, M[x(t2), Ф(*2)]=0.

(9.59)

Ввиду важности п. 1теорема названа принципом максиму­ ма. Подчеркнем, что этот принцип в общем случае дает необ­ ходимые условия для определения оптимального управления

ц(0- Таким образом, имеет2 (п+1)+/я соотношений (9.53), (9.54)

и (9.58) (т соотношений дает п. 1принципа максимума) меж­ ду 2(n-f-l)-fm координатами векторов х(/), ф(*) и и(/), Так как т соотношений —недифференциальные, то решение систем (9.53), (9.54) и (9.58) зависит от 2(я+1) неизвестных пара­

метров; кроме того, (или U—^=7*) является параметром. Один из параметров несущественен, так как ф(f) определяется с точностью до общего множителя в силу однородности Я отно­

сительно ф.

Итак, для нахождения 2(/г+1) параметров имеем 2(п+1) граничных условий на функцию x(f) и уравнение (9.59).

Применение принципа максимума для синтеза системы, оп­

тимальной по быстродействию. Линейное оптимальное быстро­ действие. Важным для технических приложений является класс

задач на оптимальное быстродействие: требуется найти управ­ ление u(t), переводящее точку в фазовом пространстве из со­ стояния k в момент ti в состояние kr за минимальное время. Поэтому функционал (9.7) в данном случае

/=^ <#= <,-<„ /0[х,и]= 1.

Функция Гамильтона принимает вид

я

Я(х, <!>, u)=2 //(х- u)4>/='h+/A(x' “)' 7-0

где

л

Н\ (х, <М)=2/;(Х’ и) ^

ф0<0—неположительная постоянная, полученная на основании

п. 2 принципа максимума.

Значение ф0влияет не на и(0, а только на значение мак­ симума. В случае принципа максимума при нахождении опти­

мального быстродействия

имеем

функции

Я,(х, ф,и)

и

М{х,ф,и)=шахЯ1(х,ф,и);

поэтому

равенства

(9.58) и (9.59)

»6и основной теоремы представим соответственно в виде:

^[x(0,iK0,u(0J=-^[x(0^(0]; ^(/i)]=—ф0>0.

Сформулируем задачу на линейное оптимальное быстродей­ ствие. Применим принцип максимума для нахождения опти­ мального быстродействия САР, которую описывают системой линейных дифференциальных уравнений с постоянными коэф­ фициентами:

= 2 aijxj+ 2 iu7 (^= Ь 2, ,n).

(9.60

Полагаем, что управляющие воздействия подчинены ограниче­ ниям вида

|ц,(*)|<Л^, М)>0, /—1, 2, ... т.

(9.61)

Требуется, минимизировать время перехода системы (9.60) из состояния х° в х1, т. е.

1т—11--to.

Составим функцию Гамильтона

п

т

 

п

п т

 

//i(x, ф» и )= 2//Ф /= 2^2

i-l

7-1

(9-62)

*“1

/*=1 7=1