книги из ГПНТБ / Цирлин, А. М. Основы оптимального управления конспект лекций
.pdfi60
|
нескольких |
вариантах |
такой задачи. |
|
|
|
|
|
||||
|
Л р |
Если какая-то |
из разовых |
координат >УК |
или время |
^Х^+/ |
||||||
не |
входят в функцию |
|
, т . е . может принимать произвольное значе |
|||||||||
ние, |
то |
соответствующая |
частная |
производная, а |
значит |
я £££ СТ) |
||||||
или |
|
+ / к1) |
равны .нулю, |
.что совпадает |
с условием (16.7;. |
Условия, |
||||||
оптимальности, |
относящиеся |
к внутренним |
точкам |
отрезка |
\ 0,Т ;( "не |
|||||||
изменяются, так как последнее слагаемое |
в |
И ? отлично |
от нуля лишь |
|||||||||
при |
6 - Т. |
|
|
|
|
|
|
|
|
|
|
|
|
• |
•Еункция |
в |
(16.10) |
может быть |
векторной |
|
|
||||
|
|
и ) |
+=а о; |
|
|
/Ja) |
= о, |
. |
. . / Х ^ > > = |
о |
|
в этом случав в X? добавится не одно слагаемое, а сумма вида
ГУ!
условия трансверсальности запишутся, как
и означают, что вектор |
У |
(,Т) может |
быть |
представлен как сумма |
||
градиентов .функций |
. Например, для |
J |
- |
1,2 |
^ ^ / ^ л е ж и т в той |
|
же плоскости, в которой лежат градиенты |
|
и / - 7 - . |
||||
Ад. Вместо или наряду |
с равенствами |
(16.10) |
в задачу могут вой |
|||
ти и неравенства |
|
|
|
|
|
|
В этом случае, как об этом говорилось в п.15. 3, каждому такому нера
венству в |
соответствует слагаемое |
|
|
причем |
Q/У ^ |
0. |
|
А 4 . Частным |
случаем условия (16.10) |
является условие, наложен |
|
ное на одну из координат (п+1)-мерного |
вектора У (Т), его можно за |
||
писать, как |
|
|
|
|
/-J |
Су =0 |
U 6 . I 5 ) |
|Для простоты |
считаем, |
что |
смешанных условии |
в форме |
(16.10), |
||||||||
(16.14) на J^(T ) не наложено. Тогда условие трансверсальности при |
|||||||||||||
мет форму |
|
|
|
|
|
|
|
|
|
|
|
||
{; |
j |
|
fyCTJ |
|
= *s£- |
|
|
|
|
(16.16) |
|||
Таким образом, |
если |
время |
или фазовая |
координата |
фиксированы, то |
||||||||
Ьоответотвупцая |
составляющая |
вектора |
^ ? ^ / ' о т л и ч я а |
от нуля. В |
|||||||||
маетности/ для задач |
с фиксированным Т и функцией Н, |
не зависящей |
|||||||||||
гот |
~£ |
явно, |
на оптимальном |
решении Н (. XCU^Jj ^С^У |
) равна |
||||||||
некоторой константе, |
так как |
С^,,, (Т) = ^У^^ |
. |
|
|
||||||||
Условие |
общности положения |
распространяется, |
конечно, и на |
связи |
|||||||||
i(I6.I0)." |
|
\.Т) и |
Т |
не |
должны быть |
"исключительными" точками» |
|||||||
|
Б. Оптимизируемый |
функционал зависит от конечного |
состояния |
[перепишем I в форме
й составим функцию
|оторая отличается от (16 . II) лишь отсутствием множителя ^У в оследнем слагаемом. Таким образом, условия оптимальности совпа дет с таковыми для предыдущей задачи с той разницей, что
1?= 1,2» ...v O+I частности, функционал (16.17) может вообще не содержать оервого
аемого ^ э |
о |
Широкий класс |
задач |
управления |
сводится к |
||
рстижению максимального |
значения |
одной |
из переменных состояния |
||||
(Т) |
при произвольных значениях |
остальных переменных .в момент Т. |
|||||
этом |
случае |
|
|
|
в соответствии с |
(16.18) |
|
С £ (Т) =+1, а |
остальные |
составляющие вектора^Т) |
равны нулю. |
16,3. Условия оптимальности классического вариационного исчисления
Проследим связь между принципом максимума Понтрягина и класси ческими вариационными методами на примере задачи о
JSOC/O ./Л(-*< |
U; ^Je/J |
(16.19) |
являющейся основным объектом изучения в вариационном исчислении, функция £ для этой задачи.
Кроме дифференциуемости no «X, |
потребуем дифференцируемости |
|||||
d0 по I*- и сформулируем |
условие |
оптимальности |
как условие |
|||
стационарности /S , |
а значит |
и & |
по У |
и ^ |
. Множество |
|
сравненияйри этом, |
конечно, |
уже^чем |
при использовании |
прин |
ципа максимума.- Из условия стационарности следует
|
Э |
£<_ |
Искдючая из этой |
оистемы ( / * & ) и учитывая, что ti = У, получим |
|
вдоль оптимальной |
траектории |
|
Уравнение (16.21) |
называется |
уравнением Эйлера. Его решенья, удов |
летворяющие граничным условиям vI6 . I9), являются возможными опти мальными траекториями.
функцию ^Р можно исключить не только после дифференцирования второго из уравнений /16.20/, но и интегрируя первое из них.
|
f6i |
Получим |
^ |
так что |
/£ц непрерывна по ^ . |
Это условие называют условием Эрдмана - ВейерштрассоМножество претендентов на решение в задаче (16.19) можно
сузить, потребовав, чтобы в точке, стационарной по U , функ-»
ция Н достигала |
максимума. |
Запишем разность между значением |
Н на оптимальном |
управлении |
некотором допустимом U. |
и учтем, что в силу условия стационарности £^*можно опреде лить из (.16-20).
Получим
Функция Е называется функцией Вейерштрасса. Условие (16.22) должно выполняться для всех И. и Ь .
16.4.Условия, наложенные на промежуточные значения фазовых координат
Условия, аналогичные (16.10), могут быть наложены на на чальные или промежуточные значения переменных состояний. В первом случае, поступая совершенно так же, как в п . 16 . 3, мы
получим условия трансверсальности при \_ = 0 . Остановимся
164
на втором случав, |
когда условие |
|
|
|
|
|
|
|||||
|
|
|
|
/ 7 7 ^ - ^ = 0 |
|
|
|
|
(16.23) |
|||
наложено для некоторого м о м е н т а ^ f , |
В остальном не |
условия |
||||||||||
задачи |
совпадают |
с п. 1 6 . I . |
|
|
|
|
|
|
|
|||
функция |
в |
соответствии |
с |
табл. |
|
I b . I имеет вид |
|
|||||
|
|
(?=/ |
|
' |
|
|
|
|
|
|
|
|
Условия |
для выбора |
£ / |
(•£) |
не изменятся, |
а стационарность |
R ао X |
||||||
приводит |
к уравнениям |
|
|
^ |
f7 |
|
|
|
|
|||
откуда |
следует* |
что в |
точке |
£а |
|
^ ( ^ м е н я е т с я |
скачком, причем |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
(.16.25) |
|
|
|
|
|
|
|
|
|
|
0= I , 2,' . . . п+1 |
||
Теперь |
рассмотрим |
случай ]_ |
|
t когда |
задача |
п.16.1 осложнена |
||||||
условием |
|
С(х,*)*о |
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
U6.261 |
|||
для всех |
i ^ f o . T j . Скалярная функция |
G- (У. |
; предполагается |
дифференцируемой по совокупности своих аргументов. На первый взгляд
можно было бы ограничиться добавлением в |
R |
|
слагаемого, |
соответ |
||||||
ствующего |
(16.26), s записать эту функцию в |
виде |
|
|
|
|||||
|
|
|
•?=/ |
|
х |
U |
6 . |
2 |
7 , |
|
оговарив |
неположительностьJ(4). Это было бы верно, |
если |
бы неравен |
|||||||
ство |
(16.26) |
выполнялось как равенство на воем |
отрезке [о,Т'] |
при |
||||||
$ |
- |
JC*~ |
« Но оно выполняется, вообще |
говоря, |
лишь на подмно- |
|||||
иестве. |
этого |
отреака. Обозначим через 9 это |
подмножество |
|
|
|
|
|
|
|
|
|
165 |
|
|
|
|
|
|
|
|
|
|
|
Для |
точек |
i , d efO, Tji |
в которых происходит |
переход от неравенства |
||||||||||||||
!с равенству |
и обратно, нужно, |
как об этом |
было |
сказано |
в п. 15.3, |
|||||||||||||
добавить |
в |
с 16.27) |
слагаемые |
типа |
^//^ Q (У-)Ь'(4.-~L^i |
Чтойы |
||||||||||||
учесть |
такую возможность, |
запишем /Qв |
форме |
|
|
|
|
|||||||||||
|
|
|)=/ |
|
|
|
|
|
|
|
|
|
|
|
(16.28) |
||||
Здесь уУ(|-) |
- |
разрывная |
функция |
и ее |
производная в точках |
разры |
||||||||||||
ва |
~ £ и |
равна |
|
$f/~ |
T?J°, на остальных точках мнояе ства |
& |
, |
|||||||||||
vo |
есть |
там, |
|
где |
Q |
(У-)~ |
О, |
^rz" -У69^0; наконец, |
вне б? |
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. Уравнения для |
|||
сопряженных |
переменных |
; 5 3 Г |
~~ ^ |
примут форму |
|
|
|
|||||||||||
Остальные |
условия |
оптимальности |
совпадают |
с п . 1 6 . 1 . |
|
|
|
|||||||||||
|
16.5. Неявная форма |
задания |
дифференциального уравнения. |
|
||||||||||||||
|
|
|
Сыешанше |
ограничения |
|
|
|
|
|
|
|
|||||||
задачи, |
рассмотренные выше, были |
регулярны |
по управления» и |
|||||||||||||||
сингулярны |
по фазовым координатам |
|
В ряде |
случаев |
задачи |
|||||||||||||
оказываются сингулярны п noi(({). Остановимся на двух |
вариан |
|||||||||||||||||
тах |
такой |
постановки. |
|
|
|
|
|
|
|
|
|
|
|
|||||
|
А . Дифференциальное |
уравнение, задано |
в форме |
|
|
|
||||||||||||
|
|
|
У |
(У, |
tt^XJ-O, |
|
|
|
|
|
|
(16.30) |
||||||
причем |
оно имеет |
такой |
вид, что его |
|
нельзя разрешить |
относитель |
||||||||||||
но J{ . Перепишем |
(16.30), |
как |
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
У |
- |
U |
^ |
|
|
|
|
|
116 . Ш |
(16.32)
Будем очитать, что функционал и условия на границах те же, что и в
п . 1 6 . 1 . Связь |
(16.32), |
а значит и вся задача сингулярна по всем |
|
входящим &у |
составляющим .решения. Составим функцию £2 , |
считая |
|
для простоты, |
что дифференциальные уравнения в явной форме |
отсут |
|
ствуют, функция у/ |
скалярная. Следует также потребовать |
ее не |
прерывной дифференцируемости по совокупности аргументов. Запишем
для функционала |
(16.2), связей (16.31) и iI6.32) - |
|
|
42= JO fa, |
«fj7?j*<^у+ |
<ft/s^Уу?As,у |
ъ |
Необходимые условия оптимальности для ограниченного замкнутого мно
жества допустимых управлений |
Vu, |
|
||||
D£ |
|
|
Э/2 |
|
|
Ъ£ |
Ъ У |
|
J |
Э К* |
|
|
Э U, |
|
о |
• — |
= о |
J |
|
|
приводят к |
|
|
|
|||
уравнениям |
|
|
|
Первые два из них эквивалентны одному
Уравнения (16.33) соответствуют "слабому" принципу максимума, так как предполагаемое решение сравнивается с близкими решэкиями как
по j{ |
, так и по У% и |
Расширить множество функций сравнения |
||||||
можно, |
перейдя |
к задаче условного максимума АР. |
|
|
|
|
||
дадим задаче несколько более общую формулировку, |
а именно, |
потре |
||||||
буем, |
чтобы на |
множестве |
допустимых управлений |
IL |
faL |
|
||
достигал |
своей |
верхней грани |
функционал ( 1 6 . 2 ) |
со |
связью |
\ . I 6 . J I ) . |
||
Множество |
V ^ - пересечение |
и множества |
значении |
ILj, |
> |
16?
удовлетворяющих С16.32) при Х(^) я J(*(4) . Тогда задача ре гулярна no l i j и Ц^, функция
и уоловия оптимальности приводят к требованиям
т . е . квадратная |
скобка в |
U6.35) должна |
оыть |
максимальна при |
||||||||
H l £ |
^ , |
. |
и |
J-CUy^^-i) |
~ |
<^ |
• |
Множество |
|
|||
в такой формулировке может учитывать и другие ограничения; от |
||||||||||||
функции J- |
не |
требуется дифференцируемости no |
|
1Ц. |
|
|
||||||
Б. Ограничения смешанного |
типа |
|
|
|
|
|
|
|||||
|
|
JCXtK-j-iJ ±0 |
|
|
|
|
(Ьб.зб) |
|||||
для |
всех |
|
|
в |
отличие от ограничений |
на фазоьые |
коор |
|||||
динаты, приводят |
к сингулярности задачи по U |
на |
том множестве б> |
|||||||||
значений |
~Ь , |
для которых |
^ |
= и. ДЛИ такой |
задачи |
остается в |
||||||
силе |
прием с |
введением Jtf(4ji |
использованный |
в |
пункте |
16.4, |
однако, |
|||||
на множестве |
|
требование |
достижения фушсцией |
£ |
своей |
верхней |
||||||
грани по |
Ц. заменяется на |
требование неположительности приращения |
Qдля малых допустимых вариаций с9 U. ,
16.6.Задача на быстродействие (пример) •
Ряд задач управления сводится к переводу системы из заданного начального состояния в заданное конечное за минимальное время. В технологических процессах режим, онтимальный по быстродействию, соответствует максимальной производительности аппарата при заданное качестве целевого продукта. Критерией оптимальности в таких задача' может быть записан в форме J_ - — ^о/~1
а
|
/6Я |
|
j / a |
(iCtuJ- - I , и функция H запишется |
как сумма только правых |
частей |
диффарешцшльных уравнений связи на |
соответствующие |
Рассмотрим в качестве примера простейшую задачу такого рода с объ
ектом, характеризующимся |
уравнением |
|||
|
of**- |
|
|
|
и ограниченным |
управлением |
j U M l |
. Введем следующие переменные |
|
»У = <fX, и |
= Mr^ |
t |
тогда |
исходное уравнение связи 2-го по |
рядка представится в виде двух уравнений 1-го порядка через фазовые
координаты v^j- '•
Согласно процедуре |
принципа максимума: |
|
|
|||||
1) |
запишем функцию Н для |
системы уравнений |
связи |
|
||||
2) |
составим систему уравнений для вспомогательных |
переменных, ис |
||||||
пользуя условие |
- |
— |
%f^~. |
|
|
|||
|
|
|
|
Решение |
этой системы: |
= (3/^ • |
||
3) |
записываем |
условие |
принципа |
максимума: |
|
|
||
так |
-RBR^.-C/J |
и первое |
слагаемое не зависит |
от М, |
то |
|
|
|
|
|
|
169 |
Н примет |
|
наибольшее |
значение„ если при |
|||
1) |
9^ |
^ |
0,Ц.= |
+1 - |
максимальное значение управления, |
|
2) |
у> |
|
0 , l i = |
|
- I - минимальное значение управления, |
|
'3) |
(/s |
|
= 0,М_ |
- |
не |
определено, |
В точке, где функция Ч£ меняет знак с + на - , должно происхо дить переключение управления с верхнего предельного значения на нижнее. Так как ^ линейная функция и не равна нулю тождест венно, то управление определено почти всюду и равно
Функция S п определяется следующим образом: j " +1^Х>0
Оптимальное управление имеет два интервала постоянства: на одном
из которых оно равно +1, а на другом |
- |
I . |
Оптимальная траектория будет состоять |
йз |
двух отрезков ( соответ- |
.ственно числу интервалов постоянства |
оптимального управления): |
|
1-й отрезок |
|
|
У I — У- У2 ~>- О ± |
- отрезок параболы; |
2-й отрезок
У, s |
_ |
J |
_ |
y |
J + |
с < |
|
|
|
«2 |
'' |
-2 |
-также отрезок параболы. |
На рисунке |
16.2 |
показаны |
семейства оптимальных траекторий для |
|||
U = +1 и К |
= |
- |
I . |
|
|
|