книги / Управление колебаниями
..pdf§ 1] З А Д А Ч И С Ф И К С И Р О В А Н Н Ы М В Р Е М Е Н Е М щ
оптимального управления (3.1.2), (3.1.14), (3.1.15). Снача ла строится однопараметрическое семейство решений кра евой задачи (3.1.31) в виде (3.1.33), где р — параметр се мейства, принадлежащий окрестности точки Р = 0 , и се мейство функционалов (3.1.37), т. е. функция J0(p). Да лее определяется точка р° минимума функции / 0(р) из (3.1.38). Если при этом выполняются условия (3.1.42) пли (3.1.44), (3.1.45), то р° = 0.
Исходные фазовые и сопряженные переменные а, ф, р, q определяем соотношениями а = |, ф = <р, р = ц, <7 = 0 и (3.1.33), в которые подставляется Р = Р°. Полученное приближение к траектории будет по построению удов летворять краевым условиям (3.1.14) и условиям транс версальности (3.1.19) с погрешностью порядка е. Реали зующееся иа этой траектории значение функционала, рав
ное /о = Jo (Р°). отличается па величину порядка е от точного минимума J* фушщионала (3.1.15).
Приближеппое оптимальное управление и* определено выражением (3.1.18), в которое нужно подставить р = ц, q = 0. Получим управление как функцию т, а, ф, а0. В формуле (3.1.18) можно полояшть а = £, однако быст рую переменную ф нельзя заменить на <р согласно (3.1.33) без потери точности (в отличие от главы 2 , где точность вычисления фазы ф была такой же, как и для медленных переменных). Получеппое управление будет зависеть от медленного времени т и фазы ф, а также от начального вектора а°.
Наконец, управление в форме синтеза (как функция т, а, ф) получается, если в выражении (3.1.33) для ц со вершить замену аргументов то т, а0-*■ а и подставить TJ в (3.1.18).
Построенное управление (для всех указанных вариан тов его функциональных зависимостей) будет приближен но оптимальным в следующем смысле. Если подставить его в исходную систему (3.1.2), то соответствующая тра ектория лежит в е-окрестности построенной приближен ной траектории, а значение функционала на Oie) отлича ется от его минимума J*.
Отметим, что решение усредненной краевой задачи (3.1.31) существенно проще исходной. Во-первых, система (3.1.31) для 1, л содержит 2п уравнений (вместо 2 /1 + 2). Во-вторых, в ней отсутствуют быстрые переменные, что
142 УСРЕДНЕНИЕ В НЕЛИНЕЙНЫХ ЗАДАЧАХ |ГЛ. 3
позволило заменой времени т = е£ исключить параметр е п свести ее к решению на коротком интервале медленно го времени т е [ т 0) 0], О ~ 1, т0 = etQ. Кроме того, исполь зование первого интеграла (3.4.32) позволяет понизить порядок усредненной канонической системы (3.1.31) и в случае системы с одной степепыо свободы сводит ее ре
шение к квадратуре. |
|
динамическую систему с од |
||
8 . |
Пример. Рассмотрим |
|||
ной степенью свободы (см. (3.1.12)) |
|
|||
у = е[к + Ну) -%у], y(t0) = y°t |
y(t0) = y°> 0. (3.1.46) |
|||
Здесь |
у — обобщенная |
координата, у = |
cly/clt — ско |
|
рость, е ^ 0 — малый параметр; |
EF — малая |
потенциаль |
||
ная сила, |
2 я-периодпческая |
функция относительно у со |
средним EF0; е / 5* 0 — коэффициент вязкого трения. Урав нением (3.1.46) описывается ряд модельных задач управ ляемого движения в слабых периодических нолях, быст рых вращений (см. (3.1.12)) п др. Уравнение (3.1.46) за
меной у = -ф, у = а приводится к стапдартпой системе ви
да |
(3.1.2) |
|
|
|
|
a = |
e[u + F(ij)) -%а], ip = a, a(t0) = y°, |
aj>(*o) = |
У0. (3.1.47) |
||
|
Поставим задачу оптимального управлеппя |
|
|||
|
|
т |
|
|
|
|
а(Г) = у * > 0 , |
J = e \ u 4 t, |
Г = |
0е-1 : (3.1.48) |
|
|
Здесь у*— заданное |
значение скорости |
у; |
ограппче- |
пия па и не налагаются. Обычным приемом интегральный функционал (3.1.47) приведем к форме (3.1.15).
Усреднеппая краевая задача (3.1.31) в принятых вы ше обозначениях приводится к виду ОХ — множитель Ла-
грапжа) |
|
§ = 4 -ч + ^ - й - S W - Л |
№ - v * , |
|
(3.1.49) |
* = ХП - Р, Л (Э) = К Т = в*, |
т0 = etQ. |
§ 11 |
ЗАДАЧИ С ФИКСИРОВАННЫМ ВРЕМЕНЕМ |
143 |
|||
Решение этой линейной краевой задачи при р = О на |
|||||
ходится элементарно и равно |
|
|
|
||
|
+ Т |
+ 4 е_х(0_г)> |
11(т ) = |
^-x(e-T)t |
|
Ь= |
4х{у* — у°е~^е~ч) — ^ |
[ 1 - |
е—z(0—T°>J} X |
||
|
x |
[ l - ^ |
e" t«)]"*1. □ |
(3.1.50) |
Приближенные выражения для оптимального управлення и функционала (3.1.48) найдем в соответствии с из ложенной выше методикой при помощи решения (3.1.50). Получим
“ * = 4 'l W , Jo(°) “ |
т ^ I1 |
— |
(3.1.51) |
Покажем теперь, что |
р = 0 |
доставляет |
минимум |
(3.1.38). Из линейности усредненной системы (3.1.49)
следует, что решение |
ц краевой задачи 43.1.49) линей |
||||
но зависит от параметра £ |
|
||||
!(т, |
р) = |о(т) + |
P^I(T), |
т|(т, р) = ло(т) + PTII(T), |
(3.1.52) |
|
|
|
|
Я ~ ЛоИрЯь |
||
|
|
|
|
||
Подставляя и* нз (3.1.51) и 1] из (3.1.52) в функцио |
|||||
нал (3.1.48), получим |
|
|
|||
|
е |
|
|
|
|
Л(Р) = 4 j |
t'l”М+ 2К М 'llW + P2'iiMld x - (ЗЛ-53> |
||||
|
‘'о |
|
|
|
|
Так как |
цДт) Ф 0 , то |
пз (3.1.53) следует, что экстре |
|||
мум |
(минимум) |
(3.1.38) |
существует и единствен. С дру |
||
гой |
стороны, пз |
общей |
формулы (3.1.41) вытекает, что |
Р = |
0 есть точка экстремума функции /<Др). Следователь |
|
но, |
р = 0 есть искомая |
точка глобального минимума |
/ 0(р), причем |
|
|
|
Jв |
(3.1.54) |
ч
144 |
УСРЕДНЕНИЕ В НЕЛИНЕЙНЫХ ЗАДАЧАХ |
[ГЛ. 3 |
В справедливости (3.1.54) можно убедиться и непо средственной проверкой, решив краевую задачу (3.1.49) при произвольном р. Таким образом, формулы (3.1.50), (3.1.51) дают искомое приближенное решение поставлен ной задачи (3.1.47), (3.1.48).
§2. Построение высших приближений
1.Уменьшение размерности системы уравнений прин ципа максимума. Перейдем к построению решении задач оптимального управления для систем стапдартпого вида (3.1.2) с произвольной наперед заданной степенью точ ности по малому параметру. В отличие от случая квази линейной системы (2.2.9), каноническая система урав нений краевой задачи принципа максимума (3.1.2), (3.1,19), (3.1.18) не имеет стандартного вида, а приведен ная к стандартной форме система (3.1.24) не является гамильтоновой. Поэтому представляется важным приве сти систему (3.1.24) к виду, обладающему привлекатель ным свойством каноничности. Это обстоятельство позво лит эффективно применить методику канонического ус реднения нз § 2 главы 2 .
Итак, рассматривается управляемая стандартная си стема с вращающейся фазой (3.1.2), для которой ставит ся терминальная задача оптимального управления. Так
как на размерность п медленного вектора a = (a i, ..., ап) не налагается ограничений, то, не ограничивая общности,
минимизируемый |
функционал можно |
взять |
в виде J— |
= а\{Т), 7, = @е“ 1, 0 = const> 0 . Чтобы |
не загромождать |
||
схему построения |
приближенного решения, |
считается, |
что дополнительное требование (3.1.14) попадания векто ра па многообразие М(а) = 0 при t — Т пе наложено. От метим, что вся развиваемая далее процедура применима и при наличии этих ограничений. Ограничения на уп равление имеют по-прежнему вид u^U , где U — замк нутое множество. Предположим, что поставлеипая за дача оптимального управления имеет единственное реше ние для всех значений s е ,(0, 8о1. Как п раньше, по строение решения основано на необходимых условиях принципа максимума и метода усреднения. С заданной точностью по медленным переменным, управлению и
$ 21 |
ПОСТРОЕНИЕ ВЫСШИХ ПРИБЛИЖЕНИЙ |
145 |
функционалу строятся допустимые решения краевой за дачи, среды которых выбирается оптимальное.
Краевая задача принципа максимума имеет вид (3.1.2), (3.1.18), (3.1.19), где условия трансверсальности прини мают форму
р(Т) = (— 1, 0, ..., 0), 5 ( Я = 0. |
(3.2.1) |
Функции /*, F*, © из (3.1.20) предполагаются далее достаточно гладкими. Отметим, что функции /, ©, F в (3.1.2) могут непрерывно зависеть от параметра е, однако эта зависимость для сокращения записи не указывается.
Формула (3.1.23), полученная из условия постоянства гамильтониана (3.1.20), может быть представлена в виде
q = EQ (а, ф, р, /г, е) = |
ем- 1 [h — (р, /J)] X |
|
X |1 - еоГ1 |
[д (р, tl)/dq + у ;]) + в» ... |
(3.2.2) |
Здесь через / о , F% |
обозиачепы функции /*, JР*, |
в ко |
торых (? = 0 . Формула (3.1.21) в силу условия трансвер
сальности (3.2.1) |
имеет вид |
|
|
||
|
|
h — |
/ю (а, ф, р) |у, |
(3.2.3) |
|
где |
/го — первая компопеыта вектора /о- |
|
|||
|
Подстановка выражения (3.2.2) ® систему (3.1.2), |
||||
(3.1.18), (3.1.19) |
привадит к краевой задаче для стандарт |
||||
ной системы, содержащей параметр h |
|
||||
|
а = е/* (я, i|), р, е 0 , |
ij) = |
© (а) -f- eF* (а, т]>, р, sQ), |
||
Р = |
— e<?f^ |
[(Р> /* (а> |
Р,е<?)) + |
|
|
|
|
|
+ GQF* (а, ф, р, е(?)], |
(3.2.4) |
|
|
я (У = а ° , |
1 >(*о)~Ч>°, |
Р (П = ( - 1 , 0 , . . . , 0 ). |
Здесь пулшо подставить (после дифференцирования по я) фупкцию q = &Q из (3.2.2).
После построения решения этой краевой задачи вели чина h определяется пз условия трапсверсальпостп (3.2.1) для q
<?(а(Г, h, е), ф(Г, h, е), р(Т), h, е) = 0. (3.2.5)
10 ф. л. Черноусько, Л. Д. Акуленко. Б. Н. Соколок
146 |
УСРЕДНЕНИЕ В НЕЛИНЕЙНЫХ ЗАДАЧАХ |
[ГЛ. 3 |
Далее должен быть выбран корень h* уравнения |
||
(3.2.5), |
доставляющий минимум функционалу |
J= |
= ai(r, h, е).
Решение задачи оптимального управления в первом приближении содержится в § 1. Для упрощения построе ния высших приближений уменьшим размерность систе мы (3.2.4) на единицу делением всех уравнений на *ф, что допустимо при достаточно малых е<=.[0 , е0] вслед ствие ш(а) > ©о> 0. В результате получим неавтономную
систему, в которой быстрая переменная — фаза |
ф рас |
||
сматривается |
как |
независимая переменная (аргумент) |
|
fQ(g, Ф, Р. fc, е) |
|
||
dip “ 6 (о («) + |
E F Q (я , ф, р , h, е)’ |
|
|
% “ - 6 |
+ в <р . W + 6< ? т £ ] <“ -I- е^ Г ‘ . |
<3 -2 -е) |
|
а(ф°) = |
а0, р(фг) = (— 1 , 0 , ..., 0 ). |
|
Здесь через /<?, Ря обозначены функции /*, F*, в ко торые подставлено выражение (3.2.2) для q, например,
/д(а, *ф, р, А, е) = /*(а, -ф, р, е(?).
Неизвестная величина фг в краевом условии (3.2.6) определяется соотношениями
Фг = ф|<=г, |
_________dip' |
(3.2.7) |
© (я) + EFQ{U, ip'./J./t, в) |
д|)0
Сюда вместо а, р подставляется как фупкцип аргу мента ф решение краевой задачи (3.2.6) при некоторых А, фг. Формула (3.2.7) при достаточно малом е устанав ливает взаимно однозначное соответствие между пере менными t и ф. Далее предполагается, что при заданных значениях параметров А из интервала [Aj, h2] и ф г ~ е - 1 решение модифицированной краевой задачи (3.2.6) су ществует и единственно.
Преобразования, в результате которых исходная авто номная гамильтонова система (3.1.2), (3.1.18), (3.1.19) сведена к системе (3.2.6), состояли в переходе к новому аргументу ф и в исключении переменной q, сопряжен ной ф, при помощи интеграла (3.1.20). Известно ([6 8 ],
§21 |
ттослтопттк высших привлттсгстт |
147 |
стр. 128), что при такой замене получается каноническая система (уравнения Уиттекера) с гамильтонианом, рав ным — q, где q дано формулой (3.2.2). Следовательно, система (3.2.6) может быть записана в канонической форме
da |
OQ |
dp_ |
<? = е (« .+ .Р .Л .е ). (3.2.8) |
|
<ip' |
d\\> |
в которой все переменные являются медленными. Функ цию Q считаем шике достаточно гладкой по аргументам я, р, в.
Исследование решения краевой задачи (3.2.6) на ос нове метода усреднения и определения решения задачи оптимального управления, содержится в п. 3.
2. Каноническая усредненная система. Система урав нений (3.2.8) может быть упрощена при помощи методи ки канонического усреднения по независимой перемен ной ф аналогично § 2 главы 2. Построим каноническое преобразование пеходпых переменных я, р к новым (ус редненным) Г|
S = |
. |
За |
P - t i |
. |
За |
|
|
+ |
e j j, |
||
|
а = |
а (я, т), ф , Л, е). |
(3.2.9) |
||
|
|
Здесь о — периодическая функция ф с периодом 2я. Потребуем, чтобы новый (усредненный) гамильтониан ей но содержал независимую переменную ф
$ - • ! ? . $ “ |
— |
*• |
Д - л « . л . л . « ) . |
(3.2.10) |
Система (3.2.10) имеет первый интеграл |
|
|||
Ж'|, |
г|, |
h, |
е) = const. |
(3.2.11) |
Переходим к вычислению искомых функций а п R. Производящая функция (я, т]) + еа преобразования (3.2.9) и гамильтониан sR находятся с произвольно за данной степенью точности по е, определяемой гладкостью исходного гамильтониана е@, в виде разложений
о(я, т|, ф, К е) = о<>(я, ц, ф, h) + eoi + ... + екак+ . . .
Ж£, 11, h, е) = Ло(|, 11, Л) + еД| + . . . + еЛЖ + . . .
(3.2.12)
10*
148 |
УСРЕДНЕНИЕ В НЕЛИНЕЙНЫХ ЗАДАЧАХ |
1ГЛ. 3 |
|
Функции (3.2.12) связаны с гамильтонианом |
системы |
(3 .2 .8 ) дифференциальным соотношением в частных про изводных [210, 145]
Щ - |
Q(а, Ч>,Р, ft, е) = Л (?, 11, ft, *). |
(3.2.13) |
Подставляя в |
(3.2.13) выражеппя (3.2.0) для |
по |
лучим нелинейное уравпеппо в частпых производных |
||
% - e (e , t .4 + |
e g . h, е) = R (а 4 е|Н,,,, А, *). (3.2.14) |
|
Используя теперь в (3.2.14) представления для иско |
||
мых функций в |
виде разложений (3 .2 .1 2 ), приравнива |
нием коэффициентов при одинаковых степенях е полу чим зацепляющуюся последовательность дифференциаль ных соотношений для щ, /?, (i ^ 0 ) впда
^ - Qi(а, ф, “П, h) = Ri (а, а], /г). |
(3.2.15) |
Здесь функции Qt на каждом шаге известны: они оп ределяются при помощи функции Q и ее производных, а также на основе функций о,-, Ri, вычпслеппых па пре дыдущих шагах. В частности, имеем
<?0 = Q(а, ф, 11, h, 0 ),
где индекс 0 отвечает е = 0. Уравнениям (3.2.15) удов летворяют функции
л , (5, П, А) = — <<?i> (?, л, ft),
|
|
2п |
|
<Qi>(a,'(\ih) = ^ |
(Ма,ф,г|,й)<% |
(3.2.17) |
|
|
|
о |
|
ffi (а, rj, ф, /г) = |
( [(?г (а, ф ', т], Л) — « ? i> (а, л , /г)] йф ', |
||
|
цГо |
|
|
|
i = 0 , 1 , ...,fc , ... |
|
|
Здесь первый |
аргумент функций R{ обозначен через |
||
| в соответствии |
с (3.2.12), |
угловые скобки |
означают |
усреднение по ф. |
|
|
|
§2] |
ПОСТРОЕНИЕ ВЫСШИХ ПРИБЛИЖЕНИЙ |
149 |
Таким образом, приближенное построение функции а п усредненного гамильтониана еД сводится к последова тельным вычислениям коэффициентов Q{ согласно (3.2.16)
иквадратурам (3.2.17).
3.Интегрирование усредненной системы. При помощи формул (3.2.12) выпишем систему (3.2.10) в (/с + 1)-м приближении
f W i > _
|
|
|
|
( 3 .2 .1 8 ) |
Здесь |
0 = eij) — медленная |
независимая |
переменпая, |
|
изменяющаяся па интервале |
[0о, 0 Т], |
где Oo = ei|)°, 0Г = |
||
= eipr ~ 1. |
В правых частях системы |
(3.2.18) |
отброшены |
члепы (/с+1)-го и более высоких порядков по е. Поэто му при выполнении известных (см., например, [224]) условий существования решения систем (3.2.10), (3.2.18)
па интервале [0о, От! для |
достаточно малых значений |
параметра е справедливы оценки |
|
II - 1{й+1)1 = OUh+1), |
Iл - Л(ь+1)1 = ОС*™). |
Построим общее решение системы (3.2.18) с погреш ностью 0(&h+l). Эти вычисления могут быть проведены па основе общего решения системы первого приближения
(3.2.18) |
при |
к = 0, |
которая в силу (3.2.17) имеет вид |
||||
|
|
|
d% |
0 <<?о) |
|
|
|
|
|
|
d0 |
дц |
’ |
(3.2.19) |
|
|
|
|
dn |
*<<?„) |
|
||
|
|
|
Л(0r) = |
||||
|
|
|
d Q - |
dt ’ |
|||
Постоянные |
cj, |
c„ — произвольные |
параметры, кото |
||||
рые, |
в частности, в первом приближении равны: с^ = а°, |
||||||
= |
(— 1 , |
0, |
..., |
0), |
см. (3.2.6). Для |
высших приближе |
ний параметры с6 и с„ лежат в е-окрестности казанных Далее считается известным общее решение задачи
(3.2.19), которое представим в виде |
|
|
1 (1) = К'9, с8, сп), П(1>= |
сг. сч)- |
(3.2.20) |
Функции | и л (не путать с переменными |, л в п. 2) зависят также от параметров 0о, 0 г и h} однако эта зави симость пока не указывается. Будем строить решение
150 |
УСРЕДНЕНИЕ П |
НЕЛИНЕЙНЫХ ЗАДАЧАХ |
[ГД. 3 |
|||
системы |
(3.2.18), |
удовлетворяющее |
условиям '|(Л-М)(0о) == |
|||
= сг» il(h+i)(0 r) = |
с„ |
в виде разложении |
|
|||
|
|
It |
|
|
и |
|
i(*+ i) |
= id ) + |
2 |
e*Si, |
11(й+ 1) = |
4(1) + S e4 i - |
(3 .2 .2 1 ) |
|
|
i=l |
|
i—-1 |
|
Здесь ппдекс вппзу у ц,- озпачаст помор коэффи циента в разложении. Неизвестпьтс функции ц, оп ределяются в результате решения линейной краевой за дачи, получаемой при подстановке (3.2.21) в (3.2.18) и прнравпивашш коэффициентов при одинаковых степе нях е
ili + |
Vi (0 , С|, <д, |
(0о) = О, |
|
|
(3.2.22) |
Здесь вторые производные |
от R0 берутся |
па порож |
дающем решении — первом приближении (3.2.20), а к,-, Wi — известные на каждом i-м шаге функции. Они опре
деляются через коэффициенты R, и |
решения |
гр, |
по |
||
строенные |
на предыдущих шагах |
(/ = 1 , |
2 , ..., £ — 1 ). |
||
Например, |
щ = ldR\/d\])t W\ = — {dR\/d%) |
при |
'i = |
l(i)> |
Чв Л(1)- Решение линейной неоднородной системы (3.2.22)
строится методом вариации произвольных постоянных иа основе общего решения соответствующей однородной си стемы. Фундаментальная матрица решений X для ука занной однородной системы, являющейся системой в ва риациях для (3.2.19), находится дифференцированием функций (3.2.20) по параметрам сЕ, с„. Учитывая началь ные н краевые условия (3.2.22), приходим к выражениям