![](/user_photo/_userpic.png)
книги из ГПНТБ / Егоров С.В. Элементы идентификации и оптимизации управляемых систем учеб. пособие
.pdfкоторая в данном случае играет роль функции Ляпунова. Первая разность Ляпунова равна
|
AV(T|l< + 1]) = |
+1]) - |
V(riM) = \ Ш - |
|
|
|
-r v G (t;* + r 1W)ii-lhWII. |
|
|||
Достаточным условием устойчивости в целом |
является |
||||
ДV<С10 для любого т] 'еУи, откуда получаем окончательное ус |
|||||
ловие |
||7—Г-Н0(^)||<1 для любого GeQ„, |
(4-40) |
|||
|
|||||
где Но= |
------ — I — гессиан функции G. |
|
|||
|
I <*ui)uk J |
|
|
|
|
Итеративный процесс сходится тем быстрее, чем меньше |
|||||
норма матрицы cp(G) =(/—ГН0(и )]. |
Учитывая это, можно |
||||
выбрать матрицу Г так, чтобы на |
каждом шаге |
cp(G)=0. |
|||
Отсюда, |
если матрица |
Нс неособая, |
то выбор |
Г[/+1] = |
= Н0-1 (£/[/]) приводит нас к алгоритму Ньютона, который в
силу вышеизложенного является устойчивым в целом. Выбор Г—На~](G0) соответствует модифицированному алгоритму Ньютона. При этом выбором начальной точки Vо всегда можно добиться, чтобы detHo(Go) ф 0. Заметим, что для слу чая, когда целевая функция G(U) является квадратичной
формой, гессиан превращается в постоянную числовую мат рицу, что соответствует согласно вышеприведенной терми нологии линейному алгоритму оптимизации.
Если применяется алгоритм (4-38) с y=const, то доста точное условие (4-40) эквивалентно следующим трем {4-7]:
а) |
Y<Ynp—const, |
(4-41) |
б) |
T)TV uG(t/* + r])>0 при E ^llrill^e -1, е > 0 , |
|
в) |
||VuG(G)||^c||G||, c=const. |
|
Эта условия имеют следующий смысл: а) максимальный коэффициент шага ограничен; б) направление изменения вектора U (против градиента) соответствует уменьшению
отклонения тр т. е. в системе оптимизации рис. 4-8 действует отрицательная обратная связь; в) целевая функция ограни чена сверху некоторой квадратичной формой. Последнее ус ловие требуется только для неограниченной области . изме нения 0, так как для целевых функций, возрастающих
быстрее, чем некоторая квадратичная форма, условие (4-40) Может нарушаться при любом фиксировании y==Yo Для о т -
клонений, больших некоторого предельного г| (уо). Если же
11-1303 |
161 |
область Qu ограничена, то условие в) становится несущест венным, .поскольку в этом случае достаточно выполнения
\\VUG(U)\\< оо.
Поскольку градиентные алгоритмы (4-38) имеют ограни чения на параметры шага снизу (элементы матрицы Г долж ны быть неотрицательны) и 'сверху (условие (4-40)), причем и при малых, и при больших коэффициентах шага скорость
сходимости мала, хотя и имеет разный характер |
(монотон |
ный — для алгоритмов с малой ||Г|| и сильно |
колебатель |
ный — для алгоритмов с большой ||Г||), естественно, что для стационарных алгоритмов имеется некоторая постоянная матрица Г, которая обеспечивает наилучший в определенном смысле процесс оптимизации, например, в смысле быстроты сходимости.
Таким образом замечаем, что хотя в условия задачи ста тической оптимизации время не входит, в 'Силу принятой итеративной (или соответствующей непрерывной) схемы оп тимизации этот процесс требует времени. Его можно наз вать переходным процессом при оптимизации. Выбором па
раметров Г соответствующей схемы рис. 4-8 требуется обес печить оптимальный переход из .t/0 в U*- За критерий опти
мальности можно взять, например, быстродействие (мини мальное число шагов в дискретном процессе), минимум по терь на поиск и т. д. Такая задача в основном соответствует классической задаче динамической оптимизации — задаче об оптимальном регуляторе (см. п. 10, § 1-2), когда заданы уравнения движения системы, например, (4-39), (при этом и* —точка равновесия), задан критерий оптимальности
/ = 2 g(r]M )-*-m in,g(-)>() t=1 г(0
и ограничения на Г отсутствуют. Оптимальный переход из Uqв U* для дискретной системы, очевидно, должен осущест
вляться за один шаг. Однако тот факт, что конечное состоя ние U* при этом неизвестно, не позволяет решить эту зада
чу. Вследствие этого возможна лишь локальная оптимизация, т. е. на один шаг, при переходе из точки U{t] в U[t +1], более близкую в некотором смысле к U*.
Рассмотрим вначале случай Г=уМЛ взяв за критерий ми нимум потерь на поиск на каждом шаге, соответствующий критерию (4-37) метода наискорейшего спуска. В этом слу
162
чае y[t] можно найти как наименьший положительный корень
уравнения
|
|
|
дАОду = О. |
14-42) |
Разлагая |
по |
Тейлору, находим |
G(U[t + l}) = G(U[t] — |
|
|
|
- |
’r [ t + \ ] S 7 uG(U\t])) = |
|
о (и И) - |
y [t + 1 ] v ;g (U {*]) Vu G (U UD + |
|||
+ -^rT2U + 1] V uTG(fy^l)./yc.VuG((/K]) 4 - . . |
||||
где Ha — |
d2Q(U[t\) |
1 |
|
|
|
dajdu•, |
J |
|
Ограничиваясь квадратичным приближением, находим из (4-42) оптимальный коэффициент для (Н-1)-го шага
т * [Н -1 ] |
_ |
у иЮ(Ц [/]) v uG(C/[f]) |
, _ п . |
9 |
(4-43) |
“ V a ' G ( U [ t ) ) . H e - v uG ( U l t ] ) ' |
~ и ’ |
Z |
|||
Последняя |
формула является точной |
для |
квадратичных |
функций. Однако надо заметить, что автономные схемы оп тимизации с Г= у1 обычно являются малоэффективными:
ведь они получены в предположении малых приращений це левой функции на каждом шаге оптимизации. В силу этого
большое внимание привлекают схемы с более |
сложной |
структурой матрицы Г, в частности, алгоритмы Ньютона |
|
U[t + 1]= ОД-Но"1V„G(U[t]), U[0]=Uo, t = 0,1,2,..., |
(4-44) |
c T= H G-'(U[t]) или Г = H o~l {U0), которые обеспечивают
при весьма широких условиях устойчивость и быструю схо димость процесса оптимизации, а для квадратичных целевых
функций обеспечивают переход из Uq в U* за |
один шаг. |
|
Сходимость таких |
алгоритмов исследовалась |
Канторови |
чем Л. В., при этом |
сформулирована следующая теорема |
|
{4-8]: |
|
со своими |
Если G(U) определена и непрерывна вместе |
частными производными до третьего порядка в области Qu и выполняются условия:
1) существует обратная матрица Го = Н0-1 (1/0), где
IIГоII <ао,
2)||r0V uG(t/0) |<&о,
3) V 1 I — dtVi°(uо)_ |
для и gQM, i,/r= 1, . . п, |
|
Jmj I |
ди/дик |
|
11 |
163 |
* |
|
4) постоянные do, Ь0, с удовлетворяют .неравенству
ро=2пао^ос^1,
то для последовательных приближений (4-44) при Н0~1— Нв~1(УУ]) справедливо неравенство
Иi/*-t/lf+ llll* . н « г
а при Hq- '^ H o-'(U 0) и р0< 1
II G * - и [ Г + 1 II m < Po '+ 1 - II и * - и 0 II m < 2 6 # 0 '+ \
при этом норма везде понимается в смысле т нормы. По следняя определяется, например, для вектора U и матрицы Г
II и II m= шах I щ I , |
II г II т = Шах 2 I Тм I • |
i |
I k |
Рассмотренные оптимальные алгоритмы становятся менее эффективными при наличии ограничений (в задачах НП, в практических схемах автоматической оптимизации реальных объектов).
III.ОПТИМИЗАЦИЯ РЕАЛЬНЫХ ОБЪЕКТОВ
§4-9. Особенности оптимизации реальных объектов
Вотличие от рассмотренной выше оптимизации .на мате матических моделях управляемых систем, оптимизация ре альных объектов имеет ряд особенностей:
1)аналитические выражения целевой функции G(U) и
ееградиента , а также ограничений часто неизвестны-,
2)целевая функция зависит не только от управляющих
воздействий, но также и от возмущений Z: G = G(U, Z);
3) измерения сопровождаются помехами, вследствие это
го в распоряжении исследователя имеются оценки перемен
ных, например, |
|
C = G + Ei, VG = VG + E2, |
(4-45) |
где Ei, Ег — помехи;
4) уравнения связи «вход—выход» (т. е. характеристики канала U-*-G) являются не конечными, а в общем случае опе
раторными: |
(4-46) |
F(G, V, Z) = 0, |
|
где F — некоторый интегро-дифференциальный |
опера |
тор. |
|
Указанные особенности вызывают дополнительные труд ности при оптимизации, преодоление которых осущест вляется специальными мерами.
Первая особенность приводит к использованию экспери ментальных методов оптимизации, которые составляют один
из предметов изучения целого раздела науки, называемого «планирование эксперимента».
Как указано в § 4-6, существующие методы оптимизации можно разделить на прямые и градиентные. Отсутствие ана литического выражения целевой функции наиболее сильно сказывается на градиентные методы, поскольку эксперимен тальное определение градиента превращается в самостоя тельную проблему идентификации. Первая особенность тре бует также дополнительного исследования (теоретического или экспериментального) о возможности существования в системе оптимального режима.
В настоящее время наличие таких режимов установлено для процессов со сжиганием топлива (нагревательные печи, двигатели внутреннего сгорания и др.), для контактно-ката литических и выпарных аппаратов в химической технологии, для отсадочные, флотационных, дробильных (с классифика торами) агрегатов в процессах добычи и обогащения полез ных ископаемых, для гидротранспортных установок, электро сварочных, электрогальванических процессов, в радиотехни
ке и т. д.
Пример 4-4. Процесс топки наиболее экономичен, если температура ■бл в камере сгорания максимальна для заданного расхода топлива. Из уравнения теплового баланса для установившегося режима можно найти
©п — (К G r (- св,6п0 в Ц- cT©rGT) (Сп^п) *>
где Ф„, д г, 0„ —температуры соответственно воздуха, топлива, продуктов сгорания;
св, ст, с„ — соответствующие теплоемкости; Ов, 0Т— расходы воздуха и топлива;
X — теплотворная способность топлива.
Зависимость frn(GB) при .постоянных остальных параметрах показана на рис. 4-10. Она имеет экстремальный характер, легко объяснимый из физических соображений: при малом расходе воздуха топливо сго рает не полностью и, следовательно, выделяет меньше тепла, а при из бытке воздуха температура падает за счет нагрева избыточной массы воздуха. Таким образом, существует оптимальное соотношение расходов, при котором температура ■&„ максимальна. Это соотношение, к сожале нию, изменяется (пунктир на рис. 4-10), если изменяется качество топлива (его теплотворная способность), что приводит к необходимости автома тически регулировать соотношение расходов топлива и воздуха.
Пример 4-5 [4-13]. Передвижение транспортного экипажа, летатель ного аппарата и т. п, можно считать наиболее экономичным, если мини
165
мален суммарный расход горючего для данного маршрута. Уравнение движения экипажа имеет вид
|
|
тх = а — kо —kix2, |
|
(4-47) |
где |
х — величина перемещения экипажа с массой |
т\ |
горючего; |
|
|
и — движущая |
сила, пропорциональная расходу |
||
ko, |
kix1 — компонент сил сопротивления движению, из которых первая не |
|||
зависит от скорости, |
а вторая пропорциональна |
ее |
квадрату (точнее |
kix sign х).
При заданных начальной и конечной точках маршрута указанная за дача относится к задачам динамической оптимизации (см. § 1-2). Однако
Рис. 4-10. |
Статическая характе- |
|
Рис. 4-11. Зависимость удельного |
|||||||||
ристика процесса |
топки |
|
|
расхода |
горючего от |
скорости |
са |
|||||
|
|
|
|
|
|
|
|
молета |
|
|
|
|
для установившегося режима, когда ускорение отсутствует, |
оптималь |
|||||||||||
ным можно считать такой режим полета с наивыгоднейшей |
(крейсерской) |
|||||||||||
скоростью, при которой удельный расход |
горючего q |
на единицу |
пути |
|||||||||
минимален. |
Поскольку |
|
|
|
|
|
|
|
|
|
|
|
|
|
dQ |
dQ |
|
dt |
|
j i_ |
|
|
|
|
|
|
^ |
dx |
dt |
|
|
dx |
|
x |
|
|
|
|
где Q — абсолютный расход |
гопючего, |
то из |
(4-47) |
получаем |
при х = 0 . |
|||||||
|
|
|
*о |
, |
. |
• |
|
|
|
|
|
|
|
|
Я= - г - |
-f |
kix. |
|
|
|
|
|
|
||
|
|
|
х |
|
|
|
|
|
|
|
|
|
Напученная зависимость q (х) |
|
имеет |
экстремальный |
характер. |
На |
|||||||
рис. 4-11 эта зависимость показана |
для |
различных |
полетных |
весов P i |
||||||||
одного типа самолета. |
Очевидно, |
что |
при дальних полетах, |
когда |
вес |
166
горючего соизмерим с полетным весом, необходимо регулировать удель ный расход горючего.
Вторая особенность приводит к тому, что оптимальное
значение целевой функции и соответствующие ему опти мальные управления становятся функциями возмущений. Это приводит к необходимости регулирования оптимальных зна чений управлений, если скорость смещения экстремума под влиянием возмущений невелика (дрейф экстремума). Такие функции выполняют системы экстремального регулирования.
Впротивном случае отслеживание экстремума невозможно,
ив этом случае приходится изменять критерий оптимально сти. В частности, если возмущения являются случайными процессами, то при оптимизации можно минимизировать среднее по ансамблю возмущений значение целевой функ
ции G==MZ{G(U, Z) } или среднее |
по времени |
G^—M^ {G(U, Z) }. Первый путь обычно |
применяют при |
аналитических расчетах, когда известны статистические ха рактеристики возмущений, второй путь наиболее применим при экспериментальных методах оптимизации.
Третья особенность приводит к необходимости примене
ния помехоустойчивых алгоритмов оптимизации, обеспечи вающих сходимость процесса поиска в условиях помех. Дело в том, что точные значения целевой функции и ее градиента неизвестны, а известны лишь эмпирические оценки (4-45). При этом в точке экстремума
a) G(>U*) =^=minG(£/*), б) V UG([/*) =£0. |
(4-48) |
Если принять, что для указанных оценок выполняются условия
V = A W )< o o , MC{V G (£/*)}-О,
то применение эмпирического (стохастического) градиент ного алгоритма, аналогичного (4-38),
«W + l]= tW ] - tf * + l]-VG(t/M), t = 0, 1, 2, ..., |
(4-49) |
может обеспечить сходимость процесса поиска лишь при оп ределенных ниже требованиях к коэффициенту шага.
Во-первых, очевидно, учитывая (4-486), что для обеспе чения сходимости U[t] к U* необходимо, чтобы
ПтуМ =0, VM>0- |
(4-50) |
1~-*оо |
|
167
Однако слишком быстрое уменьшение коэффициента ша
га не обеспечит сходимости даже при отсутствии |
помех. |
||
В самом деле, |
рассмотрим случай, когда |
|V uG(t/JY]) |^ |
|
^ II V UG(G0) II < |
xj. Тогда по алгоритму (4-38) |
|
|
||A^ + l]ll = #+l]H VuG(t/W)||^Y[/ + l]l|VuG(i;o)ll, |
|||
и перемещение из начальной точки U о за N |
шагов равно |
||
\\u[N \- и 0 \\= \\^Аищ \\к\\уиО (и0)\\ • |
И- |
||
|
г = 1 |
t - x |
|
При быстром убывании y[t] перемещение может оказаться
ограниченным, и процесс оптимизации не дойдет до экстре мума даже при N-*-oo. Например, при выборе y[f] =Yoa‘-1»
где а < 1, получаем
n N
lim У . т[^]=То-Нт - 1~ — - = Го•—— <*>• л-*» /-1 N->« 1—а 1—а
Поэтому необходимо также, чтобы суммарное продвижение могло быть неограниченным:
2 у(/]= оо,
г-1
что .предполагает достаточно медленное убывание коэффи циента шага. Последнее благоприятно и в смысле помехо устойчивости алгоритма, так как при большом числе шагов начинает действовать закон больших чисел, в результате чего
погрешности |
в оценках градиента усредняются. Однако и |
||
слишком медленное уменьшение |
ие обеспечивает полной |
||
сходимости, |
поскольку в |
районе экстремума, |
где |
!!VUG(G)|| < е |
может произойти потеря направления к экст |
ремуму. Установлено, что алгоритм (4-49) обеспечивает схо димость с вероятностью 1, т. е.
|
р |
{lim \ \ U [ t \ — U * |
|| =0} =1 |
|
|
/-♦00 |
|
при условиях (условия стохастической аппроксимации): |
|||
а) Т[*]>0, £ т ['] = ос, 2ТЧ*]<~'> |
|||
|
г= 1 |
г= 1 |
|
б) |
inf М^ци — U*)TV G (U)} > 0 |
|
|
|
|
при e < |U — U * |j < 8-T, e >0, (4-51) |
|
в) |
A M v TG ( G ) - v G ( G ; } < d ( l + |
G TG), d>0. |
168
Условия 6) и в) имеют смысл, аналогичный соответствую щим условиям >(4-41). Условия а) выполняются, например,
для уМ= —- —,t—0, 1, ... . К сожалению, условия (4-51а)
a+ t
имеют малую практическую ценность при дрейфе экстре мума, поскольку исключают .возможность .слежения за экст ремумом, начиная с некоторого t. В этом смысле алгоритм
(4-49) с yM—Yo более предпочтителен. Такой алгоритм, правда, даже при отсутствии дрейфа обеспечивает неасимп тотическую сходимость в смысле
lim Мх. { ||U [/] — U* |[ 2} < р (То, стс), t-+°°
причем р->0 при Yo ■►Оили о£—»-0. Такая сходимость (в среднеквадратичном) на практике нас всегда может удовлет ворить при выборе подходящего уо-
Четвертая особенность приводит к замедлению и затруд
нению процесса поиска экстремума, что связано с конеч ностью скорости протекания переходных процессов в объек те при изменении управляющих воздействий. Дело в том, что при статической оптимизации объекта, описываемого операторным уравнением (4-46), подразумевается нахожде ние экстремума статической характеристики Gcr(U, Z). По
этому при поиске экстремума информация о целевой функ ции GCT(U, Z) (в прямых методах оптимизации) или о ее
градиенте (в градиентных методах) должна получаться, строго говоря, только в установившихся режимах. Вслед ствие этого для весьма инерционных объектов часто прини мают меры либо по ускорению переходных процессов (обычно при шаговом движении к экстремуму), либо по компенсации влияния динамики (обычно при определении градиента с помощью синхронного детектирования). В пер вом случае решается задача максимального быстродействия (задача динамической оптимизации), во втором — задача выбора корректирующего (фазосдвигающего) устройства. В обоих 'случаях требуется знание динамических характери стик объекта по каналу управления. Поэтому при статичес кой оптимизации реальных объектов часто требуется пред варительно решать задачу идентификации. В настоящее вре
мя удовлетворительное решение всего комплекса вышеука занных задач имеется лишь для некоторых классов объектов, например, представляющих последовательное соединение инерционной линейной части и безынерционной нелиней ной (объекты «ЛЧ —НЧ» (4-10]).
169
Таким образом, в реальных объектах процесс оптимиза ции обычно распадается на последовательность двух про цессов — получения информации о значении целевой функ ции или градиента и движения к экстремуму. Каждый из
них в условиях помех и инерционности объекта требует оп ределенного времени. Вследствие этого при дрейфе экстре мума возникает проблема ускорения поиска, или повышения быстродействия систем оптимизации.
§ 4-10. Промышленные системы" оптимизации
При оптимизации реальных объектов широко применяют экстремальные регуляторы (ЭР), которые автоматически отыскивают и поддерживают оптимальные значения управ ляющих воздействий. «Совместно с объектом оптимизации такой регулятор образует систему экстремального регулиро вания (СЭР). Последняя должна удовлетворять, помимо оче видного условия устойчивости, также условиям обеспечения требуемого качества оптимизации: точности и быстродейст вия.
В некоторых типах СЭР рабочим режимом является ав токолебательный, когда происходят колебания (рысканье) управляющих воздействий около оптимальных значений. В этом случае амплитуда автоколебаний и потери на рыс канье не должны превышать допустимых. Применение ЭР для оптимизации обосновано лишь тогда, если экстремум целевой функции смещается во времени, что приводит к не обходимости регулирования управляющих переменных. При неподвижном экстремуме целесообразнее использовать для оптимизации методы планирования эксперимента.
Рассмотренные ранее схемы оптимизации соответствова ли многоконтурным астатическим системам регулирования, поскольку в статическом режиме (т. е. при отсутствии дрей фа экстремума) установившаяся ошибка Д1/СТ=||{У*—
— £^уст11=0. При дрейфе экстремума ошибка в общем случае уже отлична от нуля. Для ее уменьшения используются те же методы, что и в системах автоматического регулирования.
Пункт 1.
В СЭР могут использоваться как прямые, так и градиентные методы
оптимизации. К |
первым относятся нашедшие |
широкое |
применение С Э Р |
|||||
с запом инанием |
экстремума |
(с поиском |
по |
приращению) |
[4-10]. |
На |
||
рис. 4-12 приведена структурная схема такой системы |
и диаграмма |
ее |
||||||
работы, |
где О У — объект оптимизации |
со статической |
характеристикой |
|||||
С (U), |
У У — управляющее |
устройство, |
И Д — исполнительный |
двигатель, |
170