Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Егоров С.В. Элементы идентификации и оптимизации управляемых систем учеб. пособие

.pdf
Скачиваний:
5
Добавлен:
24.10.2023
Размер:
9.47 Mб
Скачать

которая в данном случае играет роль функции Ляпунова. Первая разность Ляпунова равна

 

AV(T|l< + 1]) =

+1]) -

V(riM) = \ Ш -

 

 

-r v G (t;* + r 1W)ii-lhWII.

 

Достаточным условием устойчивости в целом

является

ДV<С10 для любого т] 'еУи, откуда получаем окончательное ус­

ловие

||7—Г-Н0(^)||<1 для любого GeQ„,

(4-40)

 

где Но=

------ — I — гессиан функции G.

 

 

I <*ui)uk J

 

 

 

 

Итеративный процесс сходится тем быстрее, чем меньше

норма матрицы cp(G) =(/—ГН0(и )].

Учитывая это, можно

выбрать матрицу Г так, чтобы на

каждом шаге

cp(G)=0.

Отсюда,

если матрица

Нс неособая,

то выбор

Г[/+1] =

= Н0-1 (£/[/]) приводит нас к алгоритму Ньютона, который в

силу вышеизложенного является устойчивым в целом. Выбор Г—На~](G0) соответствует модифицированному алгоритму Ньютона. При этом выбором начальной точки Vо всегда можно добиться, чтобы detHo(Go) ф 0. Заметим, что для слу­ чая, когда целевая функция G(U) является квадратичной

формой, гессиан превращается в постоянную числовую мат­ рицу, что соответствует согласно вышеприведенной терми­ нологии линейному алгоритму оптимизации.

Если применяется алгоритм (4-38) с y=const, то доста­ точное условие (4-40) эквивалентно следующим трем {4-7]:

а)

Y<Ynp—const,

(4-41)

б)

T)TV uG(t/* + r])>0 при E ^llrill^e -1, е > 0 ,

в)

||VuG(G)||^c||G||, c=const.

 

Эта условия имеют следующий смысл: а) максимальный коэффициент шага ограничен; б) направление изменения вектора U (против градиента) соответствует уменьшению

отклонения тр т. е. в системе оптимизации рис. 4-8 действует отрицательная обратная связь; в) целевая функция ограни­ чена сверху некоторой квадратичной формой. Последнее ус­ ловие требуется только для неограниченной области . изме­ нения 0, так как для целевых функций, возрастающих

быстрее, чем некоторая квадратичная форма, условие (4-40) Может нарушаться при любом фиксировании y==Yo Для о т -

клонений, больших некоторого предельного г| (уо). Если же

11-1303

161

область Qu ограничена, то условие в) становится несущест­ венным, .поскольку в этом случае достаточно выполнения

\\VUG(U)\\< оо.

Поскольку градиентные алгоритмы (4-38) имеют ограни­ чения на параметры шага снизу (элементы матрицы Г долж­ ны быть неотрицательны) и 'сверху (условие (4-40)), причем и при малых, и при больших коэффициентах шага скорость

сходимости мала, хотя и имеет разный характер

(монотон­

ный — для алгоритмов с малой ||Г|| и сильно

колебатель­

ный — для алгоритмов с большой ||Г||), естественно, что для стационарных алгоритмов имеется некоторая постоянная матрица Г, которая обеспечивает наилучший в определенном смысле процесс оптимизации, например, в смысле быстроты сходимости.

Таким образом замечаем, что хотя в условия задачи ста­ тической оптимизации время не входит, в 'Силу принятой итеративной (или соответствующей непрерывной) схемы оп­ тимизации этот процесс требует времени. Его можно наз­ вать переходным процессом при оптимизации. Выбором па­

раметров Г соответствующей схемы рис. 4-8 требуется обес­ печить оптимальный переход из .t/0 в U*- За критерий опти­

мальности можно взять, например, быстродействие (мини­ мальное число шагов в дискретном процессе), минимум по­ терь на поиск и т. д. Такая задача в основном соответствует классической задаче динамической оптимизации — задаче об оптимальном регуляторе (см. п. 10, § 1-2), когда заданы уравнения движения системы, например, (4-39), (при этом и* точка равновесия), задан критерий оптимальности

/ = 2 g(r]M )-*-m in,g(-)>() t=1 г(0

и ограничения на Г отсутствуют. Оптимальный переход из Uqв U* для дискретной системы, очевидно, должен осущест­

вляться за один шаг. Однако тот факт, что конечное состоя­ ние U* при этом неизвестно, не позволяет решить эту зада­

чу. Вследствие этого возможна лишь локальная оптимизация, т. е. на один шаг, при переходе из точки U{t] в U[t +1], более близкую в некотором смысле к U*.

Рассмотрим вначале случай Г=уМЛ взяв за критерий ми­ нимум потерь на поиск на каждом шаге, соответствующий критерию (4-37) метода наискорейшего спуска. В этом слу­

162

чае y[t] можно найти как наименьший положительный корень

уравнения

 

 

 

дАОду = О.

14-42)

Разлагая

по

Тейлору, находим

G(U[t + l}) = G(U[t] —

 

 

-

’r [ t + \ ] S 7 uG(U\t])) =

о И) -

y [t + 1 ] v ;g (U {*]) Vu G (U UD +

+ -^rT2U + 1] V uTG(fy^l)./yc.VuG((/K]) 4 - . .

где Ha —

d2Q(U[t\)

1

 

 

dajdu•,

J

 

Ограничиваясь квадратичным приближением, находим из (4-42) оптимальный коэффициент для (Н-1)-го шага

т * [Н -1 ]

_

у иЮ(Ц [/]) v uG(C/[f])

, _ п .

9

(4-43)

V a ' G ( U [ t ) ) . H e - v uG ( U l t ] ) '

~ и ’

Z

Последняя

формула является точной

для

квадратичных

функций. Однако надо заметить, что автономные схемы оп­ тимизации с Г= у1 обычно являются малоэффективными:

ведь они получены в предположении малых приращений це­ левой функции на каждом шаге оптимизации. В силу этого

большое внимание привлекают схемы с более

сложной

структурой матрицы Г, в частности, алгоритмы Ньютона

U[t + 1]= ОД-Но"1V„G(U[t]), U[0]=Uo, t = 0,1,2,...,

(4-44)

c T= H G-'(U[t]) или Г = H o~l {U0), которые обеспечивают

при весьма широких условиях устойчивость и быструю схо­ димость процесса оптимизации, а для квадратичных целевых

функций обеспечивают переход из Uq в U* за

один шаг.

Сходимость таких

алгоритмов исследовалась

Канторови­

чем Л. В., при этом

сформулирована следующая теорема

{4-8]:

 

со своими

Если G(U) определена и непрерывна вместе

частными производными до третьего порядка в области Qu и выполняются условия:

1) существует обратная матрица Го = Н0-1 (1/0), где

IIГоII <ао,

2)||r0V uG(t/0) |<&о,

3) V 1 I — dtVi°(uо)_

для и gQM, i,/r= 1, . . п,

Jmj I

ди/дик

 

11

163

*

 

4) постоянные do, Ь0, с удовлетворяют .неравенству

ро=2пао^ос^1,

то для последовательных приближений (4-44) при Н0~1— Нв~1(УУ]) справедливо неравенство

Иi/*-t/lf+ llll* . н « г

а при Hq- '^ H o-'(U 0) и р0< 1

II G * - и [ Г + 1 II m < Po '+ 1 - II и * - и 0 II m < 2 6 # 0 '+ \

при этом норма везде понимается в смысле т нормы. По­ следняя определяется, например, для вектора U и матрицы Г

II и II m= шах I щ I ,

II г II т = Шах 2 I Тм I •

i

I k

Рассмотренные оптимальные алгоритмы становятся менее эффективными при наличии ограничений (в задачах НП, в практических схемах автоматической оптимизации реальных объектов).

III.ОПТИМИЗАЦИЯ РЕАЛЬНЫХ ОБЪЕКТОВ

§4-9. Особенности оптимизации реальных объектов

Вотличие от рассмотренной выше оптимизации .на мате­ матических моделях управляемых систем, оптимизация ре­ альных объектов имеет ряд особенностей:

1)аналитические выражения целевой функции G(U) и

ееградиента , а также ограничений часто неизвестны-,

2)целевая функция зависит не только от управляющих

воздействий, но также и от возмущений Z: G = G(U, Z);

3) измерения сопровождаются помехами, вследствие это­

го в распоряжении исследователя имеются оценки перемен­

ных, например,

 

C = G + Ei, VG = VG + E2,

(4-45)

где Ei, Ег — помехи;

4) уравнения связи «вход—выход» (т. е. характеристики канала U-*-G) являются не конечными, а в общем случае опе­

раторными:

(4-46)

F(G, V, Z) = 0,

где F — некоторый интегро-дифференциальный

опера­

тор.

 

Указанные особенности вызывают дополнительные труд­ ности при оптимизации, преодоление которых осущест­ вляется специальными мерами.

Первая особенность приводит к использованию экспери­ ментальных методов оптимизации, которые составляют один

из предметов изучения целого раздела науки, называемого «планирование эксперимента».

Как указано в § 4-6, существующие методы оптимизации можно разделить на прямые и градиентные. Отсутствие ана­ литического выражения целевой функции наиболее сильно сказывается на градиентные методы, поскольку эксперимен­ тальное определение градиента превращается в самостоя­ тельную проблему идентификации. Первая особенность тре­ бует также дополнительного исследования (теоретического или экспериментального) о возможности существования в системе оптимального режима.

В настоящее время наличие таких режимов установлено для процессов со сжиганием топлива (нагревательные печи, двигатели внутреннего сгорания и др.), для контактно-ката­ литических и выпарных аппаратов в химической технологии, для отсадочные, флотационных, дробильных (с классифика­ торами) агрегатов в процессах добычи и обогащения полез­ ных ископаемых, для гидротранспортных установок, электро­ сварочных, электрогальванических процессов, в радиотехни­

ке и т. д.

Пример 4-4. Процесс топки наиболее экономичен, если температура ■бл в камере сгорания максимальна для заданного расхода топлива. Из уравнения теплового баланса для установившегося режима можно найти

©п — (К G r (- св,6п0 в Ц- cT©rGT) (Сп^п) *>

где Ф„, д г, 0„ —температуры соответственно воздуха, топлива, продуктов сгорания;

св, ст, с„ — соответствующие теплоемкости; Ов, 0Т— расходы воздуха и топлива;

X — теплотворная способность топлива.

Зависимость frn(GB) при .постоянных остальных параметрах показана на рис. 4-10. Она имеет экстремальный характер, легко объяснимый из физических соображений: при малом расходе воздуха топливо сго­ рает не полностью и, следовательно, выделяет меньше тепла, а при из­ бытке воздуха температура падает за счет нагрева избыточной массы воздуха. Таким образом, существует оптимальное соотношение расходов, при котором температура ■&„ максимальна. Это соотношение, к сожале­ нию, изменяется (пунктир на рис. 4-10), если изменяется качество топлива (его теплотворная способность), что приводит к необходимости автома­ тически регулировать соотношение расходов топлива и воздуха.

Пример 4-5 [4-13]. Передвижение транспортного экипажа, летатель­ ного аппарата и т. п, можно считать наиболее экономичным, если мини­

165

мален суммарный расход горючего для данного маршрута. Уравнение движения экипажа имеет вид

 

 

тх = а — kо kix2,

 

(4-47)

где

х — величина перемещения экипажа с массой

т\

горючего;

 

и — движущая

сила, пропорциональная расходу

ko,

kix1 — компонент сил сопротивления движению, из которых первая не

зависит от скорости,

а вторая пропорциональна

ее

квадрату (точнее

kix sign х).

При заданных начальной и конечной точках маршрута указанная за­ дача относится к задачам динамической оптимизации (см. § 1-2). Однако

Рис. 4-10.

Статическая характе-

 

Рис. 4-11. Зависимость удельного

ристика процесса

топки

 

 

расхода

горючего от

скорости

са­

 

 

 

 

 

 

 

 

молета

 

 

 

для установившегося режима, когда ускорение отсутствует,

оптималь­

ным можно считать такой режим полета с наивыгоднейшей

(крейсерской)

скоростью, при которой удельный расход

горючего q

на единицу

пути

минимален.

Поскольку

 

 

 

 

 

 

 

 

 

 

 

 

 

dQ

dQ

 

dt

 

j i_

 

 

 

 

 

^

dx

dt

 

 

dx

 

x

 

 

 

 

где Q — абсолютный расход

гопючего,

то из

(4-47)

получаем

при х = 0 .

 

 

 

,

.

 

 

 

 

 

 

 

 

Я= - г -

-f

kix.

 

 

 

 

 

 

 

 

 

х

 

 

 

 

 

 

 

 

 

Напученная зависимость q (х)

 

имеет

экстремальный

характер.

На

рис. 4-11 эта зависимость показана

для

различных

полетных

весов P i

одного типа самолета.

Очевидно,

что

при дальних полетах,

когда

вес

166

горючего соизмерим с полетным весом, необходимо регулировать удель­ ный расход горючего.

Вторая особенность приводит к тому, что оптимальное

значение целевой функции и соответствующие ему опти­ мальные управления становятся функциями возмущений. Это приводит к необходимости регулирования оптимальных зна­ чений управлений, если скорость смещения экстремума под влиянием возмущений невелика (дрейф экстремума). Такие функции выполняют системы экстремального регулирования.

Впротивном случае отслеживание экстремума невозможно,

ив этом случае приходится изменять критерий оптимально­ сти. В частности, если возмущения являются случайными процессами, то при оптимизации можно минимизировать среднее по ансамблю возмущений значение целевой функ­

ции G==MZ{G(U, Z) } или среднее

по времени

G^—M^ {G(U, Z) }. Первый путь обычно

применяют при

аналитических расчетах, когда известны статистические ха­ рактеристики возмущений, второй путь наиболее применим при экспериментальных методах оптимизации.

Третья особенность приводит к необходимости примене­

ния помехоустойчивых алгоритмов оптимизации, обеспечи­ вающих сходимость процесса поиска в условиях помех. Дело в том, что точные значения целевой функции и ее градиента неизвестны, а известны лишь эмпирические оценки (4-45). При этом в точке экстремума

a) G(>U*) =^=minG(£/*), б) V UG([/*) =£0.

(4-48)

Если принять, что для указанных оценок выполняются условия

V = A W )< o o , MC{V G (£/*)}-О,

то применение эмпирического (стохастического) градиент­ ного алгоритма, аналогичного (4-38),

«W + l]= tW ] - tf * + l]-VG(t/M), t = 0, 1, 2, ...,

(4-49)

может обеспечить сходимость процесса поиска лишь при оп­ ределенных ниже требованиях к коэффициенту шага.

Во-первых, очевидно, учитывая (4-486), что для обеспе­ чения сходимости U[t] к U* необходимо, чтобы

ПтуМ =0, VM>0-

(4-50)

1~-*оо

 

167

Однако слишком быстрое уменьшение коэффициента ша­

га не обеспечит сходимости даже при отсутствии

помех.

В самом деле,

рассмотрим случай, когда

|V uG(t/JY]) |^

^ II V UG(G0) II <

xj. Тогда по алгоритму (4-38)

 

||A^ + l]ll = #+l]H VuG(t/W)||^Y[/ + l]l|VuG(i;o)ll,

и перемещение из начальной точки U о за N

шагов равно

\\u[N \- и 0 \\= \\^Аищ \\к\\уиО (и0)\\

И-

 

г = 1

t - x

 

При быстром убывании y[t] перемещение может оказаться

ограниченным, и процесс оптимизации не дойдет до экстре­ мума даже при N-*-oo. Например, при выборе y[f] =Yoa‘-1»

где а < 1, получаем

n N

lim У . т[^]=То-Нт - 1~ — - = Го•—— <*>• л-*» /-1 N->« 1—а 1—а

Поэтому необходимо также, чтобы суммарное продвижение могло быть неограниченным:

2 у(/]= оо,

г-1

что .предполагает достаточно медленное убывание коэффи­ циента шага. Последнее благоприятно и в смысле помехо­ устойчивости алгоритма, так как при большом числе шагов начинает действовать закон больших чисел, в результате чего

погрешности

в оценках градиента усредняются. Однако и

слишком медленное уменьшение

ие обеспечивает полной

сходимости,

поскольку в

районе экстремума,

где

!!VUG(G)|| < е

может произойти потеря направления к экст­

ремуму. Установлено, что алгоритм (4-49) обеспечивает схо­ димость с вероятностью 1, т. е.

 

р

{lim \ \ U [ t \ — U *

|| =0} =1

 

 

/-♦00

 

при условиях (условия стохастической аппроксимации):

а) Т[*]>0, £ т ['] = ос, 2ТЧ*]<~'>

 

г= 1

г= 1

 

б)

inf М^ци — U*)TV G (U)} > 0

 

 

 

при e < |U U * |j < 8-T, e >0, (4-51)

в)

A M v TG ( G ) - v G ( G ; } < d ( l +

G TG), d>0.

168

Условия 6) и в) имеют смысл, аналогичный соответствую­ щим условиям >(4-41). Условия а) выполняются, например,

для уМ= —- —,t—0, 1, ... . К сожалению, условия (4-51а)

a+ t

имеют малую практическую ценность при дрейфе экстре­ мума, поскольку исключают .возможность .слежения за экст­ ремумом, начиная с некоторого t. В этом смысле алгоритм

(4-49) с yM—Yo более предпочтителен. Такой алгоритм, правда, даже при отсутствии дрейфа обеспечивает неасимп­ тотическую сходимость в смысле

lim Мх. { ||U [/] — U* |[ 2} < р (То, стс), t-+°°

причем р->0 при Yo ■►Оили о£—»-0. Такая сходимость (в среднеквадратичном) на практике нас всегда может удовлет­ ворить при выборе подходящего уо-

Четвертая особенность приводит к замедлению и затруд­

нению процесса поиска экстремума, что связано с конеч­ ностью скорости протекания переходных процессов в объек­ те при изменении управляющих воздействий. Дело в том, что при статической оптимизации объекта, описываемого операторным уравнением (4-46), подразумевается нахожде­ ние экстремума статической характеристики Gcr(U, Z). По­

этому при поиске экстремума информация о целевой функ­ ции GCT(U, Z) (в прямых методах оптимизации) или о ее

градиенте (в градиентных методах) должна получаться, строго говоря, только в установившихся режимах. Вслед­ ствие этого для весьма инерционных объектов часто прини­ мают меры либо по ускорению переходных процессов (обычно при шаговом движении к экстремуму), либо по компенсации влияния динамики (обычно при определении градиента с помощью синхронного детектирования). В пер­ вом случае решается задача максимального быстродействия (задача динамической оптимизации), во втором — задача выбора корректирующего (фазосдвигающего) устройства. В обоих 'случаях требуется знание динамических характери­ стик объекта по каналу управления. Поэтому при статичес­ кой оптимизации реальных объектов часто требуется пред­ варительно решать задачу идентификации. В настоящее вре­

мя удовлетворительное решение всего комплекса вышеука­ занных задач имеется лишь для некоторых классов объектов, например, представляющих последовательное соединение инерционной линейной части и безынерционной нелиней­ ной (объекты «ЛЧ —НЧ» (4-10]).

169

Таким образом, в реальных объектах процесс оптимиза­ ции обычно распадается на последовательность двух про­ цессов — получения информации о значении целевой функ­ ции или градиента и движения к экстремуму. Каждый из

них в условиях помех и инерционности объекта требует оп­ ределенного времени. Вследствие этого при дрейфе экстре­ мума возникает проблема ускорения поиска, или повышения быстродействия систем оптимизации.

§ 4-10. Промышленные системы" оптимизации

При оптимизации реальных объектов широко применяют экстремальные регуляторы (ЭР), которые автоматически отыскивают и поддерживают оптимальные значения управ­ ляющих воздействий. «Совместно с объектом оптимизации такой регулятор образует систему экстремального регулиро­ вания (СЭР). Последняя должна удовлетворять, помимо оче­ видного условия устойчивости, также условиям обеспечения требуемого качества оптимизации: точности и быстродейст­ вия.

В некоторых типах СЭР рабочим режимом является ав­ токолебательный, когда происходят колебания (рысканье) управляющих воздействий около оптимальных значений. В этом случае амплитуда автоколебаний и потери на рыс­ канье не должны превышать допустимых. Применение ЭР для оптимизации обосновано лишь тогда, если экстремум целевой функции смещается во времени, что приводит к не­ обходимости регулирования управляющих переменных. При неподвижном экстремуме целесообразнее использовать для оптимизации методы планирования эксперимента.

Рассмотренные ранее схемы оптимизации соответствова­ ли многоконтурным астатическим системам регулирования, поскольку в статическом режиме (т. е. при отсутствии дрей­ фа экстремума) установившаяся ошибка Д1/СТ=||{У*—

— £^уст11=0. При дрейфе экстремума ошибка в общем случае уже отлична от нуля. Для ее уменьшения используются те же методы, что и в системах автоматического регулирования.

Пункт 1.

В СЭР могут использоваться как прямые, так и градиентные методы

оптимизации. К

первым относятся нашедшие

широкое

применение С Э Р

с запом инанием

экстремума

(с поиском

по

приращению)

[4-10].

На

рис. 4-12 приведена структурная схема такой системы

и диаграмма

ее

работы,

где О У — объект оптимизации

со статической

характеристикой

С (U),

У У — управляющее

устройство,

И Д — исполнительный

двигатель,

170

Соседние файлы в папке книги из ГПНТБ