Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Уткин, В. И. Скользящие режимы и их применения в системах с переменной структурой

.pdf
Скачиваний:
96
Добавлен:
21.10.2023
Размер:
10.09 Mб
Скачать

§ 3]

ОДНОМЕРНАЯ ОПТИМИЗАЦИЯ

241

Движение системы в области Е, определяемой услови­ ем (12.8), имеет колебательный характер, и согласно (12.15) средняя скорость изменения входной величины в этой области оценивается неравенством

df

|*ср | = л ------- — < А < Ц 0-

(12.18)

г

 

Непосредственно из сопоставления (12.17) и (12.18) видно, что попытка ускорить процесс поиска за счет увеличения скорости изменения задающего воздействия р не приведет к желаемым результатам, так как, во-первых, согласно (12.18) замедляется скорость сходимости процес­ са поиска в области Е, и, во-вторых, с ростом р увеличи­ вается сама область Е. В связи с этим возникает задача построения такой системы, в которой без непосредственного измерения величины df/dx скорость изменения задающего воздействия р выбирается близкой к максимально возмож­ ной скорости выходной величины объекта, равной \dfjdx\ и0. В такой системе при возникновении скользящего режима'Дэудет обеспечено монотонное движение к экстремуму со скоростью, близкой к максимальной. Для получения системы с таким свойством выберем величину А равной и0, а задающее воздействие g (t), в отличие от системы (12.3),— зависящим от функции управления следующим образом:

(12.19)

где Ро — const, ро > 0, а иср — среднее значение управле­ ния, о котором шла речь в § 6 главы II и которое может быть получено с помощью инерционного звена с достаточ­ но малой постоянной времени т. Поясним, каким образом осуществляется поиск экстремума в системе (12.3) со ско­ ростью задающего воздействия, изменяющейся в соответвии с (12.19). При отсутствии скользящего режима управ­ ление и равно и0 или — и0, знак иср совпадает со знаком и*) и, следовательно, скорость задающего воздействия р

*) Знаки иср и и совпадают, если постоянная времени %доста­ точно мала и можно пренебречь собственным движением фильтра.

9 В, И. Уткин

242

ПРИМЕНЕНИЕ

СКОЛЬЗЯЩИХ РЕЖИМОВ

[ГЛ.

XII

равна

нулю. Из соотношения (12.6)

следует,

что

при

р = 0

в любой точке

вне экстремума

выполняется,

по

крайней мере, одно из неравенств s1s1 < 0 или s2s2 < О и согласно (1.9) в системе всегда возникнет скользящий режим. Эти рассуждения в какой-то мере носят качествен­ ный характер, так как было сделано предположение о том, что постоянная времени инерционного звена т является достаточно малой величиной. Анализ поведения системы с учетом собственного движения инерционного звена по­ казывает, что для возникновения скользящего режима достаточно, чтобы выполнялось соотношение 2тр0 In 2 < Д (2Д — ширина гистерезисной петли в устройстве, реали­ зующем функцию v).

Для вывода условий существования скользящего режима в си­ стеме (12.3), (12.19) будем считать, что вспомогательное управление v обеспечнло'начальные условия .5,х2<Г0ичто и началышймомент времени

df

0, а выходная велпчнна инерционного звена (12.19) иср отри­

цательна, т. е.

совпадает по знаку с управлением и. В соответствии

с (12.3),

(12.7),

(12.19)

в этом случае

 

S2 =

(

и

\

df

 

- p ° V J - ^ Sigau° p j -

=

 

 

 

 

 

dj_

 

 

=

— Po (1 +

Sign S2 sign Ucp) — Uq dx Sign S2.

( 12.20)

При указанных начальных условиях величина s2 согласно (12.20) убывает, а величина иср до момента смены знака s2 остается

отрицательной, так как вср является выходом инерционного звена,

с отрицательным

входом. После того как величина s2 сменит знак,

So определяется

выражением

 

 

 

 

 

 

dj_

(12. 21)

 

S2 — — 2ро -|- ио dx

Очевидно, что при 2ро < ио

df_

возникает скользящий режим

dx

вточке s2 — 0. В противном случае s2 будет продолжать убывать при

и0 до тех пор, пока величина иор, определяемая пз уравне­

ния тмср -(- иср= + 1, ие станет положительной, после чего в си­

стеме возникнет скользящий режим. Приведенные рассуждения, разумеется, справедливы, если во время рассмотренных движений величина v равна нулю, т. е. s2 )> — Д. Величина s2 принимает ми­ нимальное значение в момент времени Т смены знака иср, которое

согласно (12.21) оценивается неравенством

s2 min ^ 2о0Г.

(12.22)

§ 4] ОПТИМИЗАЦИЯ МНОГОМЕРНОГО ОБЪЕКТА 243

т

Оценим величину Т из уравнения 0 = 1 — [1 — ыср (0)]е т с уче­ том условия |wcp (0) |< 1: Т = г lu [1 — пср (0)] < т In 2.

Подставляя это значение в неравенство (12.22), находим условие, при котором s2min > — Д:

2р0т In 2 < Д.

(12.23)

Таким образом, при выполпении условия (12.23) в рассматри­ ваемой системе всегда возникнет скользящий режим. (Нетрудно

убедиться в том, что такой же результат имеет место и для слу­

df

чаев, когда в начальный момент времени величины ^ и иср не яв­

ляются отрицательными.)

Как было установлено в главе II, для получения урав­ нений скользящего режима нужно вместо управления и подставить в систему цэкв — эквивалентное управление, которое равно ггср. Это означает, что величина скорости Задающего воздействия (12.19) в скользящем режиме равна

(12.24)

В (12.24) ы8КВ— некоторая непрерывная функция, кото­ рая согласно необходимому условию возникновения скользящего режима (3.3) заключена между — и0 и и0. Приведенные рассуждения позволяют сделать вывод о том, что скользящий режим будет иметь место при любом зна­ чении р„. В силу ограниченности управляющего воздейст­ вия и выходная величина объекта может отслеживать лишь ограниченные по скорости задающие воздействия, опреде­ ляемые величиной р. Это означает, что при стремлении р0 к бесконечности величина |иакв | должна стремиться к и0. Так как х = и, а в скользящем режиме х — м8КВ, то в пределе входная величина х изменяется с максималь­ ной скоростью.

§ 4. Оптимизация многомерного объекта

Рассмотрим теперь задачу многомерного поиска, когда входной параметр объекта х является re-мерным вектором с компонентами хх, . . ., х пи задача состоит в минимизации скалярной выходной величины у = / (х).

Для решения этой задачи воспользуемся широко рас­ пространенным приемом, который предполагает исполь-

9*

244

ПРИМЕНЕНИЕ СКОЛЬЗЯЩИХ РЕЖИМОВ ' [ГЛ. XII

зование

какого-либо метода одномерной оптимизации

и изменение тем или иным способом направления поиска в пространстве входных параметров [115] (например, пе­ риодически, в зависимости от состояния системы, случайным образом и т. д.). Движение такой системы описывается уравнениями

х = ки,

(12.25)

где к — кусочно-постоянный вектор (кг, . . . кп), а скаляр­ ное управление и зависит от того, какой метод одномерной оптимизации используется. Выберем управление и в соот­ ветствии с описанным в § 1 алгоритмом поиска (12.3), (12.7) для случая, когда скорость задающего воздействия р меняется согласно (12.19), а величина А равна и0.

Запишем уравнение движения системы относительно выходной величины

у = (grad f-k) и,

(12.26)

где grad/ — вектор-строка с элементами-^-.

 

i

 

При постоянном векторе к изображающая точка будет двигаться из любого начального положения вдоль пря­ мой, параллельной этому вектору, вплоть до достижения условного экстремума на этой прямой в точке (grad / •к) = = 0. В момент достижения условного экстремума следует изменить направление поиска за счет изменения вектора к. Покажем, что если движение к экстремуму происходит в скользящем реяшме, то информация об этом моменте может быть получена за счет измерения иср равного ггэкв. Для вычисления иэкв воспользуемся уравнением (12.6), которое в нашем случае согласно (12.19), (12.26) запишет­ ся в виде

ё = — Ро ( i - — — (grad/-Л) и.

Величина цэкв является решением уравнения 8 = 0 от­ носительно и. Найдем |ишв |, имея в виду, что в скользящем режиме иср = иэкв:

_________ ррЦО__________

(12.27)

ЭДаки — ро — «о (grad / •/с) sign uaKD ’

(.

КI “кпЦэкпI

 

Ч 1 - - - — }

(1 2 .2 8 )

Wqkr --- --- '

grad f-k

§ 5]

ОПТИМИЗАЦИЯ ПРИ НАЛИЧИИ ОГРАНИЧЕНИЙ

245

Так же как и в одномерном случае, величина |цэкв|заклю­ чена между нулем и и0. Из этого условия и (12.28) следует,

что sign иэкв = — sign (grad /•& )/т. е. уравнение (12.27)

.имеет вид

Рэкв! - p0 + K0|grad/.A| “ о-

Это соотношение означает, что по мере приближения к условному экстремуму (т. е. к точке grad / = 0) величи­ на мэкв приближается к и0. Этой информацией можно вос­ пользоваться, замерив величину ггср, равную ггэкв, с по­ мощью фильтра (12.19), и изменив направление поиска, когда

Щ— |макв|^ 6о,

(12.29)

где б0 — некоторое достаточно малое положительное чис­ ло. Законы изменения вектора к могут быть самыми раз­ личными. Например, в соответствии с процедурой метода Гаусса — Зейделя поочередно будем выбирать одну из компонент отличной от нуля, а остальные — равными нулю, или же значения компонент вектора к будем назначать случайным образом и т. д. Мы здесь оставляем в стороне вопросы о сходимости, так как они весьма мало связаны со спецификой работы предлагаемых здесь алгоритмов поиска и в основном определяются видом оптимизируе­ мых функций. Отметим лишь, что при решении задачи оптимизации многомерных объектов также не использу­ ются какие-либо устройства, предназначенные для изме­ рения вектора градиента или различных его проекций. По сравнению с одномерным случаем нужно предусмот­ реть лишь элемент, изменяющий направление поиска в функции эквивалентного управления, которое легко по­ лучить в результате усреднения разрывного управления.

§ 5. Оптимизация при наличии ограничений на входные параметры

Во многих случаях может оказаться, что при решении задачи оптимизации вектор аргументов оптимизируемой функции / (я) не может выбираться произвольно. Такие постановки характерны также для различных задач про­ граммирования. Рассмотрим сначала случаи, когда

246

ПРИМЕНЕНИЕ

СКОЛЬЗЯЩИХ РЕЖИМОВ

[ГЛ. XXI

ограничения являются равенствами

 

 

(ж) = 0

(£ = 1, . . ., иг).

(12.30)

Идея решения этой задачи на основе использования скользящих режимов состоит в следующем. Введем допол^ нительное nz-мерное управление в систему (12.25), каждая' компонента которого претерпевает разрывы на соответст­ вующей поверхности уг (х) — 0. С помощью этого управ­ ления обеспечим движение в скользящем режиме по пере­ сечению поверхностей y t {х) = 0 (г = 1, . . ., т) при лю­ бом значении вектора ки и, следовательно, ограничения (12.30) на входные параметры будут автоматически вы­ полняться. После этого будем решать задачу об оптимиза­ ции с помощью описанного в § 4 метода.

Уравнение системы, с помощью которой реализуется

намеченный план, имеет вид

 

 

 

 

 

х =

ки +

ByUy,

 

(12.31)

где Ву — некоторая

матрица размерности п X т,

гг'1— т-

мерное управление с компонентами ul, . . ., Um'

 

| u f

при

Т г И > 0 ,

 

 

(12.32)

1 иГ

при

Тх (х) < 0,

(£ = 1, . . .,

иг).

 

Матрицу By и величины

и и\~ выберем таким образом,

чтобы на пересечении уг

(ж) —- 0 (г 1, . . .,

т)

удалось

организовать скользящий режим с помощью метода

иерархии

управлений. Пересечение у; (х) = 0 (£ = 1,...

. . ., т) будет многообразием скольжения, если для систе­

мы (12.31)

выполняются аналогичные (3.30) условия:

grad Yr+i brr+1u%i <

min

и grad Yr+i*r —

 

Y

Y

 

u>ur+

%

 

 

m—r

 

2 gradYj.+i^rV^i],

 

 

i= 2

grad 4 ,.+1b'r+1Ur+x)>

max

(12.33)"

Г и grad Yr+i kr

 

Y

Y L

 

w*ur+2'*’*» um

m—r

— 2

grad Yr+ib?+V+i 1.

i—2

-* >

§ 5] ОПТИМИЗАЦИЯ ПРИ НАЛИЧИИ ОГРАНИЧЕНИЙ 247

Элементы, входящие в неравенства (12.33), которые долж­ ны выполняться для всех г — 0, . . ., т — 1, находятся в соответствии с описанной в главе IV процедурой, ис­ пользованной для получения уравнений (3.27).

Условия (12.33) можно выполнить, если известны зна­

ки функций grad у,.+1Ьг+1 (г = 0, . . ., т — 1). В тех слу­ чаях, когда такая информация отсутствует, можно вос­ пользоваться предложенным в § 2 принципом управления объектом со знакопеременным коэффициентом усиления. Согласно этому принципу каждая компонента управле­ ния должна претерпевать разрывы уже на двух «близких» поверхностях

 

 

uj =

uoi sign yayi2,

 

(12.34)

 

 

Tii =

Ti +

 

 

 

 

 

 

 

 

 

 

 

Ti2 =

Ti +

+ 5,

 

 

 

где uoi — const,

6 — малая

положительная величина,

а функция соi по аналогии с v (12.7)

обеспечивает в системе

начальные условия уг1уг2 < 0:

 

 

 

 

шг

’ — М g при Ти — А >

0 и Ti2>

0,

(12.35)

— acoi при (Та + А) (т« — А) <

0,

 

. М

при Tii <

0 и Ti2+ А <

0.

 

В (12.35) a, М — const, а

0, М )> 0, 2А — ширина

гистерезисной петли, на интервалах |y ix |<

А, |уг2 |< А

величина сог сохраняет то значение (— М , — асог

или М),

которое она имела до попадания в эти интервалы. Величи­ на М такова, что для любого i — 1, . . ., т создаются на­ чальные условия y;iYi2< 0- Тогда при соблюдении иерар­ хии управлений компонента и[ обеспечит возникнове­ ние скользящего режима по одной из поверхностей уи = 0

или у12

= 0 (как это имело место в разобранной в §

2 одно­

мерной

задаче), компонента к2 — по пересечению

одной

из этих поверхностей с поверхностью у21 = 0 или Y22 = 0

и т. д. Так как величины

со;, являясь решением уравнений

сЬг = — сссоi,

стремятся

к

нулю,

то все поверхности

Уп — 0 и у 1г

0 асимптотически

приближаются к по­

верхностям yi

= 0 (с точностью до б), что и позволяет вы­

полнить ограничения (12.30)

без использования информэ-

248

ПРИМЕНЕНИЕ СКОЛЬЗЯЩИХ РЕЖИМОВ

[ГЛ. XII

ции о градиентах функций Yi (я)- Соотношения, которые позволяют выбрать величины aoi, также могут быть полу­ чены с помощью рассуждений, которые позволили выпи­ сать условия (3.30). Специфика состоит в том, что в урав­ нениях (3.29) должны быть учтены производные по време-'' ни от функций к»; и должны быть известны диапазоны изме­ нения компонент градиентов функций уг (х). В результате приходим к следующим соотношениям:

По, т > sup |gradT^

, +1| (| и grad T,.+1/tr |+

m—г

 

+ 2 |grad Tr+i^r

и0) r+i |+ а |cor+1 | (r = Q , . . . , m — lV

i=2

'

 

(12.36)

В (12.36) следует вычислить верхнюю страницу по всем компонентам векторов градиентов, по юг+1, которые опре­ деляются областью рассматриваемых значений х, а также по всем компонентам вектора к *). В обоих случаях (12.31) и (12.34) уравнения скользящего режима по пересечению поверхностей Yi = 0 (i = 1, . . ., т), определяемые мето­ дом эквивалентного управления, имеют вид

х = В.< (GyB-t)*1 Gy]ku,

(12.37)

где Gч — матрица, строками которой являются градиен­ ты функций уг (i = 1, . . ., тя).

Задача выбора основного управления решается в соот­ ветствии с описанным в § 3 методом оптимизации без ограничений. При произвольной последовательности из­

менения вектора к дополнительные управления и\ «на­ правят» вектор фазовой скорости, определяемый из (12.37), вдоль пересечения поверхностей разрыва, что и гаранти­ рует выполнение ограничений (12.30).

*) Если окажется, что величина grad -уГ+11Ь^+1 близка к нулю,

то следует изменить направление вектора b£+1. Это можно сделать автоматически в соответствии с предложенной в § 3 методикой — замерить uj+1 экв и при приближении |и^+1 0КВ |к предельному значению и-г+1, 0 (что свидетельствует о приближении величины grad уГ+1&£+1 к нулю) изменить компоненты вектора Ь^+1-

§ 5]

ОПТИМИЗАЦИЯ ПРИ НАЛИЧИИ ОГРАНИЧЕНИЙ

249

 

Синтез управляющего устройства следует начать с вы­

бора управления и, а затем, следуя процедуре метода иерархии управлений, выбрать потом Um-i и т. д. вплоть

/' до и{.

Рассмотрим теперь ограничения

типа неравенств

M s ) < 0

(i = l , .

. . , Z) .

(12.38)

Введем дополнительные координаты zx, . . ., z, и, считая ихТтакже входными параметрами, применим описанный в этом параграфе метод для нахождения минимума функ­ ции / (х) при наличии ограничений типа равенств

h\ (х, ъ) = hi (х) + z4 •— 0

(Z = 1,. . . , Z).

(12.39)

Очевидно, что решение этой задачи совпадает с решением задачи без ограничений. Действительно, если х* — точка минимума функции / (х), то величины z; будут определены

таким образом, чтобы /г; (х*) = — z ,, т. е. поверхности.

hi (х, z*) = 0 в пространстве х, z пройдут через точку х*. Может оказаться, что точка х* лежит в запрещенной нера­ венствами (12.39) области. В связи с этим нужно преду­ смотреть в системе элементы, которые не допустили бы отрицательных значений координат zu так как при выпол­ нении условий (12.39) это приведет к нарушению органичений (12.38). Такой подход может быть реализован в си­ стеме, описываемой уравнениями

х = кхи + Bhuh,

(12.40)

2 = kzu -f- BhUh + uz,

где z — вектор с компонентами zl5 . . ., z,, матрицы Bh,

Bh, n- и Z-мерные векторы k x и k z, скалярное и векторное управления и и и'1выбираются так, чтобы решить задачу оптимизации при наличии ограничений (12.39), которую мы уже рассмотрели. Компоненты Z-мерного вектора пг претерпевают разрывы на плоскостях z; = 0:

Mz при Zi < 0,

0 при Zi^> 0,

(12.41)

 

М - > max (kfu + 2 b'-fli-j, i = l,...,Z,

(12.42)

..

h

3=1

 

, и, Uj

250

ПРИМЕНЕНИЕ СКОЛЬЗЯЩИХ РЕЖИМОВ

СГЛ. XII

к\, btf — элементы вектора kz и матрицы B"h, и? — компо­ ненты вектора uh. Условие (12.42) означает, что положи­ тельная величина Мг всегда превосходит любой элемент

вектора кги -}- Bh.nh, и из этрго условия следует, что в разрешенной области управление иг на движение не влияет.

В этой системе будет осуществляться поиск точки х* и эта точка будет найдена, если она лежит в допустимой области. Если же ограничения являются существенными и точка х* находится в запрещенной области, то в процессе поиска траектории изображающей точки, лежащие на

поверхностях hi = 0, попадут на одну или несколько плоскостей zt = 0, и при выполнении условия (12.43) на пе­ ресечении этих плоскостей возникает скользящий режим. В результате движения в скользящем режиме, так же как и в задаче с ограничениями типа равенств, будет най­ ден условный экстремум на границе допустимой области. Если на координаты системы наложены ограничения обоих типов (12.30) и (12.38), то для решения следует использо­ вать оба алгоритма одновременно.

Для того чтобы гарантировать сходимость всех приве­ денных здесь алгоритмов, нужно сделать соответствующие предположения о виде оптимизируемой функции и о функ­ циях, задающих область допустимых значений входных параметров, например, ограничиться рассмотрением лишь выпуклых функций.

§6. Обсуждение метода оптимизации

Вэтом параграфе мы кратко обсудим возможности при­ менения алгоритмов с постоянной и переменной скоростью поиска для нестационарных объектов, а также различные способы организации многомерного поиска иа основе ис­ пользования специфических особенностей этих алгоритмов.

Поиск экстремальной точки услоясняется в случае, когда координаты этой точки и вид нелинейной характе­ ристики изменяются во времени. Это обусловлено тем, что для нестационарной характеристики затруднено измерение компонент градиента (или знаков каких-либо его проек­ ций). Попытаемся с помощью алгоритма (12.3) осуществить оптимизацию нестационарного объекта, описываемого

Соседние файлы в папке книги из ГПНТБ