Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Системы экстремального управления

..pdf
Скачиваний:
15
Добавлен:
19.11.2023
Размер:
33.28 Mб
Скачать

§ 21.2. Методы теории чувствительности

Пусть связь между входом и выходом динамического объекта определяется дифференциальным оператором F:

у = F (х, U).

(21.2.1)

Здесь для простоты рассматривается объект с одним вхо­ дом и одним выходом, т. е. к = т = 1 (21.1.4).

Дифференциальный оператор означает, что связь меж­ ду входом и выходом объекта представляется обыкно­ венным дифференциальным, вообще говоря, нелинейным,

уравнением вида

VF (у(О, у , *(*),

 

fi,=u,

 

 

 

,

х, их,

 

 

 

 

 

 

 

 

 

Рис. 21.2.1.

Пример.

 

 

, и п) = 0,

(21.2.2)

где

lF — заданная функция.

Если объект линейный, то

это

уравнение

приобретает вид

 

 

«оУ{1) +

 

+

+

aty

= Ь0;zfo> +

&!*(*-*) +

 

 

 

 

 

 

 

bqx

Ь3+1,

(21.2.3

где

а0,

., аг, Ь0,

.,

Ьй+1 — заданные параметры, за­

висящие от управляемых параметров U=(u1, ..., ип), т. е.

«I =

o,i (U), bj = bj(U)(i = 0,

l; j = О,

g +

1)-

 

 

 

 

 

(21.2.4)

П р и м е р 1. Пусть объектом является апериодическое

звено, показанное на рис. 21.2.1, где

= щ, R2 — и

являются

управляемыми параметрами сопротивлений

 

Записываем уравнение объекта (1— 1, д—0): ÿ -f-

= ---- ^-или a0ÿ -f- агу = Ь0х.

Получаем

а0 =

R^R^u^u^

аг =

1

1

 

 

 

 

— ;

Ъ0 — — ; Ьг = 0.

 

 

 

 

А

из

иг 7 1

 

 

 

 

Теперь рассмотрим процесс оптимизации показателя

качества

т

 

 

 

 

 

 

 

 

(21:2.5)

 

 

Q (U ) = \ Ф [у (01 dt.

 

о

градиентным методом (21.1.9). Для этого оценим градиент

grad Q ( £ 7 ) = § ■ = $ - g - & it.

(21.2.6)

О

 

Так как вид функции ф (у) известен, то определение про­ изводной d<p/dy не представляет труда.

Производная

4

$> - = graduV(t)

(21.2.7)

определяет вектор, составляющие которого

диг

M L1

(21.2.8)

дип \

 

являются параметрами чувствительности объекта к из­ менениям параметров и0, ult ., ип.

Действительно, изменим один из параметров, например щ, на некоторую малую величину ôuf. Очевидно, что при этом несколько изменится и выход объекта: вместо у (t) получим у (t) + ôy (t). Определим добавку ôу (t). Раз­ ложим выход объекта в ряд Тейлора по вариации пара­ метра ôu{:

Ув(0в У(0 + * и » - ^ - 4

(ОД8

дЬ/ (t)

 

,

(21.2.9)

2

du?

^

• »

 

 

Ограничиваясь ввиду малости линейным приближени­ ем, получаем

ày W =

Как видно, функция ду (t)!dui определяет чувствительность выхода по отношению к вариации параметра ut в момент времени t.

Вектор (21.2.8) обычно жазывают векторомчувствитель­ ности. При изменении всех параметров вариация выхода

рассчитывается по следующей очевидной формуле:

 

П

 

6у(0 = [М7, grad„ÿ(ï)l = 2

(21.2.11)

i=l *

Таким образом, зная вектор чувствительности (21.2.8),

т. е. умея

определять

все п функций

чувствительности

ду (t)/dui (i

= 1,

.,

ri), очень просто

реализовать бес-

поисковую схему экстремального управления. В качест­ ве примера рассмотрим один частный случай.

П р и м е р 2. Функция чувствительности безынерцион­ ного объекта. Пусть уравнение объекта в линейном слу­

чае имеет вид у =

Ь0х +

&iî тогда

функции чувствитель­

ности равны

 

 

 

 

 

 

 

 

 

 

ду

_

дЪо .

дЪх

(i = l,

., п)\

 

(*)

 

ди|

Х du.

'

dui

 

так как зависимость Ь0 и Ъг от параметров и17

., ип

предполагается

известной, то функции чувствительности

 

 

 

 

 

 

 

легко вычисляются. Те­

 

 

 

 

 

 

перь

можно

построить

 

 

 

 

 

 

беспоисковую

систему

 

 

 

 

 

 

экстремального

управ­

 

 

 

 

 

 

ления. Она показана на

 

 

 

 

 

 

 

рис.

21.2.2.

Здесь ис­

 

 

 

 

 

 

полнительный механизм

 

 

 

 

 

 

ИМ

реализует

ре­

 

 

 

 

 

 

 

куррентную

формулу

 

 

 

 

 

 

 

(21.1.10), а блок grad у

Рис. 21.2.2.

Блок-схема

беспоиско-

определяет

функции

вой системы

экстремального

управ­

чувствительности

по

ления методом чувствительности.

формуле (*),

для чего

ния управляемых параметров.

необходимо знать значе­

Схема

работает

потактно

с периодом

Т,

необходимым

для

вычисления

интеграла

(21.2.6). В конце каждого такта

значение grad Q пере­

дается в ИМ, который изменяет оптимизируемые

пара­

метры в соответствии с формулой (21.1.10).

 

 

П р и м ер З . Еще упростим предыдущий пример. Пусть

Ь0 =

0, т. е. выход объекта не зависит от входа и, следо­

вательно,

объект

является статическим: у = Ъ1ч тогда

ду _

dbi

 

., n), т. e. вектор чувствительности

-fa----- fa^ (t = 1,

i

i

с градиентом выхода объекта. Теперь, если в

совпадает

функционале (21.1.6) положить Т 0 и <р (у) = , т. е.

Рис. 21.2.3. Блоксхема беспоискового управления ме­ тодом чувствитель­ ности статическим
экстремальным
объектом.

ряет смысл, получим Q = / (у) и grad Q = f (у) grad у. Полагая / (у) = у, получаем grad Q = grad у. Это озна­ чает, что для статических объектов вектор чувствитель­ ности совпадает с градиентом показателя качества. Блоксхемная реализация этого случая показана на рис. 21.2.3. Любопытно, что получилась система управления без об­ ратной связи (выход объекта у не используется в процессе управления). Это получилось за счет того, что известная аналитическая за­ висимость выхода от оптимизируемых

параметров у = у (U) дает возможность вычислять градиент, т. е. не пользо­ ваться выходом объекта. Правда, такую схему трудно назвать системой экстре­ мального управления. Получилась си­ стема жесткого управления, которая, как известно, эффективна для управле­ ния неизменными объектами с полной информацией, что и имеет место в данном случае. Поэтому схему, рассмот­ ренную на рис. 21.2.3, никак нельзя рекомендовать для экстремального управления реальными объектами.

Продолжим обсуждение задачи определения функций чувствительности для более сложного случая. Обозначим для простоты функции чувствительности через

-^ - = сц (г = 1 ,. . ., п).

(21.2.12)

г

 

Составим дифференциальное уравнение для определе­ ния функций чувствительности. Пусть объект линеен, т. е. описывается уравнением вида (21.2.3). Продифференци­ руем это уравнение по ut. Получаем для я0= 1

<4° + а !а[г1} +...+ a fli, =

дК

дЪп..

- Xко)

 

дал

дач

ди. У

dui

да

— —— ди~У' (21.2.13)

Это дифференциальное уравнение относительно функции чувствительности а,- обычно называют моделью чувстви­ тельности. Порядок этой модели равен порядку уравнения

объекта, а в его правую часть входят производные входа и выхода объекта. Таким образом, для определения функции чувствительности следует решить уравнение объекта (на его модели), определить производные выхода объекта и решить уравнение (21.2.13).

Блок-схема этой процедуры показана на рис 21.2.4.

В случае нелинейного уравнения объекта (21.2.2), дифференцируя его по щ, по­ лучаем модель чувствитель­ ности в виде

 

 

ат

.,о .

ат аГ,+ ^ +

 

 

ау(,)

«?>

 

 

 

Рис. 21.2.4. Блок-схема опре­

+ 4

^

=

- | ^

(21-2.14)

деления функции чувствитель­

ду

" г

 

ди.

 

ности.

где

коэффициенты

 

 

 

ду№

 

 

 

 

 

 

(А = 1,. . .,

I) зависят известным образом от у^1~х\

. . ., у,

. . ., х,

и1У. ., ип. Полученное уравнение—линейное

с переменными параметрами. Решается оно аналогично с использованием модели объ­ екта.

Обычно задачу определе­ ния функций чувствительно­ сти ставят проще. Для этого в качестве переменных выби­ рают коэффициенты уравне­ ния объекта с правой частью х (t):

ЩУ{1) + Щ.ÿ(î_1) + • • • +

+ щу = х (t). (21.2.15)

В этом случае уравнение чувствительности (21.2.13) принимает вид

Рис. 21.2.5. Блок-схема опре­ деления функции чувствитель­ ности для объектов типа (21.2.15).

щ а ^ + п1а{1-1) + . . . + щ е ц = — у & . (21.2.16)

Как видно, левые части уравнения чувствительности и уравнения объекта совпадают с точностью до обозначений, т. е. их модели идентичны.

Блок-схема определения функций чувствительности показана на рис. 21.2.5, где прямоугольниками изобра­ жен оператор модели

 

 

W(p) = _______ 1________

(21.2.17)

 

 

u oPl "b U1Р 1~Х + ••• +

и 1

 

Однако

для

определения функций

чувствительности

а 0, . . .,

а„ можно обойтись не I + 2, как показано, а дву­

мя блоками W (р). Блок-схема реализации этого метода

показана

на

рис. 21.2.6.

 

 

Рис. 21.2.6. Блок-схема упрощенного ме­ тода определения коэффициентов чувстви­ тельности.

Обоснованием такого алгоритма могут служить сле­ дующие соображения. Обозначим оператор левой части уравнения чувствительности (21.2.16) через L (а*), т. е.

L (а*) = щаР +

. . . +

ща^

(21.2.18)

Из (21.2.16) получаем

 

 

 

dL (а.) =

_ ÿ(i+i).

 

(21.2.19)

Однако

 

 

 

 

=

■£,(*„).

(21.2.20)

Подставляя эти выражения в (21.2.16), получаем

L (àj)

= L (ai+1),

(21.2.21)

откуда получаем

dot.

 

&i =

(21.2.22)

= сц+1.

(Доказательство легко сделать от противного.) Это обстоя­ тельство и дает возможность воспользоваться одной

Рис. 21.2.7. Блок-схема системы беспоискового экстремального уп­ равления с моделью чувствитель­ ности.

моделью чувствительности так, как показано на рис. 21.2.6. (Заметим, что верхние выходы W (р) на рис. 21.2.5 и 21.2.6 являются последовательными производными правого вы­ хода, что эквивалентно (21.2.22).)

Преимущество схемы 21.2.6 заключается еще и в том, что вместо одной (первой) модели объекта можно восполь­ зоваться самим объектом, тем самым сократив число необходимых моделей до

одной.

Таким образом, вектор чувствительности может быть всегда определен, коль скоро известна модель объекта.

Теперь блок-схему бесноисковой системы экстре­ мального управления мож­ но представить в виде, по­ казанном на рис. 21.2.7. Здесь исполнительный ме­

ханизм ИМ реализует работу градиентного алгоритма (21.1.9) и образует оптимизируемые параметры U. Ф — опе­ ратор вычисления градиента показателя качества по форму­ ле (21.2.6). Модель объекта работает как модельчувствитель­ ности. Заметим, что это — схема беспоискового экстре­ мального управления объектом вида (21.2.15). Другого ви­ да объекты потребуют более сложной модели чувстви­ тельности.

§ 21.3. Беспоисковая идентификация объектов

Задача беспоисковой идентификации объектов сфор­ мулирована в примере 5 § 21.1.

А. Безынерционный объект. Для простоты начинаем со случая, когда объектом является безынерционный пре­

образователь с к входами X = {хх,

., х к) и одним вы­

ходом у:

 

y = f{X).

(21.3.1)

Случай объекта со многими (т) выходами сводится, очевидно, к тд-кратному решению такой задачи, так как

каждый новый выход образует новую задачу такого же вида. Задача идентификации сводится к построению его модели:

 

У« = у(Х,

U),

(21.3.2)

минимизирующей невязку

 

 

 

 

ô (Z7) = [/(X) -

ф(Х, U)]2—*■mm.

(21.3.3)

Для этого, прежде всего, следует выбрать класс функ­

ций, по которым

можно разложить выход объекта, что

дает возможность

представить

его модель в виде

 

 

 

П

 

 

 

 

у(Х,Р) =

2 и Л

(Х),

(21.3.4)

 

 

 

;= 1

 

 

 

где функции ф; (X) (/ =

1, .. .,

п)

являются

скалярными

функциями векторного аргумента X. Приведем примеры

таких функций.

П о р о г о в ы е

ф у н к ц и и . Они за­

П р и м е р 1.

писываются в следующей форме:

 

 

ф.(Х )= 1 ‘

при

XejEQi,

 

 

 

( 0

при

 

где область Q* может быть задана самым различным об­

разом. Например, в линейном случае

 

X е й.»

если [Аи X] > 0i,

 

X ç£Qu

если

 

Х]^0{,

 

где Ai = (а£° , .

а{^)

и

0г — параметры

функции <рг.

Эта функция легко реализуется на пороговых (релейных) элементах.

К о л о к о л о о б р а з н а я

ф у н к ц и я .

Ее обыч­

но записывают в виде

 

 

(^ 0 ~ \ Х

 

где вектор A t определяет положение центра

«колокола».

Э к с п о н е н ц и а л ь н а я

ф у н к ц и я

(X) =

Г \ Х — А. \1

 

 

= expl---------

2----

• Здесь A t — положение центра

«колокола», a crf — его «ширина» (это его радиус на вы­ соте Не от основания).

Продолжим обсуждение задачи беспоисковой иденти­

фикации. Оценим градиент

невязки. Для

этого следует

 

(21.3.4)

подставить в

(21.3.3):

 

6 (Р )= [ / ( X ) - I ^ ( X ) ] 1

 

 

 

1-1

(21.3.5)

 

Градиент невязки

равен

 

 

grad à (U) = —2 i y - y J <p ( X ) ,

 

 

 

 

 

(21.3.6)

 

где вектор q> (X) имеет вид

Рис. 21.3.1. Блок-схема

<р(Х)=[ф1(Х),<р2(Х), ....

фА(Х)].

 

 

 

 

(21.3.7)

беспоисковой идентифи­

 

 

 

 

 

кации нединамических

Эти

формулы дают возможность

объектов.

построить

систему

беспоисковой

идентификации. Она показана на рис. 21.3.1. Здесь

исполнительный механизм реализует операцию

интегри­

рования:

 

Ü = — (у — Ум) Ф (Я) dt,

(21.3.8)

где ц — положительная постоянная. Это выражение и решает задачу беспоисковой идентификации.

Бели измерения выходов объекта и модели производятся дискретно в моменты времени tx, t2, . . ., tif . . ., то алго­ ритм идентификации (21.3.8) приобретает вид

tfi+i = ü I — ц (уt — yMi) ф (Х{),

(21.3.9)

где

 

 

Ut = U (iff); yt = у (U); ум = ум ( =

X (h). (21.3.10)

Рассмотрим задачу выбора постоянной р [21.4]. Как легко заметить, существует оптимальное на каждом такте значение этого параметра.

Для его определения нужно решить задачу

{yi — [U|+1, ф (Хг)1 }2 min, И'

т. е. задачу минимизации рассогласования выходов объек­ та и модели на каждом такте. Из (21.3.11) следует, что для этого достаточно удовлетворить равенству

Vi = [Ui+1, ф

(21.3.12)

Подставляя сюда (21.3.9), получим уравнение относитель­ но

у, = [и и Ф (Х{)] - pi (у,- - умг) [Ф (X,), ф(Х4)], (21.3.13)

откуда получаем оптимальное значение параметра р на l-м шаге идентификации:

 

 

14 ”

 

 

 

 

(21.3.14)

 

 

 

 

 

 

 

П р и м е р 2.

Рассмотрим

частный

случай, когда

ф{ (X) =

Xi, т. е. модель является линейной

регрессией.

В этом

случае

п =

к + 1,

фй+1 (X) =

1

и получаем

 

Ui+1 = Ui — р (yi

 

УмО (Xi,

1).

 

Здесь вектор

1)

= (*<■>, 4

 

••. 4 К

1).

 

( х „

’,

Б. Динамический объект. Для простоты рассмотрим одномерный объект, т. е. к = 1. Пусть модель динамиче­ ского объекта имеет передаточную функцию

П

И'»(Р)=

(21.3.15)

 

i=l

где Wt (р) — передаточные функции звеньев, образующих эту модель. Таким образом, объект аппроксимируется па­ раллельной суммой динамических звеньев [21.3], взвешен­ ных с весами щ, . ., ип, которые подлежат определению (рис. 21.3.2). Пусть Wo (р) — передаточная функция объе­ кта, которую следует идентифицировать. Тогда невязка объекта и его модели имеет вид

Q (U) = UW„ (р) - Wx (p)I I (<)}2. (21.3.16) Ее градиент равен

grad Q (U) = - 2 (у - ум) W { p ) x (t), (21.3.17) где вектор W (р) имеет вид