книги из ГПНТБ / Сейдж Э.П. Идентификация систем управления
.pdf4.2] М ЕТОДЫ ИДЕНТИФИКАЦИИ |
СТАТИ ЧЕСКИ Х |
СИСТЕМ |
Щ |
||
5) определить |
|
|
|
|
|
„ h i |
= _ dQ(ui+1) |
|
1MB (uif l)/rfut+1|p |
, |
|
V |
tfui+1 |
'Г |
ИdQ (uydu1|p |
V ’ |
|
6) вернуться к пункту 3) и повторять вычисления до |
|||||
тех пор, пока и не перестанет заметно изменяться |
от |
||||
итерации к |
итерации. |
|
|
|
|
Пример 4.2.3. Рассмотрим снова решение системы |
|||||
линейных уравнений Аи = |
Ь. Вновь используется квадра- |
||||
тичная функция штрафа J — 0 (и) = у (Аи — b)T R (Аи — Ь).
Выберем и1, |
тогда |
у'1 — ATR (Аи1 — Ь). |
|||
Заметил!, |
что |
|
|
|
|
|
и2 = |
и1 — /c1ATR (Аи1 — Ь), |
|||
где к1 выбирается |
|
так, |
чтобы |
минимизировать |
|
/г = 0(u2) = - L (Аи1 - |
AA^RAuW + AATRb/H - Ь)т х |
||||
X R (Аи1 - |
AATRAu1/c1 |
AATRbк1— Ь) = |
|||
= [(I - AATR/P) (Аи1 - b)lTR [(I - AATRк1) (Аи1 — Ь)]. |
|||||
Легко получить |
|
|
|
|
|
/г1 |
_ |
(Au х- |
b)T R A A TR (Аи1 - Ь) |
||
|
_ (Аи1 — b)T R A A TR A A r R (A u l — b) |
||||
Таким образом, и2 определено. После этого вычисляются у2, /с2, и3, ... Можно показать, что если и — М-вектор, то процедура сходится к точнолгу решению за М шагов. Это утверждение можно отнести к любым линейным зада чам при использовании метода сопряженного градиента с квадратичной функцией штрафа. К сожалению, для нелинейных задач или произвольных функций штрафа это свойство утрачивается.
Относительно несложно показать, что задача мини
мизации при учете ограничения |
|
/ = 0 (х, u), f (х, и) = О |
(4.2.34) |
может быть решена точно так же, как и при отсутствии ограничений. Необходимо только заменить 0 (ш) функ
112 ГРАДИЕНТНЫ Е МЕТОДЫ ИДЕНТИФИКАЦИИ 1ГЛ. 4
цией Н (х», и», Я») и, конечно, добавить к системе уравне ний дополнительные соотношения
дИ (х*, и*, X1) |
дН (х\ и\ Х{) |
_ |
дк1 |
дх1 |
(4.2.35) |
~ |
решаемые на каждой итерации.
Мы начали с рассмотрения статического одношагового градиентного метода прежде всего из-за его простоты, а не только для того, чтобы подчеркнуть применение гра диентных процедур к идентификации статических объек тов. В дальнейшем мы увидим, что эти методы с минималь ными изменениями можно применять для решения много шаговых или непрерывных задач идентификации динами ческих объектов.
4.3. ГРАДИЕНТНЫЕ МЕТОДЫ ИДЕНТИФИКАЦИИ ДИНАМИЧЕСКИХ СИСТЕМ
Результаты предыдущего раздела могут быть легко распространены на дискретные по времени или многоша говые задачи. Сначала рассмотрим следующую функцию штрафа:
кГ 1
/ = О [X (Яу)] + 2 Ф [х (к), и (к), к]. (4.3.1)
к^=к0
Необходимо минимизировать функцию штрафа, удовлет ворив одновременно следующим ограничениям:
х ( к + 1) = ф [х(/с), и (к), А]. |
(4.3.2) |
Формально можно поставить двухточечную краевую за дачу п, определив гамильтониан
Н — <р [х (к), и (/с), Я] |
Ят(к + 1) ф [х(/с), и (А), А], |
(4.3.3) |
||||
найти оптимальное управление и (к) |
и траекторию х (к) |
|||||
с помощью следующих соотношений: |
|
|||||
дН |
— х (к |
1), |
х (ко) = х0, |
(4.3.4) |
||
ЭХ {к + 1) |
||||||
дН |
= |
М^), |
|
l ( k f) = |
дв [х (kf)] |
(4.3.5) |
дх (к) |
|
дх (к^) ’ |
||||
дН |
= |
0. |
|
|
|
(4.3.6) |
ди (к) |
|
|
|
|||
4.3] МЕТОДЫ ИДЕНТИФИКАЦИИ ДИ НАМ ИЧЕСКИ Х СИСТЕМ И З
Для того чтобы обойти трудности, связанные с необходи мостью аналитического решения двухточечной задачи, применим градиентный метод первого порядка. Добавим к функции штрафа (4.3.1) ограничения (4.3.2) с множи телями Лагранжа. Учитывая (4.3.3), получим
|
Д-1 |
|
|
|
|
/ |
= 0 [х (к,)] + Гтх (/с0) + |
2 |
[Н - |
Xr (k + 1) х (к + |
1)] = |
|
)£=*„ |
|
|
||
= |
0 [X (к,)] - 1 Г {к,) X (kf) + |
[Гт + |
Хт(/:0)] х (к0) + |
|
|
|
|
|
kf—i |
|
|
|
|
+ |
S [ И - Ь Т(к)х(к)}. |
(4.3.7) |
|
|
|
|
k=z=lic |
|
|
Взяв первую вариацию или первый дифференциал, по лучим
|
р е [х ( p i |
А / — [Г |
X (Л0)1 Ах (/с0) -(- . Зх(р — ^ (kf) Ах (к,) + |
-X ( к ) Ах (к) +
Положим Ах (к0) = 0, так как х (к0) ' задано. Ради про стоты выберем X и х так, чтобы
дН |
Цк,) |
дв (х (&,)] |
(4.3.8) |
Зх (к) = 4 * ), |
Зх (к^ |
В результате первый дифференциал функции J преобра зуется к виду
Д-1 |
(4.3.9) |
А / = 2 |
|
/с—л*о |
|
Для того чтобы обеспечить наискорейшее движение в на правлении минимума, выберем
<4 '3 -1 0 >
здесь К — число, которое выбирается из соображений, связанных со сходимостью. Таким образом, использо
114 ГРАДИ ЕНТНЫ Е М ЕТОДЫ ИДЕНТИФИКАЦИИ [ГЛ. 4
вание градиентного метода первого порядка в много шаговых задачах сводится к следующей вычислительной
схеме: |
|
|
|
|
|
1) |
определить или задаться значением и* (к), |
|
|||
2) |
используя (4.3.2), вычислить х* (к) |
для к 0 |
к ^ kf, |
||
3) |
решить сопряженное уравнение (4.3.3) в «обратном» |
||||
времени для kf ;> к ;> |
к0 и |
определить |
№(к), |
|
|
4) |
определить |
|
|
|
|
д И |
= 3«Р [х4(к), ц* (к), |
к] |
W ( f t ) , u* (ft), к] % (к |
, . |
|
Эи* (к) |
Эи1' (к) |
' |
Эи1 (/с) |
1 |
' |
|
|
|
|
|
(4.3.11) |
5)получить приращение
Ли* (/с) = — К 1
дН
Эи1 (к) ’
6)вычислить новую итерацию управления
ui+1 (/с) = u1(/t) f Ли1(к), |
(4.3.12) |
7) вернуться к пункту 2) и повторять вычисления д тех пор, пока при переходе от итерации к итерации про исходят заметные изменения траектории и управления.
При идентификации реальных объектов встречается множество ситуаций, в которых применение описанного выше градиентного метода первого порядка становится затруднительным. Наиболее важным из них является случай, когда не задано начальное состояние и иденти фицируются некие постоянные параметры р (к). В этом случае функция штрафа приобретает вид
k/-i
./ = 0/ [х (,kf)] + 0О[х (К)] -j- 2 Ф [х (*), р (к), и (к), к], Л.‘=/£о
(4.3.13)
а уравнения объекта имеют вид
х (& + 1) = <р[х(&), р(к), и (к), к]. |
(4.3.14) |
Условие постоянства неизвестных параметров запишется как
Р (й + 1) = Р(*0- |
(4.3.15) |
4 -3] МЕТОДЫ ИДЕНТИФИКАЦИИ ДИ НАМ ИЧЕСКИ Х СИСТЕМ Ц 5
Можно, конечно, расширить описание состояния, вклю чив в него вектор параметров и избавившись тем самым от необходимости явного учета неизвестных параметров. Однако по причинам, которые станут ясны позднее, ка жущейся простоте обозначений будет предпочтен другой способ обобщения градиентного метода первого порядка, связанный с явной записью вектора параметров р(&).
Определим гамильтониан
Я = ф [х (к), р (к), и (к), к\ -|-
+ кт(к -|- 1) ф [х (к), р (А:), и (к), к] + Гт (к + 1) р (к). (4.3.16)
Добавив к функции штрафа уравнения движения, полу чим первый дифференциал функции J в виде
Л/ =
+
» Ц £ Ж . +.Ц 4 а)]ТЛХ(;.:„)-[-
■зедх(^)1 |
к (kf) Ах (к)) -ф- Г1 (к0) Ар (к0) |
|||
дх. <*/) |
||||
tc,-l |
|
|
||
|
Я ТТ |
-|Т |
||
■Гт (kf) Ар (kf) -ф- 2 |
||||
_ дх (к) |
— к (к) Ах (к) |
|||
|
fc=fC0 |
|
||
дН |
Ч*)]Т Ар (А) + |
Au (&)j . (4.3.17) |
||
+ . др (к) |
||||
Как и раньше, АТ упрощается путем введения сопряжен ных переменных. И, в частности, используются следую щие условия:
дН
к (к) = ’
~ дх(к)
Т (к )-
дН др(к) ’
Таким образом, первый преобразуется к виду
Лт |
Г 90о [х (к0)] |
пт |
+ к (к0) |
||
|
L дх (ко) |
|
+ Гт (Аг0)А р (£ 0) +
Ь (А/) = |
dQf [*(*/)] |
(4.3.18) |
дх (к.) |
||
Г (kf) = |
0. |
(4.3.19) |
|
|
штрафа |
kf- 1 |
Т |
|
" / |
|
|
2 [ о |
т ] * “ (*)• |
(4.3.20) |
к=к„ L w J
116 |
ГРАДИ ЕНТНЫ Е М ЕТОДЫ ИДЕНТИФИКАЦИИ |
1.ГЛ. 4 |
Выберем |
Ах (к0), Ар (к0) и Аи {к) так, чтобы |
получить |
наискорейший спуск к минимуму. Таким образом, по ложим
Ах (к0) = |
- К дх [ ЭУ (^ 0)] + М*о)] , |
(4.3.21) |
Ар {ко) = |
— /СдрГ (к0), |
(4.3.22) |
Аи(А) = |
- Х л и ^ . |
(4.3.23) |
Теперь на каждой итерации изменяется не только управ ление и (к), но изменяются и начальные условия х (/с0), р (/с0), в то время как раньше х (к0) было фиксировано и Ах (к0) равнялось нулю.
Во многих задачах х (к0) является заданным. Если это так, то х (к0) используется как начальная точка для ре шения уравнений, описывающих движение объекта. Может также оказаться, что отсутствует управление и(А;). Вэтом случае из алгоритма исключается процедура пересчета и {к) (и, разумеется, дН/ди). Общая блок-схема вычислений такова:
1)определить или задаться значениями х* (/с0), р* (к0),
ш{к),
2) |
найти решение х* (к), к0 |
к ^ |
kf, разностных урав |
|||||
нений |
(4.3.14), (4.3.15) |
с |
заданными х* (/с0) |
и р* (к0), |
||||
3) |
определить |
Я,* |
(/с) |
и |
Г1{к), |
kf |
к > |
к0, решив со |
пряженную систему |
уравнений |
(4.3.18), (4.3.19), |
||||||
4) |
определить |
приращения |
|
|
|
|||
|
Ах1 (к0) = |
— К\х |
(/со) |
J |
(4.3.24) |
|||
|
|
|
|
|
ах1 |
v ' |
||
|
АР‘ (*о) = |
-«дрГ *(А о), |
|
|
(4.3.25) |
|||
|
= |
|
|
|
|
|
|
(4Л26) |
5) |
вычислить |
следующую |
итерацию |
начальных усло |
||||
вий и управления: |
|
|
|
|
|
|
||
|
xi+1 (k0) = |
х1 (k0) -j- Ах* (/c0), |
(4.3.27) |
|||||
|
P{+1 {ко) = |
P* (Ао) -J- Ар1 {к0), |
(4.3.28) |
|||||
|
ui+1 (к) = |
|
и1(к) -f- Au1 (к), |
(4.3.29) |
||||
4.3] МЕТОДЫ ИДЕНТИФИКАЦИИ ДИНАМ ИЧЕСКИХ СИСТЕМ Ц 7
6) Вернуться к пункту 2) и повторять вычисления до тех пор, пока изменения в х (к), р (к) и и (к) при переходе от итерации к итерации не станут пренебрежимо малы.
Распространение этих алгоритмов на непрерывный случай получается непосредственно. Градиентный алгоритм первого порядка для минимизации функции штрафа
Ч
/ = 0/ [X (tf)] + е0 [х (£„)] + $ Ф [х (£), р ((), и (£), t] dt, (4.3.30) to
когда координаты состояния системы х (if), неизвестные постоянные параметры р (t) и управление u (t) удовлетво ряют системе дифференциальных уравнений
х (/) = |
f [х (£), р (£), u (£), t], |
(4.3.31) |
р (0 = |
0, |
(4.3.32) |
состоит в том, чтобы:
1)определить гамильтониан
Н= ф [х (t), р (г), и (г), t] + kT(£) f [х (г), р (t), и (г), t],
(4.3.33)
2)задаться начальными приближениями u1(t), х» (£0)
ИР*(*о).
3)используя эти и» (£), х* (£0) и р» (t0), найти х» (t) из
уравнения (4.3.31) и р* (t) из уравнения (4.3.32), 4) решить сопряженную систему уравнений
X1: |
дН |
^ " " |
дх (tf) |
(4.3.34) |
|
dxi (f) |
|||||
|
|
||||
Г* = - |
дН |
г 1 (ч) = 0, |
|
(4.3.35) |
|
ар4 (t) |
|
||||
|
|
|
|
5)определить приращения
Ли<(г) = |
— я диг аидН*(«) |
(4.3.36) |
Ах* (£0) |
K L дбо [х* (to)] ~1~ V(t0) |
(4.3.37) |
|
дхг (t0) |
|
Арг (£0) — — 7£дрГ ((0), |
(4.3.38) |
|
118 |
ГРАДИЕНТНЫ Е МЕТОДЫ ИДЕНТИФИКАЦИИ |
[ГЛ. 4 |
|
|
6) вычислить новые значения искомых величин |
||
ui+1 (it) = u* (t) + Au* (t)\ |
(4.3.39) |
|
xi+J (t0) = x*(to) + |
Ax* (t0)-, |
(4.3.40) |
Pi+1 (to) = lji (to) + |
Api (t0), |
(4.3.41) |
7) вернуться к пункту 3) и повторять вычисления до тех пор, пока изменения параметров, управления и тра ектории при переходе от итерации и итерации не станут мало заметными.
В постановке задачи идентификации можно учесть любое число ограничений, задаваемых равенствами или
Рис. 4.3.1. Настраиваемая модель из примера 4.3.1.
неравенствами. Однако в этой книге подобные постановки задач не рассматриваются (см. Сейдж, [116]), так как ограничения в форме неравенств на состояние объекта и управления и ограничения-равенства на концах тра ектории встречаются в задачах идентификации не слиш ком часто. После краткого обсуждения двух примеров особое внимание будет обращено на изучение градиент ного метода второго порядка и метода сопряженного гра диента для решения задач идентификации динамических объектов.
Пример 4.3.1. Рассмотрим идентификацию одномер ного объекта по схеме с настраиваемой моделью, схема которой изображена на рис. 4.3.1. Предполагается, что неизвестный объект описывается передаточной функцией с неизвестными постоянными параметрами ат = [а0, а1,...
4.3] МЕТОДЫ ИДЕНТИФИКАЦИИ ДИНАМ ИЧЕСКИХ СИСТЕМ Ц 9
. . fln-iF, |
ЬТ = |
[Ь0) |
|
|
Ъп.гР: |
|
|
|||
z |
(s) |
|
, Т , |
К _ |
A (s) |
_ |
ао + |
ais + |
, . . + |
fln-jS11-1 |
и |
W |
_ |
^ |
~ |
В (s) |
~~ |
60 + |
bis + |
. . . + |
Ъп_ jS71- 1 ' |
Вход |
объекта |
и (t) |
с преобразованием |
Лапласа U (s) |
||||||
и выход объекта z (t) с преобразованием Лапласа Z (s) считаются известными. В начальный момент времени объект находился в состоянии покоя.
Во временной области уравнения объекта можно за писать в виде
х= F(b)x(f) + g(a)u (t),
У(t) = hTx (t),
где |
Г - Ьп-! 1 о 0 . . ." |
|
|
“ 1 " |
|||
|
~ап-1 |
|
|||||
|
1 |
О |
0 . . . |
ап-г |
|
0 |
|
F (Ь) = |
1ез |
1 |
: . g(a) = |
, |
h = |
0 |
|
: |
о о |
||||||
|
|
0 0 |
. . |
0 |
«1 |
|
0 |
|
■Ьо |
яо |
|
||||
Подберем |
такое |
|
значение вектора параметров |
рт = |
|||
“= [ат, |
Ьт], чтобы |
минимизировать |
функцию |
штрафа |
|||
J = ^ lz W ~ y { t ) ? d t .
О
Отсюда видно, что эта задача является частным случаем задачи идентификации непрерывного объекта, которая была решена путем применения градиентного метода пер вого порядка. Полезно проследить алгоритм решения. Определим функцию
/ / = ^r [ z ( * ) - h Tx (0 ]2 +
+ |
(О [F (Ь) х (£) + g (а) и (£)] r j [0] -f- Г& [0]. |
Здесь и (£) — известный входной сигнал, не обеспечиваю щий оптимальных характеристик. Блок-схема вычисле ний такова:
120 |
ГРАДИ ЕНТНЫ Е МЕТОДЫ ИДЕНТИФИКАЦИИ |
[ГЛ. 4 |
1)задаться начальным значением а\ Ь* вектора пара метров рт = [ат, Ьт],
2)решить дифференциальное уравнение
|
х*' = F (Ь*) х*(t) + g (а*) и (t), |
х*(0) = 0, |
|
|
||||||
|
3) решить систему сопряженных уравнений |
|
|
|||||||
|
= h [z (t) - |
hTx{ (01 - |
FT (b{) Щ ), |
V (tf) = |
0, |
|
||||
|
= |
|
|
|
|
|
|
r a (t,) = o, |
|
|
|
= |
|
|
|
|
|
|
r i(f/) = 0 , |
|
|
|
4) определить изменения оценок параметров |
|
|
|||||||
|
|
Аа^ = |
- П |
аг1(0), |
|
|
|
|
||
|
|
Ab': = |
- |
^дьГЦО), |
|
|
|
|
||
|
5) вычислить новое приближение |
|
|
|
|
|||||
|
|
ai+i |
= |
а» + |
Аа1, |
|
|
|
|
|
|
|
bi+1 = |
Ъ* + |
дь* |
|
|
|
|
||
и |
продолжать вычисления, |
начиная |
с |
пункта 2), до |
до |
|||||
стижения сходимости. |
|
|
|
|
|
|
|
|
||
мо |
Важно отметить, что для идентификации р необходи |
|||||||||
располагать |
реализацией |
входного |
сигнала |
и (t) |
и |
|||||
«скорость» идентификации будет зависеть от этого вход ного сигнала.
В этой постановке предполагалось, что может быть достигнуто абсолютное совпадение выходных сигналов модели и объекта. Но, конечно, выход объекта в действи тельности может быть искажен помехой, а уравнения модели и объекта могут быть уравнениями разного по рядка. В подобных случаях логично предположить, что х (0) не задано, и определить Дх*(0), которое войдет в вы ражение для дифференциала функции штрафа
Д / = Хт (0)Ах(0),
используя формулы
АхЧ0) = — ЯдхЬЧО),
x*+i (0) = х1 (0) + Ах1 (0)
