Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Сейдж Э.П. Идентификация систем управления

.pdf
Скачиваний:
75
Добавлен:
23.10.2023
Размер:
7.91 Mб
Скачать

4.2] М ЕТОДЫ ИДЕНТИФИКАЦИИ

СТАТИ ЧЕСКИ Х

СИСТЕМ

Щ

5) определить

 

 

 

 

h i

= _ dQ(ui+1)

 

1MB (uif l)/rfut+1|p

,

 

V

tfui+1

ИdQ (uydu1|p

V ’

 

6) вернуться к пункту 3) и повторять вычисления до

тех пор, пока и не перестанет заметно изменяться

от

итерации к

итерации.

 

 

 

 

Пример 4.2.3. Рассмотрим снова решение системы

линейных уравнений Аи =

Ь. Вновь используется квадра-

тичная функция штрафа J — 0 (и) = у (Аи — b)T R (Аи — Ь).

Выберем и1,

тогда

у'1 — ATR (Аи1 — Ь).

Заметил!,

что

 

 

 

 

 

и2 =

и1 — /c1ATR (Аи1 — Ь),

где к1 выбирается

 

так,

чтобы

минимизировать

/г = 0(u2) = - L (Аи1 -

AA^RAuW + AATRb/H - Ь)т х

X R (Аи1 -

AATRAu1/c1

AATRbк1— Ь) =

= [(I - AATR/P) (Аи1 - b)lTR [(I - AATRк1) (Аи1 — Ь)].

Легко получить

 

 

 

 

/г1

_

(Au х-

b)T R A A TR (Аи1 - Ь)

 

_ (Аи1 — b)T R A A TR A A r R (A u l — b)

Таким образом, и2 определено. После этого вычисляются у2, /с2, и3, ... Можно показать, что если и — М-вектор, то процедура сходится к точнолгу решению за М шагов. Это утверждение можно отнести к любым линейным зада­ чам при использовании метода сопряженного градиента с квадратичной функцией штрафа. К сожалению, для нелинейных задач или произвольных функций штрафа это свойство утрачивается.

Относительно несложно показать, что задача мини­

мизации при учете ограничения

 

/ = 0 (х, u), f (х, и) = О

(4.2.34)

может быть решена точно так же, как и при отсутствии ограничений. Необходимо только заменить 0 (ш) функ­

112 ГРАДИЕНТНЫ Е МЕТОДЫ ИДЕНТИФИКАЦИИ 1ГЛ. 4

цией Н (х», и», Я») и, конечно, добавить к системе уравне­ ний дополнительные соотношения

дИ (х*, и*, X1)

дН (х\ и\ Х{)

_

дк1

дх1

(4.2.35)

~

решаемые на каждой итерации.

Мы начали с рассмотрения статического одношагового градиентного метода прежде всего из-за его простоты, а не только для того, чтобы подчеркнуть применение гра­ диентных процедур к идентификации статических объек­ тов. В дальнейшем мы увидим, что эти методы с минималь­ ными изменениями можно применять для решения много­ шаговых или непрерывных задач идентификации динами­ ческих объектов.

4.3. ГРАДИЕНТНЫЕ МЕТОДЫ ИДЕНТИФИКАЦИИ ДИНАМИЧЕСКИХ СИСТЕМ

Результаты предыдущего раздела могут быть легко распространены на дискретные по времени или многоша­ говые задачи. Сначала рассмотрим следующую функцию штрафа:

кГ 1

/ = О [X (Яу)] + 2 Ф [х (к), и (к), к]. (4.3.1)

к^=к0

Необходимо минимизировать функцию штрафа, удовлет­ ворив одновременно следующим ограничениям:

х ( к + 1) = ф [х(/с), и (к), А].

(4.3.2)

Формально можно поставить двухточечную краевую за­ дачу п, определив гамильтониан

Н — <р [х (к), и (/с), Я]

Ят(к + 1) ф [х(/с), и (А), А],

(4.3.3)

найти оптимальное управление и (к)

и траекторию х (к)

с помощью следующих соотношений:

 

дН

— х

1),

х (ко) = х0,

(4.3.4)

ЭХ {к + 1)

дН

=

М^),

 

l ( k f) =

дв [х (kf)]

(4.3.5)

дх (к)

 

дх (к^)

дН

=

0.

 

 

 

(4.3.6)

ди (к)

 

 

 

4.3] МЕТОДЫ ИДЕНТИФИКАЦИИ ДИ НАМ ИЧЕСКИ Х СИСТЕМ И З

Для того чтобы обойти трудности, связанные с необходи­ мостью аналитического решения двухточечной задачи, применим градиентный метод первого порядка. Добавим к функции штрафа (4.3.1) ограничения (4.3.2) с множи­ телями Лагранжа. Учитывая (4.3.3), получим

 

Д-1

 

 

 

/

= 0 [х (к,)] + Гтх (/с0) +

2

-

Xr (k + 1) х +

1)] =

 

)£=*„

 

 

=

0 [X (к,)] - 1 Г {к,) X (kf) +

[Гт +

Хт(/:0)] х (к0) +

 

 

 

 

kf—i

 

 

 

 

+

S [ И - Ь Т(к)х(к)}.

(4.3.7)

 

 

 

k=z=lic

 

 

Взяв первую вариацию или первый дифференциал, по­ лучим

 

р е [х ( p i

А / — [Г

X (Л0)1 Ах (/с0) -(- . Зх(р — ^ (kf) Ах (к,) +

-X ( к ) Ах (к) +

Положим Ах (к0) = 0, так как х 0) ' задано. Ради про­ стоты выберем X и х так, чтобы

дН

Цк,)

дв (х (&,)]

(4.3.8)

Зх (к) = 4 * ),

Зх (к^

В результате первый дифференциал функции J преобра­ зуется к виду

Д-1

(4.3.9)

А / = 2

/с—л*о

 

Для того чтобы обеспечить наискорейшее движение в на­ правлении минимума, выберем

<4 '3 -1 0 >

здесь К — число, которое выбирается из соображений, связанных со сходимостью. Таким образом, использо­

114 ГРАДИ ЕНТНЫ Е М ЕТОДЫ ИДЕНТИФИКАЦИИ [ГЛ. 4

вание градиентного метода первого порядка в много­ шаговых задачах сводится к следующей вычислительной

схеме:

 

 

 

 

1)

определить или задаться значением и* (к),

 

2)

используя (4.3.2), вычислить х* (к)

для к 0

к ^ kf,

3)

решить сопряженное уравнение (4.3.3) в «обратном»

времени для kf ;> к ;>

к0 и

определить

№(к),

 

4)

определить

 

 

 

 

д И

= 3«Р [х4(к), ц* (к),

к]

W ( f t ) , u* (ft), к] % (к

, .

Эи* (к)

Эи1' (к)

'

Эи1 (/с)

1

'

 

 

 

 

 

(4.3.11)

5)получить приращение

Ли* (/с) = — К 1

дН

Эи1 (к)

6)вычислить новую итерацию управления

ui+1 (/с) = u1(/t) f Ли1(к),

(4.3.12)

7) вернуться к пункту 2) и повторять вычисления д тех пор, пока при переходе от итерации к итерации про­ исходят заметные изменения траектории и управления.

При идентификации реальных объектов встречается множество ситуаций, в которых применение описанного выше градиентного метода первого порядка становится затруднительным. Наиболее важным из них является случай, когда не задано начальное состояние и иденти­ фицируются некие постоянные параметры р (к). В этом случае функция штрафа приобретает вид

k/-i

./ = 0/ [х (,kf)] + 0О[х (К)] -j- 2 Ф [х (*), р (к), и (к), к], Л.‘=/£о

(4.3.13)

а уравнения объекта имеют вид

х (& + 1) = <р[х(&), р(к), и (к), к].

(4.3.14)

Условие постоянства неизвестных параметров запишется как

Р (й + 1) = Р(*0-

(4.3.15)

4 -3] МЕТОДЫ ИДЕНТИФИКАЦИИ ДИ НАМ ИЧЕСКИ Х СИСТЕМ Ц 5

Можно, конечно, расширить описание состояния, вклю­ чив в него вектор параметров и избавившись тем самым от необходимости явного учета неизвестных параметров. Однако по причинам, которые станут ясны позднее, ка­ жущейся простоте обозначений будет предпочтен другой способ обобщения градиентного метода первого порядка, связанный с явной записью вектора параметров р(&).

Определим гамильтониан

Я = ф [х (к), р (к), и (к), к\ -|-

+ кт-|- 1) ф [х (к), р (А:), и (к), к] + Гт + 1) р (к). (4.3.16)

Добавив к функции штрафа уравнения движения, полу­ чим первый дифференциал функции J в виде

Л/ =

+

» Ц £ Ж . +.Ц 4 а)]ТЛХ(;.:„)-[-

■зедх(^)1

к (kf) Ах (к)) -ф- Г1 (к0) Ар (к0)

дх. <*/)

tc,-l

 

 

 

Я ТТ

-|Т

Гт (kf) Ар (kf) -ф- 2

_ дх (к)

к (к) Ах (к)

 

fc=fC0

 

дН

Ч*)]Т Ар (А) +

Au (&)j . (4.3.17)

+ . др (к)

Как и раньше, АТ упрощается путем введения сопряжен­ ных переменных. И, в частности, используются следую­ щие условия:

дН

к (к) =

~ дх(к)

Т (к )-

дН др(к)

Таким образом, первый преобразуется к виду

Лт

Г 90о (к0)]

пт

+ к (к0)

 

L дх (ко)

 

+ Гт (Аг0)А р (£ 0) +

Ь (А/) =

dQf [*(*/)]

(4.3.18)

дх (к.)

Г (kf) =

0.

(4.3.19)

 

 

штрафа

kf- 1

Т

 

" /

 

2 [ о

т ] * “ (*)•

(4.3.20)

к=к„ L w J

116

ГРАДИ ЕНТНЫ Е М ЕТОДЫ ИДЕНТИФИКАЦИИ

1.ГЛ. 4

Выберем

Ах (к0), Ар (к0) и Аи {к) так, чтобы

получить

наискорейший спуск к минимуму. Таким образом, по­ ложим

Ах (к0) =

- К дх [ ЭУ (^ 0)] + М*о)] ,

(4.3.21)

Ар {ко) =

— /СдрГ (к0),

(4.3.22)

Аи(А) =

- Х л и ^ .

(4.3.23)

Теперь на каждой итерации изменяется не только управ­ ление и (к), но изменяются и начальные условия х (/с0), р (/с0), в то время как раньше х (к0) было фиксировано и Ах (к0) равнялось нулю.

Во многих задачах х (к0) является заданным. Если это так, то х (к0) используется как начальная точка для ре­ шения уравнений, описывающих движение объекта. Может также оказаться, что отсутствует управление и(А;). Вэтом случае из алгоритма исключается процедура пересчета и {к) (и, разумеется, дН/ди). Общая блок-схема вычислений такова:

1)определить или задаться значениями х* (/с0), р* (к0),

ш{к),

2)

найти решение х* (к), к0

к ^

kf, разностных урав­

нений

(4.3.14), (4.3.15)

с

заданными х* (/с0)

и р* (к0),

3)

определить

Я,*

(/с)

и

Г1{к),

kf

к >

к0, решив со­

пряженную систему

уравнений

(4.3.18), (4.3.19),

4)

определить

приращения

 

 

 

 

Ах1 (к0) =

К\х

(/со)

J

(4.3.24)

 

 

 

 

 

ах1

v '

 

АР‘ (*о) =

-«дрГ *(А о),

 

 

(4.3.25)

 

=

 

 

 

 

 

 

(4Л26)

5)

вычислить

следующую

итерацию

начальных усло

вий и управления:

 

 

 

 

 

 

 

xi+1 (k0) =

х1 (k0) -j- Ах* (/c0),

(4.3.27)

 

P{+1 {ко) =

P* (Ао) -J- Ар1 {к0),

(4.3.28)

 

ui+1 (к) =

 

и1(к) -f- Au1 (к),

(4.3.29)

4.3] МЕТОДЫ ИДЕНТИФИКАЦИИ ДИНАМ ИЧЕСКИХ СИСТЕМ Ц 7

6) Вернуться к пункту 2) и повторять вычисления до тех пор, пока изменения в х (к), р (к) и и (к) при переходе от итерации к итерации не станут пренебрежимо малы.

Распространение этих алгоритмов на непрерывный случай получается непосредственно. Градиентный алгоритм первого порядка для минимизации функции штрафа

Ч

/ = 0/ [X (tf)] + е0 [х (£„)] + $ Ф [х (£), р ((), и (£), t] dt, (4.3.30) to

когда координаты состояния системы х (if), неизвестные постоянные параметры р (t) и управление u (t) удовлетво­ ряют системе дифференциальных уравнений

х (/) =

f [х (£), р (£), u (£), t],

(4.3.31)

р (0 =

0,

(4.3.32)

состоит в том, чтобы:

1)определить гамильтониан

Н= ф [х (t), р (г), и (г), t] + kT(£) f [х (г), р (t), и (г), t],

(4.3.33)

2)задаться начальными приближениями u1(t), х» (£0)

ИР*(*о).

3)используя эти и» (£), х* (£0) и р» (t0), найти х» (t) из

уравнения (4.3.31) и р* (t) из уравнения (4.3.32), 4) решить сопряженную систему уравнений

X1:

дН

^ " "

дх (tf)

(4.3.34)

dxi (f)

 

 

Г* = -

дН

г 1 (ч) = 0,

 

(4.3.35)

ар4 (t)

 

 

 

 

 

5)определить приращения

Ли<(г) =

— я диг аидН*(«)

(4.3.36)

Ах* (£0)

K L дбо [х* (to)] ~1~ V(t0)

(4.3.37)

 

дхг (t0)

 

Арг (£0) — — 7£дрГ ((0),

(4.3.38)

118

ГРАДИЕНТНЫ Е МЕТОДЫ ИДЕНТИФИКАЦИИ

[ГЛ. 4

 

 

6) вычислить новые значения искомых величин

ui+1 (it) = u* (t) + Au* (t)\

(4.3.39)

xi+J (t0) = x*(to) +

Ax* (t0)-,

(4.3.40)

Pi+1 (to) = lji (to) +

Api (t0),

(4.3.41)

7) вернуться к пункту 3) и повторять вычисления до тех пор, пока изменения параметров, управления и тра­ ектории при переходе от итерации и итерации не станут мало заметными.

В постановке задачи идентификации можно учесть любое число ограничений, задаваемых равенствами или

Рис. 4.3.1. Настраиваемая модель из примера 4.3.1.

неравенствами. Однако в этой книге подобные постановки задач не рассматриваются (см. Сейдж, [116]), так как ограничения в форме неравенств на состояние объекта и управления и ограничения-равенства на концах тра­ ектории встречаются в задачах идентификации не слиш­ ком часто. После краткого обсуждения двух примеров особое внимание будет обращено на изучение градиент­ ного метода второго порядка и метода сопряженного гра­ диента для решения задач идентификации динамических объектов.

Пример 4.3.1. Рассмотрим идентификацию одномер­ ного объекта по схеме с настраиваемой моделью, схема которой изображена на рис. 4.3.1. Предполагается, что неизвестный объект описывается передаточной функцией с неизвестными постоянными параметрами ат = [а0, а1,...

4.3] МЕТОДЫ ИДЕНТИФИКАЦИИ ДИНАМ ИЧЕСКИХ СИСТЕМ Ц 9

. . fln-iF,

ЬТ =

[Ь0)

 

 

Ъп.гР:

 

 

z

(s)

 

, Т ,

К _

A (s)

_

ао +

ais +

, . . +

fln-jS11-1

и

W

_

^

~

В (s)

~~

60 +

bis +

. . . +

Ъп_ jS71- 1 '

Вход

объекта

и (t)

с преобразованием

Лапласа U (s)

и выход объекта z (t) с преобразованием Лапласа Z (s) считаются известными. В начальный момент времени объект находился в состоянии покоя.

Во временной области уравнения объекта можно за­ писать в виде

х= F(b)x(f) + g(a)u (t),

У(t) = hTx (t),

где

Г - Ьп-! 1 о 0 . . ."

 

 

“ 1 "

 

~ап-1

 

 

1

О

0 . . .

ап-г

 

0

F (Ь) =

1ез

1

: . g(a) =

,

h =

0

:

о о

 

 

0 0

. .

0

«1

 

0

 

■Ьо

яо

 

Подберем

такое

 

значение вектора параметров

рт =

“= [ат,

Ьт], чтобы

минимизировать

функцию

штрафа

J = ^ lz W ~ y { t ) ? d t .

О

Отсюда видно, что эта задача является частным случаем задачи идентификации непрерывного объекта, которая была решена путем применения градиентного метода пер­ вого порядка. Полезно проследить алгоритм решения. Определим функцию

/ / = ^r [ z ( * ) - h Tx (0 ]2 +

+

(О [F (Ь) х (£) + g (а) и (£)] r j [0] -f- Г& [0].

Здесь и (£) — известный входной сигнал, не обеспечиваю­ щий оптимальных характеристик. Блок-схема вычисле­ ний такова:

120

ГРАДИ ЕНТНЫ Е МЕТОДЫ ИДЕНТИФИКАЦИИ

[ГЛ. 4

1)задаться начальным значением а\ Ь* вектора пара­ метров рт = [ат, Ьт],

2)решить дифференциальное уравнение

 

х*' = F (Ь*) х*(t) + g (а*) и (t),

х*(0) = 0,

 

 

 

3) решить систему сопряженных уравнений

 

 

 

= h [z (t) -

hTx{ (01 -

FT (b{) Щ ),

V (tf) =

0,

 

 

=

 

 

 

 

 

 

r a (t,) = o,

 

 

=

 

 

 

 

 

 

r i(f/) = 0 ,

 

 

4) определить изменения оценок параметров

 

 

 

 

Аа^ =

- П

аг1(0),

 

 

 

 

 

 

Ab': =

-

^дьГЦО),

 

 

 

 

 

5) вычислить новое приближение

 

 

 

 

 

 

ai+i

=

а» +

Аа1,

 

 

 

 

 

 

bi+1 =

Ъ* +

дь*

 

 

 

 

и

продолжать вычисления,

начиная

с

пункта 2), до

до­

стижения сходимости.

 

 

 

 

 

 

 

 

мо

Важно отметить, что для идентификации р необходи­

располагать

реализацией

входного

сигнала

и (t)

и

«скорость» идентификации будет зависеть от этого вход­ ного сигнала.

В этой постановке предполагалось, что может быть достигнуто абсолютное совпадение выходных сигналов модели и объекта. Но, конечно, выход объекта в действи­ тельности может быть искажен помехой, а уравнения модели и объекта могут быть уравнениями разного по­ рядка. В подобных случаях логично предположить, что х (0) не задано, и определить Дх*(0), которое войдет в вы­ ражение для дифференциала функции штрафа

Д / = Хт (0)Ах(0),

используя формулы

АхЧ0) = — ЯдхЬЧО),

x*+i (0) = х1 (0) + Ах1 (0)

Соседние файлы в папке книги из ГПНТБ