Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Сейдж Э.П. Идентификация систем управления

.pdf
Скачиваний:
77
Добавлен:
23.10.2023
Размер:
7.91 Mб
Скачать

6.4] РАЗНОСТНАЯ И ДИФФЕРЕНЦИАЛЬНАЯ АППРОКСИМАЦИЯ 201

ИЛИ

( “г 1

2 Fт [х (&), /с] F [х (А:), /«па = I к=к,

кг

1

= 2

ГТ 1х(/с),/c]{x (fe + 1 )— c[x(fc), А:]}. (6.4.6)

к=ко

Следовательно, оптимальная оценка вектора параметров а

определится

как

 

 

4-1

 

 

 

а =

2

FT [x(/c),/c]F[x(fc), к]

х

 

кко

 

 

 

 

X

2

Fa [х (к), к] +

1) — с [х (к), /с]}. (6.4.7)

 

 

к=к0

 

Отметим, что линейная по а система может быть существен­ но нелинейной по х.

Пример 6.4.1. Для иллюстрации метода рассмотрим ис­ пользование алгоритма дифференциальной аппроксима­ ции для определения параметра а следующей одномерной системы:

х (к + 1) = х (к) ах2(к) -f ю (к) + и (к),

где и (к) известно. Эта система линейна по а и, следователь­

но, результат

(6.4.7) применим. В этом

случае имеем

с 1х(к),

к] = х (к) +

и (к) и F [х {к), к] =

х2(к) так, что

оценка

а имеет вид

 

 

 

 

kr i

 

 

 

аД _

^

ж2 (к) [х (к + 1) — ж (к) и (Л)]

 

---------------------------------------к=к,

---------- ------------------------------------------------------

.

 

 

 

2 х4(*)

 

 

 

 

к=к0

 

Главная трудность на пути использования этого алгорит­ ма связана с необходимостью располагать полной инфор­ мацией о состоянии системы на конечном интервале вре­ мени. Один из возможных способов преодоления этой труд­ ности состоит в использовании точечных оценок с тем,

202

КВАЗИ ЛИНЕАРИЗАЦИЯ

[ГЛ. 6

чтобы по имеющимся данным получить грубую оценку тра­ ектории. А затем для оценивания параметров можно было бы использовать алгоритм разностной аппроксимации. Эти оценки могут быть и не слишком точными, если имеющиеся данные были искажены помехами. Тем не менее оценки параметров и состояния системы дают достаточно точное начальное приближение для использования градиентных алгоритмов или алгоритма квазилинеаризации,

К непрерывным системам можно применить алгоритм дифференциальной аппроксимации. В этом случае урав­ нения модели имеют вид

x{t) = f \x{t), a, t] -f w(<),

(6.4.8)

где f [x (t), a, t\ — того же вида, что и раньше, т. е. компо­ ненты f удовлетворяют (6.4.2). Показатель качества опре­ деляется, как

J = ^ I X (t) — f [х (<), a, t] |q(0* ,

(6.4.9)

to

 

где Q (t), как и раньше, произвольная положительно определенная матрица. Здесь х (t) и х (t) предполагаются известными на интервале [<„, tj].

Если приравнять частную производную / по а нулю, то для Q = I получим следующую систему алгебраических уравнений относительно а:

( а,ТЛ ^ - H 'W , а. ( 1 * -

*0

= ^ afT 1хэ(а0, а’ П X(0 dt. (6.4.10)

Непрерывный алгоритм по сравнению с дискретным имеет еще один недостаток — необходимость знания производной х (t). Один из выходов состоит в аппроксимации производ­ ной конечными разностями, что по существу превращает алгоритм в разностный.

6.51

ВЫ ВОДЫ

203

6.5. ВЫВОДЫ

Развитый в этой главе метод квазилинеаризации может быть использован для преодоления вычислительных труд­ ностей решения двухточечных краевых задач, связанных с некоторыми постановками задач идентификации систем. Хотя квазилинеаризация используется в основном как непрямой вычислительный метод, ее можно применить и для непосредственного решения некоторых классов задач идентификации, что приводит к простым и эффективным алгоритмам. Рассмотрены дискретная и непрерывная фор­ ма алгоритмов квазилинеаризации.

Также были изучены методы дифференциальной и раз­ ностной аппроксимации. Несмотря на присущие этим ал­ горитмам ограничения, существуют задачи, к которым они применимы, кроме того, эти алгоритмы могут быть ис­ пользованы для вычисления начальных приближений итеративных процедур типа квазилинеаризации или гра­ диентных методов.

Глава 7

ИНВАРИАНТНОЕ ПОГРУЖЕНИЕ И ПОСЛЕДОВАТЕЛЬНАЯ

ИДЕНТИФИКАЦИЯ

7.1.ВВЕДЕНИЕ

Вэтой главе рассматривается подход к идентификации систем, который отличен от большинства ранее рассмотрен-

н.IX методов. Будут развиты последовательные алгоритмы идентификации систем или идентификации в реальном

масштабе времени. Такой подход противопоставляется рассмотренным в предыдущих главах непоследовательным алгоритмам идентификации или идентификации вне кон­ тура регулирования. Во многих случаях (например, для многих задач теории управления) желательно в «скользя­ щем времени» иметь последовательные оценки параметров системы по мере поступления данных о функционировании.

По существу последовательное оценивание параметров систем — это не более чем задачи нелинейной фильтрации. По вопросам линейной и нелинейной фильтрации имеется обширная литература (см. ссылки в книгах Сейджа и Мелса [127], Язвинского [61]); читатели, более глубоко интересующиеся теорией нелинейной фильтрации, могут обратиться к этим источникам. Ниже развивается только один подход к нелинейной фильтрации. Это метод инвари­ антного погружения, который применяется к решению ДТКЗ, связанных с идентификацией систем (см. главу 3). Этот метод был выбран из-за его идейной простоты и боль­ шой гибкости. Сначала рассматривается более простой не­ прерывный случай.

7.2.НЕПРЕРЫВНЫЕ СИСТЕМЫ

Вэтом разделе будет рассмотрен непрерывный ва­ риант алгоритма инвариантного погружения. В целях упрощения обозначений и увеличения общности резуль­ татов исследование будет базироваться на общей постанов­ ке двухточечной краевой задачи. Необходимо найти

7.2]

НЕПРЕРЫ ВНЫ Е

СИСТЕМЫ

205

решение ДТКЗ:

 

 

 

 

 

х (0= v [ x ( 0 ,

А, (0, t],

(7.2.1)

 

4 0 = Их (0, ЦО, 11

(7.2.2)

с условиями на концах траектории

 

Ш

— Ах (<0)

b,

X(tf) — 0.

(7.2.3)

Эта формулировка охватывает все двухточечные краевые задачи из главы 3.

Основная идея инвариантного погружения состоит во включении частной задачи в более общую задачу. Если можно решить общую задачу,то частная задача ре­ шается автоматически. Удивительно, что часто легче ре­ шить более общую задачу.

Мы обобщим ДТКЗ, т. е. осуществим инвариантное погружение задачи (7.2.1) — (7.2.3), допустив, что условие на конце траектории при t — tt равно не 0, а с. Другими словами, вместо X (tf) — 0 будем писать X (tf) = с. Кроме того, будем предполагать, что как величина с, так и мо­ мент tf переменны. В частности, будут рассматриваться «соседние» траектории, одна из которых удовлетворяет условию X (tf) = с, а другая — условию X (tt + е) = = с -f Дс.

Относительно первой траектории допустим, что зна­ чение состояния системы на конце траектории имеет вид

х (tf) = г (с, tf).

(7.2.4)

Другими словами, функция г (с, tf) отражает связь между

условием

на

конце X (tf)

с и финальным значением

x(f) при

t =

tf.

Если эта

функция известна, то ДТКЗ

легко можно было бы решить, интегрируя х и X от конца

траектории при

условиях

Х(//) = с и х (tt) = г (с, tf).

Но функция г (с, t/) неизвестна, таким образом, необхо­ димо иметь метод ее определения.

Предположим, что имеется траектория, для которой при t = tf X (tf) = с и х (t/) = г (с, tf). Изменим слегка конечное значение tt на tf + е:

X(tf г) — с + Ас

(7.2.5)

206

ИНВАРИАНТНОЕ

ПОГРУЖЕНИЕ

[ГЛ. 7

и соответственно

 

 

 

X (tf + е) = X (tf) +

Ах = г (с, tf) + Дх,

(7.2.6)

где Дх и Дс имеют порядок О (е)*). Но, с другой стороны,

X (tf + е) = г (с + Дс,

tf + е).

(7.2.7)

Приравнивая правые части

(7.2.6)

и

(7.2.7),

получим

г (с, tf) -f- Дх =

г (с -f- Ac,

tf + е).

(7.2.8)

Если разложить правую часть уравнения (7.2.8) в ряд Тейлора относительно с и tf, получим

5г (с, t.)

 

dr , t А

_

Дх = -----— Дс -\------------8+

О (е2).

(7.2.9)

 

 

 

 

 

Обращаясь к уравнениям (7.2.1) и (7.2.2), видим, что

Дх =

Y I1' (с, tf),

с,

t,] в +

О (в2)

(7.2.10)

ДС =

p[r(c, I f ) ,

с,

tf\e +

0 { в2).

(7.2.11)

Так что уравнение (7.2.9) принимает вид

 

у [г (с, tf), с, tf\е =

5г (с, tf)

tf), с, tf] в +

 

-----р [г (с,

 

 

 

 

5г (с, г .)

 

 

+

а

е + ° ( е >- (7-2Л2)

Поделив (7.2.12) на в и устремляя в к нулю, получим урав­ нение в частных производных, которому должна удовлет­ ворять функция г (с, tf):

Y l r >с, t fI

дт[с, tf)

Р(г, с, tf)

дт(с, tj)

(7.2.13)

дс

dt.

 

 

К сожалению, неизвестно, как решать это уравнение в об­ щем виде. Однако часто мы можем аппроксимировать ре­ шение линейной функцией

г (с, tf) =

\{tf) + Р (0)с.

(7.2.1Л)

*) О (eJ) означает, н о

lim Q (e^)/sJ 1 =

0.

e-»o

7.2] НЕПРЕРЫ ВНЫ Е СИСТЕМЫ 207

Здесь х (tf) — решение для случая с = 0, которое яв­ ляется решением исходной ДТКЗпри X (tf) = 0. Другими словами, предполагается, что г (с, tf) является оптималь­ ным значением х (tf) (все еще неизвестным), если с = 0, плюс линейная комбинация отклонений отО, характеризуе­ мых вектором с. Такая аппроксимация будет хорошей, если с — 0, т. е. когда рассматривается траектория вблизи истинного оптимального значения. В дальнейшем будем предполагать, что с мало, пренебрегая членами по­

рядка

О (|с |2) и выше.

 

 

 

 

 

 

Если подставить (7.2.14) в (7.2.13), получим

 

Y [х + Рс, с, £/] =

Рр (х + Рс, с, tf)

+

х +

Рс.

(7.2.15)

Теперь разложим у и р в ряд Тейлора

относительно х, с

и tf,

ограничившись

членами

порядка

с.

Уравнение

(7.2.15) преобразуется

к виду

 

 

 

 

 

 

~

д\ (х, с, t , )

Р с

 

 

 

 

 

 

У (х, с, tf) -|--------------—

 

 

 

 

 

 

 

дх

 

 

 

 

 

 

 

 

 

= Рр (X, с, tf)

+

dfi (х, о, t , )

 

л

4- Рс.

(7.2.16)

 

Р ■- ■

1 Рс +

X

дх

Для того чтобы продолжить вывод, необходимо вместо v и р подставить функции, которые соответствуют ДТКЗ для идентификации систем. Ради простоты используем ДТКЗ вида (3.2.37) — (3.2.39); обобщение для ДТКЗ вида (3.2.63) — (3.2.65) получается непосредственно. Из (3.2.37) и (3.2.38) функции у и р определятся как

у (х, с, tf) = f (х, tf) — G (х, t f) i|7w(tf) GT (x, tf) c, (7.2.17)

-dll'1 (x, tt )

p (x,

c, tf) =

-------- ---

f ■ ф у |Z — h (x, tf)]

 

 

 

OS.

 

 

_

dfT (i(,

„ +

d |(.,T G (x, tf) $ w (tf) GT (x, tf )] c

( 7 2 1 8 )

 

Эх

 

Эх

 

Отметим, чго последнее слагаемое в выражении для р можно опустить, так как оно второго порядка малости по с. Теперь, если подставить (7.2.17) и (7.2.18) в (7.2.16),

получим следующее выражение, не содержащее членов

208

ИНВАРИАНТНОЕ ПОГРУЖЕНИЕ

[ГЛ. 7

более высокого порядка малости, чем с:

f (X, tf) - G (к, t{) У w (tf) GT (x, tf) c +

Pc =

 

Ox

= p

9hT^

г/)

ИГ-Ч- .h lZ

/ М

D

.afT(*-*/)

c +

Ox

- ^ [ z - M x ,

G)1 — P-

 

Ox

 

kT,

 

,

~

I

 

 

 

я ( Oh

(x, tf )

 

X + Pc.

 

+ p Ox

 

Ox

ЧГу [z — h (x, tf)}\ Pc +

 

 

 

 

 

 

 

 

 

(7.2.10)

Так как эта формула должна быть справедлива для всех достаточно малых с, можно отдельно приравнять коэффи­ циенты при членах нулевого и первого порядков малости по с. В результате получим

X =

f (X, tf) + Р

Э1- - Х:

Ф1;1(tf) [z -

h (X, tf)1,

(7.2.20)

 

 

дх

dtT(x, *,)

 

 

Р =

 

 

+

 

— G (х, G)*Pw (G)GT(i, t,) + Р

дх

 

 

 

 

 

 

 

i l i i l i L p _ p » (

_

 

h

p.

 

Ox

Ox (.

Ox

 

 

)

 

 

 

 

 

 

(7.2.21)

Этот результат можно представить в несколько более зна­ комой форме, подставив Р = — Р. К тому же вспомним, что финальный момент tf переменный, и обозначим его просто t. С этими изменениями уравнения (7.2.20) и (7.2.21) перепишутся в виде

х(<) = f [x(<), <] +

 

+

0hT lx U),

tl

,

 

 

~

_

 

Р («)-------y i U

-

W-i {t) {z {t) _

h jx (f)i t])t

(7.2.22)

 

 

dx (t)

 

T

-

 

0fT [x (0, t]

P (t) =

 

 

 

G [X(0, 01 V w (0 G1

[X (0, t] +

P (t)------ +

 

 

 

 

 

 

 

 

dx (f)

 

o f [ x ( t ) , <L p ) _ p

w

_ j L _

0hT [x(0, «I „ р-I

 

1

0x(t)

 

Ox (0

 

**v (t){z(t)-

 

Ox (0

 

hlx(<), f)> P(0. (7.2.23)

7,2] НЕПРЕРЫ ВНЫ Е СИСТЕМЫ 209

Начальные условия для уравнений (7.2.22), (7.2.23) мож­ но получить из условия (3.2.39), а именно из условия

Ч *о)= - VxJ [i(< o)-M x0].

(7.2.24)

Если решить это уравнение относительно х (t0), цолучим

х (^о) — М-х»— Ух,Л (£<>)•

(7.2.25)

Простое сравнение уравнений (7.2.14) и (7.2.25) обнаружи­ вает, что следует использовать начальные условия

x(<0) =

Mx0,

' (7.2.26)

P(*o) =

Vx,

(7.2.27)

Читателю следует помнить, что при переходе к урав­

нениям (7.2.22), (7.2.23) была

сделана замена Р = — Р,

которой объясняется отсутствие минуса в (7.2.27).

Теперь можно проинтегрировать уравнения

(7.2.22)

и (7.2.23) в прямом времени с начальными условиями (7.2.26) и (7.2.27), чтобы получить последовательную оценку «состояния» х (t). В случае постоянных парамет­ ров, который представляет наибольший интерес при иден­ тификации систем, значение, получаемое в момент t =

tf, представляет собой выход фильтра и сглаженную оценку Следовательно, финальные значения оценок пара­ метров идентичны значениям, полученным в результате решения ДТКЗ непоследовательным методом. Для удоб­ ства результаты сведены в табл. 7.2.1.

Уравнение (7.2.23) очень похоже на уравнение фильтра Калмана для дисперсии ошибки. Если f, g и h — линей­ ные функции х, то (7.2.23) есть просто фильтр Калмана. Нетрудно показать (Сейдж и Мелса [1271), что уравнение (7.2.23) представляет собой первое приближение оценки условной дисперсии ошибки

 

 

 

(t) =

var {х (t)|Z (t)},

если,

как

предполагается

в главе 3, начальное условие

х (/0) и входные шумы w(/)

и v (t) — гауссовские процессы.

Пример

7.2 1

Для

того

чтобы продемонстриро­

вать

применение

алгоритма

к идентификации систем,

7г8 Э. П. Сейдж, Дж. Л. Мелса

210

ИНВАРИАНТНОЕ

ПОГРУЖЕНИЕ

[ГЛ. 7

 

 

 

 

 

 

 

Т а б л и ц а 7.2.1

Непрерывные алгоритмы

инвариантного погружения

Модель системы

 

 

 

 

 

 

 

i(t) =

f [x(«), t] +

G[x(t), t] w (t)

(3.2.5)

Модель наблюдений

 

 

 

 

(3.2.6)

 

 

z(0 = h[x(/),

t] +v( t)

 

Статистические характеристики

 

 

 

 

£{*(«»)} = рХо,

var {х (to)} = Vw

 

 

 

(/)} = »{v(/)J = 0,

 

 

 

cov {w (0.

w (t)} =

(t) 6D (г — T),

 

 

cov {v (0,

v(t)} = 4% (t) SD (t t)

 

Алгоритмы фильтрации

 

 

 

 

Mt) =

f [x (/),

t] +

 

 

 

 

 

 

 

+ p m

9

' X/|0, l]

v ; 1 (0 {/. (t) - h | i ( O t »l)

(7.2.22)

 

 

dx (t)

 

 

 

 

Уравнения для дисперсии ошибки

 

 

Р (0 = G [х (0,

«1

 

(t) GT (£ (/), t] +

 

 

 

 

9fT[i(i), <]

af[x (/),<!

P (* )-

 

 

+ Pit)

dx (/)

+

dx (t)

 

 

 

 

 

 

 

P (O'

a

<?hT [ x (<). /|

T-;l (t)!z (0 -h [x (i), *]}

p (*)

ax (t)

 

dx (l)

 

 

 

 

 

 

 

 

(7.2.23)

Начальные условия

*W = Их„- p ('») = vx

рассмотрим задачу идентификации переменного параметра в системе второго порядка (Детчменди и Шридхар [30]). Система описывается моделью

ii = »а + (0.

= —2^ — а (t) х\ — Зх2 + 5 sin t -f w2 (t),

Соседние файлы в папке книги из ГПНТБ