книги из ГПНТБ / Сейдж Э.П. Идентификация систем управления
.pdf6.4] РАЗНОСТНАЯ И ДИФФЕРЕНЦИАЛЬНАЯ АППРОКСИМАЦИЯ 201
ИЛИ
( “г 1
2 Fт [х (&), /с] F [х (А:), /«па = I к=к,
кг |
1 |
= 2 |
ГТ 1х(/с),/c]{x (fe + 1 )— c[x(fc), А:]}. (6.4.6) |
к=ко
Следовательно, оптимальная оценка вектора параметров а
определится |
как |
|
||
|
4-1 |
|
|
|
а = |
2 |
FT [x(/c),/c]F[x(fc), к] |
х |
|
|
к—ко |
|
|
|
|
X |
2 |
Fa [х (к), к] {х (к + |
1) — с [х (к), /с]}. (6.4.7) |
|
|
к=к0 |
|
|
Отметим, что линейная по а система может быть существен но нелинейной по х.
Пример 6.4.1. Для иллюстрации метода рассмотрим ис пользование алгоритма дифференциальной аппроксима ции для определения параметра а следующей одномерной системы:
х (к + 1) = х (к) ах2(к) -f ю (к) + и (к),
где и (к) известно. Эта система линейна по а и, следователь
но, результат |
(6.4.7) применим. В этом |
случае имеем |
||
с 1х(к), |
к] = х (к) + |
и (к) и F [х {к), к] = |
х2(к) так, что |
|
оценка |
а имеет вид |
|
|
|
|
|
kr i |
|
|
|
аД _ |
^ |
ж2 (к) [х (к + 1) — ж (к) — и (Л)] |
|
|
---------------------------------------к=к, |
---------- ------------------------------------------------------ |
. |
|
|
|
|
2 х4(*) |
|
|
|
|
к=к0 |
|
Главная трудность на пути использования этого алгорит ма связана с необходимостью располагать полной инфор мацией о состоянии системы на конечном интервале вре мени. Один из возможных способов преодоления этой труд ности состоит в использовании точечных оценок с тем,
202 |
КВАЗИ ЛИНЕАРИЗАЦИЯ |
[ГЛ. 6 |
чтобы по имеющимся данным получить грубую оценку тра ектории. А затем для оценивания параметров можно было бы использовать алгоритм разностной аппроксимации. Эти оценки могут быть и не слишком точными, если имеющиеся данные были искажены помехами. Тем не менее оценки параметров и состояния системы дают достаточно точное начальное приближение для использования градиентных алгоритмов или алгоритма квазилинеаризации,
К непрерывным системам можно применить алгоритм дифференциальной аппроксимации. В этом случае урав нения модели имеют вид
x{t) = f \x{t), a, t] -f w(<), |
(6.4.8) |
где f [x (t), a, t\ — того же вида, что и раньше, т. е. компо ненты f удовлетворяют (6.4.2). Показатель качества опре деляется, как
J = ^ I X (t) — f [х (<), a, t] |q(0* , |
(6.4.9) |
to |
|
где Q (t), как и раньше, произвольная положительно определенная матрица. Здесь х (t) и х (t) предполагаются известными на интервале [<„, tj].
Если приравнять частную производную / по а нулю, то для Q = I получим следующую систему алгебраических уравнений относительно а:
( а,ТЛ ^ - H 'W , а. ( 1 * -
*0
= ^ afT 1хэ(а0, а’ П X(0 dt. (6.4.10)
Непрерывный алгоритм по сравнению с дискретным имеет еще один недостаток — необходимость знания производной х (t). Один из выходов состоит в аппроксимации производ ной конечными разностями, что по существу превращает алгоритм в разностный.
6.51 |
ВЫ ВОДЫ |
203 |
6.5. ВЫВОДЫ
Развитый в этой главе метод квазилинеаризации может быть использован для преодоления вычислительных труд ностей решения двухточечных краевых задач, связанных с некоторыми постановками задач идентификации систем. Хотя квазилинеаризация используется в основном как непрямой вычислительный метод, ее можно применить и для непосредственного решения некоторых классов задач идентификации, что приводит к простым и эффективным алгоритмам. Рассмотрены дискретная и непрерывная фор ма алгоритмов квазилинеаризации.
Также были изучены методы дифференциальной и раз ностной аппроксимации. Несмотря на присущие этим ал горитмам ограничения, существуют задачи, к которым они применимы, кроме того, эти алгоритмы могут быть ис пользованы для вычисления начальных приближений итеративных процедур типа квазилинеаризации или гра диентных методов.
Глава 7
ИНВАРИАНТНОЕ ПОГРУЖЕНИЕ И ПОСЛЕДОВАТЕЛЬНАЯ
ИДЕНТИФИКАЦИЯ
7.1.ВВЕДЕНИЕ
Вэтой главе рассматривается подход к идентификации систем, который отличен от большинства ранее рассмотрен-
н.IX методов. Будут развиты последовательные алгоритмы идентификации систем или идентификации в реальном
масштабе времени. Такой подход противопоставляется рассмотренным в предыдущих главах непоследовательным алгоритмам идентификации или идентификации вне кон тура регулирования. Во многих случаях (например, для многих задач теории управления) желательно в «скользя щем времени» иметь последовательные оценки параметров системы по мере поступления данных о функционировании.
По существу последовательное оценивание параметров систем — это не более чем задачи нелинейной фильтрации. По вопросам линейной и нелинейной фильтрации имеется обширная литература (см. ссылки в книгах Сейджа и Мелса [127], Язвинского [61]); читатели, более глубоко интересующиеся теорией нелинейной фильтрации, могут обратиться к этим источникам. Ниже развивается только один подход к нелинейной фильтрации. Это метод инвари антного погружения, который применяется к решению ДТКЗ, связанных с идентификацией систем (см. главу 3). Этот метод был выбран из-за его идейной простоты и боль шой гибкости. Сначала рассматривается более простой не прерывный случай.
7.2.НЕПРЕРЫВНЫЕ СИСТЕМЫ
Вэтом разделе будет рассмотрен непрерывный ва риант алгоритма инвариантного погружения. В целях упрощения обозначений и увеличения общности резуль татов исследование будет базироваться на общей постанов ке двухточечной краевой задачи. Необходимо найти
7.2] |
НЕПРЕРЫ ВНЫ Е |
СИСТЕМЫ |
205 |
|
решение ДТКЗ: |
|
|
|
|
|
х (0= v [ x ( 0 , |
А, (0, t], |
(7.2.1) |
|
|
4 0 = Их (0, ЦО, 11 |
(7.2.2) |
||
с условиями на концах траектории |
|
|||
Ш |
— Ах (<0) |
b, |
X(tf) — 0. |
(7.2.3) |
Эта формулировка охватывает все двухточечные краевые задачи из главы 3.
Основная идея инвариантного погружения состоит во включении частной задачи в более общую задачу. Если можно решить общую задачу,то частная задача ре шается автоматически. Удивительно, что часто легче ре шить более общую задачу.
Мы обобщим ДТКЗ, т. е. осуществим инвариантное погружение задачи (7.2.1) — (7.2.3), допустив, что условие на конце траектории при t — tt равно не 0, а с. Другими словами, вместо X (tf) — 0 будем писать X (tf) = с. Кроме того, будем предполагать, что как величина с, так и мо мент tf переменны. В частности, будут рассматриваться «соседние» траектории, одна из которых удовлетворяет условию X (tf) = с, а другая — условию X (tt + е) = = с -f Дс.
Относительно первой траектории допустим, что зна чение состояния системы на конце траектории имеет вид
х (tf) = г (с, tf). |
(7.2.4) |
Другими словами, функция г (с, tf) отражает связь между
условием |
на |
конце X (tf) |
— с и финальным значением |
|
x(f) при |
t = |
tf. |
Если эта |
функция известна, то ДТКЗ |
легко можно было бы решить, интегрируя х и X от конца |
||||
траектории при |
условиях |
Х(//) = с и х (tt) = г (с, tf). |
||
Но функция г (с, t/) неизвестна, таким образом, необхо димо иметь метод ее определения.
Предположим, что имеется траектория, для которой при t = tf X (tf) = с и х (t/) = г (с, tf). Изменим слегка конечное значение tt на tf + е:
X(tf г) — с + Ас |
(7.2.5) |
206 |
ИНВАРИАНТНОЕ |
ПОГРУЖЕНИЕ |
[ГЛ. 7 |
и соответственно |
|
|
|
|
X (tf + е) = X (tf) + |
Ах = г (с, tf) + Дх, |
(7.2.6) |
где Дх и Дс имеют порядок О (е)*). Но, с другой стороны,
X (tf + е) = г (с + Дс, |
tf + е). |
(7.2.7) |
||
Приравнивая правые части |
(7.2.6) |
и |
(7.2.7), |
получим |
г (с, tf) -f- Дх = |
г (с -f- Ac, |
tf + е). |
(7.2.8) |
|
Если разложить правую часть уравнения (7.2.8) в ряд Тейлора относительно с и tf, получим
5г (с, t.) |
|
dr (с, t А |
_ |
||
Дх = -----— Дс -\------------8+ |
О (е2). |
(7.2.9) |
|||
|
5с |
|
|
|
|
Обращаясь к уравнениям (7.2.1) и (7.2.2), видим, что |
|||||
Дх = |
Y I1' (с, tf), |
с, |
t,] в + |
О (в2) |
(7.2.10) |
ДС = |
p[r(c, I f ) , |
с, |
tf\e + |
0 { в2). |
(7.2.11) |
Так что уравнение (7.2.9) принимает вид |
|
||||
у [г (с, tf), с, tf\е = |
5г (с, tf) |
tf), с, tf] в + |
|
||
-----р [г (с, |
|
||||
|
|
|
5г (с, г .) |
|
|
|
+ |
а |
е + ° ( е >- (7-2Л2) |
||
Поделив (7.2.12) на в и устремляя в к нулю, получим урав нение в частных производных, которому должна удовлет ворять функция г (с, tf):
Y l r >с, t fI |
дт[с, tf) |
Р(г, с, tf) |
дт(с, tj) |
(7.2.13) |
|
дс |
dt. |
||||
|
|
К сожалению, неизвестно, как решать это уравнение в об щем виде. Однако часто мы можем аппроксимировать ре шение линейной функцией
г (с, tf) = |
\{tf) + Р (0)с. |
(7.2.1Л) |
*) О (eJ) означает, н о |
lim Q (e^)/sJ 1 = |
0. |
e-»o
7.2] НЕПРЕРЫ ВНЫ Е СИСТЕМЫ 207
Здесь х (tf) — решение для случая с = 0, которое яв ляется решением исходной ДТКЗпри X (tf) = 0. Другими словами, предполагается, что г (с, tf) является оптималь ным значением х (tf) (все еще неизвестным), если с = 0, плюс линейная комбинация отклонений отО, характеризуе мых вектором с. Такая аппроксимация будет хорошей, если с — 0, т. е. когда рассматривается траектория вблизи истинного оптимального значения. В дальнейшем будем предполагать, что с мало, пренебрегая членами по
рядка |
О (|с |2) и выше. |
|
|
|
|
|
|
||
Если подставить (7.2.14) в (7.2.13), получим |
|
||||||||
Y [х + Рс, с, £/] = |
Рр (х + Рс, с, tf) |
+ |
х + |
Рс. |
(7.2.15) |
||||
Теперь разложим у и р в ряд Тейлора |
относительно х, с |
||||||||
и tf, |
ограничившись |
членами |
порядка |
с. |
Уравнение |
||||
(7.2.15) преобразуется |
к виду |
|
|
|
|
|
|
||
~ |
д\ (х, с, t , ) |
Р с |
|
|
|
|
|
|
|
У (х, с, tf) -|--------------— |
— |
|
|
|
|
|
|
||
|
дх |
|
|
|
|
|
|
|
|
|
= Рр (X, с, tf) |
+ |
dfi (х, о, t , ) |
|
л |
4- Рс. |
(7.2.16) |
||
|
Р ■- ■ |
1 Рс + |
X |
||||||
дх
Для того чтобы продолжить вывод, необходимо вместо v и р подставить функции, которые соответствуют ДТКЗ для идентификации систем. Ради простоты используем ДТКЗ вида (3.2.37) — (3.2.39); обобщение для ДТКЗ вида (3.2.63) — (3.2.65) получается непосредственно. Из (3.2.37) и (3.2.38) функции у и р определятся как
у (х, с, tf) = f (х, tf) — G (х, t f) i|7w(tf) GT (x, tf) c, (7.2.17)
-dll'1 (x, tt )
p (x, |
c, tf) = |
-------- --- |
f ■ ф у |Z — h (x, tf)] — |
|
|
|
OS. |
|
|
_ |
dfT (i(, |
„ + |
d |(.,T G (x, tf) $ w (tf) GT (x, tf )] c |
( 7 2 1 8 ) |
|
Эх |
|
Эх |
|
Отметим, чго последнее слагаемое в выражении для р можно опустить, так как оно второго порядка малости по с. Теперь, если подставить (7.2.17) и (7.2.18) в (7.2.16),
получим следующее выражение, не содержащее членов
208 |
ИНВАРИАНТНОЕ ПОГРУЖЕНИЕ |
[ГЛ. 7 |
более высокого порядка малости, чем с:
f (X, tf) - G (к, t{) У w (tf) GT (x, tf) c + |
Pc = |
|
Ox |
= p |
9hT^ |
г/) |
ИГ-Ч- .h lZ |
/ М |
D |
.afT(*-*/) |
c + |
||
Ox |
- ^ [ z - M x , |
G)1 — P- |
|
Ox |
|||||
|
kT, |
|
, |
~ |
I |
|
|
|
|
я ( Oh |
(x, tf ) |
|
X + Pc. |
|
|||||
+ p Ox |
|
Ox |
— |
ЧГу [z — h (x, tf)}\ Pc + |
|
||||
|
|
|
|
|
|
|
|
||
(7.2.10)
Так как эта формула должна быть справедлива для всех достаточно малых с, можно отдельно приравнять коэффи циенты при членах нулевого и первого порядков малости по с. В результате получим
X = |
f (X, tf) + Р |
Э1- - Х: |
Ф1;1(tf) [z - |
h (X, tf)1, |
(7.2.20) |
|
|
|
дх |
dtT(x, *,) |
|
|
|
Р = |
|
|
+ |
|
||
— G (х, G)*Pw (G)GT(i, t,) + Р |
дх |
|
||||
|
|
|
|
|
|
|
i l i i l i L p _ p » ( |
_ |
|
h |
p. |
||
|
Ox |
Ox (. |
Ox |
|
|
) |
|
|
|
|
|
|
(7.2.21) |
Этот результат можно представить в несколько более зна комой форме, подставив Р = — Р. К тому же вспомним, что финальный момент tf переменный, и обозначим его просто t. С этими изменениями уравнения (7.2.20) и (7.2.21) перепишутся в виде
х(<) = f [x(<), <] +
|
+ |
0hT lx U), |
tl |
, |
|
|
~ |
_ |
|
Р («)-------y i U |
- |
W-i {t) {z {t) _ |
h jx (f)i t])t |
(7.2.22) |
|||
|
|
dx (t) |
|
T |
- |
|
0fT [x (0, t] |
|
P (t) = |
|
|
|
|||||
G [X(0, 01 V w (0 G1 |
[X (0, t] + |
P (t)------ + |
|
|||||
|
|
|
|
|
|
|
dx (f) |
|
|
o f [ x ( t ) , <L p ) _ p |
w |
_ j L _ |
0hT [x(0, «I „ р-I |
|
|||
1 |
0x(t) |
|
Ox (0 |
|
**v (t){z(t)- |
|||
|
Ox (0 |
|
||||||
— hlx(<), f)> P(0. (7.2.23)
7,2] НЕПРЕРЫ ВНЫ Е СИСТЕМЫ 209
Начальные условия для уравнений (7.2.22), (7.2.23) мож но получить из условия (3.2.39), а именно из условия
Ч *о)= - VxJ [i(< o)-M x0]. |
(7.2.24) |
Если решить это уравнение относительно х (t0), цолучим
х (^о) — М-х»— Ух,Л (£<>)• |
(7.2.25) |
Простое сравнение уравнений (7.2.14) и (7.2.25) обнаружи вает, что следует использовать начальные условия
x(<0) = |
Mx0, |
' (7.2.26) |
P(*o) = |
Vx, |
(7.2.27) |
Читателю следует помнить, что при переходе к урав |
||
нениям (7.2.22), (7.2.23) была |
сделана замена Р = — Р, |
|
которой объясняется отсутствие минуса в (7.2.27). |
||
Теперь можно проинтегрировать уравнения |
(7.2.22) |
|
и (7.2.23) в прямом времени с начальными условиями (7.2.26) и (7.2.27), чтобы получить последовательную оценку «состояния» х (t). В случае постоянных парамет ров, который представляет наибольший интерес при иден тификации систем, значение, получаемое в момент t =
— tf, представляет собой выход фильтра и сглаженную оценку Следовательно, финальные значения оценок пара метров идентичны значениям, полученным в результате решения ДТКЗ непоследовательным методом. Для удоб ства результаты сведены в табл. 7.2.1.
Уравнение (7.2.23) очень похоже на уравнение фильтра Калмана для дисперсии ошибки. Если f, g и h — линей ные функции х, то (7.2.23) есть просто фильтр Калмана. Нетрудно показать (Сейдж и Мелса [1271), что уравнение (7.2.23) представляет собой первое приближение оценки условной дисперсии ошибки
|
|
|
(t) = |
var {х (t)|Z (t)}, |
|
если, |
как |
предполагается |
в главе 3, начальное условие |
||
х (/0) и входные шумы w(/) |
и v (t) — гауссовские процессы. |
||||
Пример |
7.2 1 |
Для |
того |
чтобы продемонстриро |
|
вать |
применение |
алгоритма |
к идентификации систем, |
||
7г8 Э. П. Сейдж, Дж. Л. Мелса
210 |
ИНВАРИАНТНОЕ |
ПОГРУЖЕНИЕ |
[ГЛ. 7 |
|||||
|
|
|
|
|
|
|
Т а б л и ц а 7.2.1 |
|
Непрерывные алгоритмы |
инвариантного погружения |
|||||||
Модель системы |
|
|
|
|
|
|
||
|
i(t) = |
f [x(«), t] + |
G[x(t), t] w (t) |
(3.2.5) |
||||
Модель наблюдений |
|
|
|
|
(3.2.6) |
|||
|
|
z(0 = h[x(/), |
t] +v( t) |
|
||||
Статистические характеристики |
|
|
|
|||||
|
£{*(«»)} = рХо, |
var {х (to)} = Vw |
|
|||||
|
|
(/)} = »{v(/)J = 0, |
|
|
||||
|
cov {w (0. |
w (t)} = |
(t) 6D (г — T), |
|
||||
|
cov {v (0, |
v(t)} = 4% (t) SD (t — t) |
|
|||||
Алгоритмы фильтрации |
|
|
|
|
||||
Mt) = |
f [x (/), |
t] + |
|
|
|
|
|
|
|
+ p m |
9 |
' X/|0, l] |
v ; 1 (0 {/. (t) - h | i ( O t »l) |
(7.2.22) |
|||
|
|
dx (t) |
|
|
|
|
||
Уравнения для дисперсии ошибки |
|
|
||||||
Р (0 = G [х (0, |
«1 |
|
(t) GT (£ (/), t] + |
|
|
|||
|
|
9fT[i(i), <] |
af[x (/),<! |
P (* )- |
|
|||
|
+ Pit) |
dx (/) |
+ |
dx (t) |
|
|||
|
|
|
|
|
|
|||
P (O' |
a |
<?hT [ x (<). /| |
T-;l (t)!z (0 -h [x (i), *]} |
p (*) |
||||
ax (t) |
|
dx (l) |
||||||
|
|
|
|
|
|
|
|
(7.2.23) |
Начальные условия
*W = Их„- p ('») = vx
рассмотрим задачу идентификации переменного параметра в системе второго порядка (Детчменди и Шридхар [30]). Система описывается моделью
ii = »а + (0.
= —2^ — а (t) х\ — Зх2 + 5 sin t -f w2 (t),
