книги из ГПНТБ / Сейдж Э.П. Идентификация систем управления
.pdf7.3] |
ДИСКРЕТНЫ Е СИСТЕМЫ |
221 |
эту трудность можно преодолеть, тогда, если использо вать разложение в окрестности ф [х (kf), kf)], получим следующие выражения для а и ц:
а [х (kf), с, к,] = <р [х {к}), йг/] — Г [х (kf), kf] Vw (kf) |
X |
||||
|
|
5(ф_1)Т[х(А/), kf] |
|||
X Гт [х (kt), kf] |
|
дх (kf) |
(7.3.30) |
||
и |
|
|
|
|
|
Tt)lx(kf),c, kf] = |
|
|
|
|
|
_ 3(Ф~1)Т [х(Л,), Aj] |
ЭЬт [х~(А/ + |
1|/с/),А/ + |
1] |
||
dx (kf) |
|
dx (kf |
1 |kf) |
|
|
X Vy1(kf - f - 1) {z (kf + |
1) — |
h |x (kf -)- 1 1kf), kf -f- 1]} — |
|||
dhT [x (kf + |
1 |kf), |
A/ + l ] |
|
||
дх (к^ + 1 |kf) | |
dx (kf + 1 |kf) |
Vy1(kt 4- 1) X |
|||
|
|
||||
X {7,(kf 4- 1) — h [ x ( k f |
4- 1 1kf),kf 4- 1]}| |
X |
|||
X Г [x (kf), kf] Vw (kf) Гт [x (k,), kf] — |
■-T-i ^ (fcy)>/i:'] c, (7.3.31) |
||||
|
|
|
|
dx (kf) |
|
где |
|
|
|
|
|
x (kf 4- 1 1kf) = |
<p lx (k,), k/]. |
(7.3.32) |
|||
Для упрощения записи мы не будем перечислять все ар гументы в формулах (7.3.31) и (7.3.32). Из (7.3.31) и (7.3.32) легко можно получить все выражения, необходи мые для уравнений (7.3.24) и (7.3.25):
а [х (kf), 0, kf] = <р [х (kf), fy] = х (kf -f 1 1kf), (7.3.33)
да [х — Рс, с, kf] |
|
|
|
дс |
с=0 |
|
|
|
Эф Гх, к,] |
д (ф~1)т Гх, кА |
,(7.3.34) |
|
1 f - V ( k f ) - T \ WT^ — — J - Г |
||
|
дх |
дх |
|
|
Т1[X (kf), 0, kf] = М [X (kf + |
1 1kf), kf 4-1 ] |
(7.3.35) |
222 И Н ВАРИ АН ТН О Е ПОГРУЖ ЕНИЕ [ГЛ. 7
И |
|
|
|
|
|
|
Эц [х — Рс, с, к |
Э (ср_1)Т [х, kf] |
|
|
|||
ас |
с=о |
ах |
|
V(kf) |
|
|
|
|
|
|
|||
|
ЭМ [х (kf + |
1 |kf), kf + |
11 |
Эф [х, kf| |
|
|
-f- |
|
|
dx |
P (*/) — |
||
|
дх (kf + 11kf) |
|
|
|
||
dM\i(kf - i - l]k f),kf + i] |
|
d ((p-!)T [x, kf] |
||||
|
|
r v wr T |
dx |
. (7.3.36) |
||
|
дх (к^ -f- 1 |к^) |
" |
|
|
||
Здесь матрица M [x (к/ |- 1 |kf), kf -)- 1] определяется как |
||||||
M] x( kf + |
l\kf), fe/ + |
l] = |
|
|
|
|
|
a 9hT fx (k, |
1 |к.), к, |
4- 1] . |
|
X |
|
|
= ------ |
f’ П |
■ V71 {kf + 1) |
|||
|
dx(kf-i-l\kf) |
|
w |
|
|
|
|
X {z (kf -f-1):— h [x {kf -J- 1 1kf), kf + |
1]}. (7.3.37) |
||||
Если теперь подставить эти выражения в уравнения
(7.3.24) и (7.3.25), получим
х (*/ + |
1) = q> [х (kf), kf] + |
|
у;1 {k} + 1} x |
||||
+ |
Р(А, + |
1) |
|
ah [ х ^ + ц ^ |
. у - ц |
||
|
|
|
|
dx (kf + 1 | |
|
|
|
|
X |
{z {к} —{—1) — h [x (kf -|- 1 1kf), kf -j- 1]}, |
(7.3.38) |
||||
|
d (Ф-1) |
т |
aM |x (kf + |
1 |kf), kf + i] |
|
||
|
|
|
|
X |
|
||
P ( * / + l ) |
dx |
|
dx (kf + 1 |kf) |
|
|||
|
|
|
|
|
|||
|
X rvwrT |
а (ф-i)T [x, kf |
Эф [x, к |
|
|||
|
dx |
Эх |
^ P (kf) |
|
|||
|
|
|
|
|
„_1\Т |
P (kf). |
(7.3.39) |
|
|
|
|
= TVwr T d(ff>A1) ■- f |
|||
|
|
|
|
|
Эх |
Эх |
|
Если умножить справа уравнение (7.3.39) на дц>т1дх и определить Р (kf + 1 Ify) как
Р (kf + 1 1kt) = Г [i (kf), к,] Vw (kf) Гт [x (A;), kf] + |
|
^ 1УЧ/ IA |
, (7.3.40) |
* ! » <*» ‘ /1 p w |
Эх (kf) |
dx (kf) |
7.3] |
ДИСКРЕТНЫ Е СИСТЕМЫ |
2 2 3 |
то уравнение (7.3.32) перепишется в виде Р ^ + 1) =
(7.3.41)
Комбинируя уравнения (7.3.32), (7.3.37), (7.3.38), (7.3.40), (7.3.41), получим алгоритм для последовательного оце нивания х (к), если kf интерпретировать как текущее вре мя к. Начальные условия для этого алгоритма опреде ляются из (7.3.28), (7.3.29) как
Р (* о )= |
VXo, |
(7.3.42) |
х (к0) = |
рХо. |
(7.3.43) |
Последний алгоритм часто можно представить в более удоб ной форме. Если факторизовать симметрическую матрицу М [х (kf l|fc,), kf -(- 1], то можно записать
PM [х (kf -f 1 |kf), kf + 1 ] |
|
1) Vv1(A + |
1) H (A 4- 1), |
||||||
|
|
— HT(k + |
|||||||
dx {kf + 1 |kf) |
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
(7.3.44) |
|
где в |
общем |
случае |
Н (к -{- |
1) |
будет |
зависеть |
от |
||
х (к -f-1 |7с) и ъ |
(к -|- 1). |
Тогда, |
используя |
лемму |
об об |
||||
ращении |
матриц, можно переписать |
уравнение |
(7.3.41) |
||||||
в следующем виде: |
|
|
|
|
|
|
|
||
Р(А + 1) = Р(А + 1 | А ) - |
|
|
|
|
|
|
|
||
— Р ( А + |
1|/с)Нт (А + 1 ) [ Н ( А + l)P(A + |
l|A)HT(ft + |
1 )+ |
||||||
|
+ |
Vv (к + |
I)]"1Н (к + |
1) Р (к + |
1 1к). |
(7.3.45) |
|||
Преимущество этой формы записи состоит в том, что тре буется обращать матрицы более низкого порядка, так как размерность наблюдения обычно ниже размерности со стояния. Главный недостаток сводится к необходимости факторизации (7.3.44), что может оказаться трудной задачей. Конечно, когда наблюдение линейно ъ (к) = = Н (к)х (к) -f v (к), факторизация (7.3.44) получается совершенно естественно.
224 |
И НВАРИАНТНОЕ ПОГРУЖ ЕНИЕ |
[ГЛ. 7 |
Та б л ица 7.3.1
Дис1ретные алгоритмы инвариантного погружения |
|
|||||||||
Модель |
системы |
|
|
|
|
|
|
|
|
|
|
х (А + |
1) = |
<р [X (А), |
к] |
+ |
Г [х (к), к] w (к) |
(3.2.1) |
|||
Модель наблюдений |
|
|
|
|
|
|
|
|
||
|
|
z (к) = |
h[x (к), А] + v (к) |
|
(3.2.: |
|||||
Статистические характеристики |
|
|
|
|
||||||
|
Ч {х {ко)} = рХо, |
var {х (/с0)} = VXo, |
|
|
||||||
|
% {w (А)} = Ч {V {к)} = О, |
|
|
|
||||||
|
cov (w (/с), |
w (/')} = Vw (к) 8К {к — /), |
|
|
||||||
|
cov {у (к) , |
V (/')}= v v (к) бк {к — /) |
|
|
|
|||||
Одношаговое предсказание |
|
|
|
|
|
|
||||
|
|
х (к + 1 |к) |
= |
ср [х {к), /с] |
|
(7.3.32) |
||||
Алгоритм фильтрации |
|
|
|
ah1 [x(/c + |
i|/c), a + ij |
|
||||
х {к + 1) = |
£ {к + |
1 1к) + |
р {к + 1 ) |
X |
||||||
|
|
|
|
|
|
|
дх {к + 1 |к) |
|
|
|
X |
V-1 (fc 4- 1) {z (Л + 1) ^ |
h [х (Л -Ь 1 I А:), |
А + 1]} |
(7.3.38) |
||||||
Уравнение для априорной дисперсии |
|
|
|
|||||||
Р (А + 1 |А) = Г [£ (А), к] Vw (к) Гт [X (к), к) + |
|
|
||||||||
|
Эф [х (/с), |
/с] |
Р (А) |
ЭФТ [х (к), |
к] |
(7.3.40) |
||||
|
+ |
Эх (А) |
|
Эх (А) |
|
|||||
|
|
|
|
|
|
|
|
|||
Уравнение для дисперсии ошибки |
|
|
|
|||||||
р [к 4- 1) = |
ЭМ [х(А + 1 |к), к 1] |
|
" х |
|
||||||
|
Э х (А + 1 |
|
Р (А + 1 |А) |
|
||||||
|
|
|
|А) |
|
|
|
||||
|
|
|
X Р (А + |
1 |А), |
|
(7.3.41) |
||||
М[х(А+1|А), А + 1 ] |
= |
|
|
|
|
|
|
|
||
ЭЬ^1[ х (А+ 1 |А), |
А 4-1] |
Vy1 (А + 1) {z (А + 1) — |
|
|
||||||
|
Эх (А + |
1 |А) |
|
|
|
|||||
|
|
|
— h [х (А + |
1 |А), |
А + |
1]} |
||||
|
|
|
|
|
|
|
||||
7.3] |
ДИСКРЕТНЫ Е |
СИСТЕМЫ |
225 |
|
Таблица 7.3.1 (продолжение) |
||
Другие уравнения для дисперсии ошибки |
|
||
р (к + 1) = Р (к + 1 |к) — Р (к + 1 |к) Нт {к + 1) X |
|
||
X [Н (к + 1) Р (к + 1 |к) Нт (А + 1) + Vv (к + 1 )]- X |
|
||
|
Х Н (А + 1 )Р (А + 1|А), |
(7.3.45) |
|
Щ [х (А + 1 I к), А + 1] ■= Нт (к + 1) V ;1 (к + 1) Н (к + 1) |
|||
дх (к +1 |
] к) |
|
|
Начальные условия |
|
|
|
|
£(*<>>=и*.. |
P(*») = v Xo |
|
Для удобства все основанные на инвариантном погру жении алгоритмы идентификации дискретных систем по максимуму апостериорной вероятности сведены в табл. 7.3.1. Использование этих алгоритмов иллюстрируется следующим примером.
Пример 7.3.1. Рассмотрим дискретную аппроксима цию неидеального колебательного контура, характери зуемого отклонением x(t), скоростью г (t), декрементом затухания d, собственной частотой 5 рад!сек, положением равновесия 12,5 и аддитивным входным шумом w (t). Соответствующее непрерывное уравнение имеет вид
х -f- 10 с2ф -f- 25 х = 12,5 -|- w (t)
Дискретная аппроксимация приводит к нелинейной си стеме третьего порядка:
х (k -f-1) = х (к) + Тг (к),
г (к -(- 1) = —25 Тх (к) -}- [1—10 Td (А:)] г (к) -f- + 12,5 Т + T w (к),
d (к -f 1) = d {к),
z {к) = х (к) -f- v (к).
Используя табл. 7.3.1, приходим к алгоритмам последо вательного оценивания
* (к Н- 1) = х (к) + Тг (к) + 2TVfVn (к + 1 )[z (к + 1) -
— Цк) — Тг(к)],
226 |
|
ИНВАРИАНТНОЕ ПОГРУЖ ЕНИЕ |
|
[ГЛ. 7 |
|
г (А + |
1) = |
2ЪТх (А) + f (А) - |
10Td (к) г (к) + |
12,57’ + |
|
|
|
+ 2TV?Vn (к + 1) [г (А + 1) - |
i |
(А) - Гг (к)}, |
|
а (А + |
1) = а (А) + 2TV?Vn(k + 1)[Z (к + 1 ) - £ |
(А) — Гг(А)1, |
|||
|
Рп (А + 1 1А) = Рп (к) + 2ГР21(к) + Г2Р22(А), |
||||
Рп ( к + 1 |
1А) = --2 5 Г P u (A) + [l-Ю Г a (A )-2 5 Г 2]P 21(A )- |
||||
- ЮГг (к) Р31 (к) + 11 - юга (А)] ГР 22 (к) - |
ЮГ2г (А) Р32 (А), |
||||
|
|
Р31(A -j- 1 1А) = |
7J31(А) -|- ТР32(А), |
|
|
Р 22(А + 1 |
1А) = 625Г 2Р П (А) - |
5071[1 - 10ГЗ (А)] Р 21(А) |- |
|||
+500TV (А) Р31 (к) + [1 - юга (А)]2Р22(А) -
—20Гг (А) [1 — ю г а (А)] Р32(А) +
+100Г2а (А) г (А) Р33(А) + V',, (А),
(А + |
1 1А) = |
- 25ГР31 (А) + [1 - |
ЮГа (А)] Р32(А) - |
|
|
|||||||
Раз(А + |
1 1А) — Рзз (А), |
|
|
|
— ЮГг (А) Р33(А), |
|||||||
|
|
|
|
|
|
|
|
|||||
Рц (А + |
1) = |
Рп (А + |
1 |A) Fo (А + |
1) |
|
|
|
|
|
|||
Pn(A + |
l|A) + KB(A + i) |
|
|
|
|
|
||||||
Р 2i ( A + l ) = |
Ря(А + 1|А) F„(A + |
1) |
|
|
|
|
|
|||||
Pu(A + |
l| A )+ VB( k + 1) |
’ |
|
|
|
|
||||||
Pn(k |
|
1) |
Р81(А + 1|А)7„(А + |
1) |
|
|
|
|
|
|||
|
i'n (A + |
1 I A) + Vv (A + 1) |
’ |
|
|
|
|
|||||
|
|
|
|
|
|
|
||||||
P22 (A +1) — P22 (A + |
1 |A) -- |
|
^я(А + 1|А) |
|
V ’ v ( k + |
|||||||
l ' n ( k |
+ i |
] k ) |
+ |
|||||||||
|
|
|
|
|
||||||||
P32 (A + |
1) — P32(A -f- 1 1A) — |
P31 (A + |
1 |А) Р |
п (A + |
1 I A) |
’ |
||||||
|
|
|
|
|
Pn(A + |
l|A) + |
Vo(A + |
l) |
||||
P зз (A + |
1) = |
P33(A -f- 1 1A) — |
|
ph (A + |
1 I k) |
|
|
• |
||||
Pn(A4- l | A ) - l - K l)(A + l) |
||||||||||||
Отметим, что, воспользовавшись симметричностью мат рицы дисперсий ошибки, мы исключили три уравнения из девяти. Па рис. 7,3.1 представлены результаты
7.3] ДИСКРЕТНЫ Е СИСТЕМЫ 2 27
вычислений для случая, |
когда |
|
|
2 |
1 |
1 |
1 |
о |
|||
V x 0 = 1 2 |
1 . М х .= |
о |
|
1 |
1 |
2 |
0 |
и Vv = Vw = 20, Т — 0,002. Видно, что оценки вектора состояния и параметра d (к) сходятся к истинным зна чениям быстрее, чем за один период собственных ко лебаний.
Во многих практических задачах идентификации вход ной шум w и ошибка измерений v коррелированы. Часто
Р ис. 7.3 .1 . Совместное оцепивание траектории и параметров системы второго порядка с ш умами.
это связано со способом математического описания си стемы, а не с корреляцией реальных помех. Так бывает тогда, когда наблюдаются искаженные помехами входные сигналы или когда наблюдаемые величины содержат кор релированный шум.
Прямой метод решения задачи с коррелированными помехами состоит в преобразовании исходной задачи к задаче с некоррелированными шумами. Рассмотрим
228 |
ИНВАРИАНТНОЕ ПОГРУЖ ЕНИЕ |
[ГЛ . 7 |
|||
следующую |
модель |
формирования |
входного |
сигнала: |
|
|
х (А + |
1) = |
ср [х (А), А] + |
Г (к) w (к) |
(7.3.46) |
и модель наблюдений |
|
|
|
||
|
z (к) = |
h [х (к), к] + |
v (к). |
(7.3.47) |
|
Простоты ради предполагается, что Г не является функ цией х (к). Как обычно, w(A) и v (к) — дискретные белые шумы с нулевым средним с ковариационными матрицами Vw (к) и Уу (к). Однако теперь уже не предполагается, что v (к) и w (к) независимы, а именно:
cov {w (к), V (;)} = Vwv (к) дК (к — /). |
(7.3.48) |
Для того чтобы устранить корреляцию входного шума и ошибки измерений, перепишем (7.3.46) в следующем виде:
х ( к -f 1) = ф[х(А),А] +
+ Г (к) w (к) -)- К ? (к) [z(к) — h [х (к), к] — v (А:)]. (7.3.49)
Теперь запишем (7.3.49) как
х (к 4-1) = ф* [х (к), А] 4- w* (к) 4- К р(к) z (к), (7.3.50)
где
Ф* [х (к), А] = ф [х (к), к] — К р(к) h [х (к), к] (7.3.51)
и
w* (к) = Г (Л) w (к) - Кр (к) V (к). (7.3.52)
По-прежнему w* (к) — белый шум с нулевым средним и матрицей ковариации
cov {W* (к), w* (])}= [Г (к) Уw (А:) Гт (к) - Г (к) Vwv (A:) K j (А) - - Кр (к) V L (к) Гт (А) + Кр (к) Vv (к) К рт(А)] 6К (к - /).
(7.3.53)
Б общем случае w* (к) коррелировано с v (к). Однако корреляцию между w* (к) и у (к) можно устранить соот ветствующим выбором К р (А). Чтобы показать это, необ ходимо рассмотреть ковариацию между w* (А) и v (А):
cov {w* (А), у (А)} = Г (A) Vvw (А) — К р(A) Vv (А).
7.3] |
ДИСКРЕТНЫ Е СИСТЕМЫ |
229 |
|
|
|
|
|
|
|
|
|
|
|
|
Т а б л и ц а |
|
|
||
Д искретны е алгоритм ы |
ин вари ан тн ого |
п огруж ения |
|
|||||||||||||
для коррелированны х |
входны х ш ум ов и ош ибок измерений |
|||||||||||||||
М одель |
входного сигнала |
|
|
|
|
|
|
|
|
|
|
|
||||
|
x (ft - f - 1) == cp [x (ft), |
ft] |
+ |
Г w |
(ft) |
|
|
(7.3.46) |
||||||||
М одель |
наблюдений |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
z (ft) = |
h |
[x |
(ft), |
ft] |
+ |
v |
(ft) |
|
|
|
(7.3.47) |
||
Априорная статистика |
|
|
|
|
|
|
|
|
|
|
|
|
||||
Цх (*о) = И'х0> |
|
|
|
V x (/co)=VXo, |
|
|
|
|
||||||||
Hw (к) —°> |
cov ( wW ' w (/)} = V w (ft) 6К (к — /), |
|||||||||||||||
pv (/с) = |
°> |
cov (v (к)> v (/)} = |
v v |
6к (fc — /); |
||||||||||||
co v { w { к ) , x { к о ) } = |
o , |
cov {v ( к ) , w |
( / ) } = |
V v (v (ft) 8K (ft — |
/') |
|
||||||||||
Алгоритм фильтрации |
|
|
|
|
|
|
|
|
|
|
|
|
||||
x(ft + |
l ) = x ( f t |
+ l|ft) |
+ |
|
|
|
|
|
|
|
|
|
|
|
||
|
|
+ |
К (ft + |
1) {z |
(ft + |
1) — |
h |
[ x (ft + |
1 |ft), |
ft + |
1]} |
|||||
Однош аговое |
предсказание |
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
x (ft + |
1 1 ft) = |
|
|
|
|
|
|
|
|||
= cp [ £ (ft), |
ft] + Г V wv |
(ft) V '1 (ft) {z (ft) - |
h [£ (ft), |
ft]} |
|
|||||||||||
Уравнение для |
коэффициента усиления |
|
|
|
|
|
||||||||||
К (ft + |
1) = P (ft +1) |
dh г |
[ х |
(ft + |
1 |
I ft), |
ft + 1] |
v ; 1(ft + |
11 ft) |
|||||||
— |
dx (ft |
i , Tl, |
|
|
-v |
|
|
|
||||||||
|
|
|
|
|
|
|
1 |ft) |
|
|
|
|
|
|
|||
Уравнение для |
априорной дисперсии ош ибки |
|
|
|
||||||||||||
|
|
|
|
|
Р (ft -f-1 |ft) = |
|
|
|
|
|
|
|
||||
: <p * (ft) P (ft) q>*T (ft) Г + |
г v w (ft) r T - |
Vwv (ft) v ; 1 (ft) v vw (ft) r T |
||||||||||||||
Уравнение для |
дисперсии ош ибки |
|
|
|
|
|
|
|
|
|||||||
P(ft + l) = P(ft+l|ft)_ |
|
|
|
|
|
|
|
|
|
|
|
|||||
— Р (ft + 1 |ft) Нт (ft + |
1) [H (ft + |
1) P (ft + |
11ft) HT (ft + |
1) + |
||||||||||||
|
|
|
|
+ |
v v (ft + 11 ft)Г |
H (ft + |
1) p (ft + |
1 1ft) |
||||||||
2 3 0 ИНВАРИАНТНОЕ ПОГРУЖ ЕНИЕ [ГЛ. 7
|
|
Т а б л и ц а |
|
7.3.2 |
(продолженыг) |
||
Матричные уравнения ддк передаточной функции и наблю- |
|||||||
депий |
!кр [х (к), к] |
|
|
|
|
|
|
<Р* ( * ) - |
г v„v m V №|*-.>8|Ч г <‘ >; 4 , |
||||||
я- ' |
|||||||
|
дх (к) |
|
|
|
|
д х (/с) |
|
|
нт (к + 1) V-1{к + 1 |к) Н (к + 1) = |
|
|||||
|
д |
3hT [х(/с + |
1 U), |
к + |
1] |
||
|
дх (к + 1 |к) |
Зх(/с + |
1|/г) |
А |
|||
X v ; 1 (к + 1 |к) {г (к p i ) - h [ £ ( A |
+ |
l|fc), |
А + 1]} |
||||
Начальные условия |
|
|
|
|
|
||
|
х (0) = |
цХп, Vx ( 0 ) = V Xo |
|
|
|||
Если положить |
|
|
|
|
|
||
|
Кр (к) = |
Г (к) Vvw (к) V '1 (к), |
|
(7.3.54) |
|||
то видно, что cov ("w* (к), v (к)} = 0 и получается экви валентная исходной задача с некоррелированными шу мами, для решения которой можно воспользоваться ал горитмом из табл. 7.3.1. В результате получаются алгорит мы решения задач с коррелированными шумами, которые сведены в табл. 7.3.2. Заметим, что при известном входном сигнале z (к) в уравнении (7.3.50) одношаговый прогноз имеет вид
х (к + 1 j к) = <р* [х (к), к\ + Кр(к) z (к). -(7.3.55)
Полученный результат можно распространить на слу чай, когда средние значения или дисперсии неизвестны (Сейдж и Гуса [122]; Сейдж [117]; Сейдж и Уэйкфилд [129]). Существует практически неограниченное множе ство вариантов и комбинаций различных моделей и соот ветствующих им алгоритмов. Рассмотрим простые при меры применения этих идей к решению задач идентифи кации.
Пример 7.3.2. Рассмотрим задачу идентификации объ екта, когда наблюдение входного сигнала искажено поме хой. Модель входного сигнала
х (к + 1) = <р [х (к), к) + Г (к) w (к),
