книги из ГПНТБ / Сейдж Э.П. Идентификация систем управления
.pdf3.4] |
(КРИ ТЕРИ И МАКСИМУМА ПРАВДОПОДОБИЯ |
91 |
|
и в. |
В результате |
получится |
|
|
х(А + |
1 | М ) = ч>1х(А|е),А]. |
(3.4.43) |
Таким образом, выписана полная система уравнений дискретного нелинейного алгоритма оценивания первого порядка по методу условного среднего. Они сведены в табл. 3.4.1, включающую алгоритмы, необходимые для определения штрафной функции максимального правдо подобия рассмотренным методом первого порядка. Можно пользоваться аппроксимациями более высокого порядка для оценки (Сейдж и Мелса [127]), однако здесь они рас сматриваться не будут.
Отметим, что эти (приближенные) алгоритмы фильтра ции условного среднего по сути являются обобщением алгоритмов фильтра Калмана. Если модели формирова ния и наблюдения сигнала линейны, то эти уравнения превращаются в обычные уравнения линейного фильтра Калмана. Итак, минимизация функции штрафа из табл. 3.4.1 при ограничениях, задаваемых разностными урав нениями из той же таблицы, ведет в итоге к алгоритмам идентификации по методу максимального правдоподобия. Дальнейшему развитию этих результатов посвящены сле дующие четыре главы. Теперь рассмотрим простой при мер, иллюстрирующий наиболее существенные моменты изложенных выше результатов.
Пример 3.4.1. Используем простой пример для демон страции процедуры определения функции штрафа при идентификации по максимуму правдоподобия. Скалярные модели формирования и наблюдения сигнала с постоян ными VD и Vw имеют вид
х {к -]-1) = Фх (к) + ш (к), z (к) = х (к) + v (к)
Для такой или любой линейной модели формирования и наблюдения сигнала алгоритмы табл. 3.4.1 являются точными, а не просто хорошими приближениями. Подле жащая минимизации штрафная функция (3.4.21) прини мает вид
/ = 4 - 2 flndetlF„ + Уг (А|Л-1,Ф)] +
к—К ^
[г (к) — х(к\к — 1, Ф)]2 )
~Г Vv+ Гг (*|А-1,Ф ) /•
92 ФУНКЦИИ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФ ИКАЦИИ [ГЛ . 3
|
|
|
|
Т а б л и ц а |
|
3.4.1 |
|||
Алгоритмы первого порядка идентификации |
|
|
|
||||||
по максимуму правдоподобия |
|
|
|
|
|
||||
(штрафная функция) |
|
|
|
|
|
|
|
||
Модель формирования сигнала |
|
|
|
|
|
|
|
||
х (ft + 1) = |
ф [х (ft), к] + Г [х (к), |
к] w (к) |
|
|
|
|
|||
Модель наблюдений |
|
|
|
|
|
|
|
|
|
z (к) = h [х (к), к] + v (к) |
|
|
|
|
|
|
|||
Параметры априорных распределений |
|
|
|
|
|
|
|
||
Ч (w (к)} = 0, cov {W (к), w (/')} = Vw (к) бк (к — /), |
|
|
|
||||||
<$(у (к)} = 0, |
cov {V {к), v (/).} = Vv6K (к — /), |
|
|
|
|
||||
% (х (0)} = рх (0) = |
цХо, var {х (0)} = V~(0) = |
Vx (0) = |
V^, |
|
|||||
cov(w (к), v (к)} = cov {х (к), |
v (к)} = cov{x (к), |
w (/')} — 0, / > |
к |
||||||
Уравнение фильтра условного среднего |
|
|
|
|
|
|
|
||
х (А- + 1 | ;0 )= х > + 1 |к, 0) + |
К (ft + 1) [z(ft + |
l) — |
|
|
|
|
|||
|
|
— h[x(ft + l|ft, |
0, |
|
ft+ |
1]] |
|||
Уравнение одношаговой |
экстраполяции |
|
|
|
|
|
|
|
|
X (ft + |
1 |ft. в) = ф [х (ft |0), |
ft] |
|
|
|
|
|
||
Уравнение для коэффициента усиления |
фильтра |
|
|
|
|
||||
|
ЭЬТ [х (ft + 1 1ft, |
9), ft + 1] |
xr-i |
(ft + 1) |
|||||
K(ft + l ) = V x (ft + l|0) |
dx (ft + 1 |ft, |
0) |
|
Vv |
|
||||
|
|
|
|
|
|
|
|||
Уравнение для априорной дисперсии ошибки фильтрации
V~ (ft + 1|Л, 0) |
дф [ х (ft |0), |
ft] |
дфТ (x |
(ft 10), |
ft] |
||||
ax (ft I 0) |
|
x (k) |
dx (ft |
I 0) |
+ |
||||
|
|
|
|
||||||
|
+ r[i(fc|0), |
ft] Vw (ft)rT[x(ft|0), |
ft] |
|
|
|
|||
Уравнения для дисперсии ошибки фильтрации |
|
|
|||||||
V - (ft + |
1 |0) = |
V~ (ft + 1 |ft, |
0) - |
V5 (ft + |
1 |ft, |
0) X |
|||
ahT [x (ft + |
life. 0). fc + i] |
dhT [x (ft 4-1 |ft, 0), |
ft+ |
1] |
|||||
X |
|
0) |
|
|
dx (ft 4- 1 |ft, |
0) |
|
||
Эх (ft 4 -1 1ft, |
|
|
|
||||||
X V -(ft 4-1 |ft, |
0)! dhT [x (ft 4-1 I ft, B), |
fe + 1] |
+ |
Vv (ft + |
1) |
||||
|
|
dx (ft 4-1 |ft, 0) |
|
|
|
|
|||
dhT [x(ft4-l|fc, |
0), ft + |
1] |
V-(ft + |
1 1ft, 0) |
|
||||
X |
dx (ft + 1 |
|ft, 0) |
|
|
|||||
|
|
|
|
|
|
|
|||
X
X
3.4] |
КРИТЕРИЙ МАКСИМУМА ПРАВДОПОДОБИЯ |
93 |
||||
|
|
|
Т а б л и ц а 3.4.1 |
(продолжение) |
|
|
Штрафная функция идентификации по максимуму правдо |
|
|||||
подобия |
|
|
|
|
|
|
1 |
*1 |
|
|
|
|
|
J = - 2~ J' |
In dot Vz (к |к — 1, 0 )+ ||z(/c) — h[x(/c|/c — |
|
||||
|
к=к\ |
|
|
|
|
|
|
в). |
V |
|
|
Vv (*) + |
|
|
llv-Vfclfc-i. в). V,(*|A-1. в) = |
|
||||
+ |
dhT[x(k\k — 1, |
9), |
k] |
|
|
|
|
дх(к\к — 1, |
0) |
V - (AJ k — 1, 0) X |
|
||
|
|
|
|
|
||
|
|
X |
dhT[x (k |к — 1, |
0), k\ |
|
|
|
|
dx (k |к — 1, 0) |
|
|||
|
|
|
|
|
||
Начальные условия фильтрации |
|
|
||||
|
|
х(0|0, 0) = Ц2о, |
V- (О I 0, 0) = VXo |
|
|
|
Алгоритмы одношаговой экстраполяции из табл. 3.4.1, которые снова оказываются точными, поскольку система линейна, выглядят так:
х (к + 1 1к, Ф) = Фх (к |к — 1, Ф) +
|
<DF_ (к\к — 1,Ф) |
|
|
|
||
j |
X |
|
[z (к) — х (к |к — 1, Ф)], |
|||
' |
V-(k\k — 1,Ф) + F |
|||||
|
X |
|
и |
|
|
|
|
|
ФW V- (к\к — 1,Ф) |
I |
Т7 |
||
V~x (k + |
l\k, Ф) |
V X |
' |
|||
V-(k\k — 1 , Ф ) + Vv |
+ |
Vw |
||||
|
|
|||||
Для определения оптимального значения оценки Ф, переходной матрицы модели, мы минимизируем функ цию штрафа J относительно Ф при ограничениях, зада ваемых разностными уравнениями для х (к + 1 |к, Ф) и V- (к -j- 1 I /с, Ф). Поскольку имеется всего один настра
иваемый параметр, оценка значений штрафной функции для всех значений Ф, для которых это необходимо, ока зывается сравнительно простой (для вычислительной ма шины) задачей. На рис. 3.4.1 — 3.4.3 показаны изменения J в зависимости от Ф для нескольких различных значений отношения Vv/Vw. Следует отметить, что при конечных размерах выборки (конечное к0 = 0) минимум функции
94 ФУНКЦИИ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФИКАЦИИ [ГЛ. 3
штрафа может, при отдельных последовательностях шума, не всегда достигаться при истинном значении Ф. При «низком» уровне шума объекта и «длинной» последователь ности наблюдений минимум J достигается вблизи от истин ного значения Ф. По мере сокращения длины реализации или усиления шума наблюдений ошибка идентификации
ЛФ) ,, Ю*
I)1
_ . J |
------------ 1---------- |
1------------ |
1------------ |
1_____Lllflt |
I |
. |
, |
|
|
п |
Ц,г |
|
ЦВ |
\ |
/,0 |
|
|
Рис. 3.4.1. |
Зависимость штрафа от Ф при разных значениях Vv/Vw |
|||||||
пример |
3.4.1 |
(хо = |
0, 0; |
Vv/Vw = |
р, к) = 800). |
|||
возрастает. Точно так же можно ожидать, что параметры априорного распределения х (к0) влияют на идентифика цию. Очевидно, что если Vx (к0) равна нулю и отсутствует шум объекта или шум наблюдений, получится простая разновидность задачи идентификации, рассмотренной в главе 2. На рис. 3.4.4 показана зависимость функции штрафа от У Vv при различных размерах выборки.
Эти приближенные алгоритмы нуждаются в незначи тельных изменениях для распространения их на случай, когда шумы объекта и измерений коррелированы. Урав нения (3.4.9) и (3.4.11) для функции штрафа сохраняют силу. Однако в выражениях для входящих в них матема
тических ожиданий появляются |
отличия |
по |
сравнению |
со случаем некоррелированных |
шумов. |
В |
самом деле, |
h[х (к), к |0 |=
=Ш(z (ft) |Z (к - 1), 0} = Ш(h [х (к), k]\Z(k — 1), 0}.
3.41 |
КРИТЕРИЙ МАКСИМУМА ПРАВДОПОДОБИЯ |
9 5 |
|
|
ЛФ)
Рис. 3.4.2. Зависимость штрафа от Ф при разных значениях I; пример 3.4.1 (L — число наблюдений, Vv = 1,0; Vw = 16,0 хо = = 0,5).
Рис. 3.4.3. Зависимость функции штрафа от kVw при разных Vv/Vw; пример 3.4.1 (р = VJVw, kf = 900 — число наблюдений, х0 =
= 0,0).
96 |
Ф у н к ц и и Шт р а ф а в з а д а ч а х и д е н т и ф и к а ц и и [г л . з |
Применяя разложение в ряд Тейлора к уравнению (3.4.22), мы видим, что появляется необходимость в выражении для h [х (к |к — 1, 0)1, которое, конечно, по-прежнему определяется формулой (3.4.21). Алгоритм одношаговой
J
Рис. 3.4.4. Зависимость функции |
штрафа от Y У» ПРИ |
разных L |
|
(VvIVw = р = |
9,0, L — число наблюдений, х0 = |
0,0). |
|
экстраполяции |
(3.4.43) в данном случае уже не |
годится, |
|
так как |
|
|
|
х (к 1) = ф [х (к), к] -}- Г [х (к), к] w {к), |
|
||
и аппроксимация первого порядка принимает |
вид |
||
х (Л -И | * ,в ) = |
|
|
|
= ф [х (к 10), /с] 4- Г [х (к), |
к] $ {w (к) |Z (к), 9}, (3.4.44) |
||
что можно записать в виде |
|
|
|
х (к + 1 1к, 0) = |
<р [х (к 10), к] + |
Г [х (к), к] х |
(3.4.45) |
X Vwv {к) V^1(к |к — 1, 0) {z (к) — h [х (к \к — 1, 0), к]}, |
|||
применяя теорему об условном математическом ожидании (3.4.28) и соотношение
var (w (к) |Z (к), 0} = Vw (к) - Vwv (ft) V"1 (ft |ft - 1) Vvw (k). (3.4.46)
3.4] |
КРИТЕРИЙ МАКСИМУМА ПРАВДОПОДОБИЯ |
97 |
|
||
|
|
|
|
|
|
Т а б л и ц а |
3.4.2 |
Алгоритмы |
первого порядка идентификации |
|
|||
но |
максимуму правдоподобия |
|
|||
(коррелированные шумы объекта и наблюдений) |
|
||||
Уравнение фильтра условного среднего |
|
|
|||
х (А + 1, 0) = х (к + 11к, 0) -{- К (к + 1) {z (А + 1) |
|
||||
— h [ х (А: + 1 |к, 0), А + |
1]} |
|
|
||
Уравнение одношаговой экстраполяции |
|
|
|
||
i (к + 1 |к, |
0) = <р [2 {к |0), |
к) + |
Кр (к) {г {к) ■ |
|
|
|
— h [х (к \к — 1, |
0), А]} |
|
|
|
Уравнение для коэффициента усиления фильтра |
|
||||
К (к + 1) = |
|
|
|
|
|
= V - (* + 1 |Л, 0) |
9hT[J (А 4-1 I*. 0). k + i] |
х . |
|
||
дх (к -J- 1 |А, 0) |
|
v ( * + i i fc- 0> |
|||
Уравнение для априорной дисперсии ошибки идентификации |
|||||
дер [х (А |0), А] |
|
д(рт [х(А|0), |
А] |
||
V ; (А+1 [А, 0) = |
дх (к I 0) |
V=(A) |
д х (А |0) |
+ |
|
|
|
|
|
||
+ Г [х (А |0), к] Vw (А) Гт [х (А |0), |
А ] - |
|
|||
-K P (A)VZ- 1(A|A-1, 0)Кр (А) —
^'|й> ~ к (*)v»» (t>гТI»(* I е>’ *1 -
ОХ (А |И)
д<рт [х (А |0), А]
— Гт [х (А|0), A] Vwv (А) Кт (А)
Эх (А |0)
Уравнение для дисперсии ошибки фильтрации
V£(A + 1|0) =
dhf [х (A -f 1 |А, 0), А + |
1]1Т |
= 1 - К ( А + 1) |
Vx (к + 1 |А, 0) |
дх(к + 1 1к, 0) |
|
Уравнение для коэффициента усиления одношаговои экстра поляции
Кр (А) = Г [х (А |0), к] Vwv (А) V"1 (А + 1 |А, 0)
4 Э. П. Сейдж, Дж. Л. Мелса
98 ФУНКЦИИ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФИКАЦИИ [ГЛ . 3
Т а б л и ц а 3.4.2 (продолжение)
Штрафная функция идентификации по максимуму правдо подобия
1 |
2 111 det Vz (А I А - |
1, 0) + |
|
|
|
||
J = — |
|
|
|
||||
|
ii—ki |
|
|
|
|
|
|
|
-j-||z(A') |
h [ х (А |А |
1, 0, Л] ||у-1 q.j |
| |
|
||
|
|
|
|
|
, 0)’ |
|
|
(А: I * — 1, 0) = |
Vv (A) + |
dhT [х (А |А — 1, |
0), А] |
X |
|||
ах (л1ft — 1, |
0) |
||||||
|
|
|
|
||||
|
|
ЭЬт [х (А |А— 1, |
0), |
А] |
|
||
х V - (А' | /с — 1 , 0 ) |
дх (А |А — 1, |
0) |
|
|
|||
|
|
|
|
|
|||
Начальные условия фильтрации |
|
|
|
||||
|
х (0 10, 0) = рХо, V - (0|0, 0) = |
VXo |
|
||||
Остальные алгоритмы первого порядка фильтрации ус ловного математического ожидания нуждаются в анало гичных изменениях. Эти изменения вносятся без труда, и получающиеся в результате приближенные алгоритмы сведены в табл. 3.4.2.
Пример 3.4.2. Вернемся к примеру 3.4.1, предполагая, что теперь имеется второе наблюдение, определяемое уравнением
z2 (к) = w (к) + va (к),
причем шумы объекта и наблюдений коррелированы, так что
z(k ) |
Гг (A) I |
Гх (А) + |
v (А) |
|
Lz 2 ( f t ) J |
(А) + V i (А)]■ |
|||
|
||||
h[*(fc). *1 |
= [*оА)] * |
|
[w (ft)+i»(A)]’ |
|
|
|
|
||
= |
[0F№], Vv = Г » |
0 ■ |
||
L°
Применение алгоритмов из табл. 3.4.2 немедленно при водит к следующей функции штрафа и ограничениям
3.4] |
КРИТЕРИЙ МАКСИМУМА ПРАВДОПОДОБИЯ |
99 |
|
в |
форме |
равенств |
|
/ |
= 4 - 2 |
{in det [F0 ф- F~ (/с |/с — 1, Ф) + |
|
f* (А) — * (* I А — 1, Ф)]* ] + Р, + Р~(А |Л -1, Ф)
х (к + 1 1к, Ф) = Ф х (к |к — 1, Ф) + |
z2(k) + |
фУ~(к\к— 1, Ф)
+ 7: ( ф - 1 , Ф ) + Т , [z( * ) - * ( * ! * - ! , Ф)],
|
ф2V Г~ (А: |А — 1, Ф) |
| т ; |
V2 |
|
V~(k + i\k, Ф) |
^ х |
w |
||
7 - ( А | А - 1 , Ф ) + Г„ |
+ |
Vv ,+ Vv. ' |
||
|
На рис. 3.4.5 показана зависимость функции штрафа J от Ф для ряда значений VV2. Очевидно, что при Ни -> оо
Рис. 3.4.5. Зависимость функции штрафа от Ф при двух разных значениях Рг2; пример 3.4.2. (VvlIVW = 1, х0 = 0, к( = 800).
наблюдение z2 (к) становится бесполезным, и алгоритмы этого примера вырождаются в соответствующие алгоритмы примера 3.4.1.
4*
100 ФУНКЦИИ Ш ТРАФА В ЗАД АЧ АХ ИДЕНТИФИКАЦИИ [ГЛ . 3
3.5.ВЫВОДЫ
Вэтой главе были сформулированы и изучены функ ции штрафа для задач идентификации дискретных систем по критериям максимума апостериорной вероятности и максимума правдоподобия. Для нескольких примеров был осуществлен вывод ДТКЗ идентификации и переход к непрерывному случаю. Теперь мы обратимся к вычис лительным методам определения состояния и параметров в задачах идентификации.
