Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Сейдж Э.П. Идентификация систем управления

.pdf
Скачиваний:
75
Добавлен:
23.10.2023
Размер:
7.91 Mб
Скачать

3.4]

(КРИ ТЕРИ И МАКСИМУМА ПРАВДОПОДОБИЯ

91

и в.

В результате

получится

 

 

х(А +

1 | М ) = ч>1х(А|е),А].

(3.4.43)

Таким образом, выписана полная система уравнений дискретного нелинейного алгоритма оценивания первого порядка по методу условного среднего. Они сведены в табл. 3.4.1, включающую алгоритмы, необходимые для определения штрафной функции максимального правдо­ подобия рассмотренным методом первого порядка. Можно пользоваться аппроксимациями более высокого порядка для оценки (Сейдж и Мелса [127]), однако здесь они рас­ сматриваться не будут.

Отметим, что эти (приближенные) алгоритмы фильтра­ ции условного среднего по сути являются обобщением алгоритмов фильтра Калмана. Если модели формирова­ ния и наблюдения сигнала линейны, то эти уравнения превращаются в обычные уравнения линейного фильтра Калмана. Итак, минимизация функции штрафа из табл. 3.4.1 при ограничениях, задаваемых разностными урав­ нениями из той же таблицы, ведет в итоге к алгоритмам идентификации по методу максимального правдоподобия. Дальнейшему развитию этих результатов посвящены сле­ дующие четыре главы. Теперь рассмотрим простой при­ мер, иллюстрирующий наиболее существенные моменты изложенных выше результатов.

Пример 3.4.1. Используем простой пример для демон­ страции процедуры определения функции штрафа при идентификации по максимуму правдоподобия. Скалярные модели формирования и наблюдения сигнала с постоян­ ными VD и Vw имеют вид

х {к -]-1) = Фх (к) + ш (к), z (к) = х (к) + v (к)

Для такой или любой линейной модели формирования и наблюдения сигнала алгоритмы табл. 3.4.1 являются точными, а не просто хорошими приближениями. Подле­ жащая минимизации штрафная функция (3.4.21) прини­ мает вид

/ = 4 - 2 flndetlF„ + Уг (А|Л-1,Ф)] +

к—К ^

(к) — х(к\к — 1, Ф)]2 )

Vv+ Гг (*|А-1,Ф ) /•

92 ФУНКЦИИ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФ ИКАЦИИ [ГЛ . 3

 

 

 

 

Т а б л и ц а

 

3.4.1

Алгоритмы первого порядка идентификации

 

 

 

по максимуму правдоподобия

 

 

 

 

 

(штрафная функция)

 

 

 

 

 

 

 

Модель формирования сигнала

 

 

 

 

 

 

 

х (ft + 1) =

ф [х (ft), к] + Г [х (к),

к] w (к)

 

 

 

 

Модель наблюдений

 

 

 

 

 

 

 

 

z (к) = h [х (к), к] + v (к)

 

 

 

 

 

 

Параметры априорных распределений

 

 

 

 

 

 

 

Ч (w (к)} = 0, cov {W (к), w (/')} = Vw (к) бк /),

 

 

 

<$(к)} = 0,

cov {V {к), v (/).} = Vv6K /),

 

 

 

 

% (х (0)} = рх (0) =

цХо, var {х (0)} = V~(0) =

Vx (0) =

V^,

 

cov(w (к), v (к)} = cov {х (к),

v (к)} = cov{x (к),

w (/')} 0, / >

к

Уравнение фильтра условного среднего

 

 

 

 

 

 

 

х (А- + 1 | ;0 )= х > + 1 |к, 0) +

К (ft + 1) [z(ft +

l) —

 

 

 

 

 

 

— h[x(ft + l|ft,

0,

 

ft+

1]]

Уравнение одношаговой

экстраполяции

 

 

 

 

 

 

 

X (ft +

1 |ft. в) = ф [х (ft |0),

ft]

 

 

 

 

 

Уравнение для коэффициента усиления

фильтра

 

 

 

 

 

ЭЬТ [х (ft + 1 1ft,

9), ft + 1]

xr-i

(ft + 1)

K(ft + l ) = V x (ft + l|0)

dx (ft + 1 |ft,

0)

 

Vv

 

 

 

 

 

 

 

 

Уравнение для априорной дисперсии ошибки фильтрации

V~ (ft + 1|Л, 0)

дф [ х (ft |0),

ft]

дфТ (x

(ft 10),

ft]

ax (ft I 0)

 

x (k)

dx (ft

I 0)

+

 

 

 

 

 

+ r[i(fc|0),

ft] Vw (ft)rT[x(ft|0),

ft]

 

 

 

Уравнения для дисперсии ошибки фильтрации

 

 

V - (ft +

1 |0) =

V~ (ft + 1 |ft,

0) -

V5 (ft +

1 |ft,

0) X

ahT [x (ft +

life. 0). fc + i]

dhT [x (ft 4-1 |ft, 0),

ft+

1]

X

 

0)

 

 

dx (ft 4- 1 |ft,

0)

 

Эх (ft 4 -1 1ft,

 

 

 

X V -(ft 4-1 |ft,

0)! dhT [x (ft 4-1 I ft, B),

fe + 1]

+

Vv (ft +

1)

 

 

dx (ft 4-1 |ft, 0)

 

 

 

 

dhT [x(ft4-l|fc,

0), ft +

1]

V-(ft +

1 1ft, 0)

 

X

dx (ft + 1

|ft, 0)

 

 

 

 

 

 

 

 

 

X

X

3.4]

КРИТЕРИЙ МАКСИМУМА ПРАВДОПОДОБИЯ

93

 

 

 

Т а б л и ц а 3.4.1

(продолжение)

 

Штрафная функция идентификации по максимуму правдо­

 

подобия

 

 

 

 

 

 

1

*1

 

 

 

 

J = - 2~ J'

In dot Vz |к 1, 0 )+ ||z(/c) — h[x(/c|/c —

 

 

к=к\

 

 

 

 

 

в).

V

 

 

Vv (*) +

 

 

llv-Vfclfc-i. в). V,(*|A-1. в) =

 

+

dhT[x(k\k — 1,

9),

k]

 

 

 

дх(к\к — 1,

0)

V - (AJ k — 1, 0) X

 

 

 

 

 

 

 

 

X

dhT[x (k |к — 1,

0), k\

 

 

 

dx (k |к — 1, 0)

 

 

 

 

 

 

Начальные условия фильтрации

 

 

 

 

х(0|0, 0) = Ц2о,

V- (О I 0, 0) = VXo

 

 

Алгоритмы одношаговой экстраполяции из табл. 3.4.1, которые снова оказываются точными, поскольку система линейна, выглядят так:

х + 1 1к, Ф) = Фх |к — 1, Ф) +

 

<DF_ (к\к — 1,Ф)

 

 

 

j

X

 

[z (к) — х |к — 1, Ф)],

'

V-(k\k — 1,Ф) + F

 

X

 

и

 

 

 

 

ФW V- (к\к — 1,Ф)

I

Т7

V~x (k +

l\k, Ф)

V X

'

V-(k\k — 1 , Ф ) + Vv

+

Vw

 

 

Для определения оптимального значения оценки Ф, переходной матрицы модели, мы минимизируем функ­ цию штрафа J относительно Ф при ограничениях, зада­ ваемых разностными уравнениями для х (к + 1 |к, Ф) и V- (к -j- 1 I /с, Ф). Поскольку имеется всего один настра­

иваемый параметр, оценка значений штрафной функции для всех значений Ф, для которых это необходимо, ока­ зывается сравнительно простой (для вычислительной ма­ шины) задачей. На рис. 3.4.1 — 3.4.3 показаны изменения J в зависимости от Ф для нескольких различных значений отношения Vv/Vw. Следует отметить, что при конечных размерах выборки (конечное к0 = 0) минимум функции

94 ФУНКЦИИ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФИКАЦИИ [ГЛ. 3

штрафа может, при отдельных последовательностях шума, не всегда достигаться при истинном значении Ф. При «низком» уровне шума объекта и «длинной» последователь­ ности наблюдений минимум J достигается вблизи от истин­ ного значения Ф. По мере сокращения длины реализации или усиления шума наблюдений ошибка идентификации

ЛФ) ,, Ю*

I)1

_ . J

------------ 1----------

1------------

1------------

1_____Lllflt

I

.

,

 

п

Ц,г

 

ЦВ

\

/,0

 

 

Рис. 3.4.1.

Зависимость штрафа от Ф при разных значениях Vv/Vw

пример

3.4.1

(хо =

0, 0;

Vv/Vw =

р, к) = 800).

возрастает. Точно так же можно ожидать, что параметры априорного распределения х (к0) влияют на идентифика­ цию. Очевидно, что если Vx (к0) равна нулю и отсутствует шум объекта или шум наблюдений, получится простая разновидность задачи идентификации, рассмотренной в главе 2. На рис. 3.4.4 показана зависимость функции штрафа от У Vv при различных размерах выборки.

Эти приближенные алгоритмы нуждаются в незначи­ тельных изменениях для распространения их на случай, когда шумы объекта и измерений коррелированы. Урав­ нения (3.4.9) и (3.4.11) для функции штрафа сохраняют силу. Однако в выражениях для входящих в них матема­

тических ожиданий появляются

отличия

по

сравнению

со случаем некоррелированных

шумов.

В

самом деле,

h(к), к |0 |=

=Ш(z (ft) |Z - 1), 0} = Ш(h [х ), k]\Z(k 1), 0}.

3.41

КРИТЕРИЙ МАКСИМУМА ПРАВДОПОДОБИЯ

9 5

 

 

ЛФ)

Рис. 3.4.2. Зависимость штрафа от Ф при разных значениях I; пример 3.4.1 (L — число наблюдений, Vv = 1,0; Vw = 16,0 хо = = 0,5).

Рис. 3.4.3. Зависимость функции штрафа от kVw при разных Vv/Vw; пример 3.4.1 (р = VJVw, kf = 900 — число наблюдений, х0 =

= 0,0).

96

Ф у н к ц и и Шт р а ф а в з а д а ч а х и д е н т и ф и к а ц и и [г л . з

Применяя разложение в ряд Тейлора к уравнению (3.4.22), мы видим, что появляется необходимость в выражении для h [х |к — 1, 0)1, которое, конечно, по-прежнему определяется формулой (3.4.21). Алгоритм одношаговой

J

Рис. 3.4.4. Зависимость функции

штрафа от Y У» ПРИ

разных L

(VvIVw = р =

9,0, L — число наблюдений, х0 =

0,0).

экстраполяции

(3.4.43) в данном случае уже не

годится,

так как

 

 

 

х 1) = ф [х (к), к] -}- Г [х (к), к] w {к),

 

и аппроксимация первого порядка принимает

вид

х (Л -И | * ,в ) =

 

 

 

= ф [х 10), /с] 4- Г [х (к),

к] $ {w (к) |Z (к), 9}, (3.4.44)

что можно записать в виде

 

 

х + 1 1к, 0) =

<р [х 10), к] +

Г [х (к), к] х

(3.4.45)

X Vwv {к) V^1|к — 1, 0) {z (к) — h [х (к \к — 1, 0), к]},

применяя теорему об условном математическом ожидании (3.4.28) и соотношение

var (w (к) |Z (к), 0} = Vw (к) - Vwv (ft) V"1 (ft |ft - 1) Vvw (k). (3.4.46)

3.4]

КРИТЕРИЙ МАКСИМУМА ПРАВДОПОДОБИЯ

97

 

 

 

 

 

 

 

Т а б л и ц а

3.4.2

Алгоритмы

первого порядка идентификации

 

но

максимуму правдоподобия

 

(коррелированные шумы объекта и наблюдений)

 

Уравнение фильтра условного среднего

 

 

х (А + 1, 0) = х + 11к, 0) -{- К + 1) {z (А + 1)

 

— h [ х (А: + 1 |к, 0), А +

1]}

 

 

Уравнение одношаговой экстраполяции

 

 

 

i + 1 |к,

0) = <р [2 {к |0),

к) +

Кр (к) {г {к) ■

 

 

— h [х (к \к — 1,

0), А]}

 

 

Уравнение для коэффициента усиления фильтра

 

К + 1) =

 

 

 

 

 

= V - (* + 1 |Л, 0)

9hT[J (А 4-1 I*. 0). k + i]

х .

 

дх (к -J- 1 |А, 0)

 

v ( * + i i fc- 0>

Уравнение для априорной дисперсии ошибки идентификации

дер [х (А |0), А]

 

д(рт [х(А|0),

А]

V ; (А+1 [А, 0) =

дх (к I 0)

V=(A)

д х (А |0)

+

 

 

 

 

+ Г [х (А |0), к] Vw (А) Гт [х (А |0),

А ] -

 

-K P (A)VZ- 1(A|A-1, 0)Кр (А) —

^'|й> ~ к (*)v»» (t>гТI»(* I е>’ *1 -

ОХ (А |И)

д<рт [х (А |0), А]

— Гт [х (А|0), A] Vwv (А) Кт (А)

Эх (А |0)

Уравнение для дисперсии ошибки фильтрации

V£(A + 1|0) =

dhf [х (A -f 1 |А, 0), А +

1]1Т

= 1 - К ( А + 1)

Vx + 1 |А, 0)

дх(к + 1 1к, 0)

 

Уравнение для коэффициента усиления одношаговои экстра­ поляции

Кр (А) = Г [х (А |0), к] Vwv (А) V"1 (А + 1 |А, 0)

4 Э. П. Сейдж, Дж. Л. Мелса

98 ФУНКЦИИ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФИКАЦИИ [ГЛ . 3

Т а б л и ц а 3.4.2 (продолжение)

Штрафная функция идентификации по максимуму правдо­ подобия

1

2 111 det Vz (А I А -

1, 0) +

 

 

 

J = —

 

 

 

 

ii—ki

 

 

 

 

 

 

-j-||z(A')

h [ х (А |А

1, 0, Л] ||у-1 q.j

|

 

 

 

 

 

 

, 0)’

 

(А: I * — 1, 0) =

Vv (A) +

dhT [х (А |А — 1,

0), А]

X

ах (л1ft — 1,

0)

 

 

 

 

 

 

ЭЬт [х (А |А— 1,

0),

А]

 

х V - (А' | /с — 1 , 0 )

дх (А |А — 1,

0)

 

 

 

 

 

 

 

Начальные условия фильтрации

 

 

 

 

х (0 10, 0) = рХо, V - (0|0, 0) =

VXo

 

Остальные алгоритмы первого порядка фильтрации ус­ ловного математического ожидания нуждаются в анало­ гичных изменениях. Эти изменения вносятся без труда, и получающиеся в результате приближенные алгоритмы сведены в табл. 3.4.2.

Пример 3.4.2. Вернемся к примеру 3.4.1, предполагая, что теперь имеется второе наблюдение, определяемое уравнением

z2 (к) = w (к) + va (к),

причем шумы объекта и наблюдений коррелированы, так что

z(k )

Гг (A) I

Гх (А) +

v (А)

Lz 2 ( f t ) J

(А) + V i (А)]■

 

h[*(fc). *1

= [*оА)] *

 

[w (ft)+i»(A)]’

 

 

 

=

[0F№], Vv = Г »

0 ■

Применение алгоритмов из табл. 3.4.2 немедленно при­ водит к следующей функции штрафа и ограничениям

3.4]

КРИТЕРИЙ МАКСИМУМА ПРАВДОПОДОБИЯ

99

в

форме

равенств

 

/

= 4 - 2

{in det [F0 ф- F~ (/с |/с — 1, Ф) +

 

f* (А) — * (* I А — 1, Ф)]* ] + Р, + Р~(А |Л -1, Ф)

х (к + 1 1к, Ф) = Ф х (к |к — 1, Ф) +

z2(k) +

фУ~(к\к— 1, Ф)

+ 7: ( ф - 1 , Ф ) + Т , [z( * ) - * ( * ! * - ! , Ф)],

 

ф2V Г~ (А: |А — 1, Ф)

| т ;

V2

V~(k + i\k, Ф)

^ х

w

7 - ( А | А - 1 , Ф ) + Г„

+

Vv ,+ Vv. '

 

На рис. 3.4.5 показана зависимость функции штрафа J от Ф для ряда значений VV2. Очевидно, что при Ни -> оо

Рис. 3.4.5. Зависимость функции штрафа от Ф при двух разных значениях Рг2; пример 3.4.2. (VvlIVW = 1, х0 = 0, к( = 800).

наблюдение z2 (к) становится бесполезным, и алгоритмы этого примера вырождаются в соответствующие алгоритмы примера 3.4.1.

4*

100 ФУНКЦИИ Ш ТРАФА В ЗАД АЧ АХ ИДЕНТИФИКАЦИИ [ГЛ . 3

3.5.ВЫВОДЫ

Вэтой главе были сформулированы и изучены функ­ ции штрафа для задач идентификации дискретных систем по критериям максимума апостериорной вероятности и максимума правдоподобия. Для нескольких примеров был осуществлен вывод ДТКЗ идентификации и переход к непрерывному случаю. Теперь мы обратимся к вычис­ лительным методам определения состояния и параметров в задачах идентификации.

Соседние файлы в папке книги из ГПНТБ