Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Конспект по фильтрации

.pdf
Скачиваний:
79
Добавлен:
01.05.2014
Размер:
675.33 Кб
Скачать

Мальцева Н. В.

Рекуррентная и адаптивная фильтрация

 

 

 

31

 

Тогда:

k|i+1

 

k+

 

 

 

k|i n

k+

 

 

 

k|i

 

 

1k|i

 

k

k|i

o

 

 

 

 

T

 

 

T

 

 

 

(10.25)

 

 

x +

= x +

+ K

 

 

y

 

 

 

h(x + )

 

 

H

 

(x

x

+ )

 

(10.24)

 

 

Kk|i = Pk|iHk|i[Hk|iPk|iHk|i + Rk]

 

 

 

 

 

 

 

 

 

 

P +

= P +

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(10.26)

 

 

k|i+1

 

k|i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Hk|i

= ∂x x=xk+i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(10.27)

 

 

 

 

∂h

 

 

 

|

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+

 

 

 

 

 

 

 

 

T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ïðè ýòîì, начальные значения Pk|0

= Pkè xk|0

= xk

 

, расч¼т по формулам (10.24) (10.27)

 

выполняется до тех пор, пока изменение оценки не станет малым, т. е., например,

 

 

 

 

 

 

 

 

 

 

 

 

kxk+|i+1 − xk+|ik < ε

 

 

 

 

 

 

 

èëè

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

f(x +

 

)

f(x + )

k

< ε

 

 

 

 

 

(10.28)

 

 

 

 

 

 

 

 

 

k|i+1

 

 

 

k|i

 

 

 

 

 

 

 

 

 

 

 

 

èëè

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

f(x +

 

 

)

y

kk

< ε

 

 

 

 

 

(10.29)

 

 

 

 

 

 

 

 

 

 

 

k|i+1

 

 

 

 

 

 

 

 

 

 

 

 

При выполнении одного из условий (10.28) на итерации i0 формируется оценка

 

 

 

 

 

 

 

x = x +

 

Kk i Hk i

 

]P + )

 

 

 

 

(10.30)

 

 

 

 

 

 

Pk = [Ik|i0

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

| 0

 

| 0

 

 

k|i0

 

 

 

 

 

 

 

Особенность данного алгоритма заключается в том, что ковариационная матрица оцен ки (соотношение (10.30)) вычисляется один раз на любом шаге после окончания итерацион ного процесса по формулам (10.24) (10.27). В некоторых специальных задачах этот фильтр оказался эффективным.

Вообще, существует много разновидностей нелинейных фильтров, качество их работы проверяется экспериментальным пут¼м.

11Использование алгоритмов рекуррентной фильтрации для решения задачи определения координат и параметров дви жения объектов

Наблюдаемость :

Рассмотрим дискретную динамическую систему следующего вида:

(

xk+1 = fk(xk) ,

xk Rn

 

yk = hk(xk) + vk ,

yk Rm

(11.1)

Априорные условия аналогичны предыдущей системе.

При решении задач оценивания вектора состояния системы (11.1) возникает вопрос о на блюдаемости системы относительно вектора xk. Существует много определений наблюдае мости. При отсутствии ошибок измерения в каналах измерения говорят о наблюдаемости

Мальцева Н. В.

Рекуррентная и адаптивная фильтрация

32

системы в детерминистическом смысле , которая состоит в возможности за конечное чис ло измерений однозначно определить вектор состояния системы xk по выборке наблюдений Y1k = {y1, . . . , yk} в предположении, что помеха vk в канале наблюдения отсутствует.

Âреальных условиях измерения содержат ошибки, носящие случайный характер, что необходимо учитывать при анализе системы.

Âряде работ вводится критерий стохастической наблюдаемости следующего вида. Система (11.1) стохастически наблюдаема по измерениям Y1k, если выполняются нера

венство:

det Ik(xk) 6= 0 ,

ãäå Ik(xk) информационная матрица Фишера:

Ik−1(xk) = −E (

∂xi

∂xj1

)

 

 

2 ln L(Y k)

 

 

 

 

 

 

 

 

 

 

 

 

 

k

k

 

i,j=1,...,n

(11.2)

σ2 > 1 ;

k Ik

L(Y1k) функция правдоподобия суммарных величин Y1k.

Условие (11.2) означает, что оценка xk вектора xk, построенная по измерениям Y1k, имеет конечную ковариацию Pk.

Пренебрегая погрешностями линеаризации, условие (11.2) можно представить в виде: (см. МНК)

det(Dk · Rk0−1 · DkT) 6= 0 ,

ãäå

 

∂xk1

 

∂xk2

. . .

∂xkn

 

 

 

∂h1

 

∂h1

. . .

 

∂h1

 

 

 

 

∂xk1

 

∂xk2

∂xkn

 

 

 

∂h2

 

∂h2

 

 

∂h2

 

Dk =

...

 

...

...

...

,

 

 

∂hk

 

∂hk

 

 

∂hk

 

 

 

 

 

 

 

. . .

 

 

 

 

 

∂xk1

 

∂xk2

∂xkn

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

R1

0

. . .

0

.

Rk0

=

0

R2

. . .

0

...

...

...

...

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

00 . . . Rk

Âслучае невырожденности ковариационной матрицы ошибок измерений для выполнения условия стохастической наблюдаемости по теореме Бине Коши чтобы ранг матрицы

Dk был равен количеству компонент вектора xk, т. е. необходима детерминистическая наблюдаемость системы .

Теорема (Бине Коши). Пусть r ранг матрицы B = det(BTB) = P квадратов модулей всех миноров r-го порядка матрицы B.

Итак, рассмотрим задачу определения координат и параметров движения объекта по угловым измерениям на него с движущегося носителя.

Для применения теории рекуррентного оценивания необходимо выписать вид систе мы (11.1), т. е. записать уравнение состояния и уравнение измерения.

Зададимся характером движения объекта и носителя , т. е. определим, в каких услови ях внешних воздействий предполагается использование алгоритма.

Мальцева Н. В.

Рекуррентная и адаптивная фильтрация

33

Допустим, что объект и носитель (для носителя такое движение непринципиально) дви жутся галсами, т. е. участки достаточно длительного движения сопровождаются редкими резкими ман¼врами (изменениями курса либо скорости, либо того и другого вместе). Рас смотрим сначала случай движения объекта одним галсом.

Положение объекта на плоскости в произвольной мо мент времени tk при его равномерном прямолинейном движении описывается 4-х-мерным вектором с коорди

натами

def

 

 

Zk = (Πk, Dk, Vk, Kk)T ,

либо любым другим четыр¼хмерным вектором, связан íûì ñ zk взаимо-однозначным соответствием, где

Πk пеленг на объект в момент времени t = tk;

Dk дистанция до объекта в момент времени t = tk; Vk скорость объекта в момент времени t = tk;

Kk курс объекта в момент времени t = tk.

 

y

6

 

 

 

 

 

 

 

 

 

 

 

 

 

tk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D0 cos Π0

 

 

 

 

 

 

 

 

 

t0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Πk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Π0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

D0 sin Π0

x

 

 

 

 

 

 

 

 

 

 

Допустим, что t = t0 è Z0 = (Π0, D0, V0, K0)T. Тогда измеряемые величины Πk можно представить в виде:

Πk = arctg

D0 sin Π0 + V0 sin K0(tk − t0) − (Sxk − Sx0 )

=

 

 

 

 

 

 

 

D0 cos Π0 + V0 cos K0(tk − t0) − (Syk − Sy0 )

 

 

 

 

 

Попробуем ½развязать элементы оцениваемого вектора.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Vx = V0 sin K0

 

sin Π0 +

Vx

 

tk +

 

 

Sxk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Vy = V0 cos K0

= arctg

D0

 

D0

 

 

=

 

 

 

 

 

 

 

 

 

, ãäå

 

 

 

tk = tk − t0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

cos Π0 +

 

Vy

 

tk +

 

 

Syk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sxk = Sxk Sx0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Syk = Syk Sy0

 

 

Vx−Vxc1

 

 

 

 

 

 

 

Sxk −Vxc1 tk

 

 

 

 

Здесь Vxc

1

, Vxc

1 проекции соб

 

sin Π0 +

 

 

tk

 

 

 

 

 

 

ственного пути носителя на оси

 

 

 

 

 

 

 

 

 

 

= arctg

 

 

D0

 

 

 

D0

 

 

 

 

=

 

 

X и Y декартовой системы коор

 

 

Vy−Vyc1

 

 

 

 

 

 

 

 

 

 

 

 

 

cos Π0 +

 

tk

 

 

Syk −Vyc1 tk

 

 

динат при его движении первым

 

 

 

 

D0

 

 

 

D0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

галсом.

 

 

 

Введ¼м в рассмотрение вектор

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Xk

 

= Π0 , D0

,

 

D0

,

D0

 

T

 

 

(11.3)

 

 

 

 

 

 

 

 

def

 

1

 

 

 

Vx − Vxc1

 

Vy − Vyc1

 

 

 

 

 

 

= arctg

sin x1 + x3

 

tk − (ΔSxk − Vxc1

 

tk) · x2

.

 

 

 

 

 

 

 

 

 

 

tk (ΔSyk Vyc1

 

 

 

 

 

 

 

 

 

 

 

cos x1 + x4

 

 

tk) · x2

 

 

 

 

 

 

 

 

Мальцева Н. В.

Рекуррентная и адаптивная фильтрация

 

 

 

34

Итак, система (11.1) может быть записана в виде:

 

 

 

 

Xk+1 = Xk ,

sin x1 + x3

tk

 

(ΔSxk

 

Vxc1

tk)x2

 

Xk

 

2

 

 

 

 

 

 

 

 

 

 

ãäå

 

удовлетворяет (11.3)

yk = arctg

 

 

 

 

 

+ vk ,

ãäå vk

 

N(0, σΠ )),

 

 

cos x1 + x4

tk

 

(ΔSyk

 

Vyc1

tk)x2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

cov(vk, vj) = vkjσΠ2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

(11.4)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

построить оценку Zk =

Задача состоит в том, чтобы по последовательности измерений Y1

= (Πk, Dk, Vk, Kk) по нарастающему объ¼му выборки измерений.

Рассмотрим условия наблюдаемости системы (11.4). Из вида системы следует, что е¼ наблюдаемость относительно элемента x2 на интервале tk имеет место лишь при выпол нении одного из условий:

Sxj

6= Vxc1 · tj

 

Syj

6= Vyc1 · tj

для какого-либо j 1, . . . , k

Эти условия отражают известный факт, что при равномерном прямолинейном движении носителя определить дистанцию до объекта по замерам пеленга невозможно.

Разрешимость системы

 

 

 

 

y10

= arctg

sin x1 + x3

t1

 

 

 

 

 

cos x1 + x4

t1

 

 

 

 

 

0

 

sin x1 + x3

t2

 

 

 

 

y

2

= arctg

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

cos x1 + x4

t2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y30

= arctg cos x1 + x4

t3

 

 

 

 

 

 

 

sin x1 + x3

t3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

относительно элементов

 

 

 

 

 

 

 

 

 

 

x , x

,

 

 

 

 

 

 

 

1

3

 

4

может быть показана непосредственно.

 

 

 

 

x

Действительно, полагая

t1 = 0 x1 = y10 и далее имеем линейную систему относи

тельно x3 è x4, условием разрешимости которой является Π˙ 6= 0.

Таким образом, показана детерминистическая наблюдаемость системы (11.4) и, следо вательно, с уч¼том конечности и невырожденности ковариационной матрицы наблюдений Rk е¼ стохастическая наблюдаемость.

Для построения оценок вектора состояния системы (11.4) применим линеаризованный расширенный фильтр Калмана

xk+1 = xk + Kk+1{yk+1 − hk+1(xk)} Kk+1 = Pk · HkT[Hk+1PkHkT+1 + σΠ2 ]−1 Pk+1 = [I − Kk+1Hk+1]Pk+1 ,

no

ãäå H

 

= ∂yk

 

матрица (1

4) с начальными условиями x = xапр. , P0 = P àïð.;

Построение текущих

оценок вектора Zk

= (Π, Dk, Vk, Kk) может быть произведено по

 

k+1

∂x

x=xk+1

×

 

0

0

0

 

 

 

 

 

 

 

 

 

Мальцева Н. В.

 

Рекуррентная и адаптивная фильтрация

 

35

формулам:

 

 

 

 

 

 

+ xk4

 

 

tk

(ΔSyk

Vyc1

tk)xk2

= arctg

 

Πk = arctg cos xk1

 

 

Dy

 

 

 

 

sin xk1

+ xk3

 

 

tk

(ΔSxk

Vxc1

tk)xk2

def

Dx

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= 1/

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D

Dx + Dy

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p

 

 

 

x )

2

 

+ (x + V

 

x

 

2

/x

 

 

V

k

= (x

 

+ V

xc1

 

 

yc1

)

 

 

 

q

k3

 

 

k2

 

 

 

 

k4

 

k2

 

k2

 

 

 

 

 

 

 

 

·

 

 

 

 

 

 

 

 

·

 

 

 

 

 

 

 

 

 

 

xk3 + Vxc1 · xk2

,

 

 

 

 

 

 

 

 

Kk

= arctg

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

+ Vyc

1

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k4

 

 

 

 

 

k2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

·

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

оценка ковариационной матрицы Qk вектора Zk вычисляется по формулам:

Qk =

∂xk

· Pk ·

 

∂xk

 

T

 

 

 

∂Zk

 

 

 

∂Zk

 

 

При решении задачи оценивания координат и параметров движения объекта по пелен гам может появиться дополнительная информация о параметрах движения объекта. Ввод е¼ в алгоритм в процессе решения может существенно уточнить точку разложения нели нейной функции hk и тем самым уменьшить ошибки линеаризации.

Пусть в момент времени tk поступила дополнительная информация Zkd о параметрах движения объекта, где вектор-функция fk связывает вектор-состояния системы xk ñ çàìå ðîì Zkd:

Zd = f

(x ) + η

k

,

(11.5)

k k

k

 

 

ãäå ηk представляет собой ошибку замера, которая полагается распредел¼нной по нормаль ному закону с параметрами

E(ηk) = 0 , E(ηi, ηj) = RZδij ,

RZ ковариационная матрица ошибок измерения.

Рассматривая уравнение (11.5) как дополнительное уравнение измерения системы (11.4), оценку вектора состояния можно корректировать, например, с помощью формул линеари зованного расширенного фильтра Калмана. При этом, поскольку вектор-функция fk может

оказаться существенно нелинейной, а точность определения компонент вектора к моменту замера Zkd мала, непосредственное применение линеаризованного расширенного фильтра

Калмана может привести к большим ошибкам смещения в определении оценок вектора xk. Для уменьшения влияния нелинейностей в этом случае целесообразно использовать ½ите

рационный расширенный фильтр Калмана. Алгоритм уч¼та дополнительной информации

в виде замера Zd

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k может быть тогда представлен в виде:

1k|i

k

k|i

}

 

xk

|i+1

= xk+

 

+TKk|i{Zk+− fT

k|i

 

 

 

 

+

 

 

 

 

 

 

 

 

 

d

(x

+ )

 

H

(x

 

x + )

 

 

 

Kk|i

= Pk

iHk|i[Hk|iPk

iHk|i + RZ]

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

|

 

 

 

 

 

 

|

 

 

 

 

 

 

 

 

 

 

 

 

+

 

 

 

 

 

+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(11.6)

 

 

 

 

 

 

= P

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

k

 

i+1

k

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

|

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

|

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Hk|i =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

∂x

 

x=x

+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

∂f

 

k i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

|

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= P

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

+

+

 

P +

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= xk

 

 

k|0

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k|0

 

 

 

P +

= [I

K

k|i0

H

k|i0

]P + ,

 

 

 

 

 

x +

= x + ,

(11.7)

k

 

 

 

 

 

 

 

 

k|i0

 

 

 

 

 

k

k|i0

 

Мальцева Н. В.

Рекуррентная и адаптивная фильтрация

36

ãäå x

, P , x +

, P + представляют собой оценку вектора и его ковариационной матрицы

k

k

k

k

 

до и после уч¼та дополнительной информации соответственно;

 

x +

уточн¼нная оценка вектора состояния на момент времени

tk после i-ой итерации.

k|i

 

Уточнение оценки xk по формулам (11.6) происходящей до тех пор, пока не выполняется

условие:

 

|Zkd − f(xk+|i)| < εk .

(11.8)

После первого выполнения на i0-й итерации условия (11.8) производится построение оценок

откорректированного вектора x +

и его ковариационной матрицы

P +

по формулам (11.7).

k

 

k

 

Критерий ½малости изменения оценки для соотношения (11.8) может быть получен раз личными способами, определяемыми видом дополнительной информации. Эффективность выбранного способа зависят от степени ½нелинейности функции fk от элементов вектора xk и может быть оценена в каждой конкретной задаче экспериментально.

Рассмотрим один из возможных способов выбора порога εk.

Допустим, что к моменту tk построена оценка вектора состояния системы xk и оценка его ковариационной матрицы Pk, и пусть в момент tk+1 появилась дополнительная информация

âèäà:

Zk+1 = Φxk+1 + ηk+1 ãäå Zk+1 R1 , ηk+1 N(0, σZ2 )

(Рассмотрим для простоты сначала линейную связь дополнительной информации с векто

ром состояния)

Оценку вектора состояния xk+1 можно построить по формулам ФК:

xk+1 = xk + Kk+1(Zk+1 − Φxk)

 

Kk+1 = PkΦT[ΦPkΦT + σk2]−1

(11.9)

Pk+1 = (I − Kk+1Φ)Pk

 

Предположим, что критерием ½хорошего ввода дополнительной информации является

критерий вида

|Zk+1 − Φxk+1| < εk

(Обратим внимание, что это не невязка, а замер сравнивается с оценкой замера íà tk, à íå ñ прогнозом замера !)

Как выбрать εk?

Домножим (11.9) на Φ, тогда

 

Φxk+1

= Φxk + ΦKk+1(Zk+1 − Φxk)

 

добавим −Zk+1 к обеим частям

 

 

 

Φxk+1 − Zk+1

= Φxk + (ΦKk+1 − 1)Zk+1 − ΦKk+1Φxk

 

домножим на −1, тогда

 

 

 

Zk+1 − Φxk+1

= (1 − ΦKk+1)(Zk+1 − Φxk)

(11.10)

Ïðè ýòîì, (Zk+1 − Φxk+1) N(0, σ2 )

 

Вычислим σ2

. Èç (11.10) =

 

 

σ2 = (1 − ΦKk+1)2Z2 + Φ · Pk · ΦTk ] ;

Мальцева Н. В.

 

 

Рекуррентная и адаптивная фильтрация

 

 

 

 

 

 

 

37

Рассмотрим подробнее 1-й сомножитель:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Kk+1

 

 

 

 

 

 

 

!

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(1 − ΦKk+1)2 = 1 − Φ Pk

ΦT[ΦPk

Φ

T

+ σZ2 ]

1

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

z

}|

 

 

 

 

 

 

 

{

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

|

 

{z

 

} |

 

 

 

}

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= 1

 

 

 

 

{zσ

 

 

 

 

 

+ σ

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

k+1(прогн.)

 

k+1(прогн.)

 

 

 

Z

−1

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ2

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

!

2

 

 

 

 

 

 

 

 

 

 

 

 

 

#

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σk2+1(прогн.)

 

 

 

 

 

 

 

 

 

 

 

σ2

 

 

 

 

 

 

 

 

 

 

=

1

− σk2+1(прогн.) + σZ2

 

=

"σZ2 + σk2+1(прогн.)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Z

 

 

 

 

 

Тогда:

 

 

 

 

 

σ4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ4

 

 

 

σ2

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σZ2

+ σk2+1(прогн.)

 

 

·

 

 

 

 

 

 

 

 

 

 

Z

 

 

k+1(прогн.)

 

 

 

 

Z

 

 

 

 

 

 

2

 

σZ2 + σk2+1(прогн.)

=

σ2 + σ2Z

 

 

 

С вероятностью 0.995 должно выполнятся неравенство:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Φx

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

3 σ2

 

 

 

 

 

 

 

 

Z

 

 

 

 

< ε

 

 

,

ãäå

 

 

ε

 

 

 

 

 

 

 

 

 

Z

 

 

 

 

(11.11)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

|

 

 

|

 

 

 

 

 

Z2 + σk2+1(прогн.)

 

 

 

 

 

k+1

 

k+1

 

 

 

 

k

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Это соотношение получено в предположении линейности измерения дополнительной информации и несмещ¼нности xk. При нелинейной связи итерационное уточнение оценок

должно производится до выполнения соотношения (11.11), т. е. до соответствующего умень шения ошибок линеаризации.

12Расч¼т эффективности алгоритма оценивания по результа там моделирования

Моделирование производится методом Монте Карло. Для определения качества оце

нивания при моделировании для любой из компонент Zki оцениваемого вектора искомых величин Zk = (Πk, Dk, Vk, Kk)T в течение всего периода наблюдения рассчитывались оцен

ки первых моментов Zñð.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Z

 

 

Z

k

:

ki , получаемые на основании оценок

kin элементов вектора

 

Zñð. =

1

N

 

Zki

,

 

(i = 1, . . . , 4)

 

(12.1)

ki

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N n=1

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

оценки вторых моментов среднеквадратические отклонения σñò.

Z

ki от их истин

ных значений Zèñò.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ki

оценок

ki :

 

= v

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σki

 

 

 

 

 

 

 

(Zkin

 

Zki ) ,

 

 

 

 

 

 

 

 

 

 

1 N

 

 

 

 

 

 

 

 

 

 

 

 

 

uN n=1

 

 

 

 

 

 

 

 

 

 

 

 

 

u

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

ñò.

 

 

t

 

 

 

 

 

 

.

 

 

èñò.

 

 

 

(12.2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

расч¼тные значения дисперсией оценок σðàñ÷

 

 

 

 

 

 

 

 

 

 

 

матрицы оценок Qk

 

 

 

 

 

 

 

ki , получаемые на основании ковариационной

 

 

 

 

 

 

 

 

 

 

 

qk[i, i]n ,

 

 

 

 

 

 

σðàñ÷. =

1

 

N

 

 

 

(12.3)

 

ki

 

 

 

 

 

 

 

X p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N n=1

 

 

 

 

 

 

 

 

 

 

Мальцева Н. В. Рекуррентная и адаптивная фильтрация 38

а также минимальная граница σmin

ki соответствующих дисперсий, получаемая из элемен тов информационной матрицы Фишера (при расч¼те применялся линеаризованный фильтр

Калмана при истинной опорной траектории):

σkmini

= s

−E ∂Zkl ∂Zkm

ii

(12.4)

 

 

 

2 ln L

−1

 

Здесь N количество испытаний, проводимых по методу Монте Карло при моделиро

вании алгоритма. Анализ качества оценивания производился пут¼м сопоставления рассчи танных значений величин (12.1) (12.4) с соответствующими критериями, которые выбира лись, исходя из следующих соображений. При построении оценок вектора Zk его плотность распределения аппроксимировалась нормальным законом, в силу чего для двух первых моментов справедливы следующие соотношения:

P Zki

 

 

 

 

 

Zki1

 

, . . . , ZkiN

2

γ

 

 

 

1

 

 

− Zki

 

<

σñò.γ

, Zki2

Z

e

t2

(12.5)

 

N

= √

2 dt + O

N

 

 

èñò.

ñò.

 

 

ki

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

γ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

σki

− σki

 

<

σñò.γ

 

, Zki2

, . . . , ZkiN

2

Z

e

t2

 

1

 

(12.6)

 

N

Zki1

= √

2 dt + O

N

 

 

èñò.

ñò.

 

 

ki

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Используя (12.5) и (12.6), определим критерий несмещенности и эффективности оценок, которыми будем пользоваться при экспериментальном оценивании эффективности алгорит мов.

Один из центральных вопросов количество реализаций N, проводимых при модели

ровании.

Заметим, что левая часть соотношения (12.6) с вероятностью порядка P = 0.9 имеет в зависимости от N следующий вид:

N = 100

 

èñò.

 

ñò.

 

ñò.

σki

σki

< 0.14 σki

N = 50

 

σki

σki

 

< 0.2 σki

 

èñò.

ñò.

ñò.

 

 

èñò.

 

ñò.

 

ñò.

N = 200

σki

σki

< 0.1 σki

N = 500

 

èñò.

ñò.

 

ñò.

σki

σki

 

< 0.06 σki

N = 1000

 

èñò.

ñò.

 

ñò.

σki

σki

 

< 0.04 σki

 

 

 

 

 

 

 

 

 

 

 

 

 

Допустим, что более N = 100 реализаций делать

нецелесообразно.

Тогда, пренебрегая

величиной порядка 1/

 

, из формул (12.5) (12.6) следует, что с вероятностью порядка

N

P = 0.9 выполняются следующие неравентства:

 

 

 

 

 

 

 

 

0.86 σñò.

< σèñò.

< 1.14 σñò.

 

 

ñð.

ki

ki

ñð.

ki

 

(12.7)

ñò.

èñò.

 

ñò.

 

 

 

Zki

− 0.2 σki

< Zki

< Zki

 

+ 0.2 σki

(12.8)

Из соотношения (12.7) следует, что для данного количества реализаций σñò.

достаточно хорошей оценкой σèñò.

 

 

 

 

 

ki является

 

 

 

ki .

 

 

 

 

 

 

Из соотношения (12.8) следует, что в случае, когда дисперсия оцениваемой величины

сравнима с самой величиной, Zñð.

Zèñò.

ki является хорошей оценкой

ki .

Особый интерес представляет статистика σðàñ÷.

ki , определяемая соотношением (12.3), ко торую, с одной стороны, можно рассматривать как оценку σèñò.

ki , а, с другой стороны, как параметр, характеризующий качество работы алгоритма оценивания.

Мальцева Н. В.

Рекуррентная и адаптивная фильтрация

 

 

 

39

Для построения доверительного интервала для σðàñ÷.

σèñò.

 

 

 

 

 

 

ðàñ÷.

 

 

ki

ïî ki

заметим, что в случае,

когда флуктуации

от реализации к реализации невелики (σσðàñ÷

.

сравнима с величи

 

 

σk

i

 

íîé σðàñ÷.

 

 

 

 

 

 

ki

 

 

σðàñ÷.

 

 

 

 

 

 

 

Zèñò.

ki ), аналогично вышерассмотренному случаю оценивания

ki

 

, статистику

ki

можно рассматривать в качестве хорошей оценки σèñò.

 

 

 

 

 

оценки σñò.

σðàñ÷.

 

 

 

ki . А это означает, что в этой ситуации

ki è

ki

 

должны быть достаточно близкими друг к другу. Поскольку отно

сительная стабильность величины σðàñ÷.

 

 

 

 

 

 

 

 

 

 

 

ki

от реализации к реализации является одним из

показателей качества работы алгоритма оценивания, то близость статистик σðàñ÷.

σèñò.

которую можно трактовать как выполнение неравенства

 

 

 

ki è

ki ,

 

 

 

 

0.86 σñò. < σðàñ÷. < 1.14 σñò.

,

 

 

 

(12.9)

 

 

 

 

ki

ki

ki

 

 

 

 

 

и будет являться таким показателем.

В качестве критерия эффективности оценивания следует использовать близость ста

тистик σmin

σèñò.

 

 

σmin

σèñò.

ki

è ki . При этом, под мерой близости статистик

ki

è ki можно рас

сматривать принадлежность σmin

 

 

 

 

 

ki доверительному интервалу, определяемому соотношени

ем (12.7), что эквивалентно неравентству:

 

 

 

 

 

0.87 σmin < σñò. < 1.16 σmin .

 

(12.10)

 

ki

ki

ki

 

 

Следует отметить, что эти оценки носят асимптотический характер и, соответственно, должны выполняться при tk → ∞, т. е. в рассмотренном случае критерием эффективности оценивания следует считать приближение рассмотренных статистик к соответствующим доверительным интервалам с течением времени наблюдения.

Т. о., для экспериментального оценивания эффективности алгоритмов оценивания пред лагается использовать статистики, определяемые соотношениями (12.1) (12.4). При этом, критерии для оценки качества работы алгоритма могут быть сформулированы следующим образом.

1.Выборочное среднее, определяемое соотношением (12.1) для любой оцениваемой ком поненты вектора Zk асимптотически (при увеличении объ¼ма выборки наблюдений) удовлетворяют неравентству (12.8), т. е. оценка (12.1) является асимптотически несме ù¼ííîé.

2.Выборочное статистическое отклонение, определяемое соотношением (12), для лю бой оцениваемой компоненты вектора Zk асимптотически удовлетворяет неравент ству (12.10), т. е. оценка (12) является асимптотически эффективной .

3.Выборочной расч¼тное отклонение, определяемое соотношением (12.3), для любой оце ниваемой компоненты искомого вектора Zk асимптотически удовлетворяет неравент ству (12.9), т. е. алгоритм достоверно оценивает точность определения компоненты вектора Zk.

13Алгоритм определения координат и параметров движения маневрирующего объекта по пеленгам

Êнастоящему времени опубликовано значительное количество работ, посвященных син тезу и анализу оптимальных и субоптимальных алгоритмов определения координат и па раметров движения маневрирующих объектов. Задача определения параметров движения в них формулируется как задача оценивания вектора состояния динамической системы.

Мальцева Н. В.

Рекуррентная и адаптивная фильтрация

40

Основные различия предлагаемых алгоритмов связаны с используемыми моделями ман¼в ра объекта.

Первый подход предполагает построение искомых оценок с уч¼том статистических ха рактеристик случайного процесса, описывающего ман¼вр объекта. При этом, для построе ния оценок фактически используется лишь часть измерений последние по времени. Это целесообразно в ситуациях, когда объект маневрирует достаточно часто и время, в течение которого он совершает ман¼вр, сравнимо со временем его равномерного и прямолинейного движения.

Второй подход заключается в использовании модели редко маневрирующего объекта и в измерении структуры алгоритма оценивания при обнаружении изменения характера движения объекта. Такие алгоритмы, основаны на обнаружении факта ман¼вра объекта, позволяют идентифицировать динамику системы и, тем самым, дают возможность постро ения искомых оценок по всей совокупности информации.

Поскольку для определения дистанции и параметров движения объекта по пеленгам требуется информация, полученная на разных галсах движения наблюдателя , то при раз работке алгоритмов решения поставленной задачи, необходимо использовать подход, осно ванный на обнаружении факта ман¼вра и использовании всей имеющейся информации. С другой стороны, ман¼вры объекта при решении задачи по пеленгам, т. е. в процессе скрытного слежения, достаточно редки, что делает применение кусочно-линейной модели движения модели возможным.

Итак, полагаем, что траектория объекта состоит из участков равномерного и прямоли нейного движения (галсов), которые чередуются редкими резкими ман¼врами курсом или скоростью.

Движение объекта на галсе описываем с помощью четыр¼хмерного вектора

Xk = Π0, 1 , Vx − Vxc1 , Vy − Vyc1 T

D0 D0 D0

Полагая ман¼вр объекта мгновенным, его можно описать параметрически с помощью

вектора скачка

T

X(tθ) = Vx/D(tθ), Vy/D(tθ)

происходящего в момент времени tθ, ãäå Vx è Vy приращение проекций вектора ско рости объекта за сч¼т его ман¼вра на оси X и Y .

Тогда движение объекта на двух галсах может быть задано расширенным вектором:

T

X0 = Π0, 1/D0, (Vx − Vxc1 )/D0, (Vy − Vyc1 )/D0, Vx/Dθ, Vy/Dθ, tθ ,

а измеряемые пеленги связаны с X0 нелинейным соотношением:

yk = Πk(X0) + vk .

Задача состоит в том, чтобы в момент времени tk по известной совокупности наблюдений {Y1k} построить оценку вектора координат и параметров движения объекта. Оптимизация процесса оценивания осуществляется пут¼м синтеза алгоритма совместного обнаружения оценивания, который производит обнаружение факта скачкообразного изменения вектора состояния системы и его оценивание.

Технически реализуемый метод оценивания координат и параметров движения манев рирующего объекта может быть представлен в виде следующего последовательности дей ствий: