Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Брандин, В. Н. Основы экспериментальной космической баллистики

.pdf
Скачиваний:
50
Добавлен:
22.10.2023
Размер:
12.04 Mб
Скачать

соответствуют менее общие алгоритмы. В следующем параграфе рассматривается наиболее общая форма рекуррентных алгорит­ мов.

§ 10.3. РЕКУРРЕНТНАЯ ПРОЦЕДУРА КИФЕРА — ВОЛЬФОВИЦА

Результаты, полученные в предыдущих параграфах, имеют много общего. А именно, несмотря на различные свойства алго­ ритмов (10.1.5) и (10.2.5), они имеют общую форму. Например, оценка коэффициента усиления в одномерной задаче как в ре­ куррентном алгоритме метода наименьших квадратов, так и в рекуррентном алгоритме Чадеева уточняется по следующей зави­ симости:

Qn — Qn _ x- ' ^ n Qn - i ). ( 1 0 . 3 . 1 ) -

где коэффициент \ N равен pN''N 2 Р(1/ в (10.1.2) и рМ р +-

i =i

+<& в ( ю -2 л )-

Впрактике могут встретиться случаи, когда в распоряжении экспериментатора нет достаточной информации об условиях опы­

та, по которой могут быть найдены оптимальные значения коэф­ фициентов удг в том или ином методе. В то же время желательно найти оценки параметров. Выходом из такого положенияможет быть использование стохастической аппроксимации. Слово «ап­ проксимация» указывает здесь на приближенный характер ре­ шения, а термин «стохастическая» означает, что задача решается в условиях случайных помех.

Процедура стохастической аппроксимации была предложена Г. Роббинсом и С. Монро в 1951 г. для отыскания корня уравне­ ния регрессии в условиях помех. Спустя год после этого появи­ лась статья Кифера и Вольфовица, где идея стохастической аппроксимации была использована для поиска экстремума уни­ модальной функции одной переменной. Так как задача оценки параметров аналогична экстремальной задаче, рассмотрим в этом параграфе процедуру Кифера и Вольфовица.

Рекуррентная процедура стохастической аппроксимации применительно к оценке параметра q усилительного звена

x ( t ) = ' Ht ) q

записывается в виде (10.3.1), где улт — некоторая последователь­ ность положительных чисел.

При некоторых условиях, накладываемых на последователь­

ность чисел yjv, алгоритм (10.3.1) является сходящимся в сред­ нем

lim A f[(^ v - 9)2]= o,

N^oo

280

и с вероятностью единица

p{Y\mq =q) = \.

Упомянутые условия сходимости метода стохастической ап­ проксимации записываются следующим образом:

 

 

СО

 

(ю.3.2)

 

 

2 ^ = °°;

 

 

N-1

 

 

 

 

V ^ < o o .

(10.3.3)

 

 

N= 1

 

 

Условие (10.3.2)

обеспечивает

неограниченную

коррекцию

оцениваемых параметров. Действительно, пусть

 

 

 

ZK— ?A A v -l|< m’

 

где т — некоторая

не

зависящая

от N постоянная

величина.

Предположим, что

2

yN <Cd. Тогда для любого N можно за-

jY= 1

писать неравенство

N

qN < q o JT m ^

Лг = 1

из которого следует, что

N ->■оо

Если на самом деле действительное значение

q > q 0 + md,

то оценка qдг при несоблюдении условия (10.3.2) оказывается несостоятельной, смещенной.

Условие (10.3.3) дает возможность скомпенсировать влияние отдельных ошибок измерений. Действительно, пусть

где h — ошибка измерения с максимально возможной дисперси­ ей от2. Тогда, для того чтобы ряд корректирующих поправок был сходящимся, необходимо, чтобы дисперсия суммы поправок бы­ ла ограниченной:

оо

л.2

^ - х ) 2 <

%N‘

_N= 1

N- 1

281

Отсюда следует условие (10.3.3). Условиям (10.3.2) и (10.3.3) удовлетворяет, в частности, гармоническая последовательность чисел с общим членом Г/Л/'.

Помимо условий (10.3.2) и (10.3.3), необходимо, чтобы ошиб­ ки измерений были несмещенными и имели ограниченные диспер­ сии. В этом случае метод стохастической аппроксимации обеспе­ чивает получение состоятельных оценок.

Рассмотрим многомерный вариант метода стохастической ап­ проксимации. Пусть имеется многопараметрическая конечная аналитическая линейная модель

х (/) = < № ? .

(10.3.4)

Об ошибках измерения функции x(t)

Z i = x i Jr h i (г= 1,. .., N)

Известно, что они являются несмещенными и имеют ограничен­ ные дисперсии. Тогда алгоритм последовательного оценивания вектора параметров q в модели (10.3.4) запишется в виде

Я QN—1 Ty4v (ziy

флг9'дг_1),

(10.3.5)

где

 

 

 

 

= II4 i( ^ y v ),.

'/ у ( ^ х ) I f -

 

Алгоритм (10.3.5)

соответствует тому, что на

каждом шаге

минимизируется критерий

 

 

 

a = {z — tyTNq)2

(10.3.6)

с помощью градиентной процедуры

 

 

Я м

« W - i + Y j y V a ( ? * _ ! , 2д.),

( 1 0 . 3 . 7 )

поскольку

 

 

 

V «

= - 2 $ n ( z n - фrN q ).

 

Из выражений (10.3.6) и (10.3.7) следует, что метод стоха­

стической аппроксимации может быть применен для нелинейных моделей.

Пусть оптимальное решение нелинейной задачи характеризу­ ется критерием a (q, z). Тогда оценка вектора параметров <7 для данной последовательности реализаций измерений Z\, ..., Z\, ...

записывается в виде

Ям (7/V—1""I- У м ^ а(Ям~г ^лг)’

(10.3.8)

если функция a (q, z) является дифференцируемой по q , или в виде

282

Ev

Я f f Я n —i ~b 2 c iV 1(?W—i’ ^tv’ ^v) ®—(^Ov_р -СЛГ, ^v)]i (10.3.9)

если функция (10.3.6) недифференцируема.

Формула (10.3.9) представляет собой многомерный вариант процедуры Кифера — Вольфовица. Здесь градиент определяется

приближенно по формуле

 

 

 

 

 

 

zN)-.

u+ (QN—1> CN’ ZN> '

( Q n -

1> VN'

ZN*N->

 

 

 

2cN

 

 

 

 

 

 

 

 

 

 

 

в которой

 

 

 

 

 

 

 

a_ { я N—V CN' ZN )

la( я N —\i i ^л/b

z n ) ■■

{ я N —V

^(/у)}Т

а через lj (/=1, ..., г) обозначены базисные векторы

 

 

A = (l, 0 ,...,

0 ),..., /г= (0, 0 ,...,

1).

 

Если

функция

a(q, г)

является

выпуклой,

то

алгоритмы

(10.3.8)

и (10.3.9)

обеспечивают получение состоятельных оце­

нок при условиях

(10.3.2),

(10.3.3),

начиная с любого нулевого

приближения #0.

Для реализации рекуррентной процедуры стохастической ап­ проксимации не требуется знание статистических характеристик об ошибках измерений. Отмеченные выше сведения о несмещен­ ности ошибок и ограниченности их дисперсий необходимы для того, чтобы быть уверенным в сходимости алгоритма. Последо­ вательность коэффициентов yN, обеспечивающая быструю схо­ димость, должна выбираться в соответствии с характером по­ верхности а(<7, г).

Метод стохастической аппроксимации эффективно использу­ ется для восстановления характеристик линейных систем управ­ ления [14], а также в задачах сглаживания и прогнозирования элементов орбит космических объектов [6]. Очевидно, метод мо­ жет быть использован для оценивания нестационарных парамет­ ров, если на последовательность коэффициентов ум наложить дополнительные требования, учитывающие нестационарность оцениваемых величин.

§ 10.4. РЕКУРРЕНТНЫЕ СООТНОШЕНИЯ ФИЛЬТРА КАЛМАНА

При рассмотрении задачи оценки параметров движения ли­ нейной динамической стохастической модели в гл. VI записаны уравнения для оценок (6.4.12):

283

* 0= £ о ф^ о + "^ о ;

 

*/+ i= ® iX i+p-)4i'(jSi;

(10.4.1)

s t- = Ф /4 -1 5 г+1 4~ P i + \ Z i + \ i z i +1 ~ 5 1 + i^ H - i) ;

 

5 ^ = 0 ,

представляющие собой двухточечную граничную задачу. Построим последовательную процедуру для их решения. По­

ложим вначале N = 1. Тогда уравнения (10.4.1) запишутся в виде

*0/1= Я„Ф0® 4" тх0'

*1Л= Ф0^ол+^ТоТо®о;

.

(10.4.2)

«о= Ф!«1 + р & (zi —

Sj = 0.

Подставим во второе уравнение первое, а в третье — четвер­ тое. Получим

* i / i = Ф 05 0ф о«о + р ь М о Ф о + ф ат х ^

So = /7ili(zi — Il*i/i).

Обозначим

Вi/o= Ф0£офо + /?»,оГоГо

иподставим второе уравнение в первое. В результате система четырех уравнений (10.4.2) приводится к уравнению

*ш = Яi/oAg! (z i ~ l l x i n ) Hr ф о т м .

Сделав приведение подобных членов в этом уравнении, по­ лучим

+ ^i/oA&iSl) х и — В ц о р ^ г ^ Ф0тхй.

Умножим обе части последнего уравнения слева на матрицу

Bvl-

(#i/o + A l i l i ) *i/i = A liA 'b В \ ^ йтм .

Обозначив

£ i/i= (#i/d + A lili) \

запишем выражение для оценки вектора параметров движения по одному измерению:

284

 

i — ■^i'i/?ili'2'i "h

o<$0mx0-\-

 

+

# 1 l/^ilil.I^'ra.ro— B i

i/7iI i l i (l1om^o=

 

=

^i/iA ii (^1 —

-t-

 

Окончательно

 

 

 

Xi^ = % m xQ-)r B mpll A z i - ' & <btfnxQ)’

(10.4.3)

 

Кт = ( В щ + р М \ ) ~ 1-

(10.4.4)

Положим теперь N = 2. Тогда уравнения (10.4.1)

запишутся

в виде

 

 

 

x m = BQ® l s ^ m x()\

 

 

•*1/2— Ф0*0 2 Н“ Р^оТоТо^О-’

 

^2/2-=®1^ i/2 + ^}X iTISi ;

(10.4.5)

 

«О = Ф^1 + A ll («1 -

lixm h

 

 

Si= ®ls2-f p2l 2 (22 — I2-V2/2);

 

 

«2 = 0 .

 

 

Произведем преобразование системы уравнений (10.4.5) с ' использованием результатов и методики рассмотренного выше случая jV= 1. Подставим первое уравнение во второе:

* 1/2= фо/?офо«о+ МоТоТо«о+ <x,o"*to = £i/0'Vf' фо"**о- (10.4.6)

Четвертое уравнение в (10.4.5) запишем с учетом (10.4.3)

s0= ф 1«1 -(-1^1/1 * 1 1 A lili-*i/2 "i_ /’iliIi<^o^ o ^1/1 фотел-о>

а затем перепишем его с учетом (10.4.4):

 

$о= ф!®1 B\i\xi;\ — /Tlifi*i/2— Bijo®Qtnxo-

(10.4.7)

Подставив (10.4.7) в (10.4.6), получим

 

*1/2= #1/0 [ф1«1+ Bijlxm — р&х&Хщ]

Разрешив последнее уравнение относительно хр2, получим

* 1/2 = Bin^\sl -|-*i/i.

(10.4.8)

Подставим уравнение (10.4.8) в третье уравнение

системы

(10.4.5):

 

*2/2=ф1 ^ п ф1«1 + ф1*1/1+^!т1П«1-

(ТО.4.9)

285

О бозн ачи м

5 2/i = ® j5 i/i®i + A ,iTiYi-

Подставив предпоследнее уравнение системы (10.4.5) в урав­ нение (10.4.9), получим

Хц2— ВглР&ъ (^2 — I2-V2/2) 4“

Разрешив последнее уравнение относительно х2/2, запишем окончательное выражение оценки вектора параметров движения по двум измерениям на момент времени t2:

.*2/2 =

B2j2p £ 2 {Z2

\X\j\)

 

 

(10.4.10)

 

£2H= $ i£ i/i$ I +

/7iuriYb

 

(10.4.11)

 

=

 

 

 

(10.4.12)

Оценка (10.4.10)

вместе с оценкой (10.4.3)

составляет полную

систему оценок для случая N = 2.

 

 

4, ...,

можно пока­

Поступая точно так же для случаев N = 3,

зать, что рекуррентные соотношения имеют вид

 

X i + m + 1— Ф/ЛГц/

В i + i i + i P i + i i ; + i

( 2 4 + 1

\ i + l ® i x

Hi)\ ( 1 0 . 4 . 1 3 )

■ Дг-н// + ф;Д//гф;+/АкЛГ^г;

 

(10.4.14)

B i+lli+l= (B J -^iii-pi+1U

i r l-

(Ю.4.15)

Из уравнения (10.4.13) видно, что текущая оценка определя­ ется как предыдущая оценка плюс поправка за счет нового из­ мерения. Матрица (10.4.15) является корреляционной матрицей

вектора ij+i/i+i-

Рассмотрим в качестве примера задачу 2 (§ 1.3) определения параметров движения спускаемого на поверхность планеты кос­ мического объекта по измерениям его высоты с помощью радио­ высотомера.

Для получения конкретных выражений (10.4.13) — (10.4.15) дискретного фильтра Калмана запишем сначала модель движе­ ния (1.3.7) в конечно-разностном виде

v i+1^ = ^ { v u— Xi —g sin 0/ + »,);

в‘«=4Ф + Ы т 7 7 “ Гг)с<к''

// /+1=Д< (#,-{-vt sm 6,.),

азатем линеаризуем ее в окрестности расчетного движения, при­ няв At = 1 с:

Дг',.+1= Дг>г — g cos 6гд0; + »,■;

286

+r

R + Hi

cos 6,-Дг;,-

1 -

sin 0;

X

 

 

 

 

R +Hi

 

 

 

X Дv

 

-c o s

9,.дHe,

 

 

 

(R

+ H,)z

 

 

 

A ^ / +1 = s in

+

co s 0 ^ 0 ,-} - ду7 ; . .

 

Отсюда переходная матрица Ф* и вектор уфзаписываются в виде

1

Ъ= О ,

О

 

1

cos 0,-

R + Н

2

 

vl

sin Р;

 

— g- sin

 

0

 

 

1 ------ —— sin 6 - -4-

V:

,, 1

COS 6,1

R +

(R + /У;)2

vvOjv/'

 

-f — sin

6;

 

Vi

 

 

 

 

-----------------------

—!—i—*—I——]—

 

О C/iО чЛЭ

 

 

 

i

 

 

 

 

 

Элементы матрицы Ф* определяются по параметрам расчет­ ного движения. Из уравнения измерений

zi+i — Н i+i -\-hi+i [i — О,..., N — 1)

находим вектор

Весовые множители Pi+1 и pb,i определяются по известным средним квадратическим отклонениям, которые в данном приме­ р е полагались постоянными и равными: 0i+1=2O м, а„, г = 0,1 м/с2. Результаты расчетов вектора оцениваемых отклонений парамет­ ров движения {Ап, Д0„ АН} приведены на рис. 10.4.1 и 10.4.2.

На рис. 10.4.1 приводятся результаты работы фильтра в иде­ альных условиях, когда отклонения начальных условий парамет­ ров движения являются нулевыми. Из рисунка видно, что фильтр примерно 100 с работает устойчиво, а затем начинает расходить­ ся. На рис. 10.4.2 приводятся результаты работы фильтра в слу­ чае, когда начальные условия параметров расчетного (невозму­ щенного) и действительного движения не совпадают между собой, а именно: Ли0 = —20 м/с, А00=1 град, АЯ0= 10 000 м. Из рисунка видно, что фильтр достаточно быстро уменьшает откло-

287

Рис. 10.4.1. Графики, характеризующие работу фильтров в слу­ чае совпадающих начальных условий:

а —для скорости; б — для угла наклона к местному горизонту; в

для высоты

Рис. 10.4.2. Графики, характеризующие работу фильтров в слу­ чае несовпадающих начальных условий:

а — для скорости; б —для угла наклона к местному горизонту; . в

для высоты

289

Соседние файлы в папке книги из ГПНТБ