
книги из ГПНТБ / Брандин, В. Н. Основы экспериментальной космической баллистики
.pdfРассмотренные свойства оптимальности'остаются справедли выми и в этом случае.
Как указывалось в § 5.3, между условной оптимальностью бейесовских оценок и оптимальностью оценок максимального правдоподобия не существует постоянного отношения подчине ния, т. е. существует вопрос о целесообразности учета априор ной информации. В заключение параграфа рассмотрим влияние учета априорной информации об оцениваемых характеристиках на примере задачи анализа движения 6 (§ 1.3). Модель инстру ментальных ошибок ньютонометра с постоянной ориентацией оси
чувствительности в инерциальном пространстве |
(1.3.20) |
||
д®, (0 —Фь(0 |
\ |
Д А (t) Av -(— |
{t) w |
является линейной конечной аналитической моделью. |
|||
Пусть известно, что |
инструментальные ошибки независимы |
между собой и распределены по нормальному закону с задан ными параметрами:
Д £ * е м ( 0 , 3ft), Д А * С М ( 0 , |
Д ' / ( - М ( 0 , <з„), с о * е м ( 0 , Зш). . |
В дискретные моменты времени проводятся измерения |
|
г (- = Д®,(/,■)+ /?; |
(г = 1, . .. , М ) . |
Ошибки измерений предполагаются независимыми между со бой, распределены по нормальному закону с заданной диспер сией и неизвестным математическим ожиданием:
о,).
В данных условиях оценки инструментальных ошибок могут быть найдены по методам как максимального правдоподобия (ММП), так и максимальной апостериорной вероятности (ММАВ). В первом случае оценки находятся по формуле (6.1.9):
С ь |
|
А' |
|
N |
|
N |
N |
|
1 |
|
2 |
p A h |
2 |
P i ' h r h i |
2 |
2 |
P i'b /K i |
|
|
|
|
|
1 |
i - |
i |
/ - 1 |
1 = 1 |
|
|
|
|
N |
|
A' |
N |
N- |
|
|
|
д & |
|
2 p d k i h i |
V |
p . i 2 ■ |
2 |
2 A r h i |
|
||
|
,<_J I ’l i'A i |
|
|||||||
|
— |
1 = 1 |
i = 1 |
i = i |
1 = 1 |
|
|||
|
N |
|
N |
|
N |
N |
|
|
|
|
|
|
|
|
|
||||
A v |
|
2 |
|
i=i |
2 * t f , |
2 |
/’i'bi'Ki |
|
|
|
|
i = |
l |
i=i |
i = |
l |
|
||
|
|
N |
|
Л’ |
N |
N |
|
|
|
0) |
|
2 М о п ' Ь г |
2 М о . / ' Ы |
2 A r K i ' K i - |
2 M L |
. |
|||
|
|
i = i |
/ = 1 |
i = i |
/ = 1 |
170
N
■ 2 P i'hiz i
1=1
.V /=1Pi'hiZl
N |
’ |
2 P i\r,z i
1= 1
а во втором — по формуле (6.2.8):
Д6Б
Kkb
AvB
«Б
N |
|
N |
|
N |
|
Л’ |
|
2 |
/?/+&/+оо/°& |
2 |
м ^ Ь / |
2 |
/’/'bi'Ki |
2 |
|
/= 1 |
i=i |
|
j'= l |
/= 1 |
|||
TV |
|
N |
|
TV |
.V |
|
|
2 |
Ф*1 |
2 M $ , + * M |
2 |
Pi'^kity-ii |
2 |
/vbi'h»/ |
|
i= l |
|
/ = 1 |
i =1 |
/= 1 |
|||
TV |
|
TV |
|
N |
„ ,12 ’ , _2 / 2 |
iV |
|
2 |
Pi'^vi'l'bi |
2 |
P i\* ,i'n i |
V |
2 |
^ iФviФa.; |
|
2 |
/’iTvi + J0 °v |
||||||
1= 1 |
i = 1 |
1= 1 |
1-1 |
|
|||
N |
|
TV |
|
N |
|
TV |
|
2 л ’К/Ф*/ |
2 М ш 'Ь / |
^ |
Пгф .ф . |
2 м ! , + « 3 |
|||
i = l |
Z71tojг i vz |
||||||
i=i |
|
i= i |
|
|
/= 1 |
Л'
V Pi'hi*i
1 = 1
N
2 М*!*/ 1=1
TV
2
1=1
TV
2 Мш,-*/
1= 1
В табл. 6.2.1 приведены результаты расчетов по данным ал горитмам при различных условиях проведения измерений.
Таблица 6.2.1
Условия проведения |
|
= 0 |
mi =1 |
м с |
|
|
и зм ерен и й |
|
|||
М етод с т а ти с ти ч е |
ммп |
М МАВ |
ММП |
М М А В |
|
|
ской обработки |
||||
Д/?, |
м с |
0 , 3 - Ю - з |
0,48-10-5 |
0,45-10-2 |
0,29-Ю-з |
Д/Г |
|
0 , 1 3 - Ю - з |
—0,15-Ю-з |
0,14-10-2 |
0,24-10-4 |
Av, |
рад |
—0,58-10—3 |
- 0 , 4 - 1 0 - 8 |
- 0 , 1 6 - 1 0 - 1 |
0,7-10-з |
ju, |
рад с |
-0,11-10-5 |
0,11-10-5 |
-0,14-Ю-з |
-0,43-10-5 |
Сравнение данных таблицы с моделируемыми значениями оцениваемых величин: Л6 = 0,3 • 10"3, Д& = 0,2-10“3, Av = = —0,6-К)-3, со = —0,5-КЗ'5 показывает, что учет априорной ин формации статистического характера об оцениваемых характе ристиках может как улучшать, так и ухудшать качество оценок. Это зависит от условий проведения измерений, мощности выбор ки и характера самой априорной информации. Очевидно, необхо димо тщательно анализировать все эти факторы, чтобы правиль но решить вопрос о целесообразности учета априорной информа ции в процессе проведения баллистического эксперимента.
§ 6.3. ОЦЕНИВАНИЕ ПАРАМЕТРОВ ДЕТЕРМИНИРОВАННОЙ ДИНАМИЧЕСКОЙ МОДЕЛИ
Примерами детерминированных динамических'моделей явля ются уравнения возмущенного движения центра масс космиче ского объекта в оскулирующйх элементах (2.1.21); динамиче ские уравнения движения космического объекта относительно центра масс (2.2.8); некоторые зависимости системы управления. Линейная многомерная динамическая модель имеет вид
x = A{k,t)x-\-d(k,t), |
(6.3.1) |
где x(t) по-прежнему является н-мерным вектором параметров -движения; к—/7-мерным вектором постоянных характеристик мо дели движения; А (к, I) является квадратной матрицей п-го по рядка н d (к, t)—«-мерной вектор-функцией времени и характе ристик модели движения.
Уравнения (6.3.1) задают нелинейную связь между парамет рами движения и характеристиками движущегося объекта. В теории оценивания вид именно этих связей существенно влияет на алгоритм решения задачи. Более простой является динамиче
172
ская модель, линейная по характеристикам: |
|
x = M t ) x + D{t)\, |
(6.3.2) |
где D(t)—nXp — прямоугольная матрица известных |
функций |
времени. |
|
Рассмотрим модель (6.3.2). Пусть, как и раньше, измеряемая |
|
функция определяется выражением |
|
*/(0 = ?т( 0 * + х т(0 Ji- . |
(6.3.3) |
Линейная динамическая модель может быть преобразована в конечную аналитическую. Действительно, решение системы (6.3.2) линейных дифференциальных уравнений записывается в виде
х = Ф ((, /0) х й-\- Ф (t, /0) |
t0)D(x)Xdx, |
(6.3.4) |
где матрица фундаментальных решений Ф(^, t0) находится из уравнения
|
dФ(Л to) = A(t) Ф(/, |
t0), Ф(/0, t0)= E . |
(6.3.5) |
||
|
dt |
|
|
|
|
Подставив |
выражение (6.3.4) |
в выражение |
(6.3.3), |
получим |
|
= |
*о)*о + Г(*) Ф(Л to) |
Ф_1(г, |
to)D{x)dx X |
||
|
Х^ + Хт(0р- |
|
|
|
|
Введя r-мерный совокупный |
вектор |
характеристик |
модели |
||
q — {*о, К ц}, |
где r —n + p + s, и r-мерную вектор-функцию ф(^) |
координатных функций, получим зависимость для измеряемой функции
y(t) = tf(t)q, |
(6.3.6) |
которая описана в § 6.1. Отсюда видно, что параметры линейной динамической модели при условиях опыта типа '(6.1.4)—'(6.1.5) оцениваются точно так же, как в § 6.1. Однако следует иметь в виду, что получение зависимости (6.3.6) связано с необходи мостью решения системы уравнений (6.3.5). Кроме того, вектор оцениваемых параметров q в данном случае включает в себя начальные условия движения, которые не входили в него при рассмотрении аналитической модели.
В случае когда величина шага дискретности измерений At позволяет с достаточной точностью заменить непрерывную мо
173
дель движения (6.3.2) конечно-разностной,
лсг+1= л:,-4-Д^(Л-Л7' + А ^ ) (г= 0, 1,~. .., N — \), (6.3.7)
получение дискретного аналога решения (6.3.4) сводится к по следовательности алгебраических операций.
Полагая последовательно i = 0, 1, ..., N—1, получим
х^ = ( Е -(- Д( A q) Л"о—{—Д
х2 = (Е-\- AMi)ati + tdD{k — {E -f- tdAx){E-j- дМ0)л:0-р
+(Я + дМОдШоХ + Д/DiX;
Xn — (E -j- AtAjv-i)- • -(E-J- AtA0) x Q-|-[(£"-(- AtA/v—i)• • .(E -}- Д/Л^Х
X ДХО0-f-(Z ? -|- ДМ дг- i ) . . . {E -\- AtAj) Д/ A -f- . . . |
-f- AtDjy— i] X. |
Обозначим матрицу, умножаемую на вектор х0 в t-м равен стве, через Ф (/,-_ь to). Матрицу, умножаемую на вектор X, обоз начим через Г(^»—1, to). Тогда можно записать
■*|= ф |
( 4 - 1 . 4))*о + г & |
- 1 < - ( i = l , . . . , N ) . |
(6.3.8) |
Система условных уравнений |
|
|
|
|
2/= Й */ + Х/|* + А/ |
( i = \ , . . . , N ) |
|
с учетом зависимостей (6.3.8) преобразуется к виду |
|
||
2 /= § /ф (*/-1. |
4 ) Л'о + §/Т(^_1, *„)Х + Xjp + A; (7=1,. . ., |
N-). |
Введем r-мерный совокупный вектор характеристик q и соот ветствующую ему вектор-функцию ф(/). Тогда полученная сис тема уравнений в матричной записи будет иметь вид
г = ^ + А, |
(6.3.9) |
где Чг=1Фу|.
Таким образом, опять приходим к задаче, рассмотренной в §6.1. Как было показано в этом случае, оценка вектора неиз вестных параметров, определяемая по методу максимального правдоподобия или по методу условного математического ожи дания,
q = C~1WTPz, |
(6.3.10) |
где C = W rPW. |
|
Оптимальные свойства оценки (6.3.10) |
были рассмотрены |
ранее. |
|
174
§ 6.4. ОЦЕНИВАНИЕ ПАРАМЕТРОВ СТОХАСТИЧЕСКОЙ ДИНАМИЧЕСКОЙ МОДЕЛИ
Линейная динамическая модель, как показано в предыду щем параграфе, приводится к конечной аналитической модели, поэтому учет априорной информации о векторе оцениваемых параметров принципиально производится так же, как в § 6.2.
Рассмотрим усложненную динамическую модель, а именно — линейную динамическую стохастическую модель вида
х = А (t) х -\-D (t) A-f- £ (t) &(t), |
(6.4.1; |
которая получается из модели (6.3.2) в результате |
добавления |
я-мерной вектор-функции £(/), умноженной на скалярный белый шумД(/) гауссового типа.
Не снижая общности, рассмотрим в дальнейшем |
модель |
Еида |
|
J t = Л (0 * + ;(/)»(*), |
(6А2) |
которая может быть получена из первоначальной модели путем дополнения ее системой дифференциальных уравнений для по
стоянных параметров к, Х= 0 и расширения n-мерного вектора параметров движения до (п + р) -мерного вектора параметров состояния.
Модель движения (6.4.2) уже не может быть преобразована в конечную аналитическую модель в том смысле, как в преды дущем параграфе. З-адача оценивания параметров приобретает здесь новый смысл. Если для детерминированной динамической модели движения задача оценивания начальных условий движе ния и характеристик объекта эквивалентна задаче оценивания параметров движения на любой момент времени, то в случае динамической стохастической модели (6.4.2) знание начальных условий движения не дает возможности получить интегрирова нием параметры движения на любой момент времени.
Пусть для дискретных моментов времени наблюдения t{ (х=
= 1, ..., N), проводимых на интервале [О, |
Т], модель |
движения |
может быть записана в конечно-разностном виде |
|
|
•*/+! = фс*/ + г Л -(*'= 0, 1,. • |
N — 1), |
(6.4.3) |
где переходная матрица Фг = Пфяг(^г) IJ и вектор \(ti) связаны со ответственно с матрицей Л* и вектором £* из уравнения (6.4.2) приближенными соотношениями
ф / |
АМ,-4 |
|
|
Имеются результаты измерений: |
" |
* |
|
z t = i U , + ht |
N ) . |
(6 .4 .4 ) |
175
Ошибки измерений независимы, не смещены и распределены по нормальному закону:
Л*Г-А^О, 1 У |
(7= 1, ... , N). |
(6.4.6) |
Пусть, кроме того, о векторе начальных условий л:0 и векторе случайных возмущений ■6'= (й[, ..., ФЛ-) имеетсяаприорная ин формация
х*0(^ЛГ(тХо, ВХо); |
(6.4.6) |
3 - ( ^ (0 , Я»1). |
(6.4.7) |
В данной постановке необходимо оптимально оценить пара метры движения на любой момент времени измерения ti. Оценка
x(ti) может быть получена с учетом измерений гь ..., г,, накоп
ленных до момента |
времени |
или |
с учетом всех |
измерений |
ги --•> zn■ В первом |
случае |
оценка |
получается в |
результате |
фильтрации измерений и обозначается через л*,•/,•, во втором — в
результате сглаживания измерений и обозначается лу-д- .Эти
оценки не совпадают между собой, за исключением ■момента времени tN.
Л В большинстве случаев оценка X i,n строится с учетом оценки Xiji, т. е. решается сначала задача фильтрации, а затем произ водится сглаживание. Будем искать оценки лунаилучшие в смысле метода максимальной апостериорной вероятности. В со^ ответствии с выражениями (6.4.5) —(6.4.7) запишем плотность вероятностей совместного распределения векторов х0, h и #:
р ( х 0, h, fr)= &exp | |
[{хй — т ХоУBy] (x0~ m Xo)-i- |
-|-Л1ЯЛ + * т/>**]),
где k — постоянная величина.
Показатель экспоненты с учетом зависимости шется в виде
N - |
1 |
а = ' (■*<>- т Хоу в Хо1(х0- т Хо) -j- V . |
Pt+l{z i+l |
2 jU |
i=О
N- 1
(6 4 4) запи
’
ii +l-^Z +l)^-j-
(6.4.8)
няхо?ятгКаИЛ °,!!еТ0ДУ максимальной апостериорной вероятности нияхД(6 4 3) У 0ВИЯ минимУма критерия (6.4.8) при ограниче-
х 7+1= Ф,-*г- + Т&о-
176
Для учета ограничений введем совокупность неопределенных векторных множителей Лагранжа <у0, s N, размерность кото рых совпадает с размерностью вектора х, и новый критерий
J V -1
Р = а + 2 |
—Ф/*/ —yA)* |
(-6.4.9) |
1=0 |
|
|
В результате получаем задачу на безусловный экстремум крите рия (6.4.9). Система экстремальных уравнений запишется в виде
~ ~ — Вха {Ха |
М-Ха) Фо^о^О, |
|
dxQ |
|
|
- г ~ = х 1— ф ох о- т<А ■ = 0; |
|
|
ds0 |
|
|
d&o = о»о— То«о= 0; |
|
|
■р~= РЛ&Х\ — Pil\zi+ so— ф1«1 = 0; |
(6.4.10) |
|
О*! |
|
|
J 2 - = P * , N - l bN - l- 4 lV - lSN-l = 0’ |
|
|
a»V-i |
|
|
- щ р = P n I n Vn X n — P n I n Z n — S N _ X = 0 . |
|
|
Из системы уравнений |
|
|
^ L = 0 |
(/ = 0 , . . . , N - l ) |
|
<7tri |
|
|
непосредственно следуют соотношения
&г = РМТг®/> |
(6.4.11) |
с помощью которых случайные возмущения из дальнейшего рассмотрения могут быть исключены.
Преобразованная с учетом равенств (6.4.11) система уравне ний (6.4.10) имеет вид
B l l ( х 0— т Хо)— ®Ss0= 0 ;
**й — ф о * о — ^ oT oY oSq = 0 ;
—P& z i + So — ф1«1= 0»
P1\^ n \'n X n p n \ n Zn -j- ■SyV_ i 0,
5^ = 0.
177
Объединяя подобные члены и изменяя порядок операций, за пишем уравнения:
x 0 = B Xo<S>ls0 + m Xo;
*t+i=®ix i+ P t h i t W , |
(6-4.12) |
~ ® < + 1®< -И ~PiЬ +l^i+1(z i+l |
i / + l ^ / + l ) » |
Система уравнений (6.4.12) представляет собой двухточеч ную граничную задачу. Условия на границах определены пер вым и последним уравнениями системы.
Двухточечная граничная задача в общем случае может быть решена методом «машинной пристрелки». Однако для линейной динамической модели можно построить рекуррентную процеду
ру определения оценок фильтрации Хщ, а затем решить задачу сглаживания. Уравнения (6.4.12) являются исходными для по лучения фильтра Калмана. Фильтр Калмана и конкретный при мер его использования изложены в гл. X.
§ 6.5. ОЦЕНИВАНИЕ НЕОПРЕДЕЛЕННОЙ МОДЕЛИ
Под неопределенной моделью движения космического объек та будем понимать вектор параметров движения, связь которого с вектором характеристик модели движения и состав самого вектора характеристик являются неизвестными. В этом случае модель^ полностью определяется выбором системы координат, в которой рассматривается движение. С подобными моделями приходится иметь дело в аварийных ситуациях, а также при оценивании движения неопознанных управляемых объектов.
Для простоты предположим, что модель измерения является непосредственной, так что каждую составляющую вектора пара метров движения x(t) можно оценивать в отдельности.
Пусть на интервале [О, Т] в дискретные моменты времени ti измеряется какая-то составляющая вектора параметров движе
ния: |
|
|
*/ = ■*&) + £, |
|
(6.5.1) |
где |
0, a J Y P i ) - |
(6.5.2) |
Из выражений (6.5.1) и (6.5.*2) следует, что плотность веро ятности выборки z~- \\z\, ..., 2jvIIt записывается в виде
_ 1 '
р{г1х)={2кщ) 2 |Р |2 ехр | - - у ( г -х)'Р{г —-jc)J . (6.5.3)
178
В соответствии с методом максимального правдоподобия оценивать неопределенную модель необходимо по минимуму по казателя экспоненты в выражении (6.5.3):
N
(6.5.4)
i - \
О функции x(t) в данном случае нет никаких сведений, по тому единственным способом решения задачи является фор мальная аппроксимация. Чтобы выбираемая формальная мо дель была удобной с точки зрения ее оценивания и дальнейше го анализа, необходимо предъявить к ней ряд требований. Потребуем, чтобы формальная модель измеряемого сигнала бы ла достаточно простой, непрерывной и дифференцируемой функ цией времени. Этому может удовлетворить решение в виде ка кого-либо ряда
х ( / ) = 2 а А -(/) |
' |
(б-5-5) |
j=1 |
|
|
по линейно независимой на интервале наблюдения [О, Г] системе функций {ф3-(01- Проще всего для этой цели использовать ортонормированные системы функций. Предположим, что с доста-
Рис. 6.5.1. Графики степенных |
Рис. 6.5.2. Графики тригономет |
полиномов |
рических полиномов |
точной точностью x(t) описывается конечным разложением вида (6.5.5). Тогда задача оценки формальной модели (6.5.5) по кри терию (6.5.4) сводится к выбору системы функций {^(У)}, к определению степени аппроксимирующего полинома г и к вы числению оценок неизвестных коэффициентов а, (у = 1, ..., г).
При выборе системы функций надо стремиться к тому, чтобы эта система соответствовала физической сущности исследуемого процесса. Например, если параметр движения x(i) является мо нотонной функцией времени, то в качестве функций {ф^/)} це лесообразно взять также монотонные функции времени. Этому
179