Статистические свойства оценок неизвестных параметров мо делей движения космических объектов, получаемых при наличии ошибок измерений в опытных значениях координатных функций по рассмотренным выше линейным алгоритмам, в общем случае хуже свойств тех же оценок, получаемых с помощью обобщенно го критерия оптимальности оценок р(<?). Однако при некоторых условиях эти свойства могут быть достаточно близкими. Вопрос о возможности применения линейных алгоритмов к решению за дач оценки параметров при наблюдении с ошибками значений координатных функций должен решаться отдельно в каждом конкретном случае. Решение может быть принято на основе сравнительного анализа статистических характеристик оценок ' неизвестных параметров, получаемых по линейному и по нели- . нейному алгоритмам. Эти характеристики могут быть либо рас считаны аналитически по формулам оценки точности, либо по выборкам оценок при машинном моделировании предстоящего
эксперимента.
Рассмотрим, например, задачу оценки по результатам изме рений стационарных параметров линейного регулятора системы регулирования кажущейся скорости (РКС). Закон регулирова ния, т. е. уравнение модели линейного регулятора системы РКС, может быть записан следующим образом:
^oc¥ p + 8lAP~ a0^W,T.p.C’ [8.6.21)
где брр=брр( /) — регулирующее воздействие системы РКС, яв ляющееся изменением суммарного секундного весового расхода компонентов топлива; 6аУд.р .с= бшд.р.с( /) — рассогласование ка жущейся скорости, измеренное в направлении оси чувствитель ности датчика рассогласования кажущейся скорости (ДРС); Гос— статический коэффициент усиления системы РКС; а0— постоянная времени регулирования.,
Проводимыми в процессе испытаний синхронизированными' измерениями доставляются значения в дискретные моменты вре
мени ti (i= l, 2, ..., N) функций б|Лр(/), бцр(0 и 6шд.р.с(0- Оцен
ке подлежат статический коэффициент усиления а0 и постоянная времени регулирования Т0с.
Нетрудно видеть, что равенствами
¥Р{t)=x{t)\
—84 .p .cW = 5 ? (С;
Тос —- а| , а0— &2
уравнение (8.6.21) работы линейного регулятора системы РКС
приводится к виду
x(t) = a£i (t) + «2c2 (С- |
(8.6.22) |
Равенство (8.6.22) является частным случаем линейного от носительно вектора оцениваемых параметров уравнения модели движения космического объекта (8.1.1), если положить в послед нем р = 2 и s = 0. Поэтому решить задачу оценки по результатам измерений параметров линейного регулятора системы РКС мож но с помощью либо критерия оптимальности оценок а (а'), опре деляемого равенством (8.3.7), либо алгоритма (8.6.18), получен ного выше.
Запишем для сравнения оба указанных алгоритма решения поставленной задачи в предположении, что ошибки измерений регулирующего воздействия системы РКС и рассогласования кажущейся скорости равноточны в каждом из измерительных ка налов и независимы в совокупности.
В применении к уравнению модели вида (8.6.22) критерий оптимальности оценок а (а') приводит к следующей статистике для вектора оценок:
« H K a 2|f;
® = 1^ 11^2- • • ‘^ л г 1Г;
w x= \ w nwn . . .tt'uvf;
w 2= \ w 2lw22. . .W2N f;
2
UK'= || i a>2|; Id 38, 0 2
0
a Я— наибольший действительный корень уравнения
|
4 (flf! - |
Ы 2)- |
aT{ U - W y 1u = 0, |
(8.6.24) |
в котором |
|
|
|
|
|
|
|
|
I |
2 |
W [ W i |
wyv2 |
|
|
|
d2 = aV, U = 2WTV, |
|
|
V TV |
|
w \ w l , w ] w 2 \ |
|
и |
2 |
' |
2 |
1 |
„2 |
I D - W TW. |
|
|
ce |
|
o* |
|
0}o3 |
// |
|
Введем следующие статистики, упрощающие запись и прак тическое применение записанного алгоритма:
N
S 1= v Tv = ^ v 2i;
i = 1
Л г
S 2= w r1w 1= ^ (=1
N
S3— w lw 2= V ®2i-; /=i
N
SA= w]v—Sw uVi;
г = 1
N
S s= w lv = '2i w2iv l; t-i
N
5 6 = w lw 2 = 2® ii® «- г=1
С помощью этих статистик векторное равенство (8.6.23) пу тем несложных преобразований может быть приведено к следую щей системе двух скалярных равенств:
|
_ |
($з — т<т;д)я4 — s6s5 |
|
|
( * 2 — « 3i ) ( |
S 3 4— ’И * , ) — |
|
|
|
(8.6.25) |
|
; _ |
(«2— /ге®11) «5— |
, |
|
^2----------------------------------- |
(«2— 'яа| 1) («з— |
|
где |
— se |
|
т |
«1 |
X. |
|
а2 |
|
|
|
Сравнение (8.6.24) для определения X, входящего в выраже ние для т и являющегося наибольшим действительным корнем этого уравнения, с использованием введенных статистик S& (£ = = 1, 2, ..., 6) приводится к следующему каноническому виду:
Х3-)-ахХ2-}- 6;,Х-[-гх= 0 , ^ |
(8.6.26) |
где ах= — 2 |
£ 2 _ _ 1_ _ £ з _ \ . |
|
|
О I о |
’ |
+ 2 |
|
S4S5S6 |
si |
s |
3 |
S1 |
„2„2 |
2 |
|
|
|
3 |
,e0 6» . |
a *52 |
|
|
|
|
Применение для решения задачи оценки параметров линей ного регулятора системы РКС формулы (8.6.16) приводит к сле дующему результату:
|
|
( s 3 — A ^ J s 4 — s 6s 5 |
|
|
(s2- ^ a 25i)(S3_ ^ 2) - 4 |
|
|
(8.6.27) |
а, |
_ |
(s2 — A 4i) S5— S6S4 |
|
(s2 - N oh)z (s3- N sI ) - s62 |
|
|
Нетрудно видеть, что статистики (8.6.25) и (8.6.27) для оце нок параметров линейного регулятора системы РКС совпадают с точностью до замены т на N и наоборот. Это указывает на тесную связь между оценками.неизвестных параметров линейной модели космического объекта, получаемыми с помощью крите
рия оптимальности оценок 0 (0/) |
(а в общем случае — критерия |
$ (q')) и модифицированным методом |
максимального правдо |
подобия регрессионного анализа. |
|
|
Т а б л и ц а 8.6.1 |
|
|
|
|
|
|
Математическое ожидание |
|
Дисперсия |
Оценка |
I |
II |
|
I |
п |
|
|
Со |
2 , 0 0 0 |
1 , 1 9 8 |
- |
0 , 3 5 7 - 1 0 - 5 |
0 , 3 6 7 - 1 0 - 5 |
t ОС |
0 , 9 6 7 |
0 , 9 6 4 |
|
0 , 1 3 2 - 1 0 - 2 |
0 , 1 3 9 - 1 0 - 2 |
Моделирование на ЭВМ процессов получения и обработки измерительной информации указывает на достаточно хорошее совпадение статистических свойств оценок параметров в рассмат риваемой задаче.. Результаты моделирования приведены в табл. 8.6.1.
В этой таблице помещены выборочные математические ожи дания и дисперсии оценок Тос и а0 параметров Тос и а0 линейно-
го регулятора системы РКС, рассчитанных |
по формулам |
(8.6.25) и (8.6.27). Графы таблицы, содержащие |
значения ста |
тистических характеристик оценок неизвестных параметров, рассчитываемых по этим формулам, обозначены соответственно
I и И.
При моделировании точные значения постоянной времени ре гулирования и статического коэффициента усиления системы РКС были приняты следующими:
Рассогласование кажущейся скорости принято в приведенном примере изменяющимся по квадратичному закону в функции времени. Средние квадратические отклонения измеренных значе ний от измеряемых величин взяты равными 10% максимальных значений последних. Закон распределения ошибок измерений нормальный.
Анализ данных таблицы показывает, что выборочные стати стические характеристики оценок параметров линейного регуля тора системы РКС, определяемых с помощью критерия опти мальности оценок а (а') и модифицированным методом макси мального правдоподобия регрессионного анализа, практически совпадают. Поэтому для этой задачи алгоритм (8.6.27) как более простой предпочтительнее, по-видимому, алгоритма (8.6.25).
Во всех случаях рассмотренные в настоящем параграфе ли нейные алгоритмы расчета оценок неизвестных параметров мо гут быть применены для определения оценок нулевого прибли жения.
§8.7. СПОСОБ СТАТИСТИК ВАЛЬДА
Висследованиях Вальда [40] рассматривается способ опреде ления оценок неизвестных параметров модели процесса, имею щей вид (8.5.35). В условиях, когда ошибки измерений незави симы в совокупности и одинаково распределены в каждом из из мерительных или информационных каналов, предлагается
следующий способ определения оценок а и Ь параметров а и Ь. Вводятся вспомогательные статистики:
(8.7.1)
Для удобства число опытных точек N взято четным:
' N = 2т.
С помощью вспомогательных статистик (8.7.1) параметров а я b определяются по формулам:
" |
а 2 |
; . |
a = - z - |
|
ах |
|
■ N |
|
N |
Ь = — |
[ |
— а V |
) . |
(8.7.3) |
к |
\ jA |
1 |
А А |
■) |
|
|
W = 1 |
|
i = 1 |
/ |
|
Статистики (8.7.2) — (8.7.3) |
просты в реализации. Решение с |
их помощью рассматриваемой |
задачи оценки параметров дает |
хорошие практические результаты. |
В работе [34] показано, что |
оценки параметров а я Ь, |
рассчитанные |
по формулам |
(8.7.2) и |
(8.7.3), являются состоятельными. Большим достоинством этого способа расчета оценок является то, что статистики для их опре деления относятся к типу разностных. Это особенно важно, если ошибки измерений имеют сингулярную составляющую.
Большой практический интерес представляет вопрос о воз можности распространения способа статистик Вальда на случай многопараметрического оценивания, т. е. когда р> 1 и ^ s > 1. В этой связи необходимо-установить принцип, заложенный в ос нову рассмотренных выше статистик, поскольку этот принцип может быть использован при построении аналогичных статистик в многопараметрических случаях оценивания.
Одним из возможных обоснований принципа построения ста тистик Вальда может быть следующее.
Поскольку статистика для а есть отношение статистик для
а2 и d\, последние можно представить в виде
тN
|
1 |
2 |
- |
4 |
У) |
« 1 |
= |
|
т |
ja a a |
|
|
i = l |
|
|
i = m + 1 |
|
|
т |
|
|
N |
|
1 |
S |
- |
т |
S - |
« 2 |
= |
|
т |
|
|
i = 1 |
|
|
i= m + 1 |
Величины Wi и щ могут быть интерпретированы как коорди наты опытной точки, полученной при измерении с ошибками ко
ординат и Xi соответственно точки, |
лежащей на прямой, урав |
нение которой имеет вид |
(8.7.5) |
x = al-\-b. |
Тогда слагаемым в правых частях равенств (8.7.4) может быть придан следующий геометрический смысл:
т |
w i — w 1— средняя абсцисса первой половины опытных |
— |
т 4 4 |
точек; |
<=i |
’ |
N
|
|
средняя |
абсцисса второй половины |
опытных |
i=m+l |
точек; |
|
|
|
—т |
5 Jj ®,==,di |
средняя ордината |
первой половины |
опытных |
точек; |
|
|
|
|
;=1 |
|
|
|
|
|
N |
|
|
|
|
|
V; ■-v« — средняя |
ордината |
второй половины |
опытных |
|
2 |
точек. |
|
|
|
|
i=т + 1 |
|
|
|
Координаты wj |
и Vi определяют |
в системе координат 0 \ х |
точку L\, являющуюся средней точкой первой половины опытных точек, a w%и г;2— соответственно точку _L2, являющуюся средней точкой второй половины опытных точек (рис. 8.7.1).
Рис. 8.7.1. Геометрическая интерпретация способа статистик Вальда
Нетрудно видеть, что оценки а и Ъ, определяемые формулами (8.7.2) и (8.7.3), есть не что иное, как параметры прямой, имею щей уравнение
х— а%-\- Ъ
ипроходящей через средние опытные точки Ъ\ и Г2:
a = tga = а2
ах
Очевидно, что, используя изложенный выше принцип, можно построить статистики для оценок параметров в многопараметри ческих моделях движения. Для этого необходимо в пространстве опытных точек построить средние опытные точки в количестве, совпадающем с размерностью этого пространства. Далее мето дами аналитической геометрии надо найти параметры канониче ского уравнения гиперплоскости, проходящей через эти средние опытные точки. По найденным таким образом параметрам ука занной гиперплоскости могут быть определены неизвестные па раметры многопараметрической модели, линейной относительно вектора оцениваемых параметров. Размерность пространства опытных точек равна количеству контролируемых по результа там измерений переменных. Многопараметрические статистики типа статистик Вальда могут быть применены для оценки пара метров модели движения, уравнение которой имеет вид (8.1.8), но с ограничением, заключающимся в том, что размерность век тора b не может быть больше единицы, а координатная функция фД/) должна быть постоянной и равна единице. При этих огра ничениях уравнение модели движения, оценка параметров кото рой возможна с помощью статистик типа статистик Вальда, име ет вид
Оптимальность оценок неизвестных параметров по изложен ной выше методике во многом зависит от расположения средних опытных точек в пространстве опытных точек. Планирование их оптимального расположения должно проводиться с учетом кон кретного вида функциональной зависимости от времени ордина ты модели движения и ее координатных функций |Д Д . При этом важно, чтобы средние опытные точки были как можно дальше разнесены в проходящей через них плоскости друг от друга, так как при этом ошибки в координатах средних опытных точек бу дут оказывать меньшее влияние на параметры этой плоскости.
Глава LX. ВЫЧИСЛИТЕЛЬНЫЕ ПРОЦЕДУРЫ ОЦЕНКИ ПАРАМЕТРОВ МОДЕЛЕЙ ДВИЖЕНИЯ КОСМИЧЕСКИХ ОБЪЕКТОВ ПО ВЫБОРКЕ ИЗМЕРЕНИЙ ФИКСИРОВАННОГО ОБЪЕМА
Уравнения правдоподобия (см. гл. V и VII) в общем случае являются нелинейными относительно оцениваемых параметров. Нелинейные уравнения оценок получаются даже для некоторых видов линейных моделей движения, рассмотренных в § 6.6 и 8.3.
Процесс решения нелинейных уравнений имеет много общего с поиском экстремума некоторой функции. Стратегии поиска экс тремума функции можно разделить на два вида: случайные и детерминированные. Поиск, стратегия которого является полно стью детерминированной (не содержит элементов случайности) при проведении всех экспериментов по отысканию экстремума, называется детерминированным. Поиск, стратегия которого со
держит элементы случайности, называется случайным (или ста тистическим).
В свою очередь как случайные, так и детерминированные стратегии подразделяются на два вида: пассивные и последова тельные. Поиск, в котором стратегия проведения всех экспери ментов по отысканию экстремума определяется заранее и не из меняется в процессе проведения опытов, будем называть пассив ным (непоследовательным). Поиск, стратегия которого строится с учетом использования информации, получаемой в процессе проведения опытов, будем называть последовательным.
Таким образом, имеем следующую классификацию методов поиска:
—пассивные случайные;
—последовательные случайные;
—пассивные детерминированные;
—последовательные детерминированные.
Вэтой классификации методы располагаются примерно в по рядке возрастания их эффективности, под которой в данном слу-
чае может пониматься время поиска или объем необходимой па мяти ЭВМ. В первой группе методов почти не используется ин формация о свойствах^ исследуемой функции и информация о самом процессе поиска. Во второй и третьей группах методов соответственно используется информация или о процессе поиска, или о свойствах исследуемой функции. В последней группе ис пользуется информация обоих видов. Учет какой-то информации при построении алгоритмов естественно позволяет повысить их эффективность, т. е. сократить время поиска экстремума, но об щность алгоритмов при этом также естественно уменьшается, т. е. сужается область их применимости.
В этой главе рассматриваются типичные представители раз личных групп методов* которые наиболее полно иллюстрируют проблемы, возникающие при решении нелинейных уравнений оценок. В ряде задач оценивания линейных моделей движения, рассмотренных в гл. VI и VIII, записаны линейные алгебраиче ские уравнения оценок. В случае большой размерности вектора оцениваемых параметров решение таких уравнений является не простым делом, поэтому в § 9.5 приводятся некоторые сведения о методах их решения. Изложение каждого метода обычно начи нается с одномерного случая и затем дается обобщение на мно гомерный поиск. Дается краткая сравнительная характеристика методов.
§9.1. МЕТОД МОНТЕ-КАРЛО
Кпассивным случайным методам поиска экстремума функ ции относится ненаправленный случайный поиск. Иначе его на зывают методом Монте-Карло.
Стратегия поиска этим методом определяется заранее и за
ключается в определении иссле |
|
дуемой |
функции на |
множестве |
|
точек, выбираемых случайным об |
|
разом в области задания функции, |
|
в сравнении найденных значений |
|
функции между собой и отыска |
|
нии точки, которой соответствует |
|
наименьшее (или наибольшее) |
|
значение функции. В основе мето |
Я ч |
да поиска лежит самое общее |
Рис. 9.1.1. График функции обще |
свойство функций — в' точке абсо |
лютного |
экстремума |
принимать |
го вида |
|
наименьшее (или наибольшее)
значение из всех возможных. Этим свойством обладают как уни модальные, так и многоэкстремальные функции самого общего вида, не обязательно дифференцируемые или непрерывный. Отсюда следует, что область использования метода Монте-Карло почти не ограничена.'