
- •2.1 Примеры и постановки задач оценивания постоянных параметров при обработке навигационной информации.
- •2.1.1 Оценивание коэффициентов полинома.
- •2.1.3 Постановка линейной задачи оценивания.
- •2.1.4 Определение временного запаздывания реализаций.
- •2.1.6 Определение координат и скорости по спутниковым данным.
- •2.1.7 Постановка нелинейной задачи оценивания и ее линеаризация.
- •2.1.8 Задача комплексной обработки избыточных измерений.
- •2.2 Алгоритмы оценивания на основе минимизации наблюдаемых критериев. Метод наименьших квадратов.
- •2.2.1 Основные положения и постановка задачи метода наименьших квадратов.
- •2.2.3 Точность оценивания метода наименьших квадратов.
- •2.3 Оптимальные в среднеквадратическом смысле линейные алгоритмы оценивания.
- •2.3.1 Постановка задачи получения оптимальных линейных оценок.
- •2.3.5 Задачи к разделу 2.3.
- •2.3.6 Вопросы к разделу 2.3.
- •2.4 Небайесовский метод оценивания.
- •2.4.1 Основные положения и постановка задачи.
- •2.4.6 Задачи к разделу 2.4.
- •2.4.7 Вопросы к разделу 2.4.
- •2.5. Байесовский метод оценивания.
- •2.5.1.Основные положения и постановка задачи.
- •2.5.2 Свойства оптимальных оценок.
- •2.5.3 Решение нелинейной гауссовской задачи.
- •2.5.8 Вопросы к разделу 2.5.
- •2.6.3 Централизованная и децентрализованная схемы обработки.
- •2.6.7 Задачи к разделу 2.6.
- •2.6.8 Вопросы к разделу 2.6.
подхода. В связи с этим матрицу (I Б )−1 так же как в небайесовском подходе называют матрицей нижней границы точности. В частности, диагональные элементы матрицы устанавливают нижнюю границу для дисперсий ошибок оптимальных оценок.
2.5.3 Решение нелинейной гауссовской задачи.
Из представленного материала следует, что для решения задачи оценивания в рамках байесовского подхода необходимо располагать апостериорной плотностью. Ее нахождение представляет собой весьма важный этап решения задачи.
Получим выражение для апостериорной плотности в нелинейной гауссовской задаче
оценивания (2.1.20), (2.1.21), т.е. считая, что совместная плотность fx,v (x, v) гауссовская. Для простоты будем полгать, что ошибки измерения и оцениваемый вектор независимы
т.е. fx,v (x, v) = N (ν;0, R)N (x; x, P x ) .
Согласно результатам раздела 1.4, можем записать следующие выражения для совместной
ф.п.р.в. fx,y (x, y) и плотности |
fy ( y) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
fx,y (x, y) = f ( y / x) f (x) = f v ( y − s(x)) fx (x) = |
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
т |
|
−1 |
|
|
|
|
|
|
т |
|
|
x |
−1 |
|
|
|
|
|
|
|
= c exp − |
|
( y − s(x)) |
|
R |
|
( y − s(x)) + (x − x) |
|
(P |
|
) |
(x − x) |
, |
(2.5.12) |
|||||||||||||||||
|
|
|
|
|
|
|
||||||||||||||||||||||||||
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
−1 |
|
|
|||
|
|
fy ( y) = c∫ exp − |
|
|
|
( y − s(x))т R−1 |
( y − s(x)) + (x |
− x)т (P x ) |
(x − x) dx , |
|||||||||||||||||||||||
|
|
2 |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
где c - постоянный нормирующий множитель. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
Далее, используя выражение (1.6.2), получаем |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
1 |
|
|
|
т |
|
|
−1 |
|
|
|
|
|
|
т |
|
x |
|
−1 |
|
|
|
|
|
|
|||||
|
|
exp − |
|
|
|
( y |
− s(x)) |
|
R |
|
|
( y − s(x)) + (x |
− x) |
|
(P |
|
) |
|
(x |
− x) |
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
f (x / y) = |
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
(2.5.13) |
||
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
т |
|
|
−1 |
|
|
|
|
|
|
т |
|
x |
|
−1 |
|
|
|
|
|
|
||||||
|
∫ |
exp − |
|
|
|
( y |
− s(x)) |
|
R |
|
|
( y − s(x)) + (x |
− x) |
|
(P |
|
) |
|
(x |
− x) dx |
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
После получения выражений для апостериорной плотности дальнейшее решение задачи нахождения оценки, т.е. решение задачи синтеза алгоритма, сводится к вычислению интеграла (2.5.2), а решение задачи анализа точности – к вычислению интегралов (2.5.5), (2.5.6). При вычислении интегралов (2.5.2), (2.5.5) в общем нелинейном случае стараются использовать способы, как правило, приближенного представления апостериорной плотности, которые порождают экономичные в вычислительном отношении методы вычисления оценок (2.5.2) и условных матриц ковариаций (2.5.5).
72

Отдельную проблему составляет задача нахождения безусловной матрицы ковариаций. Для ее вычисления применяется так называемый метод статистических испытаний, или метод МонтеКарло [2.11]. Суть этого метода, как отмечалось в разделе 1.5, заключается в том, что матрица ковариаций заменяется ее выборочным значением, т.е.
|
1 |
L |
|
P = M x, y {[x − xˆ( y)][x − xˆ( y)]т} ≈ |
∑[x j − xˆ( y j )][x j − xˆ( y j )]т , (2.5.14) |
||
L |
|||
|
j=1 |
||
|
|
где x j , y j , j =1.L - реализации оцениваемого вектора и самих измерений. Эти реализации формируются путем моделирования - с использованием датчиков случайных чисел на основе известной ф.п.р.в. f x, v (x,v) и соотношений (2.2.21). Оценки xˆ( y j ), j =1.L - вычисляются для
каждого набора измерений y j , j =1.L с использованием предлагаемого алгоритма. Более подробно эта процедура поясняется на конкретном примере в подразделе 2.5.5.
Учитывая достаточную громоздкость реализации описанной процедуры нахождения бузусловной матрицы ковариаций, весьма важным при решении задачи анализа точности в нелинейной задаче оказывается умение вычислять матрицу, характеризующую нижнюю границу точности. В этой связи уместно заметить, что при гауссовском характере ф.п.р.в. fx,v (x, v) эта матрица может быть получена достаточно просто в предположении, что функция s(x)
обеспечивает выполнение условий регулярности. Действительно, принимая во внимание (2.5.12), можем записать
|
|
1 |
|
|
|
|
|
|
−1 |
|
|
|
ln fx,y (x, y) = C − |
|
( y − s(x))т R |
−1( y − s(x)) + (x − x)т (P x ) |
(x − x) , (2.5.15) |
||||||||
2 |
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
||
где C - постоянная величина, независящая от x и y . Отсюда следует, что |
|
|
|
|||||||||
|
∂ln |
fx,y (x, y) |
|
(P x )−1(x − x) − |
ds |
т |
(x) |
R−1( y − s(x)) |
|
|||
|
= − |
|
. |
|||||||||
|
|
|
∂x |
|
dx |
|||||||
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
Подставив последнее выражение в соотношение (2.5.10) и взяв математическое ожидание
сначала по плотности f ( y / x) , а затем по плотности |
fx (x) , получим |
|
|||||
ds т (x) |
|
|
ds(x) |
|
|
||
I Б = (P x )−1 + ∫ |
|
R |
−1 |
|
|
f (x)dx . |
(2.5.16) |
dx |
|
dx |
т |
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Обращаем внимание на тот факт, что выражение для I Б |
может быть представлено в виде |
||||||
I Б = (P x )−1 + ∫I (x) f (x)dx , |
|
||||||
где I (x) - матрица, с помощью которой вычисляется матрица, |
характеризующая нижнюю |
||||||
границу точности для небайесовской постановки этой же задачи. |
|
||||||
Проиллюстрируем сказанное на следующем примере. |
|
|
|
73

Будем полагать, что решению подлежит рассмотренная в разделе 2.4.4 задача оценивания
скалярной величины x по измерениям (2.4.16), |
дополнительно считая, что x |
|
- независимая от |
|||||||||||||||||||
ошибок измерения случайная величина с |
f (x) = N (x;0, σ02 ) . |
|
|
|
|
|
|
|
|
|
|
|||||||||||
В этом случае выражение для совместной ф.п.р.в. принимает следующий вид |
|
|
|
|
||||||||||||||||||
|
|
|
1 |
|
|
m |
1 |
|
|
|
|
(x − x)2 |
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
exp − |
|
|
|
|
∑ |
|
|
|
|
( yi − si (x))2 |
+ |
|
|
|
|
|
|
|
||
|
|
2 |
|
r 2 |
|
σ2 |
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
fx,y (x, y) = |
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
0 |
|
|
. |
(2.5.17) |
||||
|
|
1 |
m |
1 |
|
|
2 |
|
|
(x − x) |
2 |
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
∫ |
exp − |
|
|
|
∑ |
|
|
|
|
( yi − si (x)) |
|
+ |
|
|
|
|
|
dx |
|
|
|
2 |
|
r |
2 |
|
|
|
σ |
2 |
|
|
|
|
||||||||||
|
|
|
i=1 |
|
|
|
|
|
|
|
0 |
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Для получения алгоритма вычисления оценки (2.5.2) и апостериорной дисперсии (2.5.5), используя, например, обычный метод сеток и заменяя область с бесконечными пределами на область ± 3σ0 , можем получить следующие приближенные соотношения
|
|
|
|
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xˆ( y) ≈ ∑x j µ j , |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
j=−k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k |
|
|
|
|
|
µ j − |
|
|
|
||
P( y) |
= |
∫(x |
− ˆ |
2 |
f (x |
/ |
y) |
= |
∫x |
2 |
f |
(x / y) |
− ˆ |
2 |
( y) |
≈ |
∑(x |
j |
2 |
ˆ |
2 |
( y) , |
||||||||||||||
|
|
x( y)) |
|
|
|
|
x |
|
|
|
) |
|
|
|
x |
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
j=−k |
|
|
|
|
|
|
|
|
|
|||
в которых |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
m |
|
1 |
|
|
|
|
|
|
|
(x |
j |
− x) |
2 |
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
exp − |
|
|
|
|
|
|
|
|
|
( yi − si (x j ))2 + |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
2 |
∑ r 2 |
|
|
|
σ2 |
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
µ j = |
|
|
|
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
, |
|
|
|
||||||||
|
|
k |
|
|
|
|
1 |
m |
1 |
|
|
|
|
|
(x |
j |
− x) |
2 |
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
exp − |
|
|
|
|
|
|
|
|
|
( yi − si (x j ))2 |
+ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
∑ |
2 |
∑ r 2 |
|
|
|
σ2 |
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
j=−k |
|
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
а x j = jδ , k = 3σ0 / δ , δ - шаг интегрирования.
Нетрудно убедиться в том, что полученные алгоритмы соответствуют приближенному представлению апостериорной плотности в виде
|
|
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
f (x / y) ≈ ∑µ jδ(x − x j ) . |
|
|
|
|
|
|
|
|||||||||
|
|
j =−k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Для вычисления безусловной дисперсии следует воспользоваться соотношением (2.5.14). |
||||||||||||||||
Нижняя граница точности в данном примере будет вычисляться как |
|
|
||||||||||||||
|
Б |
−1 |
|
|
1 |
|
1 |
|
m |
dsi (x) |
2 |
−1 |
|
|||
|
|
|
|
|
|
|
|
|
||||||||
(I |
|
) |
= |
|
|
+ |
|
|
∫ |
∑ |
|
f (x)dx |
. |
(2.5.18) |
||
|
2 |
r |
2 |
dx |
||||||||||||
|
|
|
|
|
σ0 |
|
|
i=1 |
|
|
|
|
|
|||
Если ввести величину среднеквадратического значения производной |
|
|
||||||||||||||
H = |
1 |
∫ |
m dsi (x) 2 |
|
|
|
|
|
(2.5.19) |
|||||||
|
|
|
|
|
|
f (x)dx , |
|
|
||||||||
|
|
|
m |
∑i=1 |
|
dx |
|
|
|
|
|
|
|
то можно получить выражение, аналогичное (2.4.17), т.е.
74

P ≥ (I Б )−1 |
|
|
|
|
|
2 |
−1 |
|
1 |
|
mH |
|
|||||
= |
+ |
|
. |
(2.5.20) |
||||
σ2 |
r 2 |
|
||||||
|
|
|
|
|
|
|||
|
|
0 |
|
|
|
|
|
|
Правая часть этого выражения отличается от (2.4.17), во-первых, наличием первого слагаемого,
а во-вторых, тем, что при вычислении среднеквадратического значения производной H используются не квадраты значений производных при конкретных значений оцениваемого
параметра dsi (x) 2 , а их математические ожидания, соответствующие априорной ф.п.р.в. f (x) .
dx
Если пренебречь вкладом первого слагаемого в (2.5.20), то можно утверждать, что дисперсия ошибки оценивания не может быть меньше величины, определяемой отношением дисперсии
осредненной ошибки измерения |
r 2 |
к квадрату среднеквадратического значения производной |
|||||
m |
|||||||
|
|
|
|
|
|||
|
|
2 . Использование величины |
|
2 |
вместо конкретных значений производной при истинных |
||
H |
H |
значениях x , как это имеет место для небайесовского варианта, представляется более разумным с практической точки зрения.
Из рассмотренного примера следует, что в общем случае задача отыскания оптимальной оценки (2.5.2) и соответствующих ей характеристик точности в виде матриц ковариаций (2.5.5), (2.5.6) не является тривиальной. В этой задаче можно выделить следующие основные этапы.
1. |
Используя ф.п.р.в. fx,v (x, v) и представление |
|
||||
|
|
fx,y (x, y) = f ( y / x) fx (x) , |
(2.5.21) |
|||
получить выражение для |
fx,y (x, y) . |
|
|
|
||
2.Найти интеграл |
|
|
|
|
|
|
|
|
fy ( y) = ∫ f ( y / x)( y / x) fx (x)dx = c( y) , |
(2.5.22) |
|||
определяющий плотность |
fy ( y) |
и представляющий собой по сути нормирующую константу |
||||
c( y) |
для апостериорной плотности |
f (x / y) . |
|
|
|
|
3.Найти апостериорную плотность |
|
|
|
|||
|
|
f (x / y) = |
1 |
f ( y / x) fx (x) . |
(2.5.23) |
|
|
|
c( y) |
||||
|
|
|
|
|
|
|
4. |
Выбрать способ аппроксимации апостериорной плотности и найти оптимальную оценку |
|||||
(2.5.2) и соответствующую ей условную (апостериорную) матрицу ковариаций (2.5.6). |
|
|||||
6. |
Найти безусловную матрицу ковариаций (2.5.5). |
|
2.5.4 Решение линейной гауссовской задачи
Как и при использовании других методов, наиболее просто в рамках байесовского подхода решается задача оценивания в линейном гауссовском случае. Покажем это.
75
Итак, пусть требуется найти оптимальную в среднеквадратическом смысле байесовскую оценку вектора x по измерениям (2.1.11), в которых x и v предполагаются совместно гауссовскими векторами. Будем считать, что fx,v (x, v) с точностью до обозначения Pv = R
определяется соотношением (1.6.18). Фактически решение этой задачи получено в разделе 1.6, в котором показано, что апостериорная плотность f (x / y) является гауссовской и определяется соотношением (1.6.21)
|
f (x / y) |
= |
|
|
|
ˆ |
|
|
|
x / y |
), |
|
|
|
||
|
|
N (x; x( y), P |
|
|
|
|
|
|||||||||
а ее параметры, т.е. математическое ожидание |
|
xˆ( y) и матрица |
ковариаций |
P x / y , |
||||||||||||
выполняющая роль матрицы |
P , задаются соотношениями (1.6.22), |
(1.6.23). В частном случае, |
||||||||||||||
когда векторы x и v между собой независимы, |
т.е. матрица B = 0 , с учетом используемых в этом |
|||||||||||||||
разделе обозначений Pv = R , |
P x / y = P можно записать |
|
|
|
|
|
|
|||||||||
|
xˆ( y) = x + K ( y − Hx) , |
|
|
|
|
|
(2.5.24) |
|||||||||
|
K = P x H т (HP x H т + R)−1 , |
|
|
(2.5.25) |
||||||||||||
|
P = P x |
− P x H т (HP x H т + R)−1 HP x . |
|
|
(2.5.26) |
|||||||||||
Заметим, что в соответствии с (1.6.27), (1.6.28) |
матрицы P x |
и K |
могут быть |
также |
||||||||||||
представлены как |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
−1 |
+ |
H |
т |
R |
−1 |
|
|
−1 |
|
|
(2.5.27) |
||
|
P = (P |
|
) |
|
|
|
H |
|
, |
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
K = PH тR−1. |
|
|
|
|
|
|
|
|
|
|
(2.5.28) |
Нетрудно убедиться в том, что в линейной гауссовской задаче оптимальная в среднеквадратическом смысле оценка является эффективной. Действительно, при подстановке s(x) = Hx в выражении (2.5.16), получаем
P = P( y) = (I |
Б |
) |
−1 |
|
(P |
x |
−1 |
+ H |
т |
R |
−1 |
|
−1 |
(2.5.29) |
|
|
= |
|
) |
|
|
H |
. |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Важно подчеркнуть, что апостериорная плотность в рассматриваемой задаче является гауссовской, а алгоритм вычисления оптимальной в среднеквадратическом смысле оценки - линейным относительно измерений y . Существенно также, что условная матрица ковариаций
P( y) от измерений не зависит и, следовательно, она совпадет с безусловной матрицей ковариаций
P , что в общем случае не выполняется. Это объясняется тем, что гауссовской является совместная плотность распределения оцениваемого вектора x и ошибок измерения v , а связь измерений с x
и v - линейная. Невыполнение любого из этих условий приводит к нарушению гауссовского характера апостериорной плотности и, как правило, к существенному усложнению алгоритма вычисления оптимальной оценки.
Из сказанного следует, что при решении линейной гауссовской задачи оптимальная
76
байесовская оценка совпадает с оптимальной в среднеквадратическом смысле линейной оценкой, полученной в разделе 2.3. В свою очередь в соответствии с результатами подраздела 2.3.4 отсюда вытекает справедливость следующего утверждения: задача нахождения оценки,
минимизирующей среднеквадратический критерий (2.3.1) в гауссовском случае, эквивалента задаче нахождения линейной оценки, обеспечивающей выполнение условия ортогональности (2.5.7).
В подразделе 2.3.3 уже обсуждалась связь оценки, полученной на основе ММНК, с линейной оптимальной в среднеквадратическом смысле оценкой. Там отмечалось, что, если в критерии
ММНК принять D = (P x )−1 , а Q = R−1 , то в предположении, что B = 0 , алгоритм вычисления
ММНК совпадет с оптимальным линейным алгоритмом. Обсудим причины такого совпадения. Апостериорная плотность в силу ее гауссовского характера является симметричной функцией и соответствующее ей математическое ожидание xˆ( y) , т.е. оптимальная оценка (2.5.2), совпадает со
значением x , при котором |
эта плотность достигает максимального значения. Принимая во |
|
внимание представление для |
f (x / y) в виде (2.5.12), замечаем, что максимизация апостериорной |
|
плотности равносильна минимизации критерия вида |
|
|
|
J (x) = ( y − Hx)т R −1 ( y − Hx) + (x − x)т (P x )−1 (x − x) , |
(2.5.30) |
совпадающего с критерием (2.2.14), используемым в ММНК при соответствующем выборе матриц Q и D . Этот факт и объясняет совпадение оценки ММНК с оптимальной байесовской оценкой, которая в линейной гауссовской задаче при независимых x и v совпадает с линейной оптимальной оценкой. Соответственно совпадают и матрицы ковариаций их ошибок.
Учитывая связь байесовских оценок и оценок, основанных на использовании ММНК, а также связь оценок МФП с оценками, соответствующими ОМНК при соответствующем выборе весовых матриц в наблюдаемых критериях, для линейной гауссовской задачи при независимых ошибках измерения и оцениваемого вектора можно, опираясь на соотношение (2.2.18), записать следующее аналогичное (2.2.37) выражение
ˆ |
= |
P((P |
x |
) |
−1 |
x |
+ |
(P |
мфп |
) |
−1 ˆ |
мфп |
( y)), |
(2.5.31) |
x( y) |
|
|
|
|
|
x |
|
устанавливающее взаимосвязь оптимальных байесовских оценок и оценок МФП. Из этого выражения вытекает, что оптимальная байесовского оценка в рассматриваемой линейной гауссовской задаче может быть сформирована в результате взвешивания априорного математического ожидания x и оценки xˆ мфп ( y) , полученной без учета априорной информации о
векторе x . Причем весовые матрицы, стоящие перед x и xˆ мфп ( y) , совпадают с матрицами,
обратными матрицам, характеризующим, по сути, точность взвешиваемых величин. Ясно, что
такая процедура возможна в случае, когда матрицы Pмфп |
и P x не вырождены. Очевидно, что при |
невырожденности матрицы P допустима и обратная |
операция, предполагающая вычисление |
xˆ мфп ( y) по известному значению байесовской оценки |
|
77

ˆ мфп |
( y) |
= |
P |
мфп |
(P |
−1 |
ˆ |
− |
(P |
x |
) |
−1 |
x). |
(2.5.32) |
x |
|
|
|
x( y) |
|
|
|
Из соотношения (2.5.27) следует, что при (P x )−1 << H тR−1H , оптимальная байесовская оценка
(2.5.2), соответствующая ей матрица ковариаций (2.5.15) и критерий (2.5.30) будут совпадать с оценкой (2.4.19), матрицей ковариаций (2.4.20) и критерием (2.4.18) метода максимума функции правдоподобия.
Необходимо иметь в виду, что при нелинейном характере функции s(x) , когда минимизируемый в ММНК критерий вида записывается как
J (x) = ( y − s(x))т R −1 ( y − s(x)) + (x − x)т (P x )−1 (x − x) ,
соответствующая этому методу оценка не будет совпадать с оптимальной среднеквадратической оценкой. Это объясняется тем, что апостериорная плотность при нелинейном характере функции, как правило, не является симметричной, а следовательно, ее максимум не совпадает с условным математическим ожиданием.
2.5.5 Повышение точности оценивания при использовании нелинейных алгоритмов.
Поскольку при отыскании оптимальной в среднеквадратическом смысле линейной оценки минимизация критерия (2.3.1) осуществляется в ограниченном классе функций, ясно, что такая оценка в общем случае будет всегда по точности уступать оптимальной байесовской оценке. Исключение составляет гауссовская линейная задача, поскольку, как следует из утверждения, представленного в предыдущем подразделе, для гауссовской линейной задачи эти оценки совпадают. Таким образом, на вопрос о возможности повышения точности оценивания в
смысле критерия (2.5.1), за счет усложнения алгоритма, в частности, придания ему нелинейного относительно измерений характера для линейной гауссовской задачи, следует дать отрицательный ответ.
Когда решается нелинейная задача или линейная задача, в которой оцениваемый вектор и ошибки измерения негауссовские, приведенное утверждение несправедливо. Иными словами, в
общем случае точность оценивания, достигаемая при использовании нелинейного алгоритма, может быть повышена по сравнению с точностью линейного оптимального алгоритма.
Проиллюстрируем это весьма важное для практических приложений утверждение на простом примере рассмотренной в разделе 2.3 задачи оценивания (задача 2.3.5) скалярной случайной величины x , равномерно распределенной в интервале [0, b], по измерениям
yi = x + vi , i =1.m ,
в которых vi , i =1.m - независимые между собой и от x случайные величины, равномерно распределенные в интервале [0, a].
78

Из результатов решения задачи 2.3.5 следует, что для оптимальной линейной оценки и соответствующей ей дисперсии справедливы следующие соотношения
|
|
|
|
|
|
|
|
2 |
|
|
m |
|
|
|
|
|
|
|
xˆ opt ( y) = x + |
|
|
|
σ0 |
|
|
∑( yi − x −v) , |
|
||||||||
|
r |
2 |
+σ |
2 |
|
||||||||||||
|
|
|
|
|
|
0 m i=1 |
|
|
|
|
|
||||||
|
Popt = |
σ2r |
2 |
|
|
|
|
|
|
|
|
|
|
|
|||
|
0 |
|
|
|
. |
|
|
|
|
|
|
|
|
|
|||
|
|
r 2 +σ2m |
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
Подставив |
в них значения математических ожиданий |
x = b / 2 , v = a / 2 |
и дисперсий |
||||||||||||||
σ02 = b2 /12 , |
r 2 = a2 /12 , получим |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xˆ opt ( y) = |
b |
+ |
|
|
|
b 2 |
|
m |
( yi − |
b + a |
) , |
(2.5.33) |
||||
|
|
|
(a 2 +b2 m) ∑i=1 |
|
|||||||||||||
|
|
2 |
|
|
|
2 |
|
|
|||||||||
|
Popt = |
|
a2b2 |
|
|
. |
|
|
|
|
|
|
(2.5.34) |
||||
|
12(a2 |
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
+b2m) |
|
|
|
|
|
|
|
Важно напомнить, что эти соотношения определяют оптимальную линейную оценку и соответствующую ей дисперсию вне зависимости от того, каков вид распределения для оцениваемой величины x и ошибок измерения vi , i =1.m . Существенно лишь, чтобы они имели заданные значения математических ожиданий и дисперсий, т.е. v = a / 2 , x = b / 2 и σ02 = b2 /12 ,
r 2 = a2 /12 . При гауссовском же их характере эти соотношения определят значения оптимальных байесовских оценок (см. задачу 2.5.2).
Получим теперь оптимальную байесовскую оценку и сопоставим соответствующую ей дисперсию с дисперсией (2.5.34) для оптимального линейного алгоритма.
Следуя изложенной в предыдущем подразделе общей схеме, запишем сначала выражения для
fx,y (x, y) = f ( y / x) fx (x) и fy ( y) . С учетом |
специфики рассматриваемой |
задачи выражения |
|||||
(2.5.21), (2.5.22) можно представить в виде |
|
|
|
|
|
||
|
|
|
1 |
f ( y / x), x [0, b], |
|
||
fx,y (x, y) = |
|
|
(2.5.35) |
||||
|
|||||||
b |
|||||||
|
|
|
|
0, x [0, b], |
|
||
|
|
|
|
|
|||
fy ( y) = |
1 |
b |
f ( y / x)dx . |
(2.5.36) |
|||
b |
∫ |
||||||
|
|
|
|
|
|||
|
|
0 |
|
|
|
|
Для получения значений (2.5.36) при фиксированных значениях измерений требуется располагать f ( y / x) . По аналогии с тем, как это было сделано при решении задачи 2.4.4, можем записать
m
f ( y / x) = ∏ fv ( yi − x) , i=1
где
79

1 |
, |
x [ yi − a, |
yi ], |
||
|
|
|
|||
|
|||||
f ( yi / x) = fv ( yi − x) = a |
x [ y − a, y ], |
||||
0, |
|||||
|
|
|
|
||
и таким образом |
|
|
|
||
c*, x Ω, |
|
||||
f ( y / x) = |
|
|
|
||
0, x Ω. |
|
|
|||
В этом соотношении c* - некоторая константа, |
а область |
Ω |
формируемый в результате пересечения всех интервалов [ yi − a, yi ],
i =1.m ,
(2.5.37)
представляет собой отрезок,
i =1.m , т.е.
m |
|
|
Ω ≡ I[ yi |
− a, yi ] =[d1, d2 ] =[ ymax − a, ymin ] . |
(2.5.38) |
l=1 |
|
|
Границы этого интервала d1 = ymax − a |
и d2 = ymin определяются максимальным |
ymax и |
минимальным ymin измеренными значениями.
В рассматриваемой задаче нет необходимости привлекать приближенные методы вычисления интегралов (2.5.2), (2.5.6), поскольку они могут быть вычислены точно. Действительно, учитывая
(2.5.35)-(2.5.38) и тот факт, что
b
∫xf ( y / x)dx
|
xˆ( y) = |
0 |
|
|
|
, |
|
|
|
|
|
|
|
|
|
|
|||
b |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
∫ f ( y / x)dx |
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
для оптимальной байесовской оценки можем записать следующее соотношение |
|
||||||||||||||||||
|
|
|
1 |
|
c |
|
1 |
|
|
|
c2 |
|
|
(c |
+ c |
) |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
2 |
|
|
|
x2 |
|
|
|
|
|
||||||
xˆ( y) = |
|
|
|
∫xdx = |
|
|
|
|
|
|
|
= |
|
2 1 |
|
, |
(2.5.39) |
||
c |
2 |
− c |
|
c |
2 |
− c |
2 |
|
|
2 |
|
||||||||
|
|
1 |
|
c |
1 |
|
|
c |
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
1 |
|
|
|
|
|
1 |
|
|
|
|
|
|
в котором [c1, c2 ] - отрезок, представляющий собой пересечение априорной области [0, b] и
области Ω, так что |
|
c1 = max{0, d1} |
c2 = min{b, d2 }. |
Важно подчеркнуть при этом, что оценка (2.5.39) нелинейным образом зависит от измерений. Выражение (2.5.39) есть следствие того факта, что апостериорная плотность в рассматриваемой
задаче соответствует равномерному распределению на отрезке [c2 , c1 ] . |
|
|||||
С учетом сказанного нетрудно показать, что |
|
|
|
|
|
|
b |
(c |
2 |
− c |
)2 |
|
|
P( y) = ∫(x − xˆ( y))2 f (x / y)dx = |
|
1 |
|
. |
(2.5.40) |
|
|
|
12 |
|
|||
0 |
|
|
|
|
|
|
В частности, если d1 = ymax − a и d2 = ymin не выходят за пределы априорной области [0, b] , то для оптимальной оценки и условной дисперсии будут справедливы следующие соотношения
80

xˆ( y) = |
ymin + ymax |
− |
a |
, |
|
|
|
|
(2.5.41) |
|
|
|
|
|
|
|
|||||
2 |
2 |
|
|
|
|
|
|
|
||
|
b |
|
|
|
( y |
|
+ a − y |
|
)2 |
|
P( y) = ∫(x − xˆ( y))2 |
f (x / y)dx = |
min |
max |
. |
||||||
|
|
12 |
|
|
||||||
0 |
|
|
|
|
|
|
|
|
|
Из выражения (2.5.41) фактически следует, что оптимальная оценка представляет собой среднее арифметическое максимального и минимального значений измерений, подсчитанное с учетом известного математического ожидания для ошибок измерений.
Для сопоставления точности оптимальной нелинейной оценки с точностью линейной оптимальной оценки, характеризуемой дисперсией (2.5.34), следует вычислить безусловную дисперсию. Как следует из предыдущего подраздела, для вычисления этой дисперсии может быть использован метод Монте-Карло. Предварительно заметим, что в рассматриваемом примере не удается воспользоваться неравенством Рао-Крамера для вычисления нижней границы точности,
поскольку функция fx,y (x, y) не удовлетворяет условиям |
регулярности |
в силу ее |
|||
недифференцируемости. |
|
|
|
||
Выражение (2.5.14) в данном случае может быть представлено в виде |
|
||||
P = M x,y {(x − xˆ( y))2} ≈ |
1 |
L (x j |
− xˆ( y j )2 , |
(2.5.42) |
|
L |
|||||
|
∑ |
|
|
||
|
|
j=1 |
|
|
где x j , y j , j =1.L - реализации оцениваемой случайной величины и самих измерений.
Кроме того, эта же дисперсия в соответствии с (2.5.6) и методом Монте-Карло может быть
вычислена как |
|
|
|
|
1 |
L |
|
P ≈ |
|
∑P( y j ) . |
(2.5.43) |
|
|||
|
L j=1 |
|
Для получения необходимых в (2.5.41), (2.5.42) реализаций оцениваемого параметра и вектора измерений используют датчик равномерно распределенных с.в. При этом сначала следует сформировать x j [0,b], а затем - m независимых между собой случайных величин vij [0, a].
Компоненты вектора |
измерений y j получают |
как y j = x j + v j , |
i = |
|
. Оценки xˆ( y j ) |
и |
|||
1.m |
|||||||||
|
|
i |
i |
|
|
|
|
|
|
условная дисперсия |
P( y j ) вычисляются для |
каждого |
набора |
измерений y j , j = |
|
|
с |
||
1.L |
использованием (2.5.39), (2.5.40).
Ниже в таблице и на Рис.2.5.1 приведены результаты расчета среднеквадратических значений ошибок оценивания, рассчитанных в соответствии с описанными процедурами в условиях, когда L =1000 , b =1, a = 0,1 , при разном количестве измерений m =1,2.....100 .
Среднеквадратические значения ошибок оптимальных линейных и нелинейных оценок для второго варианта
Число измерений |
10 |
20 |
100 |
|
|
|
|
Линейная оптимальная оценка |
0.009 |
0.006 |
0.003 |
|
|
|
|
81

Нелинейная оптимальная оценка |
0.0055 |
0.0035 |
0.0007 |
|
|
|
|
0.03
0.025
0.02
0.015
0.01
0.005
00 |
10 |
20 |
30 |
40 |
50 |
60 |
70 |
80 |
90 |
100 |
Рис. 2.5.1 Изменение СКО для оптимального линейного (сверху) и нелинейного (снизу) алгоритмов при разном числе измерений.
2
0
1
8
1
6
1
4
1
2
1
0
8 |
|
|
|
|
|
|
|
|
|
|
6 |
|
|
|
|
|
|
|
|
|
|
4 |
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
00 |
0. |
0. |
0. |
0. |
0. |
0. |
0. |
0. |
0. |
1 |
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
|
Рис. 2.5.2 Апостериорные ф.п.р.в. для оптимального нелинейного алгоритма при m =1,2,3.
Из представленных результатов следует, что точность нелинейного оптимального алгоритма заметно выше точности алгоритма, оптимального в классе линейных алгоритмов, что вполне согласуется с приведенным в начале подраздела утверждением. Формально такое отличие объясняется тем, что вид апостериорной функции плотности распределения вероятностей (Рис.2.5.2) заметно отличается от гауссовского характера плотности. На качественном уровне можно дать следующее объяснение такого отличия. Замечаем, что при выполнении условия
82

a <<b2m |
алгоритм вычисления |
оптимальной линейной |
оценки |
фактически |
сведется |
к |
||
нахождению среднего арифметического по всем значениям |
yi − a / 2 , |
i = |
|
, принадлежащим |
||||
1.m |
||||||||
отрезку |
[ ymin − a / 2, ymax − a / 2] . |
В то же время в оптимальном |
нелинейном |
алгоритме |
||||
апостериорная область значений [c1, c2 ] определяется пересечением априорной области [0, b] |
и |
|||||||
отрезка [ ymax − a, ymin ]. |
|
|
|
|
|
|
|
ymin + a − ymax
a / 2
ymin
ymin − a / 2 |
|
|
ymax − a / 2 |
||
|
|
|
|
|
|
ymax − a |
ymax − ymin |
Рис.2.5.3 К сопоставлению линейного и нелинейного оптимального алгоритмов.
Очевидно, что при увеличении числа измерений повышается вероятность появления измерения
с минимальным (близким к нулю) и максимальным (близким к |
a ) значениями ошибки, т.е. |
ymin → x , а ymax → x + a . Отсюда следует, что длина отрезка |
ymax − ymin , определяющего |
область всех возможных измерений, которые используются при вычислении среднего арифметического, стремится к величие a , задающей размер априорной области. В то же время длина отрезка ymin + a − ymax , определяющего размер апостериорной области для оптимальной нелинейной оценки, будет стремиться к нулю. Сказанное поясняется на рисунке 2.5.3.
Полученные результаты и подтверждает тот факт, что в ряде случаев применение нелинейных алгоритмов позволяет существенно повысить точность решения задач оценивания.
2.5.6 Сопоставление байесовского и небайесовского подходов
Завершая раздел, посвященный основам байесовского подхода при решении задач оценивания, представляется целесообразным в заключение еще раз акцентировать внимание на некоторых его особенностях по сравнению с небайесовским подходом. Основное отличие здесь заключается в том, что в рамках байесовского подхода предполагается случайным вектор x , и считается заданной совместная функция плотности распределения f (x, v) , располагая которой с учетом соотношения (2.1.21) и правил преобразования случайных векторов, может быть получена функция f (x, y) . Именно эта функция фигурирует при вычислении математического ожидания в
83
минимизируемом критерии, причем естественно, что фиксации вектора x не требуется. В отличие от этого при небайесовском подходе только после фиксации искомого вектора можно ввести ф.п.р.в. f ( y / x) , которая фигурирует при вычислении критерия. Следует также заметить, что поскольку вектор x не фиксируется, то при байесовском подходе понятие состоятельности не вводится. Весьма важно подчеркнуть, что при байесовском подходе удается получить общее правило вычисления несмещенной оценки с минимальной дисперсией в виде (2.5.2). Для небайесовского подхода такого правила не существует. Все отмеченные особенности обоих подходов представлены в таблице 2.5.1.
|
|
|
|
|
|
Таблица 2.5.1 |
|||
Отличительные особенности байесовского и небайесовского подходов. |
|||||||||
|
|
|
|
||||||
Особенности |
Байесовский подход |
Небайесовский подход |
|||||||
|
|
|
|
||||||
Характер оцениваемого вектора |
Случайный с плотностью |
Детерминированный |
|
||||||
|
f (x) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Задание функции правдоподобия |
+ |
|
|
|
|
+ |
|
|
|
|
|
|
|
|
|
|
|
|
|
Задание совместной плотности |
+ |
|
|
|
|
- |
|
|
|
f (x, v) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Определение несмещенности |
ˆ |
= |
M x (x) |
M |
|
ˆ |
= |
x |
|
оценки |
M y (x(y)) |
|
|
y / x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Определение состоятельности |
- |
|
|
limPr (x − e < xˆk |
< x + e) =1 |
|
|||
оценки |
|
|
|
k →∞ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Общее правило нахождения |
xˆ( y) = M x / y (x) |
|
|
- |
|
|
|
||
несмещенной оценки с |
|
|
|
|
|
|
|
|
|
минимальной дисперсией |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Следует обратить внимание на тот факт, что понятие несмещенности в разных подходах вводится по-разному. Для небайесовского подхода оценка является несмещенной, если
математическое ожидание |
для оценки, соответствующее плотности f ( y / x) , совпадает с |
||
фиксированным значением |
ˆ |
= |
x . В байесовском подходе ошибка считается |
x , т.е. M y / x (x( y)) |
|
несмещенной, если математическое ожидание от оценки совпадет с априорным математическим ожиданием x , т.е. M y (xˆ( y)) = M x (x) . Из сказанного следует, что одна и та же оценка, являясь
несмещенной в одном смысле, может оказаться смещенной в другом смысле.
Проиллюстрируем сказанное на примере анализа смещения оценок в линейной гауссовской задаче. Ранее уже подчеркивалось, что оптимальная в среднеквадратическом смысле байесовская оценка, представляющая собой условное математическое ожидание (2.5.2), является несмещенной в байесовском смысле. Для линейной задачи это очевидно, поскольку
84
M y xˆ( y) = M y (x + KH ( y − Hx))= x .
Определяя смещение оценки xˆ( y) = x + KH ( y − Hx) с позиций небайесовского подхода, т.е.,
вычисляя его как
M y / x xˆ( y) = (E − KH )x + KHx ,
замечаем, что эта величина отлична от нуля. Принимая во внимание (2.5.27), (2.5.28), обращаем внимание, что величина такого смещения тем меньше, чем выше апостериорная точность
оценивания, т.е., чем меньше матрица P по сравнению с P x . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
Для простейшего примера оценивания скалярной величины по измерениям при |
r 2 |
= r 2 |
, i = |
|
|
|||||||||||||
1.m |
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
i |
|
|
|
|
|
и x = 0 полученное выражение принимает следующий вид |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
2 |
m |
|
|
|
2 |
|
|
|
|
xr 2 |
|
|
|
|
|
|
|
|
σ0 |
|
|
|
|
mσ0 |
|
|
|
|
|
|
|
|
|
|
M y / x (x − xˆ) = M y / x x − |
|
|
|
∑yi |
= x 1 |
− |
|
|
|
= |
|
|
|
. |
|
|
||
r |
2 |
2 |
2 |
2 |
|
2 |
2 |
|
|
|||||||||
|
|
+ σ0 m i=1 |
|
|
|
mσ0 + r |
|
mσ0 |
+ r |
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Как нетрудно заметить коэффициент, стоящий перед x , представляет собой отношение апостериорной дисперсии к ее априорному значению. Таким образом, чем меньше это отношение, тем меньше смещение.
2.5.7 Задачи к разделу 2.5
Задача 2.5.1.
Запишите выражение для оптимальной оценки и ее дисперсии для задачи, нахождения
скалярной с.в. x по измерениям (2.1.1) |
при независимых |
x |
и |
vi , |
i = |
1.m |
, для которых заданы |
|||||||||||||||||||||||||||||
f (x) = N (x; x, σ2 ) , |
f (v) = N (v;0, R) |
, |
где |
|
R |
- диагональная матрица с элементами |
r 2 , i = |
|
. |
|||||||||||||||||||||||||||
1.m |
||||||||||||||||||||||||||||||||||||
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i |
|
|
|
Упростите полученные выражения |
|
для |
|
случая, |
когда |
|
r 2 |
= r 2 , |
i = |
|
|
и |
сопоставьте |
их с |
||||||||||||||||||||||
|
|
1.m |
|
|||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
аналогичными выражениями, соответствующими ММНК. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
Решение. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Используя (2.5.24), (2.5.27), (2.5.28), запишем |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
m |
1 |
|
−1 m |
y − x |
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
ˆ |
= |
x |
+ |
|
K ( y |
− |
Hx) |
= |
x |
+ |
|
|
+ |
∑ r2 |
|
|
∑ |
|
, |
(1) |
||||||||||||||
|
|
x( y) |
|
|
|
|
|
|
|
σ2 |
|
|
|
r2 |
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
i=1 |
i |
|
|
i=1 |
i |
|
|
|
|
|
|||
|
|
|
|
1 |
|
|
|
m |
1 |
|
−1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
P = |
|
+ |
∑ |
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(2) |
|||||||||
|
σ2 |
r 2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
0 |
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Если при этом r 2 |
= r 2 , i = |
|
, то приведенные соотношения упрощаются и принимают вид |
|||||||||||||||||||||||||||||||||
1.m |
||||||||||||||||||||||||||||||||||||
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
m |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
xˆ( y) = x + |
|
|
|
σ0 |
|
|
∑( yi |
|
|
, |
|
|
|
|
|
|
|
|
|
|
(3) |
|||||||||||||
|
|
|
r |
2 |
+ σ |
2 |
|
− x) |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
0 m |
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
85
|
1 |
|
m |
−1 |
2 |
2 |
|
|
|
P = |
+ |
|
= |
σ0r |
|
. |
(4) |
||
σ2 |
|
|
|
||||||
|
|
r 2 |
|
r 2 +σ2m |
|
||||
|
0 |
|
|
|
|
|
0 |
|
|
Легко убедиться, что выражения для оценок (1), (3) совпадают с приведенными в таблице 2.1.2
|
|
1 |
|
1 |
|
|
выражениями, соответствующими ММНК при |
d = |
|
и |
qi = |
|
, а выражения для дисперсий (2), |
σ2 |
r 2 |
|||||
|
|
0 |
|
|
i |
|
(4) - с аналогичными выражениями для ММНК, полученными в задаче 2.2.4.
Задача 2.5.2. Найдите такие ф.п.р.в. для ошибок измерения и оцениваемого скаляра x в условиях задачи 2.3.6, при которых полученный там алгоритм будет оптимальным байесовским алгоритмом.
Решение.
Полученный в этой задаче алгоритм будет оптимальным, если оцениваемая величина и ошибки
измерения будут гауссовскими с математическим ожиданием b / 2 и дисперсией σ02 = r 2 = b2 /12 .
В чем нетрудно убедиться, если при нахождении параметров условной гауссовской плотности
учесть наличие ненулевых математических ожиданий для ошибок vi , i = |
1.m |
. |
|
|
|
|
|||||||||
Задача 2.5.3. Конкретизируйте выражения для |
fx,y (x, y) и |
fy ( y) |
|
в |
задаче оценивания |
||||||||||
центрированной гауссовской случайной величины с дисперсией σ02 |
по измерениям |
|
|
||||||||||||
|
|
|
|
|
yi = si (x) + εi , |
|
|
|
|
|
|
|
|
|
(1) |
в которых ошибки εi |
независимы от x и, как в задаче 2.4.2, представляются в виде |
|
|||||||||||||
|
|
|
|
|
εi = d + vi |
|
|
|
|
|
|
|
|
|
(2) |
- суммы центрированной гауссовской случайной величины с дисперсией |
σd2 |
и независимых |
|||||||||||||
между собой |
и от |
d |
|
центрированных гауссовских |
случайных величин |
с |
одинаковыми |
||||||||
дисперсиями r 2 |
= r 2 , i = |
|
. Упростите полученные выражения при условии |
σ2 |
>> r 2 . |
|
|||||||||
1.m |
|
||||||||||||||
i |
|
|
|
|
|
|
|
|
|
|
|
d |
|
|
|
Решение. Принимая во внимание независимость |
x и |
ε и тот факт, |
что |
fx (x) = N (x;0, σ02 ) , |
|||||||||||
fε (ε) = N (ε;0, Pε ) , для |
fx,y (x, y) , можем записать |
|
|
|
|
|
|
|
|
|
|
||||
|
f x,y (x, y) = f ( y / x) f x (x) = f x (x) fε ( y − s(x)) = N (x;0, σ02 )N ( y − s(x);0, P ε ) . |
(3) |
|||||||||||||
Учитывая соотношение (3) из задачи 2.4.2, нетрудно убедиться в том, что |
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
1 |
|
|
m |
|
|
|
|
|
σd2 |
|
|
|
|
|
m |
|||
|
|
|
|
x 2 |
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|||||||||||
fx,y ( y) = c exp − |
|
|
|
|
|
+ |
|
|
|
|
|
∑ ( yi − si (x)) |
|
− |
|
|
|
|
|
|
|
∑ ( yi |
||||||
2 |
|
σ |
2 |
|
r |
2 |
|
|
|
2 |
+ r |
2 |
||||||||||||||||
|
|
|
|
|
0 |
|
|
|
|
|
i=1 |
|
|
|
mσd |
|
|
i=1 |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
2 |
|
1 |
|
|
m |
|
|
|
|
σd2 |
|
|
|
|
|
m |
|
|||||
|
|
x |
|
|
|
|
2 |
|
|
|
|
|
|
|
||||||||||||||
fy ( y) = c∫ |
exp − |
|
|
|
|
|
+ |
|
|
|
|
∑ |
( yi − si (x)) |
|
− |
|
|
|
|
|
|
∑ ( yi − |
||||||
2 |
σ |
2 |
|
r |
2 |
|
2 |
+ r |
2 |
|||||||||||||||||||
|
|
|
0 |
|
|
|
|
i=1 |
|
|
|
mσd |
|
|
i=1 |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
−
si
2
si (x)) ,(4)
2
(x)) dx .(5)
Задача 2.5.4. Конкретизируйте выражение (2.5.12) применительно к предыдущей задаче,
86
полагая, что оцениванию подлежит вектор X =(x, d) .
Решение.
|
|
1 |
x |
2 |
|
d |
2 |
|
1 |
m |
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
f ( X , y) = |
f ( X ) f ( y / X ) = c exp − |
|
|
|
|
+ |
|
|
+ |
|
|
( yi − si (x) − d) |
|
|
. |
2 |
σ2 |
σ2 |
r 2 ∑ |
|
|||||||||||
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
0 |
|
|
d |
|
|
i=1 |
|
|
|
|
Задача 2.5.5. Покажите, что в задаче оценивания центрированного |
n - мерного вектора |
|
x |
с |
|||||||||||
заданной матрицей ковариаций P x |
по m - мерным измерениям |
|
|
|
|
|
|
|
|
|
|
||||
y = Hx + v , |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
в которых v - не зависящий от |
x центрированный вектор с матрицей ковариаций R , матица |
||||||||||||||
ковариаций для вектора невязки |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
µ ( y) = y − Hxˆ( y)
определяется в виде
Pµ = M {µ ( y)µт ( y)}= R − HP x H т ,
где xˆ( y) = Ky , а K = PH T R−1 .
Решение.
Действительно, представляя невязку как
µ ( y) = y − yˆ = Hx + v − Hxˆ( y) = H (x − xˆ( y)) + v ,
имеем
M {µ ( y)µт ( y)}= M {[H (x − xˆ( y))+ v][H (x − xˆ( y))+ v]т }= = HP x H т + M {H (x − xˆ( y))vт + v(x − xˆ( y))т H т}+ R .
Поскольку
M {xˆ( y)vт}= M {K(Hx + v)vт}= KHR = PH тR−1R = PH т ,
получаем
M {µ ( y)µт ( y)}= HPH т − 2HPH т + R = R − HPH т .
Задача 2.5.6. Покажите, что для оптимальной оценки центрированного вектора x справедливо следующее соотношение
Mxˆ( y)xˆ т ( y) = P x − P .
Решение. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Это соотношение вытекает из следующей цепочки равенств |
|
|
|
|
|
|
|
|
|
|||||||||
P |
= |
M x, y {[x |
− ˆ |
|
− ˆ |
т |
} |
= |
M y M x / y {xx |
т − ˆ |
т − |
ˆ |
т + ˆ ˆ |
т |
} |
= |
||
|
x( y)][x |
x( y)] |
|
|
x( y)x |
|
xx( y) |
x( y)x( y) |
|
|
||||||||
|
|
|
= |
M y M x / y {xx |
т − ˆ ˆ |
т |
}. |
|
|
|
|
|
|
|||||
|
|
|
|
|
x( y)x( y) |
|
|
|
|
|
|
|
87