Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Медич Д. Статистически оптимальные линейные оценки и управление

.pdf
Скачиваний:
63
Добавлен:
25.10.2023
Размер:
13.81 Mб
Скачать

состояния

x(k), минимизирующую

критерий

качества ви­

да J[x(k\j)]

= E{L[x(k\j)]},

где L —допустимая

функция

потерь.

 

 

 

 

 

 

Заметим, что в

силу

свойств

условного

математиче­

ского ожидания

 

 

 

 

 

E7{L [x (k I /)]} =

Et.[E7{L

[x (k I /) J| г (1),

. .,

 

где 2* обозначает /га-мерный вектор вида

ІИ>)||

IIz С') I

Так как внешнее математическое ожидание в пра­

вой части равенства не

зависит от выбора

x(k\j),

то

минимизация Е {L [x (k \ /)]} эквивалентна

минимизации

Е {L[x(k\j)]\z(l),

2(2),

2(/)}. Поэтому уравнение

(5-1)

можно также записать в виде

 

 

J[x(k\i)]

= Ex{L[x(k\j)]\z(\),

z(j)}.

(5-2)

Следовательно, значение критерия качества, как можно было интуитивно ожидать, обусловлено факти­ ческими значениями измерений. Уравнение (5-2) можно рассматривать как определение критерия качества.

В любом случае в формулу для критерия качества входит условное математическое ожидание. Это понятие является фундаментальным для всей теории оценок, под­ робнее его место в теории будет выяснено впоследствии.

Пример 5-1. Предположим, что одна из составляющих передавае­ мого сообщения представляет собой случайную величину x ( k ) , где£ =

= const, неизвестную получателю.

Предположим также, что во время передачи сообщение подвер­

гается воздействию мультипликативного шума v t ( i ) в канале

переда­

чи и аддитивного

шума и2 (0

в приемнике, так что принимаемый сиг­

нал в / дискретных точках

может быть представлен в виде

г ( і ) =

— x(k)Vi(i)+v2(i),

i'=l, 2. ..., /, где &=const. Вся система изображе­

на в виде структурной схемы на рис. 5-3. Задача заключается

в опре­

делении значения x(k) по известным измерениям 2(1), z(2), .. ., z ( j ) .

Сформулируем

ее как задачу

оптимальной

оценки,

утверждая,

что любая оценка

x (k) вида x {k\j) =

<р [г ((')• і =

1, 2

/] являет»

180

u,(i)

u,(i)

 

Принимаемый,

x(k)

сигнал

Передатчик

г(і)

 

i=l,2,...,j

Рис. 5-3. Структурная схема системы связи.

'ся оптимальной, если у—скалярная функция / переменных, миними­ зирующая критерий качества вида / [х (k\j)] = £ [\х (k) — х

В этом примере функция потерь представляет собой просто модуль ошибки оценки.

Основы теории оценок

Представим условную функцию распределения ве­ роятностей x(k) при условии z ( l ) , ..., z(y') в виде

Р[х(Ь)<1\г*(І)]

=

Г[1\г*(І)]

z*(j)—/m-мерный

для всех n-мерных векторов

\, где

вектор вида

 

 

 

 

 

 

 

 

z(/)

 

 

 

Решение задачи оценки при выполнении

определен­

ных условий, накладываемых на F[l\z*(j)],

дается сле­

дующей теоремой.

 

 

 

 

 

Теорема

5-1. Если функция

L есть допустимая

функ­

ция потерь

и

функция

F[l\z*(j)]

 

симметрична

относи­

тельно

своего

 

математического

ожидания

I,

т. е.

F{%—1|г*(/)]=1

 

F ff— l\z*(i)]

 

для любого

g, и

выпукла

для всех l ^ i

т.е. F{1^+(\-К)Щг*

 

(j)]^lF[^\z*_{j)]

+

+ ( 1 — К)Filz\z*(j)]

для

любых

п-векторов I 1 , 12<СІ при

0<czX<c\,

то оптимальная оценка

имеет вид

 

 

 

 

 

 

x(k\j)

=

E[x{k)\z*(j)}.

 

(5-3)

Этот фундаментальный и мощный результат принад­ лежит Шерману [Л. 5-1]. Другими словами, в теореме утверждается, что при выполнении требований симмет­ ричности и выпуклости условной функции распределения оптимальная оценка представляет собой условное мате­ матическое ожидание. Очевидно, оптимальная оценка

ISi

определяется

сразу,

если

известна

условная

функция

распределения

F{x(k)

\z*(j)]

или, что то же самое, услов­

ная плотность

распределения f[x(k)

\z*(j)], при

условии,

что она существует. Однако более важно заметить, что

E[x(k)\z*(j)]

— оптимальная

оценка

при

любых комби­

нациях допустимых функций

потерь

для

симметричных

и выпуклых условных функций распределения.

Пример функции распределения, симметричной отно­

сительно

своего математического ожидания и выпуклой

1,0

Выпуклость

Симметрия

І

Рис. 5-4. Иллюстрация симметричной и выпуклой условной функции распределения вероятностей случайной величины.

для всех значений аргумента, меньших или равных ее математическому ожиданию, показан на рис. 5-4.

Очевидным следствием теоремы 5-1 является то, что при независимых случайных процессах {x(k), kŒl} и

{z(i), / = 1 , ..., /} оптимальная оценка равна x(k\j)

=x(k)

при любых k и /.

 

Доказательство теоремы основано на следующей лем­ ме, известной из теории вероятностей [Л. 5-2, 5-3].

Лемма

5-1.

Пусть

L — допустимая

функция потерь,

а у — n-мерный

случайный

вектор с нулевым

математи­

ческим

ожиданием и плотностью

распределения,

симмет­

ричной

относительно

этого математического

ожидания

(нуля)

и

выпуклой

для

всех

у^О.

Тогда

E[L(y)]^

^E{L(y—а)]

для любого п-вектора а.

 

 

 

Доказательство теоремы 5-1 с помощью леммы пред­

ставляется читателю в качестве упражнения.

 

В

связи

с теоремой 5-1 заметим,

что

оптимальная

оценка также имеет вид E[x(k)\z*(/)],

если

требование

выпуклости

функции

/ 7 [ | | г * ( / ) ]

заменить

условием вы­

пуклости функции потерь L {Л. 5-4].

 

 

 

182

Теперь рассмотрим следствие теоремы 5-1, которое относится к частному случаю более общей задачи, по­

ставленной выше.

 

 

 

 

 

 

Следствие 5-1. Если

функция

L

является

допустимой

функцией

потерь, a

ix(k),

k<=I} и

{z(i); t = l , ...,

/} — га-

уссовские

случайные

процессы с

дискретным

 

временем,

то

 

 

 

 

 

 

 

 

x{k\jf)==E[x{k)\z*{j)\.

 

 

 

Д о к а з а т е л ь с т в о .

Следствие

сводится

к

теореме

5-1, если удастся показать, что гауссовская

условная

функция

распределения

F[x(k)\z*(j)]

симметрична от­

носительно своего математического ожидания и выпукла

для всех |<;' ; | .

 

 

 

 

 

 

Опуская для простоты

аргументы,

имеем:

 

F(Ç| 2 *) = j

j aexp [

- - i

- ( x - ï ) ' Q - > ( x - f ) dx,

 

 

 

 

 

 

— О

 

 

 

 

 

(5-4)

г д е

 

 

 

 

 

 

t=X+P

.P"1

lz* — ?•);

 

 

1

xz* z*z*v

 

 

 

 

P

 

JP~..P.

;

(5-5)

 

 

 

xz* z*z*

z*x'

 

 

 

 

 

Ѵ{2ъГ

I

Q I

 

 

в предположении, что матрица Рг-г* размера jmxjtn и матрица Q размера пХп несингулярны.

Сначала докажем симметричность. Заменяя g в урав­ нении (5-4) на I\ получаем:

 

 

a ехр

(x-t.yQ->X

-ОО

оо

 

(5-6)

Аналогично

Х(х-Щах.

 

 

 

P ( È - S | 2 * ) = j . . . j

a e x p [ - 4 - ( x - ^ Q - ' X

—00

—00

 

 

X(x-l)]dx,

183

откуда

следует, что

 

 

 

00

ОС

 

1

ç ; z * ) = j

.. . j

а exp

 

X Q " l ( J C - T )

dx.

Проводя замену переменных y = x в последнем выражении, получаем:

1 -F(t-l[z*)

= (- 1)"...

 

j a exp

- S ) ' Q - ( ^ - 6 ) ] r f « / = j '

...

j

а е х р [ - і - ( 0 -

 

— 00

— 0 0

 

 

— tYQ'Hy

— t)

dy

(5-7)

Сравнивая уравнения (5-6) и (5-7), можно_видеть, что функция F(l\z*) симметрична относительно | .

Выпуклость для любого £<g;£ следует из того факта,

что

d*F

*, у = 1 , 2 , ...,П.

 

Завершение доказательства представляется читателю

в качестве упражнения.

 

Отметим, что следствие также справедливо для асим­ метричных функций потерь (Л. 5-4], т. е. четвертое свой­ ство допустимой функции потерь здесь не является необ­ ходимым.

Из следствия видно, что оптимальная оценка имеет

вид

x (k

i j) =7v (*) +

Рт)гЧІ)Р7,\і)г,и)

[г* (J) - z* (/)].

(5-8)

Для простоты предположим, что процессы {х(к),

/ее/}

и {z(i),

2, ...,

/} имеют

нулевые математические

ожидания. В этом случае оптимальная оценка прини­ мает вид:

-•Р .Р~.\г*,

(5-9)

184

хг* г*г* '

 

где

 

 

x =

x(k\j);x

= x(k); z* = z*(i).

Такая оценка

имеет

следующие важные и полезные

свойства, которые можно получить из теоремы 3-2 на

основании свойств

 

условного

математического ожидания

и уравнения

(5-9) :

 

 

 

 

 

 

 

1.

x (k I /) линейная

оценка,

т. е. линейная

комбина­

ция известных измерений.

 

 

 

 

 

2.

x(k\j)

и x(k\

j) — гауссовские

случайные

«-векто­

ры.

Ошибка x(k\j)

 

 

 

 

 

 

 

3.

не зависит от любой линейной

ком­

бинации известных

измерений.

В частности, x(k\\)

не

зависит от x(k\j),

откуда

следует, что

 

 

 

 

 

 

E[x(k\j)

* ' ( £ ; / ) ] =

О

(5-10)

для любых / и k.

 

 

 

 

 

 

 

 

4.

Оценка x(k\j)

 

единственна.

 

 

 

Утверждение

следствия

5-1

ограничивается

 

опти­

мальными оценками гауссовских процессов при единст­ венном требовании допустимости рассматриваемых функ­ ций потерь. Теперь рассмотрим задачу оптимальной оценки для функции потерь частного вида, не наклады­ вая на функцию распределения F[E,\z*(/')] требований выпуклости или симметричности. Однако потребуем, что­

бы

условная

плотность

 

распределения

f[x(k)

|£*(/)]

была

 

определена

 

и непрерывна

во

всей

области

— o o < x , < o o ;

і = 1 , 2, ..., п кроме,

быть

может,

конечно­

го числа точек.

 

 

 

 

 

 

 

 

 

 

Рассматриваемая здесь функция потерь имеет вид

L[x(k\j)]

= x'(k\j)x(k\j).

 

Обычно

соответствующий

ей

критерий качества

оценки

называют

среднеквадратиче-

ской

ошибкой.

Это

вызвано тем,

что

Е[х'

 

(k\j)x(k\j)}

представляет

собой

среднее

значение квадрата

евклидо­

вой меры вектора

ошибки.

 

 

 

 

 

 

 

 

Для этого случая известен следующий результат (ср.

задачу 3-11).

 

 

 

 

 

 

 

 

 

 

 

Теорема

5-2.

Если

L [x (k \ /)] = x'(k\

j) x (k \ j),

то

x{k\j)

 

=

E[x(k)\z*(j)].

 

 

 

 

 

 

 

 

Д о к а з а т е л ь с т в о .

Вначале

докажем

необходи­

мость.

Для

L[x(k\j)]

= xf(k\j)x(k\j)

 

уравнение

(5-2)

 

 

 

 

 

 

 

 

 

 

 

 

 

185

можно записать в виде

 

 

J[x(k\ j)} = Е {[x {k) ~ x(k

I /)]' [x (k) - x(k I ;)] 1 z* (/)} .

Для удобства записи опустим аргументы, т. е.

/(х)

=

Е[{x ~

x)'(х-х)\z*}.

Тогда

 

 

 

 

00

 

00

 

 

J(x)—

 

^(x — x)'(x —

x)f(x\z*)dx,

—oo

—oo

 

 

где f(x\z*)—условная

плотность

распределения x(k)

при условии г(1), (2), ..., г(/) и предполагается, что эта функция определена и непрерывна на всей области ин­ тегрирования за возможным исключением конечного чис­ ла точек.

Взяв от последнего выражения градиент по х,

полу­

чаем:

 

 

 

 

 

 

 

00

00

 

 

ѴГ [/(х)] =

- 2 J . . .

\(x-x)'f(x\z*)dx.

(5-11)

 

 

— 0 0 — 0 0

 

 

Приравнивая

градиент нулю, имеем:

 

00

00

 

00

00

 

x' J . . . §f(x\z*)dx=

J . . . ^x'f(x\z*)dx.

 

—oo

—oo

—oo

—oo

 

Транспонируя обе части полученного соотношения и проводя в нем интегрирование, приходим к искомому результату:

x(k\j) = E[x(k)\z*(j)}.

Достаточность легко доказывается при рассмотрении

вторых частных

производных d'4[(dxidxj)

для і, / = 1,2,...

...,п. При і =

/

из уравнения (5-11) следует, что

 

 

 

00

00

 

-

^

-

= 2 Г . . .

[f(x\z*)dx =

2.

 

дхА

J

J

 

При І

j

t

—OO — 0 0

 

 

 

 

 

dxtdxj

186

Из дифференциального исчисления известно, ^то этих

двух

условий

достаточно, чтобы точка

x(k\j) =

=Е[х

(k) j z* (/)] являлась локальным минимумом. Однако так

как / [x (k I /)] выпуклая монотонно возрастающая функ­ ция x(k\j), то в точке условного математического ожи­ дания она имеет глобальный минимум, что и требова­ лось доказать.

Из доказанной теоремы следует, что по меньшей ме­ ре для одной допустимой функции потерь, а именно для L = x'[k\j)x(k\j), утверждение теоремы 5-1 справедливо без требований симметричности или выпуклости услов­ ной функции распределения вероятностей. Неизвестно, справедливо ли оно для какой-либо другой допустимой функции потерь или нет.

Из сравнения теоремы 5-1 с теоремой 5-2 ясно, что последняя, хотя и накладывает более жесткие ограни­ чения на функцию потерь, является более общей, чем первая, в том смысле, что она справедлива для более широкого класса случайных процессов. Любопытно от­ метить, что если допущения, сделанные при формулиров­ ке задачи оценки, удовлетворяют только условиям тео­ ремы 5-1 или только теоремы 5-2, то оптимальная оцен­ ка в обоих случаях является условным математическим ожиданием. В этом смысле утверждения двух доказан­ ных теорем совпадают.

Теперь сосредоточим внимание на оптимальных ли­ нейных оценках. Всякая линейная оценка x(k), получен­ ная на основе^измерений г(1), 2(2), ..., z(j), может быть представлена в виде

Jc(k\j)= t

А{і)г(І),

(5-12) M

 

i=\

 

где A(i)—матрицы

размера

nXm.

 

Пусть [x(k), kel)

и {z(i),

t ' = l , . .. , /} —

произвольные

случайные процессы. Тогда справедливо следующее утверждение.

Теорема 5-3. Если

известны

только

первые

и

вторые

моменты

случайных

процессов

[x(k),

k<=I} и

{z(i), i =

= 1, ...,

/ } , то для любой допустимой

функции

 

потерь

оптимальной

является

линейная

оценка

вида

 

 

x (k I j) =

x{k) +

P , / - ; ( ) 2

, ( ( ) [2* (/) - 5f (/)].

(5-13)

187

Д о к а з а т е л ь с т в о . Если известны первые и вто­ рые моменты, т. е. математические ожидания и корреля­

ционные

матрицы процессов

{x(k),

k^I}

и {z(i),

i =

= 1, ...,

/ } , то

можно

найти

единственные

гауссовские

процессы

{xa(k),

kŒl}

и {za(i),

i = l ,

..., /} с такими

же

математическими ожиданиями и корреляционными ма­ трицами, поскольку гауссовские процессы однозначно определяются их первыми и вторыми моментами.

Однако для гауссовских процессов в силу следствия 5-1 можно утверждать, что оценка, оптимальная для лю­

бой допустимой

функции потерь, имеет вид E[x(k) \ z*(j)]

и описывается

уравнением (5-13). Оценка, очевидно, ли­

нейная, что доказывает теорему.

В доказательстве использован тот факт, что при из­

вестных первых и вторых моментах случайных процес­ сов {x(k), kŒl} и {z(i), i = l , ..., /} эти процессы можно моделировать гауссовскими процессами с теми же ста­ тистическими параметрами.

Точнее, заметим, что необходимо знать только x(k),

* 0')' Рх(к)г*(і) И Pz*(k)z*(k)-

Возможна и другая точка зрения на приведенный ре­ зультат. Если ограничиться линейными оценками, т. е. оценками вида (5-12) (ср. задачу 3-13), то для опреде­ ления оценок потребуются только моменты первого и второго порядков. Далее, используя тот факт, что суще­ ствуют единственные гауссовские процессы с теми же первыми и вторыми моментами, применим следствие 5-1 и получим в результате, что линейная оценка, оптималь­

ная для одной

допустимой функции потерь,

оптимальна

и для любой допустимой функции потерь.

 

Теорема 5-1

является фундаментальным

результатом

и дает решение очень широкого класса задач оценки. Следствие 5-1 представляет собой частный случай при­ менения теоремы к гауссовским процессам. Принципи­ альным результатом следствия является тот факт, что оценка, оптимальная для любой допустимой функции потерь, а именно оценка в виде условного математиче­ ского ожидания, является линейной в силу гауссовости рассматриваемых случайных процессов.

В теореме 5-2 общность класса допустимых функций потерь снижается ради расширения допустимого класса случайных процессов. Для критерия качества вида среднеквадратической ошибки оптимальная оценка вновь имеет вид условного математического ожидания, однако

188

условная функция распределения вероятностей уже не обязательно должна быть симметричной или выпуклой.

Теорема 5-3 относится к ситуации, когда известны только первые и вторые моменты рассматриваемых слу­ чайных процессов. Она дает оценку, оптимальную для любой допустимой функции потерь. Простота оценки, а точнее ее линейность, делает этот результат особенно привлекательным с вычислительной точки зрения.

Теорема 5-1, как отмечалось ранее, принадлежит Шерману (5-1). Следствие 5-1 и теорема 5-2 доказаны Дубом (Л. 5-5], а теорема 5-3 представляет собой интер­ претацию некоторых результатов Калмана [Л. 5-6].

5-2. ОПТИМАЛЬНОЕ ПРЕДСКАЗАНИЕ В ДИСКРЕТНЫХ ЛИНЕЙНЫХ СИСТЕМАХ

Хотя результаты предыдущего параграфа достаточ­ но фундаментальны, они имеют ограниченное практи­ ческое применение. Это можно видеть, рассматривая га­ уссовский случай, когда

x (к \ j) =Гх (к) + PxWz*U)P-\i)z,U)

[z* (/) - z* (/)].

Для каждого мно сества измерений здесь необходимо вычислить матрицу, обратную матрице •Р,.( / -) 2 ,( ; -) размера jmxjtn. Напомним, что / — число измерений, a m — чис­ ло компонент в векторе измерения. Если m равно едини­ це или двум и проделано 40 измерений, то потребуется обращать матрицу размера 40x40 или 80X80.

Если как k, так и / могут изменяться, и требуется проводить последовательную оценку, т. е. обрабатывать

новые измерения по мере их поступления,

применение

полученного соотношения

для вычисления

оптимальной

оценки становится

практически

нецелесообразным.

С инженерной

точки зрения

требуются эффективные

и практичные, алгоритмы

последовательной

обработки

измерений для получения

текущей оценки,

желательно

в реальном масштабе времени. Оказывается, что такие алгоритмы легко получить для гауссовских марковских процессов с дискретным временем, модель которых была, описана в § 4-2.

В настоящем и следующем параграфах будут полу­ чены алгоритмы оптимального предсказания и оптималь­ ной фильтрации для указанного класса случайных про-

180

Соседние файлы в папке книги из ГПНТБ