Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистические методы обработки сигналов в радиотехнических системах

..pdf
Скачиваний:
29
Добавлен:
05.02.2023
Размер:
6.9 Mб
Скачать

111

выполненными условия дифференцирования интеграла по параметру (оценке), вычислимпроизводнуюотусловногориска (4.10) пооценке и приравняемеенулю. Витогеполучимуравнение

 

R (y)

 

 

 

 

 

 

 

 

 

 

 

 

Б W ( / y) d 0.

(4.11)

 

 

 

 

 

 

 

 

 

Б

 

 

 

 

 

 

 

Такимобразом, байесовскаяоценка Б(y) приквадратичнойфунк-

ции потерь имеетминимум СКО и определяетсяв виде

 

 

 

 

 

 

 

 

 

 

W ( / y) d .

(4.12)

 

 

 

Б y

Из (4.12) следует, что оценка Б(y) равна апостериорному средне- му значению параметра по распределению вероятностей W ( / y) при фиксированном значении выборки y.

Рассмотрим байесовскую оценку параметра при использовании

функции потерь модульного типа. Подставив

C

( )

 

 

 

в (4.9),

 

 

 

 

 

имеем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

W ( / y )

d

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

R

(y )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( /

y ) d

 

(

/ y ) d .

 

 

 

W

 

 

 

 

 

W

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

нулю, получаем

Приравняв производную от условного риска по

уравнениедляоценки

Б

W ( / y) d W ( / y) d .

(4.13)

 

 

 

Б

 

Из (4.13) видно, что байесовская оценка при модульной функции потерьсовпадаетсопределениеммедианыапостериорногораспреде- ления вероятностей W ( / y) неизвестного параметра .

Простаяфункцияпотерьвида (рис. 4.1,в) определяетсявыражением

 

 

0

при

 

 

 

 

0

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(4.14)

 

 

 

 

 

 

 

 

 

 

 

С( , )

 

при

 

 

 

 

 

 

.

 

 

 

 

 

 

1

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

112

При использовании этой функции полагается, что оценки, образуемыеизмерительнойРТС, одинаковохороши, еслиошибканепревышает по модулю 0 (потери равны нулю), и одинаково плохи, если модуль ошибки превышает 0 . Применение функции потерь (4.14) оправдано, например, всистемерадионаведения, когдапоражениецелипроисходит прилюбомпромахенепревышающемнекоторойвеличины.

Представимсреднийрискдляфункции потерь (4.14) ввиде

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

R

 

 

 

0

.

W ( , ) d d

W ( , ) d d P

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Изданноговыражениявидно, чтоминимизациясреднегорискаэквивалентна минимумувероятности того, чтомодуль ошибки превысит заданное значение 0 . Для определения решающего правила перепишем выражение условного риска в виде

 

 

( 0 )

 

(y)

 

W

( / y)

d

 

W ( / y) d .

(4.15)

R

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( 0 )

 

 

 

 

 

 

 

 

 

 

и приравнивая производную нулю,

Дифференцируя (4.15) по

найдемусловие, определяющееоценку:

 

 

 

 

W ( / y)

 

 

W ( / y)

 

.

(4.16)

 

 

 

 

 

 

 

0

 

 

 

 

0

 

Таким образом, оптимальная оценка должна обеспечивать равные значения апостериорной ПРВ в точках ( 0 ) и ( 0 ) . Если функция W ( / y) симметрична относительно некоторого , то байесовскаяоценкасовпадаетсцентромсимметрии, те. . Б . Можно показать, чтопомереуменьшениявеличины 0 байесовскаяоценкапри простойфункциипотерьприближаетсякзначениюпараметра max , при котором апостериорная ПРВ W ( / y) максимальна.

4.2.2. Оценки максимального правдоподобия

Байесовскаяоценкаприпростойфункциипотерьсоответствуетположению максимума функции W ( / y) и может быть определена как кореньуравнения

113

W ( / y)

 

 

0.

(4.17)

 

 

 

 

Б

 

 

Поскольку логарифм есть монотонно возрастающая функция аргумента, точастоболееудобнорешатьуравнение

ln [W ( / y)]

 

0.

(4.18)

 

 

 

 

Б

 

 

 

Используем известное соотношение для любой условной ПРВ

W ( / y) W ( ) W (y / ) /W (y) kW ( )W (y / ) , где k W (y) кон-

станта, не зависящая от и подставим его в (4.18). В итоге уравнение дляоценкиприметвид

ln [W (y / )]

 

 

 

ln [W ( )]

 

 

0.

(4.19)

 

 

 

 

 

 

 

Б

 

 

Б

 

 

Вомногихпрактическихзадачахаприорнаянеопределенностьопараметревелика, те. . функцияW( ) достаточноширокая— имеетслабовыраженный максимум по или вовсеего не имеет. В этом случае второе слагаемоев (4.19) близкок нулю. В итогеоценка помаксимумуапостериорнойвероятностисовпадаетснебайесовскойоценкойпомаксимуму функции L( ) W (y / ) . Функцию L( ) называют функцией правдопо-

добия (ФП). Оценки параметров, определенные этим способом, называют оценками максимального правдоподобия (МП). Таким образом,

функция правдоподобия есть функция неизвестного параметра

иважноизменениееезначенийприизменениипараметра, подлежащего оцениваниюпризаданномсигналеy.

Отметим, чтосуществуютразличныеситуации(например, измерение радиолокаторомскоростивращенияпланеты), когданетсмыслапредполагать, что параметр выбирается случайным образом из некоторого множества, на котором можно разумным способом задать априорную ПРВ. В этом случае использование оценок МП в сравнении с байесовскимив большейстепени соответствуетсодержанию подобныхзадач.

При наличии в полезном сигнале случайных неинформативных параметров ФП принимает вид L( ; ) W (y / ; ) . Определение МП оценки МП в этом случае предполагает вычисление безусловной ПРВвыборкипутемстатистическогоусреднения, тоесть

114

W ( y / ) ... W (y / ; ) W ( ) d L( ) ,

где W( ) — совместная ПРВ совокупности параметров . Интегрированиеприэтомвыполняетсяпообластивозможныхзначений .

Поиск оценок МП связан, в общем случае, с решением одного или, в случаевекторногопараметра , системы нелинейныхалгебраических уравненийвида

ln [W (y / )]

 

 

0.

(4.20)

 

 

 

 

МП

 

 

Процесс определения МП оценки равносилен выбору среди семейства ПРВ W (y / ) , образованногозначениями параметра , такой W (y / МП) , которая для конкретной выборки y доставляет максимальную вероятность (плотность вероятностей). Отсюда проистекает название— «максимальноправдоподобнаяоценка». Любоезначение ,

отличное от МП , для которого L( ;y) L( МП;y) , приводит к меньшейвероятностипоотношениюкисходнымданным, поэтомуономенее удовлетворительно.

ОценкиМПпостоянныхпараметровмогутиметьрядпримечательных свойств — они асимптотически (при увеличении объема выборки) состоятельны, эффективны и их ПРВ W ( / ) является гауссовской. Поэтому метод построения оценок по максимумуФП находит широкое практическоеприменение. УказанныесвойстваоценокМПреализуются в случае, если ФП обладает свойством регулярности. Суть этого свойства в том, чтодолжновыполняться тождество [6]

 

 

 

 

 

 

 

 

... T (y) W (y / )dy

 

... T (y)

 

 

W (y / ) dy ,

 

 

 

 

 

 

 

 

 

то есть ПРВ W (y / ) должна допускать дифференцирование по параметру под знаком интеграла. В указанном тождестве T(y) является произвольнойинтегрируемойфункцией. Впрактическихзадачахнарушение тождествачастосвязаносналичиемуфункции W (y / ) (какфункции y) точек разрыва, положение которых изменяется в зависимости от .

В простейшем случае уравнение правдоподобия (4.20) является линейным и его решение можно найти аналитически. В общем случае

115

длярешениянеобходимоиспользоватьчисленныеметоды. Результативностьчисленногометодазависитотхарактера функцииправдоподобия и близости начального приближения к неизвестномукорню уравнения. Вчастности, важноезначениеимеетунимодальностьФП, тоестьналичие унееединственногомаксимума.

4.2.3.Оценки неизвестных параметров методом наименьших квадратов

Вомногихпрактических задачахможнополагать, чтонаблюдаемый сигналнаинтервалевремени (0;Т) допускаетпредставление

r 1

 

y(t; ) i fi (t) n(t) ,

(4.21)

i 0

где T 0 , 1,..., r 1 r-мерный вектор-строка неизвестных параметров; fi (t) , (i 0,..., r 1) — совокупность r известных функций; n(t) — аддитивнаяпомеха. Задачасостоитвнахожденииспособаполученияоптимальныхоценок i параметров i . Обратимвниманиенадва обстоятельства:

1)математическая модель (4.21) является линейной по отношению кпараметрам i ;

2)помеха n(t) является аддитивной, и постановка задачи не предполагаетзаданияеестатистическихсвойств.

Рассмотримметоднаименьшихквадратов(МНК). Получимвыраже-

 

 

 

 

 

 

 

 

 

 

 

 

, предполагаяпоступлениеданных(сигнала) (4.21)

ниедляоценки МНК

в дискретные моменты времени tk

k t;

 

k 1,...,m;

m T / t.

Мно-

жествонаблюденийпредставимввидесистемы m уравнений

 

y(t1) 0 f0 (t1) 1 f1(t1) ...

r 1 fr 1(t1) n(t1);

 

 

 

 

y(t

2

)

0

f

0

(t

2

) f (t

2

) ...

 

r 1

f

r 1

(t

2

) n(t

2

);

 

 

 

 

 

 

 

 

 

1 1

 

 

 

 

 

 

 

 

 

 

 

(4.22)

.............................................................................

 

 

 

 

 

 

 

 

 

y(t

m

)

0

f

0

(t

m

) f (t

m

)

...

r 1

 

f

r 1

(t

m

) n(t

m

).

 

 

 

 

 

 

 

 

1 1

 

 

 

 

 

 

 

 

 

 

 

 

 

Вматричныхобозначенияхсистема(4.22) имеетвид

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y F n ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(4.23)

116

где y — m-мерный вектор-столбец наблюдений с координатами yi y(ti ); n — m-мерный вектор-столбец помехи с координатами ni n(ti ); F — матрицаразмерностью m r вида

F =

f0 (t1)

f1(t1) fr 1(t1)

.

(4.24)

 

 

 

 

 

f0 (tm )

f1(tm ) fr 1(tm )

 

 

Для заданных моментов времени tk и известных функций fi(tk) матрица F является числовой.

Допустим, что есть некоторая оценка, тогда (y F ) n — вектор остаточной помехи. Данный вектор называют вектором невязок наблюдений; по существу он является вектором оценок помехи. Критерий оптимальности (целевая функция) для оценок МНК определяется в виде

 

m

m

 

T

 

(4.25)

 

 

J ( ) ni Rij n j

(y F )

 

R(y F ) ,

 

i 1

j 1

 

 

 

 

где R — положительно определенная и симметрическая матрица весовых коэффициентов размерностью m m. Из (4.25) видно, чтоскалярная функция J ( ) является функцией r переменных. Для единичной матрицывесов(R E — единичнаяматрица) значениецелевойфункции

m

J ( ) ni2 , тоесть равносумме квадратов значений невязок по всем

i 1

моментам времени. Для оптимальной по МНК оценки должно выпол-

нятьсяусловие

J ( МНК ) min[ J ( )].

Таким образом, если оптимальная оценка существует, то она может бытьопределенакаккореньуравнения

 

 

 

 

 

 

 

 

 

J ( )

 

 

0.

(4.26)

 

 

 

 

 

 

 

 

 

 

МНК

 

Выполняяперемножениев(4.25) поправиламалгебрыматриц, получимцелевуюфункциюввиде

117

 

T

Ry 2y

T

 

T

F

T

 

(4.27)

J ( ) y

 

 

RF

 

R F .

Второеитретьеслагаемыев (4.27) зависятотоценки, причемвторое является линейной формой по отношению к , а третье — квадратичной. Вычислениепроизводной (4.26) сучетом (4.27) даетуравнение дляоценки

F

T

Ry (F

T

 

(4.28)

 

 

RF) .

Решая(4.28) матричнымметодом, получаемвыражениеоценкиМНК:

 

(F

T

RF )

1

F

T

Ry Ly ,

(4.29)

МНК

 

 

 

где L (FT RF) 1FT R — матрица размерностью r m, определяющая

линейноепреобразованиевекторанаблюдений y.

Важно отметить, что оптимальная по МНК оценка вектора неиз- вестных параметров сводится к линейному оператору (оператору L)

над входными данными. Очевидно, это следствие линейности модели наблюдаемогосигналаиаддитивностипомехи.

Получениеоценкисогласно(4.29) предполагаетобращениематрицы FT RF размерностью r r. Рассмотрим структуру этой матрицы для случая R E. Выполнивперемножениематриц, получим

 

 

 

m

m

m

 

 

 

 

 

 

f02 (ti )

f0 (ti ) f1(ti ) f0 (ti ) fr 1(ti )

 

 

 

 

 

i 1

i 1

i 1

 

 

 

 

 

 

m

m

m

 

 

 

F

T

F

f1(ti ) f0 (ti )

f12 (ti ) f1(ti ) fr 1

(ti )

.

(4.30)

 

i 1

i 1

i 1

 

 

 

 

................................................................................

 

 

 

 

 

m

m

m

 

 

 

 

 

 

fr 1(ti ) f0 (ti )

fr 1(ti ) f1(ti ) fr 12 (ti )

 

 

 

 

 

i 1

i 1

i 1

 

 

 

Обращение матрицы (4.30) реализуется просто, если она является диагональной. Для этого необходимо, чтобы семейство функций f0 (t), f1(t),..., fr 1(t) обладало свойством дискретной ортогональности,

m

 

то есть fk (ti ) fl (ti ) 0 для любых

k l. Например, полиномы

i 1

 

118

Чебышева обладают этим свойством. При этом необходимо временной интервал наблюдения (0;Т) привести к интервалу (–1;1) и временные отсчеты формировать в моменты ti cos (2i 1) / 2m , где i 1, 2,..., m, причем m k,l.

4.3. Статистические свойства оценок МНК

ОпределимсмещениеидисперсиюоценокМНК. Вычислимматема-

тическое ожидание оценки M[ MHK ]. Для этого в (4.29) подставим выражение вектора наблюдений (4.23) и представим уравнение оценки в виде

 

(F

T

RF)

1

F

T

R (F n) Ln ,

(4.31)

MHK

 

 

 

 

где L — матрица, определяющаяоператороценкив (4.29). Такимобразом, из (4.31) векторошибок оценивания

 

) Ln

(4.32)

MHK ( MHK

 

иегостатистическоесреднее M MHK M Ln LM n . Изэтогосле-

дует, чтосреднеезначениеошибки обращается в нуль при M n 0 , то есть оценки МНК являются несмещенными, если помеха n(t), введен- ная в модель наблюдений (4.21), имеет нулевое среднее.

Определимковариационнуюматрицувектораошибок (4.32) ввиде

K MHK

M

 

T

T T

T

,

(4.33)

nn

 

Lnn L

LKnL

где Kn — ковариационнаяматрицапомехи. Вразвернутойформесучетомвыражениядля L матрица(4.33) имеетвид

K MHK

1

1

 

FT RF

FTRKnRF FTRF .

(4.34)

Обсудим вопрос, связанный с выбором весовой матрицы R, которая определяет коэффициенты Rij в выражении (4.25) для критерия оптимальности J. Очевидно, что существенный вклад в J вносят большие по величине невязки, которые возникают при большой интенсивностипомехи. Всвязисэтимдлясниженияихвлиянияцелесообразнозадатьвесовыекоэффициентыобратнопропорциональнымиинтенсив-

119

ности помехи. Можно строго показать [4], что при выборе R Kn1

оценки параметров по МНК для линейной задачи вида (4.21) имеют минимальную дисперсию ошибки. Очевидно, что получение таких оценоктребуетаприорнойинформацииокорреляционныхсвойствахпомехи, тоестьнеобходимознатьматрицу Kn.

Подставимв(4.34) оптимальнуювесовуюматрицу R Kn1 . Витоге ковариационнаяматрицаошибокпринимаетпростойвид

K MHK opt

1

 

FT KnF .

(4.35)

ЗадачаформированияоценокМНКусложнится, еслиматематическая модель (4.21) будет нелинейной по параметрам. В этом случае целевая

m

функция, равная J ( ) yi s(ti ; ) 2 , не является квадратичной

i 1

функциейотпеременных 0 , 1,..., r 1 .

Поисканалитическогорешениясистемыуравненийвида (4.26) сцельюопределениявыражениядляоценокМНКвнелинейныхзадачах, как правило, оказываетсябезуспешным. Проблемаобычнорешаетсяподходящим численнымметодом. Возможностьприменения МНКв конкретнойзадачезависит отскоростисходимостии точностивыбранногочисленного метода. Большое значение при этом имеют оценки на первом шаге итеративного процесса поиска корней (начальное приближение) исведенияохарактерецелевойфункции.

4.4.Пример оценки неизвестного скалярного параметра

Рассмотрим простую задачу оценивания, когда выборочный вектор наблюдаемогосигнала y образован совокупностьюотсчетов вида

yi ni , i 1,...,m; (4.36)

где ni — дискретный отсчет стационарного гауссовского шума с равномерным энергетическим спектром Sn ( ) N0 / 2 Вт/Гц в полосе

( 2 fв; 2 fв) исредним ni 0 ; — неизвестныйпараметр.

Найдем МП оценку параметра Прежде получим в явном виде

функцию правдоподобия L( ) W (y / ) . Будемполагать, чтоинтервал

120

дискретизации t 1/(2 fв) . Тогда согласно (1.45) дискретная последовательность ni ( i 1,...,m ) являетсяпоследовательностьюстатистически независимых случайных величин. Из (4.36) следует, что yi ( i 1,...,m ) естьстационарнаягауссовскаяпоследовательностьнезависимыхслучайных величин со средним yi . Таким образом,

m

 

 

 

1

 

 

m

 

(y )2

W (y / ) W (yi

/ )

 

 

 

 

exp

i

 

 

 

m

(2 )

m / 2

2

2

i 1

 

n

 

 

i 1

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

2

 

 

 

 

K exp 0,5 n2 yi

 

,

 

 

(4.37)

 

 

 

i 1

 

 

 

 

 

где K — постоянная, не зависящая от ; 2n ni2 N0fв — диспер-

сия дискретного шума.

Из(4.37) найдемлогарифмфункцииправдоподобия

ln L( )

 

ln W (y / )

 

ln K 0,5 2

m

( y )2.

 

 

(4.38)

 

 

 

 

 

 

n

i

 

 

 

 

 

 

 

 

 

 

i 1

 

 

Такимобразом, уравнениеправдоподобияимеетвид

 

 

 

 

d ln L( )

m

 

 

 

 

 

 

 

 

 

 

 

 

yi m 0 ,

 

 

 

 

 

d

 

 

 

 

 

 

 

 

 

i 1

 

 

 

ивитогедляМПоценкипараметра получаем

 

 

 

 

 

 

 

 

1

 

m

 

 

 

 

 

МП

(y)

 

yi .

 

 

(4.39)

 

 

 

 

 

 

 

 

 

 

 

 

m i 1

 

 

 

Выражение оценки (4.39) по существу является средним арифметическим выборочных отсчетов.

Найдем по МНК оценку параметра В соответствии с (4.22)

и (4.23) матрица F размерности m r имеет m строк и один столбец.

Определимвесовуюматрицу R K n1

n2

E , тогдацелеваяфункция

(4.25) дляоценокМНКприметвид

 

 

 

 

 

 

 

 

 

1

m

 

 

 

2

 

 

 

 

 

i

 

 

,

2

J

 

 

y

 

 

n i 1

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]