Добавил:

fench Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский ядерный университет (МИФИ)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Загребаев Методы обработки статистической информации в задачах контроля 2008

.pdf

Скачиваний:

Добавлен:

16.08.2013

Размер:

7.77 Mб

Скачать

☆

<<< < Предыдущая 9 10 11 12 13 14 15 16 17 18 19 2021 / 3921 22 23 24 25 26 27 28 29 30 31 32 33 > Следующая >>>

≥[QDη1/2 Dη−1/2U ]× U т (Dη−1/2 )т (Dη−1/2т )U −1			×

× U т (Dη−1/2 )т (Dη1/2 )т	Qт	= QU U т (Dη−1 )тU −1U тQт .

Так как QU = I , то можем записать

QDηQт ≥ U тDη−1U −1 .

Учитывая (3.3.43) и (3.3.53), можем записать

ˆ − ≥ ˆ − var(bL b ) var(bMV b ) ,

что и требовалось показать. Очевидно, линейная оценка минимальной дисперсии (3.3.51) обладает, кроме доказанного свойства минимальности дисперсии, теми же свойствами, что и оценка наименьших квадратов.

3.3.6. Метод максимума правдоподобия

		~
В том случае, если известна	p( y / c = c ) , т.е. плотность распре-
деления вероятности выхода y	( y – конкретная реализация выхо-

да) при условии, что оцениваемый параметр		~	, естественно
		c = c
попытаться найти такую оценку	ˆ
	cMP , которая максимизирует эту

плотность вероятности. Такие оценки получили название – оценки максимального правдоподобия, а метод – максимума правдоподобия.

Таким образом,

~		~	(3.3.55)
J (c ) = p( y / c ) ,
или, что эквивалентно	~
~			(3.3.56)
J (c ) = −ln( p( y / c )) .

	~
Функция ln( p( y / c )) называется функцией правдоподобия. Та-
ˆ
ким образом, cMP является корнем уравнения:
		∂p( y / c )		= 0 ,	(3.3.57)
		∂p( y / c )
		∂c
		∂c		ˆ
			c	=cMP

201

или
∂ln p( y / c )		= 0	(3.3.58)
∂ln p( y / c )
∂c
∂c		ˆ
	c	=cMP

Если выход объекта в каждый i-й момент времени является аддитивной функцией возмущений η(i) , т.е.

y(i) = Ψ(z (i),c ) + η(i) ,

(3.3.59)

где z(i) – вектор наблюдений, и известна функция распределения шума η − f (η(i)) , то нетрудно заметить, что

p( y(i) / c = c ) = f (η(i)) η(i)=y(i)−Ψ(z (i),c )=ε(i) .

Если измерения некоррелированны, то для N взаимно некоррелированных измерений можно записать

N	N
p( y / c = c ) = ∏ p( y(i) / c = c ) = ∏ f (η(i))		η(i)=ε(i) . (3.3.60)
p( y / c = c ) = ∏ p( y(i) / c = c ) = ∏ f (η(i))		η(i)=ε(i) . (3.3.60)
i=1	i=1

В том случае, когда измерения коррелированны, плотность рас-

~
пределения p( y / c = c ) не может быть представлена в виде про-
изведения (3.3.60), и необходимо использовать формулу
p( y / c ) = f (η = ε(c )) ,	(3.3.61)

где ε – вектор невязок, сформированный по N измерениям. Рассмотрим частный случай решения задачи максимального

правдоподобия при нормальном законе распределения вероятности ошибок измерений

	1			1		т	−1
f (η) =		exp	−		η		Dη η .	(3.3.62)
f (η) =	(2π)N / L (det D )1/2	exp	−	2	η		Dη η .	(3.3.62)
	(2π)N / L (det D )1/2			2
	η

Согласно (3.3.56), (3.3.61) и (3.3.62), критерий качества будет иметь вид:

J (c ) = ln[(2π)N /2 (det Dη)1/2 ] + 12 εт(c )Dη−1ε(c ) .

Так как первое слагаемое последнего выражения от c не зависит то можно записать:

J (c ) = εт(c )Dη−1ε(c ) ,

ε ~

или, подставляя вместо (c ) его выражение, получим:

202

	т	D	−1		(3.3.63)

J (c ) = ( y − Ψ(c ))				( y − Ψ(c )) .
		η

Как видно, последнее выражение соответствует критерию качества метода наименьших квадратов при R = Dη−1 .

3.3.7. Метод максимума апостериорной вероятности

Пусть наряду с плотностью распределения	~
	p( y / c ) известна
		~
априорная плотность распределения вероятности	p(c = c ) .

Тогда, используя формулу Байеса, можно записать апостериор-

ную плотность распределения

p(c = c / y) :

p( y / c )P(c

= c )

= c / y) =

(3.3.64)

p( y)

Оценка cMAP , обеспечивающая максимальное значение апосте-

риорной плотности распределения = ~ , называется оцен- p(c c / y)

кой максимального правдоподобия.

Таким образом, в качестве критерия в методе максимума апостериорной вероятности может быть использована функция:

	~		~
J (c ) = −ln p(c / y) .					(3.3.65)

Подставляя в (3.3.65) формулу Байеса, и принимая во внимание,

~	, можно критерий записать в виде:
что p( y) не зависит от c

~				~		~	(3.3.66)
	J (c ) =		(−ln P( y / c ) − ln P(c )) .
		ˆ	является корнем уравнения
Таким образом, cMAP
	∂
		(−ln p( y / c ) − ln p(c ))				= 0 .	(3.3.67)

	∂c					ˆ
					c	=cMAP

В общем случае, решение задачи (3.3.67) не может быть получено в явном виде.

Рассмотрим решение этой задачи для линейной системы (3.1.6) при нормальном законе распределения ошибок измерений η и

нормальном законе априорной плотности распределения p(b ) :

203

−1

f (η) =

exp

−

Dη η

(3.3.68)

(2π)N /2 (det D )1/2

) =

exp

−

(

т −μ

)D−1(

−μ

)

. (3.3.69)

(2π)m/2

(det D )1/2

Принимая во внимание, что при линейном объекте и аддитивной

помехе p( y /

) = f (η)

, можно записать

η=y−Ub

N +m

1/2

−ln p( y / b ) − ln p(b ) = ln (2π)

(det Dη

det Db )

−1

( y −Ub )

Dη

( y −Ub ) +

−μb )

−μb ) . (3.3.70)

Подставляя (3.3.70) в (3.3.67) и учитывая, что Dη и Db

не зави-

сят от оценки, получаем

∂

т −1

=0. (3.3.71)

(y −Ub)

Dη

(y −Ub) +

−μb)

∂b

Введем следующие обозначения:

b−bMAP

D−1

y* =

R* =

(3.3.72)

U* =

;

−1

где Im – единичная матрица размера m × m .

Используя обозначение (3.3.72), выражение (3.3.71) можно переписать в виде:

∂		т
∂		т
	( y * −U *b )		R ( y −U *b )			= 0 .
					ˆ
∂b				b	=bMAP

Производя дифференцирование и разрешая полученное матрич-

ное уравнение относительно bMAP , найдем

ˆ	т	*	−1	т	(3.3.73)
bMAP = (U *		R U *)		U * Ry * .	(3.3.73)

Нетрудно заметить, что форма уравнения (3.3.73) совпадает с формой уравнения (3.3.13), однако в данном случае используется расширенная матрица входа U * и расширенный вектор измерений

204

y * , причем вектор математического ожидания μb рассматривают-

ся как дополнительные измерения. Подставляя (3.3.72) в (3.3.73), запишем формулу для оценки в ином виде:

bMAP = (Db

Dη U )(U

Dη

y + Db μb ). (3.3.74)

−1

Нетрудно заметить,

что

−1

, можно трактовать

D−1

как матрицу дисперсий объединенного вектора ошибок измерений

	η
η* =		. Тогда оценка (3.3.73 ) является оценкой минималь-
b − μb

ной дисперсии по отношению к линейному объекту вида: y* =U *b + η* .

Ковариационная матрица ошибок оценки, согласно формуле (3.3.55), может быть записана следующим образом

	ˆ	*т	*	*	−1

var (bMAP − b ) = U			R U		,

или, подставив обозначения (3.3.75 ) и произведя несложные преобразования, получим

	ˆ	−1	+U	т	−1	−1	.

var (bMAP −b ) = (Db					Dη U )

Отметим, что в случае отсутствия априорной информации о параметре, дисперсия оцениваемого параметра Db = ∞ . Тогда

−1

bMAP

= Dlim→∞(Db

Dη

U )

Dη

y + Db μb )=

= (U

−1

Dη U )

Dη

= bLS .

Наоборот, при достоверном знании

значения параметра

Dη = 0 .

−1

bMAP

= Dlim→0 (Db

Dη U )

Dη

+ Db

μb )= μb . (3.3.75)

205

3.3.8. Байесовские оценки

Можно заметить, что методы оценивания, описанные ранее, представлены в порядке возрастания априорной информации, необходимой для их реализации. Так, для использования метода наименьших квадратов не требуется никаких дополнительных сведений ни о статистических характеристиках шумов измерений или помех, ни о плотности распределения самого оцениваемого параметра. Конечно, статистические свойства полученной оценки зависят от этих характеристик. Для реализации метода максимума правдоподобия требуется знание плотности распределения

p( y / c ) , а для метода максимума апостериорной вероятности на-

ряду с p( y / c ) должна быть известна и априорная плотность рас-

пределения p(c ) .

Для получения байесовских оценок, кроме функций распреде-

~ ~

ления p( y / c ) , p(c ) , p( y) , необходимо знание и некоторой

функции штрафа ϕ(c − c ) ; при этом байесовская оценка миними-

зирует условное

математическое ожидание функции

штрафа

M{ϕ(c − c ) / y} при конкретной реализации выхода y . Так как

∞

(3.3.76)

M{ϕ(c −c ) / y} = ∫

ϕ(c −c ) p(c / y)dc ,

то байесовская оценка

−∞

сˆ

∞

∫

ϕ(c −c ) p(c / y)dc .

(3.3.77)

= arg min

−∞

При квадратичной функции штрафа (3.2.23) функционал (байесовский риск) принимает вид:

∞

∫

J (c ) =

R(c −c ) p(c / y)dc .

(3.3.78)

(c −c )

−∞

Оценка cˆB , обеспечивающая минимум критерия (3.3.78), по сути, является оценкой с минимальной среднеквадратической ошиб-

206

кой при данной выборке				y . Ее можно найти, приравняв к нулю
градиент	~			~	и решив уравнение
	J (c ) по переменной c
	∂J (c )		= 2	∞	ˆ	(3.3.79)


	∂c			∫ R(c − cMV )P(c / y)dc = 0
			ˆ	−∞
		c	=cB

относительно cˆB . Равенство (3.3.79) можно переписать в виде:

∞∞

сˆB ∫ P(c / y)dc = ∫cP(c / y)dc .

−∞ −∞

Учитывая теперь, что функция P(c / y) является плотностью

∞

распределения и, следовательно, ∫P(c / y)dc =1, получаем форму-

−∞

лу для оценки

∞

ˆ	∫cP(c / y)dc = M{c / y}.	(3.3.80)
cB =

−∞

Нетрудно показать [14], что рассмотренная процедура минимизации действительно приводит к минимально возможному значению байесовского риска (3.2.23). Очевидно, выражение (3.3.80) представляет собой условное математическое ожидание M{c / y}

параметра c при конкретной реализации выхода y , т.е. оценка cˆB

совпадает с апостериорным средним значением параметра c . Рассмотрим более подробно задачу нахождения байесовской

оценки параметров линейного регрессионного объекта (3.1.6) при нормальных законах распределения f (η) и p(b ) , которые описы-

ваются формулами (3.3.68) и (3.3.69). В качестве функции штрафа будем использовать квадратичный критерий (3.3.78). Как было по-

казано, в этом случае ˆ представляет собой апостериорное сред- bB

нее (3.3.80), т.е.

ˆ	∞
	∫b p(b / y)db = M{b / y}.	(3.3.81)
bB =

−∞

207

Апостериорная плотность распределения p(b / y) может быть определена по формуле Байеса:

p(		/ y) =	( p( y /	b	) p(	b	))	.	(3.3.82)
	b

			p( y)

В этой формуле p(b ) (априорная плотность распределения оцениваемого параметра) имеет, по условию, нормальный закон распределения, p( y / b ) = f (η) η=y−Ub – также представляет собой

нормальный закон распределения. Кроме того, учитывая, что объект линейный относительно параметра b и шума η , и исходя из

свойств нормального закона распределения [5], можно заключить, что P( y) – нормальный закон распределения с параметрами:

+ η} =Uμ

;

var{y} =UD U т + D .

M{y} = M{Ub

Таким образом:

p( y) =

(2π)

N / 2

det(UD U

1/ 2

+ D )

×exp −

( y −Uμ

)т ×(UD U т

+ D )−1( y −Uμ )

. (3.3.83)

Подставляя в (3.3.82) выражение для p( y / b ) , p(b ) , p( y) , определяемые формулами (3.3.68), (3.3.69) и (3.3.83), получим:

[det(UDbU т + Dη)]1/ 2 p(b / y) = (2π)m / 2[det Db det Dη]1/ 2 ×

×exp − 1 ( y −Ub )т D−1( y −Ub ) − (b −μ )т D−1(b −μ ) +

η b b b

+ ( y −Uμ )т(UD U т − D )−1( y −Uμ ) .

b b η b

Раскрывая скобки в показателе экспоненты и приводя подобные члены, можно записать:

208

p(b / y) =

×exp

det D

(2π)m / 2

det(UD U т + D )

−

(b −

ξ )

(b −ξ )

(3.3.84)

где введены следующие обозначения:
		= (D−1	+U тDη−1U )−1(U тDη−1 y + D−1μb );	(3.3.85)
	ξ	= (D−1	+U тDη−1U )−1(U тDη−1 y + D−1μb );	(3.3.85)
		b	b
			G = (Db−1 +U тDη−1U ).	(3.3.86)

Как и следовало ожидать, p(b / y) имеет нормальный закон

распределения с параметрами:

M{b / y} = ξ ; var{b / y} = G −1 .

Таким образом, учитывая (3.3.81), можно заключить:

			ˆ
			ˆ	= M{b / y} =
		bB		= M{b / y} =
= (Db−1 +U тDη−1U )−1 (U тDη−1 y + Db−1μb );									(3.3.87)
	ˆ				−1	+U	т	−1	(3.3.88)
	ˆ				−1		т	−1
var {bMV −b} = Db								Dη U .

Сравнивая последние выражения с оценкой максимума апостериорной вероятности для линейного объекта при нормальных зако-

нах распределения b и η , можно заметить, что эти оценки полностью совпадают.

3.4. Рекуррентные сходящиеся алгоритмы при полной априорной информации о помехе

3.4.1. Метод стохастической аппроксимации для решения скалярных стохастических уравнений

Метод стохастической аппроксимации был предложен в 1951 г. Робинсоном и Монро [14] для решения скалярных стохастических уравнений вида

209

ψ(c,η(i)) − y(i) = 0 , i =1,2,...,

(3.4.1)

где с – искомый параметр; η(i) – случайная последовательность с характеристиками

M{η(i)} = 0 , cov{η(i),η( j)} = ση2 δk (i − j) .

Для нахождения корня стохастического уравнения (3.4.1) было предложено использовать рекуррентную последовательность

cˆi+1 = cˆi − γi+1(ψ(cˆi ) − y(i +1)) .

(3.4.2)

Задача состоит в подборе такого коэффициента γi+1 , который

обеспечивал бы состоятельность оценки в среднеквадратичном, а именно:

lim M{(cˆ − c)2} = 0 .

(3.4.3)

i→∞ i

Запишем математическое ожидание квадрата ошибки оценки на (i + 1)-м шаге через математическое ожидание квадрата ошибки оценки на i-м шаге:

M{(cˆi+1 − c)2} = M{[cˆi − γi+1(ψ(cˆi ) − y(i +1)) − c]2} =

= M{(cˆi − c)2} + M{γi2+1(ψ(cˆi ) − y(i +1))2} −

−2M{γi+1(cˆi				− c)(ψ(cˆi ) − y(i +1))} .							(3.4.4)
Введем обозначения:
	ξ			= M{(cˆ				− c)2} ;			(3.4.5а)
		i+1				i+1
	ξ	i	= M{(cˆ				−c)2 };
		i				i
e = M				{[ψ(cˆ ) − y(i +					1)]2};		(3.4.5б)
i						i
di = M{(cˆi − c)(ψ(cˆi ) − y(i +1))} .											(3.4.5в)
Используя эти обозначения, запишем (3.4.4) в виде:
ξ	i+1		= ξ		i	+ γ2	e − 2γ		d	.	(3.4.6)
Так как ξi , ξi+1 , ei	i+1				i	i+1 i			i+1 i
Так как ξi , ξi+1 , ei	больше нуля, то для того, чтобы ошибка

оценки на каждом шаге в принципе могла уменьшаться, необходимо выполнение условия:

γi+1di > 0 .

(3.4.7)

В противном случае, математическое ожидание квадрата ошибки оценки будет монотонно увеличиваться.

210

<<< < Предыдущая 9 10 11 12 13 14 15 16 17 18 19 2021 / 3921 22 23 24 25 26 27 28 29 30 31 32 33 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
16.08.20132.42 Mб294Жолобов Ввведение в Математическое 2008.pdf
#
16.08.20131.61 Mб74Жукова Обсчая химия 2008.pdf
#
16.08.20131.33 Mб160Забродин УНИХ основы командного интерфейса 2010.pdf
#
16.08.20133.93 Mб150Завадцев Комплексы для инспекции елементного состава грузов 2011.pdf
#
16.08.201310.97 Mб125Загребаев Методы матпрограммирования 2007.pdf
#
16.08.20137.77 Mб92Загребаев Методы обработки статистической информации в задачах контроля 2008.pdf
#
16.08.20132.57 Mб44Задорожный Методы ядерно-физического мониторинга 2008.pdf
#
16.08.2013621.57 Кб19Захарова Праздники и традиции в Германии 2010.pdf
#
16.08.20135.66 Mб162Зебрев Физические основы кремниевой 2008.pdf
#
16.08.201312.57 Mб41Зелдович Физика ударных волн и высокотемпературных гидродинамических явлений 1966.pdf
#
16.08.2013674.08 Кб106Земсков Лабораторная работа Изучение интерферометра ФАБРИ-ПЕРО 2011.pdf