Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Пермский национальный исследовательский политехнический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

книги / Математические методы принятия решений

..pdf

Скачиваний:

Добавлен:

13.11.2023

Размер:

22.94 Mб

Скачать

☆

<<< < Предыдущая 31 32 33 34 35 36 37 38 39 40 41 4243 / 5943 44 45 46 47 48 49 50 51 52 53 54 55 > Следующая >>>

Ковариационную матрицу оценок D(9) найдем как матрицу N 1,

обратную матрице N с элементами
d2F	d2F	_	d2F	d2F
~ дв] ’	æ , æ	2 _	æ 2æ , ’	ÔQ2 ’

вычисленными при найденных значениях оценок 02 и 0}.

После определения точечных оценок 0ь 02 или 0'15 02 и их дис

персий D(0i), D(02) и л и D(9'j ), D(02) находят доверительные интер валы для координат вектора параметров 0. Если число экспери ментальных точек достаточно велико и можно считать, что оценки параметров распределены относительно их математических ожи даний по нормальному закону, то для получения доверительных интервалов применяют безразмерную ^-статистику Стьюдента, ко торая подчиняется ^-распределению с v = п —1 степенями свободы.

Для получения оценок свободных параметров функции Гаусса

находится точка минимума функционала
	р _	у	( (Xj -	li?	(ÿi-T)i)2\
		“	V °2(ХЛ		°2(г/«)	)
при дополнительном условии
	dF _		Xj -Z i	yi —Tjj дгц _
	Sii		o2(xt)	a2(yi) dli
1	f	(5i-9i)2'l		a
rae * = Æ f e	expl —		Щ ~ 1 -	e‘ 3 1 6 2 s		"■
Знание статистики		получаемых			оценок необходимо для даль

нейшего анализа экспериментальных данных и правильной трак товки результатов их обработки, а также для выявления послед ствий сделанных допущений. Приведем результаты числовых экспериментов для определения закона распределения оценок пара метров 01 и 02 функции Гаусса.

Для различных погрешностей элементов выборок х н у ис следовалась зависимость средних квадратических отклонений оце нок параметров функции Гаусса, соответствующей прямой линии г) = 2 + £, от числа заданных точек на отрезке [0,2; 9,8] и закона их расположения на этом отрезке. Как и следовало ожидать из обще теоретических соображений, концентрация точек к концам прямой

	приводит к уменьшению дис
	персии оценок.	Зависимость
	средних квадратических откло
	нений от числа точек приведе
	на на рис. 8.2.
	Затем для различного числа
	экспериментальных точек (от 6
	до 50) и различных комби
	наций относительных погреш
Рис. 8.2. Зависимость средних квад	ностей по обеим осям коор
ратических отклонений оценок па	динат (5(æi) = 1 ... 10 %, b(yi) =
раметров функции Гаусса от числа	= 1 ... 10 %) с помощью датчи
точек п:	= 1 ... 10 %) с помощью датчи
точек п:	ка нормально распределенных
J — а ф 0 при 8(х<)=10%, 8(у0=10% ;	ка нормально распределенных
J — а ф 0 при 8(х<)=10%, 8(у0=10% ;	случайных чисел	исследовал
2 — а (в 1) при S(Xi) = 1 %, 8 (з/i) = 5 %; 3 —	случайных чисел	исследовал
а(0г) при 8(х0= 10%, 8 (2/*) = 10%; 4—	ся вид функции распределения
о(02) при S(si) = 1%, 8(2/*) = 5 %	оценок. На рис.	8.3 показаны

гистограммы распределения значений оценок 0i и 02 для разно го числа экспериментальных точек, имевших погрешность 10% по осям координат.

В каждом варианте вычислялись также дисперсии оценок и опре делялись доверительные интервалы дисперсий. Приведем резуль

таты, полученные для 17 экспериментальных точек. Как показал

Ц, N

0,375

0,250 •

0,125 -

Рис. 8.3. Гистограммы распределения оценок параметров функции Гаусса для различного числа экспериментальных точек при погрешности 10% по обеим осям координат;

/—для 49 точек, 2—для 17 точек, 3 —для 6 точек; а—распределение параметра 0i ;

б—распределение параметра 02

анализ оценок параметров 0i и 02 по критерию х2-распределения с вероятностью, приблизительно равной 0,80, закон распределения оценок можно считать нормальным со средними квадратическими отклонениями соответственно o(0i) = 0,060 и о(0г) = 0,017.

Процедура линеаризации имеет и свои недостатки. При обра ботке нелинейных функций таким методом следует иметь в виду, что для того, чтобы оценки 0 соответствующих параметров 0, по лученные из преобразованного уравнения, обладали оптимальными свойствами (несмещенностью, минимальной дисперсией и т.д.), необходимо, чтобы предположение аддитивности ненаблюдаемой случайной ошибки было справедливым для преобразованной, а не для первоначальной модели.

Влияние аддитивной ошибки на величину оценки параметров в преобразованной и исходной моделях можно установить, только исследуя каждую конкретную модель.

На рис. 8.4 и 8.5 приведены гистограммы относительных ча стот появления значений параметра о функции Гаусса при обра ботке экспериментальных данных непосредственно и с помощью операции линеаризации. Исходные данные после линеаризации со ответствовали уравнению прямой г) = 2 + Ç. Относительная средняя квадратическая погрешность в исходных данных составляла 10%. Значения £ принадлежали отрезку [0,2; 9,8]. Гистограммы получены для 6, 17 и 49 экспериментальных точек.

Одновременно в каждом варианте определялись дисперсии а 2(8) оценок 8 в предположении, что справедлива квадратичная аппрок симация минимизируемого функционала, т. е. дисперсии оценок вы числялись согласно теореме Крамера—Рао, и относительная частота появления оценок дисперсий, а также находилось среднее значе ние о(8) полученного ряда о(8). Выпишем интервальные оценки при доверительной вероятности 0,68 и средние значения о(8) при различном числе экспериментальных точек:

1) для операции линеаризации функции Гаусса

0,972 ^ 8 6 <			1,062,	0,030 ^		а(86) < 0,100,	о(36) = 0,040,
0,987	^	З п <	1,010,	0,008	^ a ( 3 i7) < 0,031,		сг(317) = 0,018,
0,997	^	849 <	1,008,	0,003	^	0(849) < 0,019,	0(849) = 0,006;


Рис. 8.4. Относительная часто			Рис. 8.5. Относительная часто
та появления оценок параметра о			та появления		оценок		парамет
при применении операции линеа			ра а при непосредственной оцен-
ризации, Ъ(х{) = 5(?/г) =		Ю %:	ке, Ь{хг) = Ытд) = 10%:
7 —начало отсчета 0,980, шаг гисто			1 — начало	отсчета		0,709,	шаг	ги
граммы 0,005, число точек		6; 2 —	стограммы	0,065,		число	точек	6;
начало отсчета 0,920, шаг гистограм			2 —начало отсчета 0,653, шаг гисто
мы 0,027, число точек 17			граммы 0,109, число точек 17
2) для непосредственной оценки параметра о функции Гаусса
0,762 < 36 <	1,092,	1,174 ^	а(36) < 0,984,		а(36) = 0,992,
0,939^017 <	1,070,	0 ,1 2 4 ^ а (3 ,7) <0,312,			о (3,7) = 0,154.

Индексы оценки 3 определяют число точек выборки.

Из приведенных результатов следует, что операция линеариза ции занижает реальную интервальную оценку параметра о.

Подобные числовые эксперименты проводились для различных исходных данных и при различных комбинациях погрешностей: от 1 % до 10%.

В табл. 8.1 приведены относительные изменения дисперсии оценки математического ожидания для нормального закона распре деления при различных комбинациях относительных погрешностей признака 5(xj) и частоты где noi — частота попадания значе ний оценки 0, в г-ю ячейку гистограммы.

Таблица 8.1

Относительное изменение дисперсии оценки параметра 0i при различных комбинациях относительных погрешностей признака b(xi) и частоты 8(noi)

&(П0г), %			8 ( Х г ) ,%
&(П0г), %	0,5	1,5	2,5	3,0	5,0
	0,5	1,5	2,5	3,0	5,0
0,5	1	1,078	1,083	1,084	1,089
1,5	5,467	9,064	9,557	9,655	9,753
3,0	9,310	29,16	35,02	36,25	38,27
5,0	10,29	42,96	57,14	60,59	66,04

Теперь можем сделать следующие выводы:

1) неучет погреш ности аргумента занижает реальную интер вальную оценку параметров;

2) разные алгоритмы приводят к различным интервальным оценкам.

Н аиболее оптимальные оценки должны получаться в тех алго ритмах, в которых операции обработки данных ведутся непосред ственно с исходными экспериментальными данными, когда не нару ш ается принцип аддитивности и не изменяется искусственно закон распределения исходных данных.

Больш ое практическое значение имеет положение эксперимен тальны х точек на исследуемом интервале возможных значений. О птимальны й закон их распределения (обеспечивающий минимум дисперсии оценок) зависит от конкретных значений эксперимен тальны х величин и их погреш ностей, и без упрощ ающ их предполо ж ений о последних получить его в явном виде не удается. Расчеты показали, что при одинаковых относительных ошибках в каждой точке для всех рассмотренных алгоритмов предпочтительнее вы брать равномерный ш аг по оси ординат, чем по оси абсцисс. В этом случае дисперсии оценок будут минимальными.

§ 8.2. Оценка параметров функции плотности распределения вероятностей с учетом погрешности вектора признаков

П рименим результаты, полученные в гл. 7, для решения статис тической задачи распознавания образов. Рассмотрим первый этап задачи классификации, когда требуется по результатам наблюдений

найти оценки функций плотности распределения вероятностей. Пусть известен вид функции распределения Р(£,0 1соД j = 1,2,...

..., т, но не известны значения вектора параметров 0. По результа там наблюдений случайных векторов х\,Х 2, . . . , х п требуется найти оценки вектора свободных параметров 0 и дисперсии оценок D(0). Проблема состоит в том, что наблюдаемые значения х \,Х 2, . . . , х п имеют соответствующие погрешности и аппроксимирующая функ ция распределения Р(£, 0 1от,) не строго пройдет по наблюдае мым точкам, т. е. в каждой наблюдаемой точке образуется область неопределенности, форма которой определяется законами распре деления координат наблюдаемой точки. Для получения оценок параметров и их дисперсий в данной ситуации применим изло женные в гл. 7 методы конфлюэнтного анализа [20, 40].

В приведенных ранее традиционных методах классификации [3, 7, 8, 14, 17-19, 28] определялись только точечные оценки па раметров в законах распределения, причем погрешности наблюдае мых случайных величин (векторов) х \ , х г , ..., х п при этом не учи тывались.

Предположим, что координаты {хцс} наблюдений случайных векторов Х\,Х2, . . . , х п для j-ro класса образов — непрерывные слу чайные величины с известными функциями плотности распре деления вероятностей /(ж**;), г = 1,2, . . . ,n , к = 1,2,...,1. Также будем считать, что в процессе аппроксимации результатов наблю дений х \ , . . . , х п с помощью функции распределения известно го вида Р(£, 0 1(ÙJ) предварительно вычислены (способом группи ровки, например) эмпирические значения вероятностей Р(хм \ o>j), i = 1,2,..., n, А; = 1,2, . . . , I, с которыми сравниваются соответству

ющие значения	P(Ç»fc,6 1<^j)> г = 1 ,2 ,...,п, к = 1, 2, . . . , / . Опреде
лен также вид	функции плотности распределения вероятностей

9 (Pifc 19) Для значений Р(хц; \ <àj). Тогда согласно методу максимума правдоподобия функция правдоподобия будет иметь вид [21, 40]

ПI

L(x, р 10) = П П 9(P»fe I $)f(xiк).

i = i ь = i

Предположим, что все случайные величины подчиняются мно гомерному распределению Гаусса с математическими ожиданиями

величин P(£ib 0 1(ùj) и lik, ковариационной матрицей К и диспер сиями a2(Xik). В этом случае для образа (ùj имеем

In L(x, р 10) =

= - у { [p - p(£.e i u j) Y K ~ 1[p—p(^ 91toj)]+ i ;				^	(V (~ io )2} +
					+ const,	(8.1)
где	p —набор значений p(xife\|o)j),	г = 1	,	2	k =l , 2, . . . , l
и	p(Ç, 0 \| (ùj) —набор элементов P(^fc, 8 1(ùj), i = 1, 2 ,..., n,					k =
= 1, 2, . . . , / .
	Оценки вектора параметров 0 функции р(£, 0 1(ùj) и их диспер
сии D(0) найдем из условия максимума (8.1) или как точку миниму
ма функционала
F(x, р 10) = [р —Р(1, в \| (ùj)]TK ~ l [P -		Р(^, в \| (ùj)] +
		y i	y i	(Xjk - Zik)2		(8-2)
		Z J	Z J	a 2(xik) ■		(8-2)
		г=1	k=\

Функционал (8.2) можно было бы сразу записать как функци онал ортогональной регрессии [21, 43], позволяющий учесть как погрешность определения р, так и погрешности измерений вели чин xi, Х2, . . . , х п. Как уже отмечалось в гл. 7, в ортогональной регрессии минимизируется сумма квадратов расстояний от наблю

давшихся точек до линии (поверхности) регрессии.
Точечные оценки вектора параметров 0 и неизвестных ^							мож
но найти из условий
	dF_		v =	1, 2, . .. , iV,			(8.3)
	æ v		v =	1, 2, . .. , iV,			(8.3)
	æ v
Pik ~ p(Çtfe>0\|^j)		/	Û I .. ч i xik		?>ik _	л
------ ^	—	Н . Л * . e l“ j) +			-	".	(8.4)
	%= 1, 2, . . . , л,		k	1, 2, ...,/,

где o2(pik) —дисперсия значений Pik, p\xk ~ производная от функ ции pâik, 0 1(ùj) no £ifc. Решая системы уравнений (8.3) и (8.4) сов местно, находим точечные оценки 0 и £. Условия (8.3) — система

алгебраических уравнений относительно из которой можно най ти явные выражения для £,гк, подставить их в (8.2) и получить более простую форму функционала (8.2).

Для прямой р = а + Ьх	функционал			(8.2) при	о2(рцс) = а 2(р)
и а2(хц;) = а2(х), г = 1, 2, . . . , п, к = 1, 2, . . . , I, примет вид
	1		П
F (x,p \|0) =	1		2	(p i - a - b x i )2;		(8.5)
F (x,p \|0) =	+ Ь2 о 2 ( х )		2	(p i - a - b x i )2;		(8.5)
о 2 ( р )	+ Ь2 о 2 ( х )		г=1
для гиперплоскости р = а +	I	bkXk при тех же предположениях
для гиперплоскости р = а +	2	bkXk при тех же предположениях
	к= 1	п	/	I	\2
		п	/	I	\2
F (x,P \Q) = ----------- г----------		_		2	h x k )	(8.6)
		г=1	'	к=1	'
о2(р) + È Ь2ко2(хк) i

к=1

Функционалы (8.5) и (8.6) позволяют непосредственно (со гласно (8.3)) найти оценки свободных параметров 0 и их диспер сий D(0). Дисперсионную матрицу оценок свободных параметров 0 находим из следующего условия [21]:

D ( ê ) - M - ' , м . ( - ^ ) |9_г Л . А - 1 . 2 ........N.

Пользуясь полученными формулами, покажем теперь, что ли нейная разделяющая функция, определенная без учета погреш ностей признаков х и у для двух образов, для которых р(х | to*), г = 1, 2, — функция плотности двумерного гауссова распределения с математическими ожиданиями (х*, у*), i = 1, 2, и одной ковариаци-

-	„	М * )	.	0 \	~
оннои матрицей	К =	I Л	.		, является смещенной оценкой

\0 a2(y)J

реальной разделяющей функции.

Разделяющая функция в данном случае имеет вид уравнения прямой. Данная прямая ортогональна к середине отрезка, проходя щего через точки (х,, у*), г = 1, 2, т. е. имеет угловой коэффициент, раный

( х 2 - Х \ ) о 2 ( у )

02(х)(У2 - y i ) '

Найдем уравнение прямой у = а + Ьх, проходящей через точ ки (xj, yi), i = 1, 2, . . . , п, учитывая дисперсии оценок а 2(х) и а 2(у).

Оценки параметров a n b искомой прямой определим как координа ты точки минимума функционала (8.5) из системы уравнений (8.3), взяв в качестве параметров 0 соответственно а и Ь:

1 п

1=1

П	71
S (î/t - а - b x i ) x i	£ (V i - а - b x i f
о 2( у ) + b2o 2( x )	[о2(у) + Ь2а 2(х )]2	^

Из первого уравнения получим

Л1

а— —

Подставим а во второе уравнение, которое станет квадрат ным относительно Ъ. Оценку углового коэффициента b определим

из квадратного уравнения
О2(у) [( î > t )	—п Е	Я?] + СГ2(х) [п £		у ■-		( Е Уг)	]
6 2 + Ь-	/ п	п	п			\	р2(у)	= 0.
6 2 + Ь-	/ п	п	п			\	ст2(х )	= 0.
02(х)( Е Уг Е x i ~ п Е х гУг )
	Н = \	г = 1	г = 1		7
Для двух точек (х ь у\),		(хг, уг) это уравнение примет вид
ь2 + ь ° 2^	Ух ~ У2)2 ~ ° 2(-уКх ' ~ Xl?					<?(у)	= 0.
	о2(х){У\ ~ Уг)(х1- хг)					а2(х)	= 0.
В общем случае угловой коэффициент					(х2- х \)а г(у) не являет-
					CT2(z)(ï/2-		2/l)

ся корнем данного квадратного уравнения, за исключением редких случаев, когда не различимы разные линии регрессии, что подтвер ждает смещенность оценки, полученной без учета а 2(х) и о2(у). Угловой коэффициент b однозначно связан с угловым коэффициен том разделяющей прямой: их произведение равно - 1.

Далее оценим смещение разделяющих функций при учете по грешностей признаков на примере одномерных гауссовых функций плотности распределения вероятностей р(х | coi) и р(х | «г) с мате матическими ожиданиями т\ и т г соответственно, а также с оди наковыми дисперсиями а 2.

В традиционных методах не различаются значения ж и Ç, поэто му в качестве функции плотности распределения берется р(ж | (ùj) вместо р(£ | u>j). Тем не менее, в процессе оценки свободных пара метров Ш | , т 2 и ст2 функций, распределенных по нормальному за кону, должны быть получены соответствующие погрешности Ami,

Д ш 2 и Д а.

Разделяющая граница в традиционных методах может быть определена согласно выражению

	l„ÎË lü !i= 0,	(8.7)
где	р(х \| о>2)
где
р(х \| G)j) \f2,—	2о*^Х	\| j ^

и в данном случае при А т \ = Д т 2 = 0 разделяющая граница про

	ходит через точку (mi + m 2)/2.
	В действительности из-за наличия погрешностей Д т ь	Д т 2
	и Д а вместо выражения (8.7) следует записать
	p (x \|o )i)± A p(x\|o)i)	(8.8)
	р(х I 6)2) ± Др(х I 6)2)	(8.8)
	р(х I 6)2) ± Др(х I 6)2)
	Погрешности Др(ж \| б)г) получим как линейные члены разложе
	ния в ряд Тейлора функций р(х \| со*), г = 1,2:
	Др(х 11ôi) = p'mi(x I оц)Атп1 + р'а(ж \| о)г)Да, г = 1,2.	(8.9)

Здесь p'mi(x | 6)j) И р'а(х | 6)j) — ПрОИЗВОДНЫе фуНКЦИИ р(х | 0);) ПО ТП{

и а с о о т в е т с т в е н н о .

Найдем максимальное смещение разделяющей границы (в чис

лителе выражения (8.8) прибавляется	погрешность Др(ж 16)i),
а в знаменателе вычитается Др(ж \| б)2)),	учитывая только Д т ]

и Д т 2. Используя соотношения (8.9), перепишем выражение (8.8) в следующем виде:

	,	, ( я - m i )	А
Ь Й ^	1 Н---------:-----		АТП\	= 0.
	+ 1П ______ Of_______
р(х I 6)2)	,	(я ~ т 2) Л
	1 -----------~----- Д т 2
Разложим функции In ^ 1 + Х		A m ^j и ln ^l — Х			Д т 2^

в ряд Маклорена. Поскольку здесь не обязательно выполняется

<<< < Предыдущая 31 32 33 34 35 36 37 38 39 40 41 4243 / 5943 44 45 46 47 48 49 50 51 52 53 54 55 > Следующая >>>

Соседние файлы в папке книги