Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Пермский национальный исследовательский политехнический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

книги / Математические методы принятия решений

..pdf

Скачиваний:

Добавлен:

13.11.2023

Размер:

22.94 Mб

Скачать

☆

<<< < Предыдущая 33 34 35 36 37 38 39 40 41 42 43 4445 / 5945 46 47 48 49 50 51 52 53 54 55 56 57 > Следующая >>>

ния от начального приближения к решению при условии, что в точ ке регуляризованного решения значения первых производных функ ционала малы по сравнению со значениями вторых производных.

§ 8.4. Классификация образов по измеренному с ошибкой вектору признаков

Рассмотрим процедуру распознавания образов — второй этап задачи классификации. Пусть нам известны все характеристики

наблюдавшихся		случайных величин х\, Х2,--- ,х п, по которым
на	первом этапе нашли вид		функции	распределения Р(£, 0 1Oj),
j =	1, 2, . . . , т,	эмпирические	значения	плотностей	вероятностей
Pi(K \| Wj), i = 1, 2, . . . , п, точечную и интервальную					оценки разде

ляющей функции Ф(£, 0)|ç=a;. Требуется провести измерение слу чайной величины (вектора признаков) х, по которой должен быть классифицирован объект cij е П. Считаем, что интервальная оценка для случайной величины х известна.

Прежде всего отметим, что с определением интервальной оцен ки разделяющей функции появляется нулевая зона — зона неопреде ленности. Если наблюдавшееся значение х (а точнее, ее «истинное значение» <;) попадает в эту зону, то требуется, строго говоря, сле дующее дополнительное наблюдение вектора признаков. Получив наблюдение х, необходимо посмотреть, не пересекается ли допу стимый интервал значений случайной величины х с интервальной оценкой разделяющей функции. Если пересечения нет, применяет ся традиционный метод. В противном случае надо предваритель но найти «истинное значение» наблюдавшегося признака £. Одна ко по единственному измерению х нельзя найти соответствующие оценки признака Ç. Поэтому необходимо результаты наблюдений х присовокупить к имеющимся результатам наблюдений, получен ным в процессе обучения системы распознавания, т. е. к данным, характеризующим каждый объект от, 6 Q.

Оценку £ получим из уравнения (8.4), допуская, что случайная величина х может принадлежать двум соседним распределениям,

описывающим разные классы, т. е. получим \\ и В большинстве случаев, например для функций плотности распределения Гаусса, условие (8.4) приводит к трансцендентному уравнению, которое

может быть решено только численными методами. Для численных методов полезно использовать дополнительное ограничение вида

\i е [х — За(х), х + Зо(а:)], г = 1 ,2 ,

где о(х) — среднее квадратическое отклонение для наблюдавшейся случайной величины х.

Вблизи решающих функций (границ раздела) большинство функций распределения хорошо аппроксимируются гиперплоско стями (в К2 — прямыми линиями). Так, для одномерных гауссовых плотностей условие (8.4) примет вид

а2ф)		(; , \| M t ) + £ z j i = o,				i = l 2,
а2ф)		П Л ^г\^г/-г			V,
где
ГС \	\	1	/	1	—	!•
K<5i K ) = v s r : ex p i				г —	—	!•
p j’ j b	I <■>.) = Рг(Ь I (''г) —			.	i =	1,2,

P i определяют по результатам всех наблюдений x \ , X 2 , . . . , x n (на пример, путем группировки).

Разложим «теоретическую» функцию плотности Pi(E,i | <*ч) в ряд в окрестности наблюдаемой точки х. Получим уравнение прямой

p Â i I 0>i) «	Piix) ( 1 +		х	X) + Pi(x) Х			Xi.
Обозначим
Рг(х) ( 1 +	Х J	11 х )	= au		Pi(x)Х		= bi
и получим в окрестности точки х				уравнение Pi(ti \| «>*) — Щ + bîXi-
Тогда оценки Ç* найдем из условия
?	(Pi-ai)bi+ x				. _	Л
У	у ф	) + Ъ2оЧх)’			г	’
По значениям £i и Z,2>соответствующим первому и второму рас
пределениям, проводим классификацию (если							и £2 не попадают

в зону неопределенности, то требуется еще одно дополнительное наблюдение). В случае, когда обстоятельства не позволяют прове сти дополнительные измерения, принимают решение по наиболее

вероятному значению

г = 1, 2.

Рассмотренный в §8.2 и §8.4 алгоритм решения статистиче ской задачи распознавания образов (статистической задачи реше ния) позволяет полностью учесть статистическую природу резуль татов наблюдений как на этапе нахождения условных плотностей распределения вероятностей и разделяющих функций, так и на эта пе классификации по результатам наблюдений вектора признаков.

В задачах распознавания образов для принятия решения, ко гда применяется решающая процедура с фиксированным объемом выборки, используется критерий отношения правдоподобия. Рас смотрим, как изменится этот критерий при учете неопределенности исходной информации.

Согласно традиционному подходу определим отношение прав доподобия между классами tûj и (ùj следующим образом:

pjx\(ùj)	или In X = In p(s I Ы»)			г # j-

P ( x \ U j ) ’		pix\<ùjY
Тогда, применяя	байесовское	решающее	правило, получим
d* = di, т.е. x~<ùi,	если ^	111111 Ь Х	^	l n ( ^ ^ y ) , i , j =

= 1, 2, . . . , m , i ï j .

Этот же результат следует из критерия Неймана—Пирсона, со гласно которому при данном числе наблюдений п оптимальное ре шение задачи выбора гипотезы Н\ о том, что х ~ м ь против гипо тезы Я 2 о том, что х ~ о>2, с вероятностью, не меньшей 1 - а, если верна гипотеза Н\, и с вероятностью, не меньшей 1 —р, если верна гипотеза Яг, определяется отношением правдоподобия Хп, имею щим вид

У ТГТ р ( х j I (0|) _ Рп(х |щ )

" “ 1 1 p (ii \| <о2)	p „(x \|to 2)'
г—1

Здесь а — ошибка первого рода, р — ошибка второго рода.

Этот критерий обеспечивает наименьшую ошибку р (наиболее мощный критерий).

Рассмотрим, как изменятся результаты решения данной задачи при известных оценках плотностей р(х | со i) и р(х | со2):

_ р(х I COj) ±	A p i
р(х \|COj) ±	A pj ’

ИЛИ		In X = In р(х I (ùi) ± Api
		In X = In р(х I (ùi) ± Api								(8.17)
				р(х \|O j) + Apj '
В последнем случае (см. (8.7)) решение х								- (х>г	имеет	место,
если		In Р(ч?)		i , j
In X ^		In Р(ч?)		i , j	= 1, 2,			гФЗ-		(8.18)
		P(Wi)’
Перепишем (8.17) в следующем виде:
p(x\u>i)±Api					p(x\u>i)		Ар{ т		Apj
I n A — I n	-— j	г—:—г		= Ш — —j		i	~—;	г - \|- ” j		г .
p(x I Wj) ± Apj					p(x\|<0i )		p(x I Cùi)		p(x I (ùj)
Тогда вместо условия (8.18) имеем
In	р(х \|(ùi)			ДPi	т	A pj	^	P(o)j)		(8.19)
In	■	I " т	" j г -\|-			■ \|	" ^ ln	_.	. ,	(8.19)
	p(x\ Uj)		p(x\(ài)		p(x\u>j)			P((Oi)

Учитывая, что погрешности Api и A pj могут быть разных зна ков, для надежной идентификации образов вместо условия (8.19) следует использовать условие

р(х I (ùj)	\|Api\|	\|Ap,i	> J	P((ùj)
p(x\|w j)	p(x \|со»)	P(x\<ùj)	"	P(0)i)'

Два последних слагаемых в левой части неравенства опреде ляют нулевую зону (зону неопределенности в принятии решений)

в задачах распознавания образов при фиксированном объеме вы борки.

§8.5. Классификация летательных аппаратов

сучетом погрешностей в измерениях признаков

Рассмотрим задачу классификации объектов по ряду признаков. Объектами распознавания являются различные типы (классы) ле тательных аппаратов (л. а.): тип 1, тип 2 и т. д. Прежположим, что в результате активной радиолокации были получены следующие ра диолокационные характеристики:

1)эффективная площадь рассеяния (ЭПР);

2)спектральные и временные характеристики отраженных от объектов сигналов.

Характеристики были измерены радиолокационной станцией (РЛС) с длиной волны 10 м.

При использовании этих данных были выделены признаки, определяющие л. а. Такими признаками являлись: скорость движе ния объекта v, высота полета Н, частота модуляции отраженного сигнала / т и значения ЭПР, измеренные при различных ракурсах.

Способы вычисления скорости движения и высоты полета л. а. по спектральным и временным характеристикам отраженных от объектов сигналов описаны в [19, 65]. Модуляция отраженного сигнала вызывается вращением турбин или винтов л. а. Частота мо дуляции f m зависит от типа двигателя (винтовой или реактивный) и от количества двигателей.

Эффективная площадь рассеяния является оценкой интенсив ности вторичного излучения л. а. и зависит от диэлектрической и магнитной проницаемости материала, из которого изготовлен л. а., от ракурса, под которым наблюдается л. а., рабочей частоты РЛС, от формы и размеров л. а., от поляризации приемной и передающей антен РЛС [56-58].

Априори известно, что признаки статистически независимы, плотности распределения каждого признака каждого класса соот ветствуют нормальному закону распределения N(\i, а 2) и априор ные вероятности классов равны P(wj) =1/5, j = 1,..., 5, j — число классов.

В табл. 8.2 приведены значения числовых характеристик плот ностей вероятности каждого признака для каждого класса л. а.

Таблица 8.2

Значения числовых характеристик условных плотностей вероятности признаков

Тип	Скорость		Высота		Частота моду
Тип	движения v,		полета Я ,		ляции fm,
летательного		м/с	м			кГц
аппарата	у	а	У	а	И	О
	у	а	У	а	И	О
1	800	200	2000	1583	9,5	1,3
2	1500	366	10000	1816	15	1,6
3	400	100	500	491	1,5	0,25
4	200	100	500	250	15	0,2
5	550	100	10000	166	—	—

Зависимости ЭПР от ракурса л. а. при длине волны X = 10 м и горизонтальной поляризации для различных классов л. а. приведе ны на рис. 8.6. Величины ЭПР нормированы относительно значения 10“ 5 м2. Из рис. 8.6 можно сделать следующий вывод: если учесть погрешности измерений, то различные летательные аппараты будут не различимы.

Рис. 8.6. Зависимость ЭПР летательных аппаратов от ракурса при длине волны X = 10 м (номер линии на графике соответствует типу летательного аппарата)

Необходимо было, используя данную информацию, осуществить распознавание конечного числа классов по результатам измерений признаков. Критерием распознавания является вероятность ошиб ки, которая не должна превышать заданной вероятности Р(е)3 = 0,1. Вероятность ошибки Р(е) определяется по следующей формуле [28]:

Р(е) = 1 - 2 f р(х | a)i)P(<Oi)dx,

i=lRi

где Ri — область принятия решений для г-й гипотезы, s — число объ ектов.

Радиолокационные характеристики, как и любые измерения, содержат случайные ошибки. Погрешности радиолокационных из мерений подразделяются на ошибки, вносимые л. а., и ошибки, вносимые аппаратурой. Основные ошибки, вносимые л. а., проис ходят вследствие флуктуации амплитуды сигнала, а также зависят

от состояния окружающей среды. Из числа ошибок, вносимых ап паратурой, наибольшее значение имеют ошибки, появляющиеся вследствие собственных шумов приемного устройства. Если зада ны параметры РЛС, а также характеристики л. а. и окружающей среды, уровень ошибки распознавания для определенной точки пространства обзора РЛС может быть рассчитан как средняя квад ратическая сумма всех отдельных составляющих, вычисленных для этой точки. Однако нас интересует определение ошибок во всей зоне обзора РЛС. Для упрощения вычислений в работах [19, 65] предложена методика расчета оптимальной точности, при кото

рой	суммарная ошибка	не зависит от погрешностей, вносимых
л. а.,	а оценивается по	проектным данным или данным испыта
ний РЛС.

В данной задаче ошибки измерения по каждому признаку опре делялись ошибками, вносимыми РЛС, и для таких признаков, как скорость движения, высота полета и частота модуляции, средние квадратические погрешности соответствуют следующим значени ям: о(и) = 100 м/с, о(Н) = 250 м, а (/то) = 0,2 кГц. Предполагалось, что средняя квадратическая погрешность измерения ЭПР состав ляет 10 дБ и одинакова при всех ракурсах; точность определения ракурса составляет 10°

С учетом погрешностей признаков числовые характеристики условных плотностей вероятности изменяются (табл. 8.3). В табл. 8.3 приводятся также средние квадратические отклонения числовых характеристик условных плотностей распределения вероятностей, с помощью которых легко вычислить интервальные оценки функ ций условных плотностей распределения вероятностей в интересу ющих нас областях.

Анализируя рис. 8.6, получаем, что наилучшим образом клас сы л. а. по ЭПР разделяются при ракурсах 30°, 60°, 120° Возьмем в качестве признаков эти значения ракурсов (табл. 8.4).

Для вычисления вероятности ошибки воспользуемся методом, предложенным в [14, 17-19].

При большой размерности пространства признаков непосред ственное интегрирование значительно усложняется, поскольку усложняется выбор пределов интегрирования. Так, например, для получения вероятности ошибки и ее интервальных оценок при

15 — 4077

Таблица 8.3

Значения числовых характеристик и их средних квадратических отклонений с учетом погрешности наблюдений

Тип		Скорость				Высота				Частота
Тип	движения V,					полета Я ,			модуляции fm,
летательного		м/с					м			кГц
аппарата		м/с					м			кГц
аппарата	и	Д И О Д а			и	Д р а		Д а	и Д р а			Д а
	и	Д И О Д а			и	Д р а		Д а	и Д р а			Д а
1	720	70	230	40	2150	205	1630	250	10,2	0,9	1,25	0,21
2	1610	120	340	65	9100	850	1750	280	13,5	1,2	1,7	0,3
3	420	30	105	20	465	37	410	95	1,6	0,1	0,24	0,04
4	190	20	97	21	515	46	270	52	15,5	1,4	0,18	0,02
5	510	55	112	22	1080 980		156	29	—	—	—	—

Таблица 8.4

Значения числовых характеристик условной функции плотности ЭПР для каждого класса л. а.

Тип летательного	ф =	30°	ср =	60°	-с II
Тип летательного
аппарата	и	О	и	О	и
1	73	10	74	10	64
2	71	10	55	10	71
3	62	10	63	10	43
4	47	10	61	10	63
5	53	10	60	10	61

К) оо

использовании n -признаков необходимо вычислять n -мерные ин тегралы

Р(е) = / -

р(х | <Dj)P(<ùj) dx i ... dxn,

где Rj — область пространства Rn, которая характеризует образ <ùj. Таким образом, непосредственное вычисление вероятности ошибки (в. о.) описанным способом вызывает значительные затруд

нения.

В работе [14] рассмотрен метод вычисления вероятности ошиб ки распознавания классов, использующий каждый признак в от дельности. Формула вычисления в. о. для данного метода име

ет вид

Р(е) = ^[Р (ж О - max P(oj)p(Xi \ (ùj)],	(8.20)
i=1
s	T —коли-
где P (x j) = 2 P((x>j)p(xi \| (ùj), s — общее число классов;	T —коли-

j = 1

чество реализаций, T = R N, R —число значений признаков, N — общее число признаков.

В случае, когда функции плотности соответствуют многомер ному нормальному распределению, использование формулы (8.20) дает возможность перейти к серии одномерных нормальных распре делений и использовать для них линеаризующее преобразование.

Границы интервальной оценки вероятности ошибки в данном случае будут определяться по следующим формулам:

Рн(е) = 2 [Рн(я-г) - max P(^j)pH(Xi I (ùj)] =

Ci)

2=1

P(o)j)pH(Zî | tûj) - max P((ùj)pH(xi | (ÙJ)

Гr s

PB(e) X J 2 p(uj)Pb(xi I Wj) - max P((ùj)pB(xi I (ùj) . i=\ Lj= l

Использование в рассматриваемом случае одного любого при знака дает в. о. больше заданной Р3(е) = 0,1. Например, в. о. при ис пользовании одного признака — скорости — составляет P i(е) = 0,252, Р,(е) > Р,(е).

Как указывалось ранее, в процедуре идентификации объек тов при известных точечных и интервальных оценках функции плотности распределения вероятностей по^наблюдаемому вектору признаков х н следует определить оценки и величину эллипти ческой (гиперэллипсоидной) области, которая покрывает истинное значение с доверительной вероятностью (3. Эта область резко уве личивается с возрастанием числа координат вектора признаков £н-

15*

Отклонение от наблюдаемого значения х н по каждой координате равно /сра(ж): для доверительной вероятности р = 0,683 и для од ной координаты æ„ имеем fcp = 1, для двух координат — fcp = 2, для трех координат — fcp = 3,4, для пяти координат — /ср = 6, или, други ми словами, колебание в одно среднее квадратическое отклонение для одного параметра имеет доверительную вероятность р = 0,683, для двух параметров —р = 0,38, для трех параметров —р = 0,20 и т.д.

Другой пример распознавания образов при наблюдении двух признаков показан на рис. 8.7. В традиционном подходе реше ние принимается по значениям координат (x i,X 2), что приводит к неверному решению. Решение следует принимать по оценкам Ç. Строго говоря, в данном случае решение принято быть не мо жет, поскольку и наблюдаемые значения (х \,Х 2), и оценки £ по пали в область неопределенности принятия решений (нулевую зону).

Рис. 8.7. Распознавание образов с учетом погрешностей наблюдений при знаков при известном с точностью до параметров виде функций условных плотностей вероятности:

..........— без учета погрешностей признаков;------------с учетом погрешностей призна

ков; --------------интервальная оценка решающей функции

<<< < Предыдущая 33 34 35 36 37 38 39 40 41 42 43 4445 / 5945 46 47 48 49 50 51 52 53 54 55 56 57 > Следующая >>>

Соседние файлы в папке книги