книги / Математические методы принятия решений
..pdfния от начального приближения к решению при условии, что в точ ке регуляризованного решения значения первых производных функ ционала малы по сравнению со значениями вторых производных.
§ 8.4. Классификация образов по измеренному с ошибкой вектору признаков
Рассмотрим процедуру распознавания образов — второй этап задачи классификации. Пусть нам известны все характеристики
наблюдавшихся |
случайных величин х\, Х2,--- ,х п, по которым |
||||
на |
первом этапе нашли вид |
функции |
распределения Р(£, 0 1Oj), |
||
j = |
1, 2, . . . , т, |
эмпирические |
значения |
плотностей |
вероятностей |
Pi(K | Wj), i = 1, 2, . . . , п, точечную и интервальную |
оценки разде |
ляющей функции Ф(£, 0)|ç=a;. Требуется провести измерение слу чайной величины (вектора признаков) х, по которой должен быть классифицирован объект cij е П. Считаем, что интервальная оценка для случайной величины х известна.
Прежде всего отметим, что с определением интервальной оцен ки разделяющей функции появляется нулевая зона — зона неопреде ленности. Если наблюдавшееся значение х (а точнее, ее «истинное значение» <;) попадает в эту зону, то требуется, строго говоря, сле дующее дополнительное наблюдение вектора признаков. Получив наблюдение х, необходимо посмотреть, не пересекается ли допу стимый интервал значений случайной величины х с интервальной оценкой разделяющей функции. Если пересечения нет, применяет ся традиционный метод. В противном случае надо предваритель но найти «истинное значение» наблюдавшегося признака £. Одна ко по единственному измерению х нельзя найти соответствующие оценки признака Ç. Поэтому необходимо результаты наблюдений х присовокупить к имеющимся результатам наблюдений, получен ным в процессе обучения системы распознавания, т. е. к данным, характеризующим каждый объект от, 6 Q.
Оценку £ получим из уравнения (8.4), допуская, что случайная величина х может принадлежать двум соседним распределениям,
описывающим разные классы, т. е. получим \\ и В большинстве случаев, например для функций плотности распределения Гаусса, условие (8.4) приводит к трансцендентному уравнению, которое
может быть решено только численными методами. Для численных методов полезно использовать дополнительное ограничение вида
л
\i е [х — За(х), х + Зо(а:)], г = 1 ,2 ,
где о(х) — среднее квадратическое отклонение для наблюдавшейся случайной величины х.
Вблизи решающих функций (границ раздела) большинство функций распределения хорошо аппроксимируются гиперплоско стями (в К2 — прямыми линиями). Так, для одномерных гауссовых плотностей условие (8.4) примет вид
а2ф) |
|
(; , | M t ) + £ z j i = o, |
i = l 2, |
|||
|
П Л ^г\^г/-г |
|
|
V, |
|
|
где |
|
|
|
|
|
|
ГС \ |
\ |
1 |
/ |
1 |
— |
!• |
K<5i K ) = v s r : ex p i |
г — |
|||||
p j’ j b |
I <■>.) = Рг(Ь I (''г) — |
. |
i = |
1,2, |
P i определяют по результатам всех наблюдений x \ , X 2 , . . . , x n (на пример, путем группировки).
Разложим «теоретическую» функцию плотности Pi(E,i | <*ч) в ряд в окрестности наблюдаемой точки х. Получим уравнение прямой
p  i I 0>i) « |
Piix) ( 1 + |
х |
X) + Pi(x) Х |
Xi. |
|||
Обозначим |
|
|
|
|
|
|
|
Рг(х) ( 1 + |
Х J |
11 х ) |
= au |
Pi(x)Х |
= bi |
||
и получим в окрестности точки х |
уравнение Pi(ti | «>*) — Щ + bîXi- |
||||||
Тогда оценки Ç* найдем из условия |
|
|
|
|
|||
? |
(Pi-ai)bi+ x |
. _ |
Л |
|
|||
У |
у ф |
) + Ъ2оЧх)’ |
г |
’ |
|
||
По значениям £i и Z,2>соответствующим первому и второму рас |
|||||||
пределениям, проводим классификацию (если |
и £2 не попадают |
в зону неопределенности, то требуется еще одно дополнительное наблюдение). В случае, когда обстоятельства не позволяют прове сти дополнительные измерения, принимают решение по наиболее
вероятному значению |
г = 1, 2. |
Рассмотренный в §8.2 и §8.4 алгоритм решения статистиче ской задачи распознавания образов (статистической задачи реше ния) позволяет полностью учесть статистическую природу резуль татов наблюдений как на этапе нахождения условных плотностей распределения вероятностей и разделяющих функций, так и на эта пе классификации по результатам наблюдений вектора признаков.
В задачах распознавания образов для принятия решения, ко гда применяется решающая процедура с фиксированным объемом выборки, используется критерий отношения правдоподобия. Рас смотрим, как изменится этот критерий при учете неопределенности исходной информации.
Согласно традиционному подходу определим отношение прав доподобия между классами tûj и (ùj следующим образом:
pjx\(ùj) |
или In X = In p(s I Ы») |
г # j- |
||
|
||||
P ( x \ U j ) ’ |
pix\<ùjY |
|
||
Тогда, применяя |
байесовское |
решающее |
правило, получим |
|
d* = di, т.е. x~<ùi, |
если ^ |
111111 Ь Х |
^ |
l n ( ^ ^ y ) , i , j = |
= 1, 2, . . . , m , i ï j .
Этот же результат следует из критерия Неймана—Пирсона, со гласно которому при данном числе наблюдений п оптимальное ре шение задачи выбора гипотезы Н\ о том, что х ~ м ь против гипо тезы Я 2 о том, что х ~ о>2, с вероятностью, не меньшей 1 - а, если верна гипотеза Н\, и с вероятностью, не меньшей 1 —р, если верна гипотеза Яг, определяется отношением правдоподобия Хп, имею щим вид
У ТГТ р ( х j I (0|) _ Рп(х |щ )
" “ 1 1 p (ii | <о2) |
p „(x |to 2)' |
г—1 |
|
Здесь а — ошибка первого рода, р — ошибка второго рода.
Этот критерий обеспечивает наименьшую ошибку р (наиболее мощный критерий).
Рассмотрим, как изменятся результаты решения данной задачи при известных оценках плотностей р(х | со i) и р(х | со2):
_ р(х I COj) ± |
A p i |
р(х |COj) ± |
A pj ’ |
ИЛИ |
|
In X = In р(х I (ùi) ± Api |
|
|
|
|||||
|
|
|
|
(8.17) |
||||||
|
|
|
|
р(х |O j) + Apj ' |
|
|
|
|||
В последнем случае (см. (8.7)) решение х |
- (х>г |
имеет |
место, |
|||||||
если |
|
In Р(ч?) |
i , j |
|
|
|
|
|
|
|
In X ^ |
= 1, 2, |
|
гФЗ- |
(8.18) |
||||||
|
|
P(Wi)’ |
|
|
|
|
|
|
|
|
Перепишем (8.17) в следующем виде: |
|
|
|
|
||||||
p(x\u>i)±Api |
|
p(x\u>i) |
Ар{ т |
Apj |
|
|||||
I n A — I n |
-— j |
г—:—г |
|
= Ш — —j |
i |
~—; |
г - |- ” j |
г . |
||
p(x I Wj) ± Apj |
|
p(x|<0i ) |
p(x I Cùi) |
p(x I (ùj) |
||||||
Тогда вместо условия (8.18) имеем |
|
|
|
|
||||||
In |
р(х |(ùi) |
|
ДPi |
т |
A pj |
^ |
P(o)j) |
(8.19) |
||
■ |
I " т |
" j г -|- |
■ | |
" ^ ln |
_. |
. , |
||||
|
p(x\ Uj) |
p(x\(ài) |
p(x\u>j) |
|
P((Oi) |
|
|
Учитывая, что погрешности Api и A pj могут быть разных зна ков, для надежной идентификации образов вместо условия (8.19) следует использовать условие
р(х I (ùj) |
|Api| |
|Ap,i |
> J |
P((ùj) |
p(x|w j) |
p(x |со») |
P(x\<ùj) |
" |
P(0)i)' |
Два последних слагаемых в левой части неравенства опреде ляют нулевую зону (зону неопределенности в принятии решений)
в задачах распознавания образов при фиксированном объеме вы борки.
§8.5. Классификация летательных аппаратов
сучетом погрешностей в измерениях признаков
Рассмотрим задачу классификации объектов по ряду признаков. Объектами распознавания являются различные типы (классы) ле тательных аппаратов (л. а.): тип 1, тип 2 и т. д. Прежположим, что в результате активной радиолокации были получены следующие ра диолокационные характеристики:
1)эффективная площадь рассеяния (ЭПР);
2)спектральные и временные характеристики отраженных от объектов сигналов.
Характеристики были измерены радиолокационной станцией (РЛС) с длиной волны 10 м.
При использовании этих данных были выделены признаки, определяющие л. а. Такими признаками являлись: скорость движе ния объекта v, высота полета Н, частота модуляции отраженного сигнала / т и значения ЭПР, измеренные при различных ракурсах.
Способы вычисления скорости движения и высоты полета л. а. по спектральным и временным характеристикам отраженных от объектов сигналов описаны в [19, 65]. Модуляция отраженного сигнала вызывается вращением турбин или винтов л. а. Частота мо дуляции f m зависит от типа двигателя (винтовой или реактивный) и от количества двигателей.
Эффективная площадь рассеяния является оценкой интенсив ности вторичного излучения л. а. и зависит от диэлектрической и магнитной проницаемости материала, из которого изготовлен л. а., от ракурса, под которым наблюдается л. а., рабочей частоты РЛС, от формы и размеров л. а., от поляризации приемной и передающей антен РЛС [56-58].
Априори известно, что признаки статистически независимы, плотности распределения каждого признака каждого класса соот ветствуют нормальному закону распределения N(\i, а 2) и априор ные вероятности классов равны P(wj) =1/5, j = 1,..., 5, j — число классов.
В табл. 8.2 приведены значения числовых характеристик плот ностей вероятности каждого признака для каждого класса л. а.
Таблица 8.2
Значения числовых характеристик условных плотностей вероятности признаков
Тип |
Скорость |
Высота |
Частота моду |
|||
движения v, |
полета Я , |
ляции fm, |
||||
летательного |
|
м/с |
м |
|
|
кГц |
аппарата |
у |
а |
У |
а |
И |
О |
|
||||||
1 |
800 |
200 |
2000 |
1583 |
9,5 |
1,3 |
2 |
1500 |
366 |
10000 |
1816 |
15 |
1,6 |
3 |
400 |
100 |
500 |
491 |
1,5 |
0,25 |
4 |
200 |
100 |
500 |
250 |
15 |
0,2 |
5 |
550 |
100 |
10000 |
166 |
— |
— |
Зависимости ЭПР от ракурса л. а. при длине волны X = 10 м и горизонтальной поляризации для различных классов л. а. приведе ны на рис. 8.6. Величины ЭПР нормированы относительно значения 10“ 5 м2. Из рис. 8.6 можно сделать следующий вывод: если учесть погрешности измерений, то различные летательные аппараты будут не различимы.
Рис. 8.6. Зависимость ЭПР летательных аппаратов от ракурса при длине волны X = 10 м (номер линии на графике соответствует типу летательного аппарата)
Необходимо было, используя данную информацию, осуществить распознавание конечного числа классов по результатам измерений признаков. Критерием распознавания является вероятность ошиб ки, которая не должна превышать заданной вероятности Р(е)3 = 0,1. Вероятность ошибки Р(е) определяется по следующей формуле [28]:
Р(е) = 1 - 2 f р(х | a)i)P(<Oi)dx,
i=lRi
где Ri — область принятия решений для г-й гипотезы, s — число объ ектов.
Радиолокационные характеристики, как и любые измерения, содержат случайные ошибки. Погрешности радиолокационных из мерений подразделяются на ошибки, вносимые л. а., и ошибки, вносимые аппаратурой. Основные ошибки, вносимые л. а., проис ходят вследствие флуктуации амплитуды сигнала, а также зависят
Отклонение от наблюдаемого значения х н по каждой координате равно /сра(ж): для доверительной вероятности р = 0,683 и для од ной координаты æ„ имеем fcp = 1, для двух координат — fcp = 2, для трех координат — fcp = 3,4, для пяти координат — /ср = 6, или, други ми словами, колебание в одно среднее квадратическое отклонение для одного параметра имеет доверительную вероятность р = 0,683, для двух параметров —р = 0,38, для трех параметров —р = 0,20 и т.д.
Другой пример распознавания образов при наблюдении двух признаков показан на рис. 8.7. В традиционном подходе реше ние принимается по значениям координат (x i,X 2), что приводит к неверному решению. Решение следует принимать по оценкам Ç. Строго говоря, в данном случае решение принято быть не мо жет, поскольку и наблюдаемые значения (х \,Х 2), и оценки £ по пали в область неопределенности принятия решений (нулевую зону).
Рис. 8.7. Распознавание образов с учетом погрешностей наблюдений при знаков при известном с точностью до параметров виде функций условных плотностей вероятности:
..........— без учета погрешностей признаков;------------с учетом погрешностей призна
ков; --------------интервальная оценка решающей функции