Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Математические методы принятия решений

..pdf
Скачиваний:
3
Добавлен:
13.11.2023
Размер:
22.94 Mб
Скачать

ния от начального приближения к решению при условии, что в точ­ ке регуляризованного решения значения первых производных функ­ ционала малы по сравнению со значениями вторых производных.

§ 8.4. Классификация образов по измеренному с ошибкой вектору признаков

Рассмотрим процедуру распознавания образов — второй этап задачи классификации. Пусть нам известны все характеристики

наблюдавшихся

случайных величин х\, Х2,--- ,х п, по которым

на

первом этапе нашли вид

функции

распределения Р(£, 0 1Oj),

j =

1, 2, . . . , т,

эмпирические

значения

плотностей

вероятностей

Pi(K | Wj), i = 1, 2, . . . , п, точечную и интервальную

оценки разде­

ляющей функции Ф(£, 0)|ç=a;. Требуется провести измерение слу­ чайной величины (вектора признаков) х, по которой должен быть классифицирован объект cij е П. Считаем, что интервальная оценка для случайной величины х известна.

Прежде всего отметим, что с определением интервальной оцен­ ки разделяющей функции появляется нулевая зона — зона неопреде­ ленности. Если наблюдавшееся значение х (а точнее, ее «истинное значение» <;) попадает в эту зону, то требуется, строго говоря, сле­ дующее дополнительное наблюдение вектора признаков. Получив наблюдение х, необходимо посмотреть, не пересекается ли допу­ стимый интервал значений случайной величины х с интервальной оценкой разделяющей функции. Если пересечения нет, применяет­ ся традиционный метод. В противном случае надо предваритель­ но найти «истинное значение» наблюдавшегося признака £. Одна­ ко по единственному измерению х нельзя найти соответствующие оценки признака Ç. Поэтому необходимо результаты наблюдений х присовокупить к имеющимся результатам наблюдений, получен­ ным в процессе обучения системы распознавания, т. е. к данным, характеризующим каждый объект от, 6 Q.

Оценку £ получим из уравнения (8.4), допуская, что случайная величина х может принадлежать двум соседним распределениям,

описывающим разные классы, т. е. получим \\ и В большинстве случаев, например для функций плотности распределения Гаусса, условие (8.4) приводит к трансцендентному уравнению, которое

может быть решено только численными методами. Для численных методов полезно использовать дополнительное ограничение вида

л

\i е За(х), х + Зо(а:)], г = 1 ,2 ,

где о(х) — среднее квадратическое отклонение для наблюдавшейся случайной величины х.

Вблизи решающих функций (границ раздела) большинство функций распределения хорошо аппроксимируются гиперплоско­ стями (в К2 — прямыми линиями). Так, для одномерных гауссовых плотностей условие (8.4) примет вид

а2ф)

 

(; , | M t ) + £ z j i = o,

i = l 2,

 

П Л ^г\^г/-г

 

 

V,

 

где

 

 

 

 

 

 

ГС \

\

1

/

1

!•

K<5i K ) = v s r : ex p i

г —

p j’ j b

I <■>.) = Рг(Ь I (''г) —

.

i =

1,2,

P i определяют по результатам всех наблюдений x \ , X 2 , . . . , x n (на­ пример, путем группировки).

Разложим «теоретическую» функцию плотности Pi(E,i | <*ч) в ряд в окрестности наблюдаемой точки х. Получим уравнение прямой

p  i I 0>i) «

Piix) ( 1 +

х

X) + Pi(x) Х

Xi.

Обозначим

 

 

 

 

 

 

 

Рг(х) ( 1 +

Х J

11 х )

= au

Pi(x)Х

= bi

и получим в окрестности точки х

уравнение Pi(ti | «>*) — Щ + bîXi-

Тогда оценки Ç* найдем из условия

 

 

 

 

?

(Pi-ai)bi+ x

. _

Л

 

У

у ф

) + Ъ2оЧх)’

г

 

По значениям £i и Z,2>соответствующим первому и второму рас­

пределениям, проводим классификацию (если

и £2 не попадают

в зону неопределенности, то требуется еще одно дополнительное наблюдение). В случае, когда обстоятельства не позволяют прове­ сти дополнительные измерения, принимают решение по наиболее

вероятному значению

г = 1, 2.

Рассмотренный в §8.2 и §8.4 алгоритм решения статистиче­ ской задачи распознавания образов (статистической задачи реше­ ния) позволяет полностью учесть статистическую природу резуль­ татов наблюдений как на этапе нахождения условных плотностей распределения вероятностей и разделяющих функций, так и на эта­ пе классификации по результатам наблюдений вектора признаков.

В задачах распознавания образов для принятия решения, ко­ гда применяется решающая процедура с фиксированным объемом выборки, используется критерий отношения правдоподобия. Рас­ смотрим, как изменится этот критерий при учете неопределенности исходной информации.

Согласно традиционному подходу определим отношение прав­ доподобия между классами tûj и (ùj следующим образом:

pjx\(ùj)

или In X = In p(s I Ы»)

г # j-

 

P ( x \ U j ) ’

pix\<ùjY

 

Тогда, применяя

байесовское

решающее

правило, получим

d* = di, т.е. x~<ùi,

если ^

111111 Ь Х

^

l n ( ^ ^ y ) , i , j =

= 1, 2, . . . , m , i ï j .

Этот же результат следует из критерия Неймана—Пирсона, со­ гласно которому при данном числе наблюдений п оптимальное ре­ шение задачи выбора гипотезы Н\ о том, что х ~ м ь против гипо­ тезы Я 2 о том, что х ~ о>2, с вероятностью, не меньшей 1 - а, если верна гипотеза Н\, и с вероятностью, не меньшей 1 —р, если верна гипотеза Яг, определяется отношением правдоподобия Хп, имею­ щим вид

У ТГТ р ( х j I (0|) _ Рп(х |щ )

" “ 1 1 p (ii | <о2)

p „(x |to 2)'

г—1

 

Здесь а — ошибка первого рода, р — ошибка второго рода.

Этот критерий обеспечивает наименьшую ошибку р (наиболее мощный критерий).

Рассмотрим, как изменятся результаты решения данной задачи при известных оценках плотностей р(х | со i) и р(х | со2):

_ р(х I COj) ±

A p i

р(х |COj) ±

A pj

ИЛИ

 

In X = In р(х I (ùi) ± Api

 

 

 

 

 

 

 

(8.17)

 

 

 

 

р(х |O j) + Apj '

 

 

 

В последнем случае (см. (8.7)) решение х

- (х>г

имеет

место,

если

 

In Р(ч?)

i , j

 

 

 

 

 

 

In X ^

= 1, 2,

 

гФЗ-

(8.18)

 

 

P(Wi)’

 

 

 

 

 

 

 

Перепишем (8.17) в следующем виде:

 

 

 

 

p(x\u>i)±Api

 

p(x\u>i)

Ар{ т

Apj

 

I n A — I n

-— j

г:г

 

= Ш j

i

~;

г - |- ” j

г .

p(x I Wj) ± Apj

 

p(x|<0i )

p(x I Cùi)

p(x I (ùj)

Тогда вместо условия (8.18) имеем

 

 

 

 

In

р(х |(ùi)

 

ДPi

т

A pj

^

P(o)j)

(8.19)

I " т

" j г -|-

■ |

" ^ ln

_.

. ,

 

p(x\ Uj)

p(x\(ài)

p(x\u>j)

 

P((Oi)

 

 

Учитывая, что погрешности Api и A pj могут быть разных зна­ ков, для надежной идентификации образов вместо условия (8.19) следует использовать условие

р(х I (ùj)

|Api|

|Ap,i

> J

P((ùj)

p(x|w j)

p(x |со»)

P(x\<ùj)

"

P(0)i)'

Два последних слагаемых в левой части неравенства опреде­ ляют нулевую зону (зону неопределенности в принятии решений)

в задачах распознавания образов при фиксированном объеме вы­ борки.

§8.5. Классификация летательных аппаратов

сучетом погрешностей в измерениях признаков

Рассмотрим задачу классификации объектов по ряду признаков. Объектами распознавания являются различные типы (классы) ле­ тательных аппаратов (л. а.): тип 1, тип 2 и т. д. Прежположим, что в результате активной радиолокации были получены следующие ра­ диолокационные характеристики:

1)эффективная площадь рассеяния (ЭПР);

2)спектральные и временные характеристики отраженных от объектов сигналов.

Характеристики были измерены радиолокационной станцией (РЛС) с длиной волны 10 м.

При использовании этих данных были выделены признаки, определяющие л. а. Такими признаками являлись: скорость движе­ ния объекта v, высота полета Н, частота модуляции отраженного сигнала / т и значения ЭПР, измеренные при различных ракурсах.

Способы вычисления скорости движения и высоты полета л. а. по спектральным и временным характеристикам отраженных от объектов сигналов описаны в [19, 65]. Модуляция отраженного сигнала вызывается вращением турбин или винтов л. а. Частота мо­ дуляции f m зависит от типа двигателя (винтовой или реактивный) и от количества двигателей.

Эффективная площадь рассеяния является оценкой интенсив­ ности вторичного излучения л. а. и зависит от диэлектрической и магнитной проницаемости материала, из которого изготовлен л. а., от ракурса, под которым наблюдается л. а., рабочей частоты РЛС, от формы и размеров л. а., от поляризации приемной и передающей антен РЛС [56-58].

Априори известно, что признаки статистически независимы, плотности распределения каждого признака каждого класса соот­ ветствуют нормальному закону распределения N(\i, а 2) и априор­ ные вероятности классов равны P(wj) =1/5, j = 1,..., 5, j — число классов.

В табл. 8.2 приведены значения числовых характеристик плот­ ностей вероятности каждого признака для каждого класса л. а.

Таблица 8.2

Значения числовых характеристик условных плотностей вероятности признаков

Тип

Скорость

Высота

Частота моду­

движения v,

полета Я ,

ляции fm,

летательного

 

м/с

м

 

 

кГц

аппарата

у

а

У

а

И

О

 

1

800

200

2000

1583

9,5

1,3

2

1500

366

10000

1816

15

1,6

3

400

100

500

491

1,5

0,25

4

200

100

500

250

15

0,2

5

550

100

10000

166

Зависимости ЭПР от ракурса л. а. при длине волны X = 10 м и горизонтальной поляризации для различных классов л. а. приведе­ ны на рис. 8.6. Величины ЭПР нормированы относительно значения 10“ 5 м2. Из рис. 8.6 можно сделать следующий вывод: если учесть погрешности измерений, то различные летательные аппараты будут не различимы.

Рис. 8.6. Зависимость ЭПР летательных аппаратов от ракурса при длине волны X = 10 м (номер линии на графике соответствует типу летательного аппарата)

Необходимо было, используя данную информацию, осуществить распознавание конечного числа классов по результатам измерений признаков. Критерием распознавания является вероятность ошиб­ ки, которая не должна превышать заданной вероятности Р(е)3 = 0,1. Вероятность ошибки Р(е) определяется по следующей формуле [28]:

Р(е) = 1 - 2 f р(х | a)i)P(<Oi)dx,

i=lRi

где Ri — область принятия решений для г-й гипотезы, s — число объ­ ектов.

Радиолокационные характеристики, как и любые измерения, содержат случайные ошибки. Погрешности радиолокационных из­ мерений подразделяются на ошибки, вносимые л. а., и ошибки, вносимые аппаратурой. Основные ошибки, вносимые л. а., проис­ ходят вследствие флуктуации амплитуды сигнала, а также зависят

от состояния окружающей среды. Из числа ошибок, вносимых ап­ паратурой, наибольшее значение имеют ошибки, появляющиеся вследствие собственных шумов приемного устройства. Если зада­ ны параметры РЛС, а также характеристики л. а. и окружающей среды, уровень ошибки распознавания для определенной точки пространства обзора РЛС может быть рассчитан как средняя квад­ ратическая сумма всех отдельных составляющих, вычисленных для этой точки. Однако нас интересует определение ошибок во всей зоне обзора РЛС. Для упрощения вычислений в работах [19, 65] предложена методика расчета оптимальной точности, при кото­

рой

суммарная ошибка

не зависит от погрешностей, вносимых

л. а.,

а оценивается по

проектным данным или данным испыта­

ний РЛС.

 

В данной задаче ошибки измерения по каждому признаку опре­ делялись ошибками, вносимыми РЛС, и для таких признаков, как скорость движения, высота полета и частота модуляции, средние квадратические погрешности соответствуют следующим значени­ ям: о(и) = 100 м/с, о(Н) = 250 м, а (/то) = 0,2 кГц. Предполагалось, что средняя квадратическая погрешность измерения ЭПР состав­ ляет 10 дБ и одинакова при всех ракурсах; точность определения ракурса составляет 10°

С учетом погрешностей признаков числовые характеристики условных плотностей вероятности изменяются (табл. 8.3). В табл. 8.3 приводятся также средние квадратические отклонения числовых характеристик условных плотностей распределения вероятностей, с помощью которых легко вычислить интервальные оценки функ­ ций условных плотностей распределения вероятностей в интересу­ ющих нас областях.

Анализируя рис. 8.6, получаем, что наилучшим образом клас­ сы л. а. по ЭПР разделяются при ракурсах 30°, 60°, 120° Возьмем в качестве признаков эти значения ракурсов (табл. 8.4).

Для вычисления вероятности ошибки воспользуемся методом, предложенным в [14, 17-19].

При большой размерности пространства признаков непосред­ ственное интегрирование значительно усложняется, поскольку усложняется выбор пределов интегрирования. Так, например, для получения вероятности ошибки и ее интервальных оценок при

15 — 4077

Таблица 8.3

Значения числовых характеристик и их средних квадратических отклонений с учетом погрешности наблюдений

Тип

 

Скорость

 

 

Высота

 

 

Частота

 

движения V,

 

 

полета Я ,

 

модуляции fm,

летательного

 

м/с

 

 

 

м

 

 

кГц

 

аппарата

 

 

 

 

 

 

 

и

Д И О Д а

и

Д р а

Д а

и Д р а

Д а

 

1

720

70

230

40

2150

205

1630

250

10,2

0,9

1,25

0,21

2

1610

120

340

65

9100

850

1750

280

13,5

1,2

1,7

0,3

3

420

30

105

20

465

37

410

95

1,6

0,1

0,24

0,04

4

190

20

97

21

515

46

270

52

15,5

1,4

0,18

0,02

5

510

55

112

22

1080 980

156

29

Таблица 8.4

Значения числовых характеристик условной функции плотности ЭПР для каждого класса л. а.

Тип летательного

ф =

30°

ср =

60°

II

 

 

 

 

 

аппарата

и

О

и

О

и

1

73

10

74

10

64

2

71

10

55

10

71

3

62

10

63

10

43

4

47

10

61

10

63

5

53

10

60

10

61

К) оо

О

10

10

10

10

10

использовании n -признаков необходимо вычислять n -мерные ин­ тегралы

Р(е) = / -

р(х | <Dj)P(<ùj) dx i ... dxn,

где Rj — область пространства Rn, которая характеризует образ <ùj. Таким образом, непосредственное вычисление вероятности ошибки (в. о.) описанным способом вызывает значительные затруд­

нения.

В работе [14] рассмотрен метод вычисления вероятности ошиб­ ки распознавания классов, использующий каждый признак в от­ дельности. Формула вычисления в. о. для данного метода име­

ет вид

Т

Р(е) = ^[Р (ж О - max P(oj)p(Xi \ (ùj)],

(8.20)

i=1

 

s

T коли-

где P (x j) = 2 P((x>j)p(xi | (ùj), s — общее число классов;

j = 1

чество реализаций, T = R N, R число значений признаков, N — общее число признаков.

В случае, когда функции плотности соответствуют многомер­ ному нормальному распределению, использование формулы (8.20) дает возможность перейти к серии одномерных нормальных распре­ делений и использовать для них линеаризующее преобразование.

Границы интервальной оценки вероятности ошибки в данном случае будут определяться по следующим формулам:

т

Рн(е) = 2 [Рн(я-г) - max P(^j)pH(Xi I (ùj)] =

Ci)

2=1

P(o)j)pH(Zî | tûj) - max P((ùj)pH(xi | (ÙJ)

Гr s

PB(e) X J 2 p(uj)Pb(xi I Wj) - max P((ùj)pB(xi I (ùj) . i=\ Lj= l

Использование в рассматриваемом случае одного любого при­ знака дает в. о. больше заданной Р3(е) = 0,1. Например, в. о. при ис­ пользовании одного признака — скорости — составляет P i(е) = 0,252, Р,(е) > Р,(е).

Как указывалось ранее, в процедуре идентификации объек­ тов при известных точечных и интервальных оценках функции плотности распределения вероятностей по^наблюдаемому вектору признаков х н следует определить оценки и величину эллипти­ ческой (гиперэллипсоидной) области, которая покрывает истинное значение с доверительной вероятностью (3. Эта область резко уве­ личивается с возрастанием числа координат вектора признаков £н-

15*

Отклонение от наблюдаемого значения х н по каждой координате равно /сра(ж): для доверительной вероятности р = 0,683 и для од­ ной координаты æ„ имеем fcp = 1, для двух координат — fcp = 2, для трех координат — fcp = 3,4, для пяти координат — /ср = 6, или, други­ ми словами, колебание в одно среднее квадратическое отклонение для одного параметра имеет доверительную вероятность р = 0,683, для двух параметров —р = 0,38, для трех параметров —р = 0,20 и т.д.

Другой пример распознавания образов при наблюдении двух признаков показан на рис. 8.7. В традиционном подходе реше­ ние принимается по значениям координат (x i,X 2), что приводит к неверному решению. Решение следует принимать по оценкам Ç. Строго говоря, в данном случае решение принято быть не мо­ жет, поскольку и наблюдаемые значения (х \,Х 2), и оценки £ по­ пали в область неопределенности принятия решений (нулевую зону).

Рис. 8.7. Распознавание образов с учетом погрешностей наблюдений при­ знаков при известном с точностью до параметров виде функций условных плотностей вероятности:

..........— без учета погрешностей признаков;------------с учетом погрешностей призна­

ков; --------------интервальная оценка решающей функции

Соседние файлы в папке книги