Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Горелик, А. Л. Некоторые вопросы построения систем распознавания

.pdf
Скачиваний:
29
Добавлен:
19.10.2023
Размер:
7.4 Mб
Скачать

Рис. 4.2.

ствии С

ф о р м ) 'лой Б а й е с а

;равны

 

Р ( 2 , | * * , = =о; х Ві = 0)

!і о

СО

Р{ 2 , 1

= і ;

* йі — 0)

II О

-*4

 

 

р ( 2 , 1

= о;

a '0j = і)

= 0 ,4 3 ,

я (2 ,1 * а 2 = 1; * „ == і) == 0 ,8 8 ,

Ю

 

 

 

м

І * а , =

0;

 

ю

1 А'в,

= : I;

Р ( 2 2

І ^ а

, =

°;

Р ( 2 а 1 ^ =

1

•*«, -= 0) = 0 ,8 2 ,

=0,3 3 ,

*flI == 0) =

х^ --= 1) = 0 ,57,

: 1 ) == 0 ,1 2 .

3.Составим карту штрафов. Будем полагать, что стоимости

проведения экспериментов равны

С(аі) = С (а2) = 100, а

риски приня­

тия окончательных решений составляют:

 

 

а) без проведения экспериментов

 

 

 

— риски правильных решений

 

 

 

с в,

(z„ -> 2 0

= С йа (z 0 -> Qa) = 100.

 

Выражение вида Cs

(г0 -» 2t)

означает риск принять

окончательное

решение г0 о том, что объект

cog5 2 j

тогда, когда

он в действитель­

ности относится к классу 24, і =

1, ...

, т.

700; Сй (г0 -* 2 0 =

— риски ошибочных решений

Cffi

(z0 -►S2) =

= 600.

Выражение вида Са (г0 -* 2К) означает риск принять окончатель­

ное решение г0 о том, что ш £ 2 г тогда, когда в действительности to относится к классу 2g, q, g = 1, ... , т, q ф g-

б) после проведения экспериментов первой стадии

— риски правильных решений

СВі [*, ( * ft) - 2,1 ==

[г, ( XaJ - 22] = 100;

— риски ошибочных решений

80

в)

после

проведения

экспериментов второй

стадии

 

 

 

— риски правильных решений

 

 

 

 

 

 

 

 

 

 

 

 

 

СЙ1 !** (*«,.

XaJ

-

ß,] =

 

[г, ( Хаі, Х аі)

2г] =

ЮО;

 

— риски ошибочных решений

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

CBl[z,(^fll,^ o,)-*S2,I =

 

500;

 

 

 

 

 

 

 

 

 

 

 

 

 

Ся, Iz2 {X0i, X aJ

-* 2j] =

 

300.

 

 

 

 

 

 

 

Заметим,

что

выражение

вида Csg [z ( Хаft) -* 23]

 

означает,

что

на основании исхода Х аft опыта аЛ

принято

решение,

что

объект

относится к классу 23, в то время

как

в действительности

он

при­

надлежит

классу

2g, g, < 7 = 1 , . . . ,

т;

q ф S-

 

 

 

 

 

 

 

 

4,

 

 

Произведем расчет значений рисков прекращения эксперимен

тов — р°

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а)

Без проведения экспериментов.

 

 

что

объект

относится

Риск

принять

окончательное

решение,

 

к классу Qi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Pmcffi, —

 

(го

ö,) Р (2:) +

СВш(2Г0 — Q.)

(2.) =.

 

 

 

 

 

 

 

 

=

100-0,6 + 600 -0,4 =

300.

 

 

 

 

 

 

 

Риск

принять

окончательное

 

решение,

 

что

 

объект

относится

к классу

Q2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рш^а, ~ С8і (20 —►2j) Р, (2,) +

Cffij (г0

 

2 г) Р (2а) =

 

 

 

 

 

 

 

 

 

=

700-0,6 +

100-0,4 =

460.

 

 

 

 

 

 

 

Таким образом, ро°= 300.

 

 

 

 

 

 

 

 

стадии.

 

 

 

б)

После

проведения

экспериментов первой

 

 

 

После проведения эксперимента ах.

 

 

 

 

 

 

 

 

 

 

 

Если Х аі = 0,

то

риск

принять

окончательное

решение,

что

объект

относится

к первому классу, равен

 

 

 

 

 

 

 

 

 

 

 

 

РшеЙ1 =

СВі \zt (Хаі =

0) -> 2,] Р (2 j!

 

=

0) +

 

 

 

 

 

 

+

 

 

Г*. (*„, = 0) -

2,] Р (2г I

Х'ь =

0) +

 

 

 

 

 

 

+ С (а,) =

100-0,43 +

300-0,57 +

100 =

314,

 

 

 

а риск принять окончательное решение, что объект относится к клас­

су

равен

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P<»s

a, =

CBl [z, ( Xüi =

0) -

2,] P

(QJX^

=

0) +

 

 

 

 

 

+

CSi \zx (Xai = 0) -

2a] P

(Q, I

X ai =

0) +

С (а,) =

 

 

 

 

 

 

=

500-0,43 +

100-0,57+ 100 =

372.

 

 

 

 

 

Таким образом,

риск прекращения

экспериментов

после проведе­

ния опыта а,

с

исходом

Х Пі =

0

равен

р®( Ха =

0)= 314,

Если

Ха 1,

то

риски

принять

окончательные

 

решения,

что

объект

относится к классу

2,

или

2 а соответственно

равны

 

 

 

= 256 и

Рт^я2 =

438, и значит риск прекращения экспериментов после прове­

дения опыта'а, с исходом Х а^ =1

равен р°(А'аі =

1) =-256,

 

 

 

90

Аналогично после

проведения

эксперимента

аг\

если

Х а = 0,

то Р ^ я , ^ 340 и

 

 

 

значит,

р° (A(Ij = 0)

=

320;“

если

х а, = 1> то

 

 

= 240 и P«,e a, =

520,

значит,

р° (А ^ == 1) =

240.

в)

 

после проведения эксприментов второй стадии.

Цепочка экспе

риментов а х, а2.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

При

Х аг =

0;

X aj =

0

рше52і =

464,

р(1,е

„г =

 

372

и

значит

ро ( Хаз= 0 , Х аі = 0) =

372.

 

 

 

 

 

 

 

 

 

 

 

При

 

 

1;

АОі= 0

ршейі =

366;

Рш 6ца

=

 

568

и

значит

Р° (2+_ = 1,

2 ^ =

0) =

366.

 

 

 

 

 

 

 

 

 

 

При AUj =

О;

^ =

1

рш ейі=414;

 

=

472

и

значит

Р»(Аа і = 0 ,

Х Пі =

1) =

414.

 

 

 

 

 

 

 

 

 

 

При Х а%= 1;

Х йі =

1 ршеЯі =

324;

Ршейз=

652

и

значит

р«(А0. =

1,

Х аі =

1) =

324.

 

 

 

 

 

 

 

 

 

 

Цепочка

экспериментов а2ах со

всевозможными

исходами

приво­

дит к следующим значениям:

 

 

 

 

 

 

 

 

 

 

р» ( Хаі =

0, А'Яа =

0) = 372, р° (Х% =

1,

=

0) =

414,

 

Р° ( X ^

=

0,

 

=

1) = 366, p° ( Xai =

1, * öa =

1) =

324.

 

5.

Произведем расчет значений рисков

продолжения эксперимен-

->

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

тов р.

 

Риск продолжения опытов после

эксперимента

а х

с

исходом

а)

 

Х а = 0 равен

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7 (АГЯі = 0) = р ( Х аі = 0, Х ^

= о) Р Хаі =0 (Ха,

= °) +

 

 

 

 

+ Р(2Гаі=0,

Хаг=1)РХаі=0(Ха^ \ ) .

 

 

 

 

 

Вероятности исходов

X ch = 0 и X lh = 1

эксперимента

аг после

проведения опыта

я,,

закончившегося исходом Х а^ =

0, соответствен­

но равны:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рх0і (Ха, = °) =

Ря, (Ха, =

0 I Х^ =

0) Р (Q, I Х 0і = 0)+

 

 

 

+

Ря,

(Ха, = 0 12Гаі = 0) Р (О, I Х йі =

0) =

 

 

 

 

 

 

 

 

=

0,2-0,43 + 0,7 .0,57 =

0,49

 

 

 

 

 

 

 

Р Хаі =0 (*а,

=

И =

Ря,

(Ха, = 1 I Ха,

=

0) Р (0Ж| Х ^

=

0)+

 

 

 

+

Р®, (Ха, = 1 I Х йі =

0) Р (Sj 1Х а^ =

0) =

 

 

 

 

 

 

 

 

=

0,8-0,43 + 0,3-0,57 =

0,51.

 

 

 

 

 

 

 

С учетом того, что в данном случае

р(АГ0і, Х а^ ~

р° (Л ^, А я>)

о(АЯі =

0) = 372-0,49 +

366-0,51 =

369

 

 

 

 

 

 

 

 

 

Аналогично при исходе

Х а^ = 1

 

 

 

 

 

 

 

 

 

 

 

 

7 ( А а>

=

1) =

414-0,34 + 324-0,66 =

355.

 

 

 

 

 

91

 

б) Риск продолжения опытов после

эксперимента

а2

с исходом

Х йі = 0 равен

 

 

 

 

 

 

 

 

 

 

 

~?(Х

= 0 ) = 372-0,51 +414-0,49 = 394

 

 

 

 

При исходе Х а — 1

опыта а2

 

 

 

 

 

 

 

 

 

7 (X

= 1) =

366-0,36 + 324-0,63 = 339.

 

 

 

 

том

в) Риски проведения экспериментов первой стадии

а,

и дг

с уче­

того, что и в данном случае

при любых

исходах экспериментов

д, и аг р ( X

) = р° ( Ха ),

А: = 1,2,

соответственно равны:

 

 

 

 

 

Л

h

 

 

 

 

 

 

 

 

 

7=314 • 0,42+256 • 058= 281, "р= 320 • 0,4 + 240 • 0,6 = 272.

 

 

 

Сравнение величин [>° и р дает основание утверждать следую­

щее.

 

 

 

 

 

 

 

 

 

 

тов,

1. Принимать окончательное решение г0, не проводя эксперимен­

нецелесообразно.

следует провести эксперимент а2. При

 

2. На первой

стадии

любом исходе эксперимента аг (т.

е.

при

АГ0 = 0

или

Х а^ = 1)

дальнейшее

проведение

экспериментов

нерационально.

При

этом,

если Х 0і = 0, то следует принять окончательное решение z 1(X„t =0)->

~>S2,

т-

е- решение о том, что

распознаваемый объект относится к

классу 2 г. Если Х а =

1, то следует принять

окончательное решение

г, (А'

=

1)-*£!,, т.

е. решение

о том, что

распознаваемый объект

относится

к классу I.

 

 

 

4.6.ЧАСТНЫЕ ПОДХОДЫ К ПРИНЯТИЮ РЕШЕНИИ ПРИ РАСПОЗНАВАНИИ

Мы рассмотрели задачу оптимизации процесса рас­ познавания. При этом установили, что общий подход к принятию решения при распознавании объектов со­ стоит в сравнении рисков продолжения и прекращения экспериментов. Эти риски зависят от целого ряда факто­ ров— мы уже о них говорили. Однако далеко не всегда удается определить значения этих факторов, а подчас даже просто выявить всю их совокупность. В этих слу­ чаях приходится пользоватьбя некоторыми частными подходами к принятию решений. На некоторых из них и остановимся.

А. Критерий заданного превышения максимальной вероятности по отношению ко всем остальным. Поло­ жим, в результате проведения опытов определено ѵ признаков объекта и установлены условные апостериор­ ные вероятности отнесения этого объекта к каждому

92

г-му классу Qi, і = \ , . .. , т, т. е. величины

Р(СѴа), где а . ^ Х ^ Х ? , Х2 = Х°2 , X = Х ° ) .

Решение о принадлежности этого объекта к тому или

другому классу в соответствии с рассматриваемым кри­ терием производится на основании соотношения

Р (Qija) ^ ацР (Qj/a),

(4.17)

где ац — некоторые числа для какого-либо

фиксирован­

ного і-го класса при всех

 

При выполнении этого условия принимается гипотеза Ни которая означает утверждение: объект принадле­ жит к классу Qi. Величины ац связаны с вероятностями

ошибочного решения

следующим образом.

Обозначим

через bji вероятность

принять гипотезу Я*.

в то время

как справедлива гипотеза Ну.

 

Ьн = Р(Ні \Нj).

(4.18)

Тогда вероятность щ отклонить гипотезу Яг- в то время,

как она справедлива, будет равна

ТП

 

оц = Р (Н і\Н і) = ' £ І Ьц.

(4.19)

Ш ■

 

Так как в соответствии с принятым критерием веро­ ятность не совершить ошибки при принятии гипотезы Ні должна быть по крайней мере в ац раз больше вероят­

ности совершить ошибку при том же условии о приня­ тии гипотезы Ні, то

 

 

 

 

m

 

 

 

 

1— X ьн

 

 

 

=

 

 

 

(4-20)

Пусть для каждого k-ro класса,

k = \ , . . . ,

m, величины

вероятностей ошибочных решений

bjk, j=/=k, равны меж­

ду собой; bik= b2k=

■■■= b m-ih,

тогда

bjk = cnl(m— l).

Если, кроме того,

положить

аі = а2=

. . . — ат = а , то

ßH = a/(m— 1), І^Я,

js^ni,

где

m — число

классов, для

которых Р( Пі | аѵ) # 0 .

Следовательно,

 

 

а ц ^ ( ш — 1)(1—а)/а,

іфі,

1

 

j ^ m .

93

Положим aij=(m— 1)(1—а)/а. Тогда, если ао — вы­

бранное значение вероятности ошибочного решения, то в соответствии с (4.17) гипотеза /Д принимается, когда неравенство

 

Д2 і К )

( m - l ) ( l —а0)

, „ 01ч

 

 

Pi2j\aJ ^

а„

 

(

'

выполняется для всех ]фі,

j ^ m .

В противном слу­

чае

необходимо учитывать

(ѵ+1)-й признак, так как

при

ѵ-х признаках не обеспечивается

уровень

довери­

тельной вероятности (1—ао). Например, если вероят­ ность ошибки принять равной ао=0,05, то для случая двух гипотез вероятность отнести объект к одному клас­ су должна быть в 19 раз больше вероятности отнести объект к другому классу.

Для трех классов наибольшее значение вероятности

Р (Qi I аѵ) должно быть в 38 раз больше всех

других ве­

роятностей P(Q j|aJ, / ф і ,

т. д.

 

Значение ошибочного

решения ао может

быть вы­

брано из следующих соображений. Пусть при использо­ вании признаков получено г исключающих друг друга гипотез Нj, j = 1, 2 , , г. Обозначим через Cj стоимость ошибки при принятии гипотезы Hj. Предположим так­

же, что при правильном ответе плата не производится. Тогда математическое ожидание платы за одно решение будет равно

г

= £

С р і Р і ,

(4.22)

 

/=1

 

где Pj — вероятности

гипотез Hj, а

ctj — соответствую­

щие вероятности ошибок.

 

 

Обозначим через

Сѵ+1

стоимость

определения (ѵ+

+ 4 ) -го признака, а через Р* — вероятность того, что на

(ѵ+ 1)-м шаге процесс закончится принятием определен­ ного решения (например, однозначного решения) .

Тогда после проведения (v-f- 1)-го*эксперимента сред­ няя плата за ошибки, включая стоимость этого экспери­

мента, выразится С(ѵ+1)—[—(1 — Р*) С. Очевидно,

что если

С(ѵ+І) + (1 - Р * ) с ^ С ,

(4.23)

94

то рационально принять решение на ѵ-й стадии экспери­ ментирования, а при

С(ѵ+І) + (1 - P * ) C < Ü

(4.24)

рационально проводить (ѵ +!1)-й эксперимент. Перепи­

шем предпоследнее неравенство в виде

 

С(ѵ+1>- Р* £ C5aöPj > 0

(4.25)

/=1

г. Тогда мож­

и положим, что ссз = ссо при всех / = 1 , . . . ,

но определить значение а0

 

а0< С (ѵ + 1)/Р * .£ C f , .

(4.26)

/=I

 

Б. Критерий идеального наблюдателя

(критерий Зи-

герта — Котельникова). В том случае, когда мы лишены возможности определить числа в соответствии с рас­ смотренным выше методом, решение о принадлежности объекта к тому или другому классу может быть приня­ то на основе критерия идеального наблюдателя, исполь­ зование которого обеспечивает минимум ошибочных ре­ шений.

Пусть все множество объектов подразделено на два класса fii и ß2 и априорные вероятности появления объ­ ектов этих классов равны P(Qt) и Р(Й2) соответственно.

Пусть, кроме

того, стоимости правильных решений

Сц = С22=0,

а

стоимости ошибочных решений равны

между собой,

т. е. С12 = С21.

Критическое (пороговое) значение отношения или коэффициента правдоподобия в этом случае равно отно­

шению априорных вероятностей

 

X o=P(fli)/P(ß2).

(4.27)

Пусть в результате эксперимента установлено, что зна­

чение признака у распознаваемого объекта

равно Х°.

Тогда коэффициент правдоподобия равен

 

K(X = X°)=f2(X°)IU(X°).

(4.28)

В соответствии с критерием идеального наблюдателя объект относится к классу Qi, если А,(Х°)<Хо и к классу

Qg> если Я(Х°)>Яо,

95

Если установлено значение Хо, при котором имеет

место равенство

P(Ql)h(Xo)=P(Qz)f2(Xo), (4.29)

то в соответствии с рассматриваемым критерием объект относится к классу Йі, когда измеренное значение при­ знака этого объекта А°<А0, и к классу й 2, когда А0>АоКритерий идеального наблюдателя совпадает с кри­ терием максимума апостериорной вероятности. В самом деле, в соответствии с критерием максимума апостери­ орной вероятности решение о принадлежности объекта к классу Q,., г 1, .. . , т, принимается тогда, когда

апостериорная вероятность отнесения объекта к этому классу больше, чем апостериорная вероятность отнесе­ ния его ко всем остальным классам:

если

Р (QrI Х°) =

max Р (Йг-| Х°), г =

1,..., т.

Апостериорные вероятности

того, что объект

относится

к классам йі и Й2, равны соответственно:

 

П /П 1Ѵ»\ --

Р (йі) /і (А0)

(4.30)

1

11

j " P (2.) h [X°)+IP (Ö.) h {X')

 

p (Q i vo\_

E1(S 2) f 2 (yY°)

(4.31)

12

Л '

P (2.) h (*°)+ P (2,) f2 (X'oy

 

Объект относится к классу Qi, если

 

 

P(Ql \X°)>P(Q2\X°),

(4.32)

и к классу й 2,

если Р (й 2|А0) > Р (й і| А0).

 

Граница соответствует равенству

 

 

Р(Й1|А0)=Я(Й2|А°)

(4.33)

или с учетом (4.30)

и (4.31)

равенству

 

f2(X°)lfi (X°)=P(Ql)/P(Q2)=X0.

(4.34)

Таким образом, применение критерия максимума апостериорной вероятности предусматривает в качестве порога критическое значение коэффициента правдопо­ добия.

В. Критерий заданного превышения максимальной апостериорной вероятности над суммарной апостериор­ ной вероятностью всех остальных гипотез. Пусть в ре­ зультате проведения экспериментов установлены значе96

ния п ризн ак ов

рас п о зн ав ае м о го о б ъек та

Х і = Х і °,

X N = X N° и пусть,

кром е того,

 

Р (Qr I X ?, ..., Х°ы ) = шах Р (й,- [ X ?,

X°N).

Всоответствии с рассматриваемым критерием решение

опринадлежности распознаваемого объекта к классу

Qr, r=l,

, m,

принимается в том случае, если

 

 

Ш—I

 

m i *

? ......

a d --., s m i а ; ........

и -35)

І = 1

ІфГ

Применение подобного критерия оправдано в тех слу­ чаях, когда решение о принадлежности распознаваемо­ го объекта к Пг-му классу сопряжено со значительным риском.

Д. Принятие решений при неполных данных. В ряде практически важных случаев не представляется возмож­ ным измерить всю совокупность признаков, использо­ ванных для описания объектов различных классов. По­ добная ситуация может иметь место вследствие самых разнообразных причин. Например, у врача может не оказаться под рукой той или другой аппаратуры, необ­ ходимой для определения соответствующих симптомов заболевания, геолог в полевых условиях, как правило, лишен возможности произвести подробные исследования физических и химических свойств исследуемых материа­ лов и т. д. Более того, мы уже говорили о том, что в самом общем случае планирования работы систем распознавания решение на проведение очередной серии экспериментов или о прекращении экспериментирования производится именно при неполных данных, т. е. когда известна лишь часть признаков, характеризующих распо­ знаваемый объект. Во всех подобных ситуациях возни­ кает задача нахождения оптимального решающего пра­ вила, обеспечивающего решение задачи распознавания

сминимальной ошибкой. Подобное правило может быть

вряде случаев построено на основе определения макси­

мального неполного коэффициента подобия. Рассмотрим основные методы решения задачи.

I. Пусть N — общее число признаков, характеризую­ щих объект со, а k ■— число признаков этого объекта,

определить которые не удалось. Итак, задан объект зна-

7—452

9 7

чениями своих признаков

V

,

) -■X

О

А

Л

 

- д ,А _а

,

 

 

 

 

 

 

N —k '

 

Тогда для определения принадлежности этого объек­ та к одному из двух классов можно воспользоваться следующим решающим правилом:

öjgr&j, если

P{Q,\X\,...,X*N_k)

(4.36)

 

Р<Р*\Х\..... X°N_k) ^

Здесь P(Qj|X“

— условные апостериорные ве­

роятности отнесения объекта к классу Q,{.

В соответствии с байесовым правилом

Р(9.,\Х\,..., X V ,)

P(ßi)h{X\ ......X \ _ k)

т

S

/>(0М*Ѵ •••• *W >

t=1

Р (Q21X0,, X V ,) =

...... (4.37)

2 P ( i ) f t ( X \ . . . . . X ^ ) i=l

где P(Qj), г'=1, 2,— априорные вероятности появления объектов соответствующих классов. И значит, решаю­ щее правило можно записать в следующем виде:

ce(=Q,, если

<в £ Q,, если

fЛ Х %

.....

x ° N_k) ^ p ^ ) ’

 

M * °......

 

 

fi(x% .....

* V -,)

(4.38)

U (X\,

....

^ ( 2 , ) '

 

Заметим, что левая часть неравенства представляет собой не что иное, как неполный коэффициент правдо­ подобия X(Х°і, ..., Х°іѵ_,). Применение приведенного пра­

вила является вынужденным, хотя оно может быть весь­ ма отличным от оптимального.

II. Второй метод может быть использован в тех слу­ чаях, когда удается определить наиболее вероятные зна­ чения отсутствующих признаков XN- h+i, . . . , XN, кото­ рые обозначим через Х*л--ь+і,. . . , X*N.

Пусть в результате проведения экспериментов уста­ новлены значения следующих признаков распознаваемого

98

Соседние файлы в папке книги из ГПНТБ