Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Горелик, А. Л. Некоторые вопросы построения систем распознавания

.pdf
Скачиваний:
37
Добавлен:
19.10.2023
Размер:
7.4 Mб
Скачать

(4.4), иначе обеспечивает минимизацию математическо­ го ожидания расходов, связанных с реализацией процес­ са распознавания.

4.3.ОБЩЕЕ ПРЕДСТАВЛЕНИЕ АЛГОРИТМА ПРОЦЕССА РАСПОЗНАВАНИЯ

Рассмотренные понятия и определения позволяют сформулировать алгоритм процесса распознавания в ви­ де правила последовательного поиска решений, обеспе­ чивающего разработку оптимального плана проведения экспериментов. Смысл подобного алгоритма состоит в том, что он на основе предыстории экспериментирова­ ния, на основе информации, полученной в результате предыдущих экспериментов, определяет оптимальный план дальнейшего проведения экспериментов, определя­ ет все последующие стадии экспериментов, т. е. опреде­ ляет на каждом шаге, какие очередные технические средства должны быть использованы и какие признаки объекта с помощью этих средств должны быть выявлены.

Общая запись алгоритма, обеспечивающего последо­ вательное планирование экспериментов, может быть представлена в следующем виде:

R — I2"’

а‘ ’

ö2 (^a,),

(X,h’ ^ a), •••’

ak{Xat,...,

Xa^ ) , zu(Xai,..., Xa )},

(4.5)

г д е а ^ Л ^ ;

a2(Xa ) ^ А г (Хщ) , ...,

ak (Xih, ....

X a^ ) 6E

£zA^(Xa, ...,

Xa

) свидетельствует

о том, что алгоритм

строится с учетом системы ограничений Г.

Наличие в алгоритме zo означает, что окончательное

решение о том, что объект принадлежит к одному из классов Оі, принимается без проведения экспериментов. В этом случае все операции, обозначаемые в алгоритме аі, ..., ßft и Zi, ..., zu, отсутствуют. Если в алгоритме го

отсутствует, то тогда назначается проведение эксперимен­ тов первой стадии щ. Если на основе признаков объек­ та, определенных по информации экспериментов первой стадии, принимается окончательное решение о его при­ надлежности к какому-то классу — Zi(Xai), то опять все

операции,

обозначаемые в алгоритме а%........щ и го,

22, • • -, 2ft,

ОТСУТСТВУЮТ.

79

Наличие в алгоритме R члена ak (Xa,..., X

) озна-

1

я - I

чает, что на основе изучения признаков распознаваемого

объекта, полученных в результате

исходов

эксперимен­

тов Хаі, ..., Ха

, принято решение

о проведении экспе­

риментов k-й стадии сіи

состоящих в

использова­

нии у технических средств для определения

/

признаков

объекта.

 

 

 

 

 

Если в алгоритме R присутствует член zh(Ха,..., X а )£=

€=Zi,

то это

означает, что

после

получения

исходов

Ха, .

Х а экспериментов а , ,

... , ак, проведенных согласно

правилу R, принимается окончательное решение, что

распознаваемый объект относится к определенному клас­ су, и дальнейшие эксперименты не проводятся.

Порядок планирования экспериментов в соответствии с алгоритмом (4.5) схематически изображен на рис. 4.1.

Р и с . 4.1.

80

Из рассмотрения схемы следует, что алгоритм рабо­ тает следующим образом. Пусть па вход системы рас­ познавания поступил объект со и для определения его признака решено провести эксперимент щ (из каких со­ ображений принимается подобное решение будет пока­ зано ниже).

Положим, возможные исходы эксперимента а1Х'а

и X" . Эти исходы анализируются в блоке анализа ре­ зультатов экспериментов. При этом, если исход X " 0f

то, к примеру, принимается окончательное решение гДХ" ), а если — X' , то принимается решение провести новый эксперимент а2(Х' ). Пусть его возможные исходы X' X" и X '" . Анализ этих исходов может привести, на­

пример, к таким решениям: если исходы X' П2 или

X'" (-2*

то следует

принять окончательные решения z2 (X'

, X' )

ш и г 2(Х’щ,

X'" ), а если Х " а, то

необходимо провести

эксперимент а3(Х’щ, X" ). Исходы

этого

эксперимента

Х'аз и Х ”аз вновь

анализируются,

и разрабатывается

план дальнейшего развития экспериментов.

 

 

Легко увидеть,

что алгоритм работает

как система

с обратной связью. Действительно, всякий раз результа­ ты эксперимента используются для корректировки пла­ на проведения последующих экспериментов.

4.4.АЛГОРИТМ ОПРЕДЕЛЕНИЯ ОПТИМАЛЬНОГО ПЛАНА R

Уравнение (4.5) фактически определяет множество всевозможных последовательных правил поиска реше­ ний. В этом множестве нужно определить одно правило, являющееся оптимальным с точки зрения минимизации затрат на проведение процесса распознавания.

Для отыскания этого правила введем в рассмотрение

так называемую

„карту штрафов“ — С (X 1

Хаft ;

z),

согласованную с

системой ограничений Г. Величин?

Cw(Xa,..., Ха \ г)

означает штраф, уплачиваемый

в

том

случае, когда подвергается распознаванию объект ю, для определения его признаков проведены эксперименты а,,

6—452

81

öik с исходами X , Ха и принято окончательной

решение z. Как правило, имеет место такая ситуация,

когда расходы на проведение экспериментов с помощью технических средств Т суммируются и не зависят от

объектов со и конкретных исходов экспериментов Ха .

В этом случае

•••» ^ \ 2) = (Д ( аі) + Сш(а2) +

+

4~ с т (аь) + Qi-

(4-6)

Здесь Qi — убыток от принятия окончательного решения,

связанного с отнесением распознаваемого объекта со к классу £2;.

Для каждого объекта со и выбранногоДюследовательного правила R величина среднего убытка ÜW{R) равна

математическому ожиданию от величины Сш:

Ош(^) = М[Сш(Хаі...... X ; z(Xa , ..., X )], (4.7)

где математическое ожидание подсчитывается в соот­

ветствии с распределением Р ^(Х а /Х а,

Х а ) ,

кото­

рое определяет вероятность исхода Х а

1

опыта а ц + i при

условии, что проведенные эксперименты

а19...9 а& дали

исходы Х а>,

Х а по всем возможным

цепочкам

разви­

тия эксперимента до принятия окончательного решения в алгоритме R. Величина среднего убытка, вычисляемая по возможным цепочкам исходов алгоритма R, оканчи­ вающимся принятием окончательного решения z, может

быть определена иначе на основании следующего вы­ ражения:

0 . ( R

) = E c . [ Х л ......х Лі;

 

 

 

п

 

 

Zh(Xai, .... X ^ lP ^ a , , . . . , ak),

 

(4.8)

где Pa (а,,,.., aft) — вероятность реализации

именно

дан­

ной цепочки развития эксперимента может

быть выра­

жена с помощью

распределения Pfi (Ха | Х0і, ...,

Ха )

82

следующим образом:

Р й . ( Х а . ’ - ’ х а )

P S i (X ah \ X at> - ’ Х ак _ ) У

(4.9)

В выражении (4.8) п — число всевозможных цепочек

развития экспериментов. Поскольку алгоритм (4.5) дол­ жен носить массовый характер и заранее неизвестно, какого класса объект будет подвергаться распознава­ нию в каждой из конкретных ситуаций, величину убыт­

ка Um (R) следует усреднить с помощью априорной ве­

роятности появления объектов соответствующих классов Р(Пі) и каждый алгоритм характеризовать величиной

(4.4)

т

£МЯ) = Е ÜJR)P(Qt),

;=1

где Up(R) — функция убытка (функция риска).

Теперь появляется возможность, подобно тому как это осуществляется в теории последовательных стати­ стических решений, методологические вопросы выбора приемлемого правила поиска последовательных решений рассматривать как игру двух сторон с функцией убытка Up(R). В качестве одной стороны выступает наш «веро­

ятный противник», чистыми стратегиями которого явля­ ются все объекты со из Qt-, в качестве второй стороны — система распознавания, чистыми стратегиями которой является совокупность последовательных правил R из Rr . Это, в свою очередь, позволяет рассматривать во­

просы существования чистых минимаксных стратегий, смешанных минимаксных стратегий и байесовых страте­ гий. Следует отметить, что класс байесовых страте­ гий оказывается в некотором смысле полным, т. е. для любой небайесовой стратегии найдется лучшая (или, во всяком случае, не худшая) байесова стратегия. Исходя из этого, в дальнейшем будем придерживаться именно байесова подхода к решению задачи.

Оптимальным байесовым последовательным прави­ лом назовем такой алгоритм R, который минимизирует

Up(R). Это означает, что UV(R) ^ U P(R) для всех воз­ можных алгоритмов R e Rr. При реализации системы

6*

83

распознавания целесообразно использовать оптимальные байесовые алгоритмы. Принципиальная возможность построения таких алгоритмов, рассчитанных заранее до начала функционирования системы распознавания, опре­ деляется рекуррентными уравнениями для так называе­ мых функций риска [12].

Введем в рассмотрение следующие три определения.

Определение 1. Риском прекращения эксперимен­

тов после цепочки исходов X

. ..., Хп назовем величину

рЧХ*,...... X ) = , п і п 2 С . ( Х аі...... X

; z) X

ft

zgrZ

 

ft

X P ( ß i \Xa, -

’ Xa ).

(4.10)

Здесь P(Qi!Xaг,...,

X aк) — апостериорное

распределение

вероятностей объектов, которое вычисляется с помощью формулы Байеса по априорной вероятности появления объектов данного класса Р(£2і) и априорным вероятно­

стям вида

Частным случаем риска прекращения экспериментов

после цепочки исходов (Ха ,..., Ха ) является риск при­

нятия окончательного решения без проведения экспери­ ментов р°, который равен

Р° = min £ Сш(г) Р і). Z^ z 9.г

Определение 2. Риском продолжения эксперимен­

тов после цепочки исходов Х„,..., X назовем величину

а,

Р(*

X ) = infUp

[*(Ха

* )]• (4-П)

Здесь inf берется по всевозможным последовательным правилам R (X a,..., Ха ), которые в соответствии с си-

стемой ограничений Г

можно последовательно

построить

с помощью экспериментов, принадлежащих

соответст­

венно Ak+ l (Xa ,..., X

); Ak+,(X

,..., Ха ),... стадиям.

U,

u,

“fc+1

 

84

 

Определение 3. Риском после цепочки исходов

1

« называется

 

(4.12)

Необходимо заметить, что величина риска прекращения дальнейших экспериментов определяется расходами на проведение всех предыдущих экспериментов и наимень­ шими потерями, которые несет система распознавания от принятия окончательного решения о принадлежности распознаваемого объекта к соответствующему классу.

Величина риска продолжения экспериментов после проведения опытов с исходами ХЯі, Ха определяется

расходами на дальнейшее проведение экспериментов (k+l)-H стадии, спланированных на основе оптималь­

ного последовательного правила R. В связи с этим спра­

ведливо следующее рекуррентное уравнение.

(4.13)

(4.14)

представляет вероятность исхода Ха .

При планировании процесса распознавания количе­ ство стадий экспериментирования, можно ограничить некоторым числом N. Тогда для любой цепочки экспери­ ментов х аі, ..., x aN

=

(4.15)

Рекуррентное уравнение (4.13) с учетом

последнего ра­

венства позволяет на основе использования рекурсии от N к N — 1, N — 2 и т. д. и данных о значениях р° после каждой стадии проведения экспериментов от 1- до N-й,

восстановить значения функций риска р(Х^.......X ) и

85

—т

функции риска продолжения экспериментов р ( Х а1, ..., Х аft)

при

всех значениях

k — N — 1,

N — 2,

1.

Порядок

расчета таков.

После

установления

количества

стадий

экспериментов определяются значения р°,

р°(Ха),

р° (X

,

х а)

.......Р° (Xch........

XaJ-

По

величине

р(Хаі.........

XaJ = -

= р° (Ха , ...,

XaJ

в соответствии

с уравнением (4.13) оп

ределяется

величина

р(Х^

...... Ха

).

На

основе

сопо­

ставления величин р°(Х . ..., X,

)

и р(Х

. ...,Х„

)

в

соответствии с (4.12) определяется значение p(Xaj, ..;

■•■>XaN ,)• Это, в свою очередь, на основе уравнения

(4.13) позволяет определить р (Хаі, ..., Ха^ 2). 7Ѵ-кратное

повторение описанной процедуры расчетов позволяет оп­

ределить значения р (Х^, ..., Х ^ _ з), ?{Хаі, Xa#_J, и

т. д. вплоть до риска проведения экспериментов первой стадии.

Определение значений функций риска продолжения и прекращения экспериментов после каждой стадии по­ зволяет осуществлять оптимальное последовательное планирование проведения экспериментов, а именно:

эксперименты последовательно проводятся до тех пор,

—>

 

 

 

 

 

 

 

 

пока р<р°.

 

 

 

 

 

 

 

 

Как только (после исходов Ха1, ..., Хаft) величина

ри-

ска продолжения

 

эксперимента

р(Х%, ..., X )

становит­

ся больше или равна величине риска

прекращения

экс­

периментов р°(Х

1,

..., Хаft ), проведение экспериментов еле-

дует прекратить и принять

решение

z(XQi, .... Ха ),

при

котором достигается

 

 

 

 

 

 

P(x ai. - . X

)

= min S C e X

 

 

 

 

 

h

 

я.

 

 

 

X ( X a,, .... Ха \

z ) P ( Q t

|X ^ ,...,X ak).

(4.16)

86

Порядок управления экспериментами (до тех пор, по­ ка их выгодно продолжать) определяется с помощью

функции риска продолжения экспериментов р(Ха*, ..., Х ак),

а именно в качестве ah+i (Х а,

..., Х а ) в байесовом прави-

 

 

1

к

 

ле следует выбрать такой эксперимент (ай+1£:Лй+] а, ...,

Xaft), на

котором достигается

inf в правой части ре­

куррентного уравнения для риска (4.13).

 

Таким образом, реализация оптимального управле­

ния процессом распознавания

связана

с выполнением

следующих расчетных работ.

 

 

1.

На основе карты

штрафов, априорных вероятно­

стей появления объектов соответствующих классов и

условных законов распределения значений признаков по

классам

в соответствии с

уравнением

(4.10) определя­

ются значения рисков прекращения экспериментов после

2.Из физических соображений определяется предель­ ное количество стадий экспериментирования, т. е. вели­ чина N.

3.На основе рекуррентного уравнения (4.13) рассчи­ тываются значения рисков продолжения экспериментов

для всех стадий от (N— 1)-й до 1-й.

4. На основе сравнения величин р° и р для всевоз­ можных исходов экспериментов определяется оптималь­ ное количество стадий экспериментальных работ.

Рассмотрим на конкретном примере порядок опти­ мального планирования процесса распознавания.

4.5. ПРИМЕР

Положим, что в системе распознавания, предназначенной для распознавания объектов ш, принадлежащих одному из двух классов ßi или й 2, следует реализовать оптимальное планирование экспери­ ментов. Пусть априорные вероятности появления объектов соответ­ ственно равны: Р (йі)= 0,6 и Р (й 2)=0,4. Будем исходить из того, что признаки объектов тр и гр дискретны и могут принимать значения:

87

При этом положим, что вероятности отнесения со к Qi, і= 1, 2, в за­ висимости от значений признаков X j , / = 1, 2, равны

^ Bl(* i =

°) =

°.з;

РвЛ а', =

і ) = о,7,

=

0)

=

0.6.

PBt{ X t =

1) = 0,4.

^ ffil( ^ 2 =

0)

=

0,2,

P Bi( X t =

1) =

0,8.

=

0) =

0,7,

Р ^ ( Х г =

1) =

0,3.

Определение

признаков

АП и Х 2 связано с проведением экспери­

ментов

я,

и я 2-

Ограничим

 

число стадий экспериментов N — 2. При

этом на первой

стадии

возможно

проведение либо эксперимента

а и

связанного с определением

признака Х ,

с исходами

Х йі = 0 и Х а

= 1, либо

эксперимента

я 2,

связанного с определением

признака

X і

с исходами Х а = 0 и АГ0а =

 

1.

 

 

 

 

 

 

а2 ( Ха = 0 );

На

второй

стадии

 

возможны

эксперименты

 

я 2 ( Хйі =

1);

либо эксперименты

а , (26

=

0);

а х (Х а

= 1) также

с исходами

Х п = 0 ;

А',,

= 1

и

Х п = 0 ;

Х„

=

1

соответственно*

Общая

схема

экспериментов

приведена на рис. 4.2. Наша задача

состоит в том, чтобы определить риск прекращения и продолжения

экспериментов, т. е. величины р°

и р после

всех

исходов каждого

эксперимента первой и второй стадий, и на основе их сравнения

определить оптимальную процедуру распознавания.

 

 

 

 

Последовательность расчетов такова.

 

 

 

 

 

 

1.

 

Определяем по формуле Байеса значения апостериорной веро­

ятности отнесения со к Qi классу после проведения экспериментов

первой стадии. В данном случае

 

 

 

 

 

 

 

 

Р (S, I Х щ =

0) =

0,43

 

 

 

P (Q ,| A'Ci =

l)= 0 ,7 2

 

P (S 21Х щ = 0 ) =

0,57

 

 

 

Р (S2 I X Ü1 =

1) = 0,28

 

Я ( ^ 1 ^ = 0 ) = 0 ,3

 

 

р (2і1^йа=

1*) =

0,8

Р (S, I 26Ua = 0) =

0,7

 

 

P(Q2\Xai = 1) =

0,2

2. Будем полагать, что условные вероятности вида Р 0

( X

/А" ),

^ = 1,2, равны

 

 

 

 

 

 

 

 

 

Л». (* са 0 I Х 0і = 0) =

0,2

 

 

( X at =

0 1Х ^

=

0) =

0,7

Л ,а ( * 0а = 1 1 ^ = 0 )

=

0,8

f/Bi (А'0а =

1 1 ^ = 0 )

=

0,3

P ai( X 0t = °\Х а, = I) =

°.2

Яй,

=

0 I *«, =

>) =

°-7

Рыі (Х а, = 1 I * 01 = 1) =

0,8

P s, ( Xß, =

1 I

=

1) =

0,3

При этом апостериорные вероятности отнесения объекта со к Qi классу после проведения экспериментов второй стадии в соответ-

88

Соседние файлы в папке книги из ГПНТБ