книги из ГПНТБ / Горелик, А. Л. Некоторые вопросы построения систем распознавания
.pdf(4.4), иначе обеспечивает минимизацию математическо го ожидания расходов, связанных с реализацией процес са распознавания.
4.3.ОБЩЕЕ ПРЕДСТАВЛЕНИЕ АЛГОРИТМА ПРОЦЕССА РАСПОЗНАВАНИЯ
Рассмотренные понятия и определения позволяют сформулировать алгоритм процесса распознавания в ви де правила последовательного поиска решений, обеспе чивающего разработку оптимального плана проведения экспериментов. Смысл подобного алгоритма состоит в том, что он на основе предыстории экспериментирова ния, на основе информации, полученной в результате предыдущих экспериментов, определяет оптимальный план дальнейшего проведения экспериментов, определя ет все последующие стадии экспериментов, т. е. опреде ляет на каждом шаге, какие очередные технические средства должны быть использованы и какие признаки объекта с помощью этих средств должны быть выявлены.
Общая запись алгоритма, обеспечивающего последо вательное планирование экспериментов, может быть представлена в следующем виде:
R — I2"’ |
а‘ ’ |
ö2 (^a,), |
(X,h’ ^ a), •••’ |
||
ak{Xat,..., |
Xa^ ) , zu(Xai,..., Xa )}, |
(4.5) |
|||
г д е а ^ Л ^ ; |
a2(Xa ) ^ А г (Хщ) , ..., |
ak (Xih, .... |
X a^ ) 6E |
||
£zA^(Xa, ..., |
Xa |
) свидетельствует |
о том, что алгоритм |
||
строится с учетом системы ограничений Г.
Наличие в алгоритме zo означает, что окончательное
решение о том, что объект принадлежит к одному из классов Оі, принимается без проведения экспериментов. В этом случае все операции, обозначаемые в алгоритме аі, ..., ßft и Zi, ..., zu, отсутствуют. Если в алгоритме го
отсутствует, то тогда назначается проведение эксперимен тов первой стадии щ. Если на основе признаков объек та, определенных по информации экспериментов первой стадии, принимается окончательное решение о его при надлежности к какому-то классу — Zi(Xai), то опять все
операции, |
обозначаемые в алгоритме а%........щ и го, |
22, • • -, 2ft, |
ОТСУТСТВУЮТ. |
79
Наличие в алгоритме R члена ak (Xa,..., X |
) озна- |
1 |
я - I |
чает, что на основе изучения признаков распознаваемого
объекта, полученных в результате |
исходов |
эксперимен |
||||
тов Хаі, ..., Ха |
, принято решение |
о проведении экспе |
||||
риментов k-й стадии сіи |
состоящих в |
использова |
||||
нии у технических средств для определения |
/ |
признаков |
||||
объекта. |
|
|
|
|
|
|
Если в алгоритме R присутствует член zh(Ха,..., X а )£= |
||||||
€=Zi, |
то это |
означает, что |
после |
получения |
исходов |
|
Ха, . |
Х а экспериментов а , , |
... , ак, проведенных согласно |
||||
правилу R, принимается окончательное решение, что
распознаваемый объект относится к определенному клас су, и дальнейшие эксперименты не проводятся.
Порядок планирования экспериментов в соответствии с алгоритмом (4.5) схематически изображен на рис. 4.1.
Р и с . 4.1.
80
Из рассмотрения схемы следует, что алгоритм рабо тает следующим образом. Пусть па вход системы рас познавания поступил объект со и для определения его признака решено провести эксперимент щ (из каких со ображений принимается подобное решение будет пока зано ниже).
Положим, возможные исходы эксперимента а1— Х'а
и X" . Эти исходы анализируются в блоке анализа ре зультатов экспериментов. При этом, если исход X " 0f
то, к примеру, принимается окончательное решение гДХ" ), а если — X' , то принимается решение провести новый эксперимент а2(Х' ). Пусть его возможные исходы X' X" и X '" . Анализ этих исходов может привести, на
пример, к таким решениям: если исходы X' П2 или |
X'" (-2* |
||||
то следует |
принять окончательные решения z2 (X' |
, X' ) |
|||
ш и г 2(Х’щ, |
X'" ), а если Х " а, то |
необходимо провести |
|||
эксперимент а3(Х’щ, X" ). Исходы |
этого |
эксперимента |
|||
Х'аз и Х ”аз вновь |
анализируются, |
и разрабатывается |
|||
план дальнейшего развития экспериментов. |
|
|
|||
Легко увидеть, |
что алгоритм работает |
как система |
|||
с обратной связью. Действительно, всякий раз результа ты эксперимента используются для корректировки пла на проведения последующих экспериментов.
4.4.АЛГОРИТМ ОПРЕДЕЛЕНИЯ ОПТИМАЛЬНОГО ПЛАНА R
Уравнение (4.5) фактически определяет множество всевозможных последовательных правил поиска реше ний. В этом множестве нужно определить одно правило, являющееся оптимальным с точки зрения минимизации затрат на проведение процесса распознавания.
Для отыскания этого правила введем в рассмотрение
так называемую |
„карту штрафов“ — С (X 1 |
Хаft ; |
z), |
согласованную с |
системой ограничений Г. Величин? |
||
Cw(Xa,..., Ха \ г) |
означает штраф, уплачиваемый |
в |
том |
случае, когда подвергается распознаванию объект ю, для определения его признаков проведены эксперименты а,,
6—452 |
81 |
öik с исходами X , Ха и принято окончательной
решение z. Как правило, имеет место такая ситуация,
когда расходы на проведение экспериментов с помощью технических средств Т суммируются и не зависят от
объектов со и конкретных исходов экспериментов Ха .
В этом случае
•••» ^ \ 2) = (Д ( аі) + Сш(а2) + |
+ |
4~ с т (аь) + Qi- |
(4-6) |
Здесь Qi — убыток от принятия окончательного решения,
связанного с отнесением распознаваемого объекта со к классу £2;.
Для каждого объекта со и выбранногоДюследовательного правила R величина среднего убытка ÜW{R) равна
математическому ожиданию от величины Сш:
Ош(^) = М[Сш(Хаі...... X ; z(Xa , ..., X )], (4.7)
где математическое ожидание подсчитывается в соот
ветствии с распределением Р ^(Х а /Х а, |
Х а ) , |
кото |
||
рое определяет вероятность исхода Х а |
1 |
опыта а ц + i при |
||
условии, что проведенные эксперименты |
а19...9 а& дали |
|||
исходы Х а>, |
Х а по всем возможным |
цепочкам |
разви |
|
тия эксперимента до принятия окончательного решения в алгоритме R. Величина среднего убытка, вычисляемая по возможным цепочкам исходов алгоритма R, оканчи вающимся принятием окончательного решения z, может
быть определена иначе на основании следующего вы ражения:
0 . ( R |
) = E c . [ Х л ......х Лі; |
|
|
|
п |
|
|
Zh(Xai, .... X ^ lP ^ a , , . . . , ak), |
|
(4.8) |
|
где Pa (а,,,.., aft) — вероятность реализации |
именно |
дан |
|
ной цепочки развития эксперимента может |
быть выра |
||
жена с помощью |
распределения Pfi (Ха | Х0і, ..., |
Ха ) |
|
82
следующим образом:
Р й . ( Х а . ’ - ’ х а ) |
P S i (X ah \ X at> - ’ Х ак _ ) У |
(4.9)
В выражении (4.8) п — число всевозможных цепочек
развития экспериментов. Поскольку алгоритм (4.5) дол жен носить массовый характер и заранее неизвестно, какого класса объект будет подвергаться распознава нию в каждой из конкретных ситуаций, величину убыт
ка Um (R) следует усреднить с помощью априорной ве
роятности появления объектов соответствующих классов Р(Пі) и каждый алгоритм характеризовать величиной
(4.4)
т
£МЯ) = Е ÜJR)P(Qt),
;=1
где Up(R) — функция убытка (функция риска).
Теперь появляется возможность, подобно тому как это осуществляется в теории последовательных стати стических решений, методологические вопросы выбора приемлемого правила поиска последовательных решений рассматривать как игру двух сторон с функцией убытка Up(R). В качестве одной стороны выступает наш «веро
ятный противник», чистыми стратегиями которого явля ются все объекты со из Qt-, в качестве второй стороны — система распознавания, чистыми стратегиями которой является совокупность последовательных правил R из Rr . Это, в свою очередь, позволяет рассматривать во
просы существования чистых минимаксных стратегий, смешанных минимаксных стратегий и байесовых страте гий. Следует отметить, что класс байесовых страте гий оказывается в некотором смысле полным, т. е. для любой небайесовой стратегии найдется лучшая (или, во всяком случае, не худшая) байесова стратегия. Исходя из этого, в дальнейшем будем придерживаться именно байесова подхода к решению задачи.
Оптимальным байесовым последовательным прави лом назовем такой алгоритм R, который минимизирует
Up(R). Это означает, что UV(R) ^ U P(R) для всех воз можных алгоритмов R e Rr. При реализации системы
6* |
83 |
распознавания целесообразно использовать оптимальные байесовые алгоритмы. Принципиальная возможность построения таких алгоритмов, рассчитанных заранее до начала функционирования системы распознавания, опре деляется рекуррентными уравнениями для так называе мых функций риска [12].
Введем в рассмотрение следующие три определения.
Определение 1. Риском прекращения эксперимен
тов после цепочки исходов X |
. ..., Хп назовем величину |
||
рЧХ*,...... X ) = , п і п 2 С . ( Х аі...... X |
; z) X |
||
ft |
zgrZ |
|
ft |
X P ( ß i \Xa, - |
’ Xa ). |
(4.10) |
|
Здесь P(Qi!Xaг,..., |
X aк) — апостериорное |
распределение |
|
вероятностей объектов, которое вычисляется с помощью формулы Байеса по априорной вероятности появления объектов данного класса Р(£2і) и априорным вероятно
стям вида
Частным случаем риска прекращения экспериментов
после цепочки исходов (Ха ,..., Ха ) является риск при
нятия окончательного решения без проведения экспери ментов р°, который равен
Р° = min £ Сш(г) Р (Оі). Z^ z 9.г
Определение 2. Риском продолжения эксперимен
тов после цепочки исходов Х„,..., X назовем величину
а,
Р(* |
X ) = infUp |
[*(Ха |
* )]• (4-П) |
Здесь inf берется по всевозможным последовательным правилам R (X a,..., Ха ), которые в соответствии с си-
стемой ограничений Г |
можно последовательно |
построить |
|
с помощью экспериментов, принадлежащих |
соответст |
||
венно Ak+ l (Xa ,..., X |
); Ak+,(X |
,..., Ха ),... стадиям. |
|
U, |
u, |
“fc+1 |
|
84
|
Определение 3. Риском после цепочки исходов |
1 |
« называется |
|
(4.12) |
Необходимо заметить, что величина риска прекращения дальнейших экспериментов определяется расходами на проведение всех предыдущих экспериментов и наимень шими потерями, которые несет система распознавания от принятия окончательного решения о принадлежности распознаваемого объекта к соответствующему классу.
Величина риска продолжения экспериментов после проведения опытов с исходами ХЯі, Ха определяется
расходами на дальнейшее проведение экспериментов (k+l)-H стадии, спланированных на основе оптималь
ного последовательного правила R. В связи с этим спра
ведливо следующее рекуррентное уравнение.
(4.13)
(4.14)
представляет вероятность исхода Ха .
При планировании процесса распознавания количе ство стадий экспериментирования, можно ограничить некоторым числом N. Тогда для любой цепочки экспери ментов х аі, ..., x aN
= |
(4.15) |
Рекуррентное уравнение (4.13) с учетом |
последнего ра |
венства позволяет на основе использования рекурсии от N к N — 1, N — 2 и т. д. и данных о значениях р° после каждой стадии проведения экспериментов от 1- до N-й,
восстановить значения функций риска р(Х^.......X ) и
85
—т
функции риска продолжения экспериментов р ( Х а1, ..., Х аft)
при |
всех значениях |
k — N — 1, |
N — 2, |
1. |
Порядок |
||||||
расчета таков. |
После |
установления |
количества |
стадий |
|||||||
экспериментов определяются значения р°, |
р°(Ха), |
р° (X |
, |
||||||||
х а) |
.......Р° (Xch........ |
XaJ- |
По |
величине |
р(Хаі......... |
XaJ = - |
|||||
= р° (Ха , ..., |
XaJ |
в соответствии |
с уравнением (4.13) оп |
||||||||
ределяется |
величина |
р(Х^ |
...... Ха |
). |
На |
основе |
сопо |
||||
ставления величин р°(Х . ..., X, |
) |
и р(Х |
. ...,Х„ |
) |
в |
||||||
соответствии с (4.12) определяется значение p(Xaj, ..;
■•■>XaN ,)• Это, в свою очередь, на основе уравнения
(4.13) позволяет определить р (Хаі, ..., Ха^ 2). 7Ѵ-кратное
повторение описанной процедуры расчетов позволяет оп
ределить значения р (Х^, ..., Х ^ _ з), ?{Хаі, Xa#_J, и
т. д. вплоть до риска проведения экспериментов первой стадии.
Определение значений функций риска продолжения и прекращения экспериментов после каждой стадии по зволяет осуществлять оптимальное последовательное планирование проведения экспериментов, а именно:
эксперименты последовательно проводятся до тех пор, |
||||||||
—> |
|
|
|
|
|
|
|
|
пока р<р°. |
|
|
|
|
|
|
|
|
Как только (после исходов Ха1, ..., Хаft) величина |
ри- |
|||||||
ска продолжения |
|
эксперимента |
р(Х%, ..., X ) |
становит |
||||
ся больше или равна величине риска |
прекращения |
экс |
||||||
периментов р°(Х |
1, |
..., Хаft ), проведение экспериментов еле- |
||||||
дует прекратить и принять |
решение |
z(XQi, .... Ха ), |
при |
|||||
котором достигается |
|
|
|
|
|
|
||
P(x ai. - . X |
) |
= min S C e X |
|
|
||||
|
|
|
h |
|
я. |
|
|
|
X ( X a,, .... Ха \ |
z ) P ( Q t |
|X ^ ,...,X ak). |
(4.16) |
|||||
86
Порядок управления экспериментами (до тех пор, по ка их выгодно продолжать) определяется с помощью
функции риска продолжения экспериментов р(Ха*, ..., Х ак),
а именно в качестве ah+i (Х а, |
..., Х а ) в байесовом прави- |
|||
|
|
1 |
к |
|
ле следует выбрать такой эксперимент (ай+1£:Лй+] \Ха, ..., |
||||
Xaft), на |
котором достигается |
inf в правой части ре |
||
куррентного уравнения для риска (4.13). |
|
|||
Таким образом, реализация оптимального управле |
||||
ния процессом распознавания |
связана |
с выполнением |
||
следующих расчетных работ. |
|
|
||
1. |
На основе карты |
штрафов, априорных вероятно |
||
стей появления объектов соответствующих классов и |
||||
условных законов распределения значений признаков по |
||||
классам |
в соответствии с |
уравнением |
(4.10) определя |
|
ются значения рисков прекращения экспериментов после
2.Из физических соображений определяется предель ное количество стадий экспериментирования, т. е. вели чина N.
3.На основе рекуррентного уравнения (4.13) рассчи тываются значения рисков продолжения экспериментов
для всех стадий от (N— 1)-й до 1-й.
4. На основе сравнения величин р° и р для всевоз можных исходов экспериментов определяется оптималь ное количество стадий экспериментальных работ.
Рассмотрим на конкретном примере порядок опти мального планирования процесса распознавания.
4.5. ПРИМЕР
Положим, что в системе распознавания, предназначенной для распознавания объектов ш, принадлежащих одному из двух классов ßi или й 2, следует реализовать оптимальное планирование экспери ментов. Пусть априорные вероятности появления объектов соответ ственно равны: Р (йі)= 0,6 и Р (й 2)=0,4. Будем исходить из того, что признаки объектов тр и гр дискретны и могут принимать значения:
87
При этом положим, что вероятности отнесения со к Qi, і= 1, 2, в за висимости от значений признаков X j , / = 1, 2, равны
^ Bl(* i = |
°) = |
°.з; |
РвЛ а', = |
і ) = о,7, |
||
= |
0) |
= |
0.6. |
PBt{ X t = |
1) = 0,4. |
|
^ ffil( ^ 2 = |
0) |
= |
0,2, |
P Bi( X t = |
1) = |
0,8. |
= |
0) = |
0,7, |
Р ^ ( Х г = |
1) = |
0,3. |
|
Определение |
признаков |
АП и Х 2 связано с проведением экспери |
||||||||||||||
ментов |
я, |
и я 2- |
Ограничим |
|
число стадий экспериментов N — 2. При |
|||||||||||
этом на первой |
стадии |
возможно |
проведение либо эксперимента |
а и |
||||||||||||
связанного с определением |
признака Х , |
с исходами |
Х йі = 0 и Х а |
— |
||||||||||||
= 1, либо |
эксперимента |
я 2, |
связанного с определением |
признака |
X і |
|||||||||||
с исходами Х а = 0 и АГ0а = |
|
1. |
|
|
|
|
|
|
а2 ( Ха = 0 ); |
|||||||
На |
второй |
стадии |
|
возможны |
эксперименты |
|
||||||||||
я 2 ( Хйі = |
1); |
либо эксперименты |
а , (26 |
= |
0); |
а х (Х а |
= 1) также |
|||||||||
с исходами |
Х п = 0 ; |
А',, |
= 1 |
и |
Х п = 0 ; |
Х„ |
= |
1 |
соответственно* |
|||||||
Общая |
схема |
экспериментов |
приведена на рис. 4.2. Наша задача |
|||||||||||||
состоит в том, чтобы определить риск прекращения и продолжения |
||||||||||||||||
экспериментов, т. е. величины р° |
и р после |
всех |
исходов каждого |
|||||||||||||
эксперимента первой и второй стадий, и на основе их сравнения |
||||||||||||||||
определить оптимальную процедуру распознавания. |
|
|
|
|
||||||||||||
Последовательность расчетов такова. |
|
|
|
|
|
|
||||||||||
1. |
|
Определяем по формуле Байеса значения апостериорной веро |
||||||||||||||
ятности отнесения со к Qi классу после проведения экспериментов |
||||||||||||||||
первой стадии. В данном случае |
|
|
|
|
|
|
|
|
||||||||
Р (S, I Х щ = |
0) = |
0,43 |
|
|
|
P (Q ,| A'Ci = |
l)= 0 ,7 2 |
|
||||||||
P (S 21Х щ = 0 ) = |
0,57 |
|
|
|
Р (S2 I X Ü1 = |
1) = 0,28 |
|
|||||||||
Я ( ^ 1 ^ = 0 ) = 0 ,3 |
|
|
р (2і1^йа= |
1*) = |
0,8 |
||||
Р (S, I 26Ua = 0) = |
0,7 |
|
|
P(Q2\Xai = 1) = |
0,2 |
||||
2. Будем полагать, что условные вероятности вида Р 0 |
( X |
/А" ), |
|||||||
^ = 1,2, равны |
|
|
|
|
|
|
|
|
|
Л». (* са 0 I Х 0і = 0) = |
0,2 |
|
|
( X at = |
0 1Х ^ |
= |
0) = |
0,7 |
|
Л ,а ( * 0а = 1 1 ^ = 0 ) |
= |
0,8 |
f/Bi (А'0а = |
1 1 ^ = 0 ) |
= |
0,3 |
|||
P ai( X 0t = °\Х а, = I) = |
°.2 |
Яй, |
= |
0 I *«, = |
>) = |
°-7 |
|||
Рыі (Х а, = 1 I * 01 = 1) = |
0,8 |
P s, ( Xß, = |
1 I |
= |
1) = |
0,3 |
|||
При этом апостериорные вероятности отнесения объекта со к Qi классу после проведения экспериментов второй стадии в соответ-
88
