
книги из ГПНТБ / Журавлёв, Ю. И. Алгоритмы вычисления оценок и их применение [монография]
.pdfкаждого элемента „М~еЦ4 построим оценку Ги (ад). Оценку Гн (S)
определим одним из следующих способов:
а) |
|
|
|
|
|
|
|
|
|
|
|
|
Г . С Т - |
2 |
Г .С 1; |
|
|
|
|
|
|
|
|
|
М А |
|
|
|
|
.6), |
пусть для |
каждого элемента |
множества |
|
из |
задана чис |
|||
ловая |
функция |
|
|
|
|
|
|
|
|
|
|
Г „ (5 ) - |
^ |
|
|
|
|
|
|
|
|
|
|
Л1^_6‘2д |
|
|
|
|
|
|
|
|
|
U) |
|
|
|
|
|
Функция « |
может |
задавать, |
например, |
|
степень |
BLaжнocти |
|||
(представительности) |
опорного |
множества М- |
) |
которая может |
|||||
v v |
|
/ |
г |
|
|
|
|||
быть, |
например, |
пропорциональна |
числу элементов. |
|
6.Решающее правило для алгоритма А. Предположим, чт
по опорной |
системе |
множеств и |
строке вычислены |
величины |
Г, ( Я Г, ( Я |
... , Г; ( Я |
Решающее |
правило алгоритма |
представ |
ляет собой функцию от данных величин. Область этих значений
функции /-'есть 0, 1, 2, ... |
, /. |
|
|
то строка 5 клас |
|||||
Если F |
[Г, ( Я Г , (5),... |
Г, (5)] = н, 1 |
|
||||||
сифицируется как строка, |
принадлежащая |
|
классу |
Ки . |
|
||||
Если /-'[Г, (5), |
Г, ( Я ..., Г;(5)] |
= 0, то |
алгоритм |
не определя |
|||||
ет класс, к которому следует отнести строку S. |
|
|
|||||||
Примеры решающих правилТ |
|
|
|
|
|
||||
1) |
|
|
и, если Г„ - |
Г. > о ь |
|
|
|||
|
|
|
|
|
|||||
F [Г, ( Я |
Г2 (S).......Г, (5)] |
при У ==", |
1 |
<У < /. |
|
|
|||
|
|
|
О, |
во всех |
остальных случаях; |
||||
|
|
|
| |
|
|
1Т |
/ |
|
|
|
|
|
|
и, если, |
|
|
|||
2) F [Г, (5), Г, ( Я |
Г, (S)] = |
2 Т „ / У г ; > |
3- |
||||||
|
|
||||||||
|
|
/=* |
|
||||||
|
|
|
|
|
|
|
|||
|
|
|
|
О, если хотя бы одно |
из ус |
||||
|
|
|
|
ловий 1°, 2° не выполнено; |
здесь величины 3j и о, есть априори, заданные константы.
20
Оценки Г,Дш) и Гн(5) назовем числом голосов, |
поданных |
за |
||||||||
класс Ки , (и — 1, |
2, ... , /) по фиксированному опорному |
множе |
||||||||
ству и по системе |
опорных множеств соответственно. |
|
|
|||||||
Дадим интерпретацию описанных выше этапов, |
применитель |
|||||||||
но к задаче распознавания образов. |
|
первого |
5, , S2 ,..., St |
|||||||
Пусть заданы |
объекты двух |
классов: |
||||||||
и второго |
, с-2 , ... , |
ог . Каждый из объектов характеризуется |
||||||||
набором |
значений |
п |
бинарных |
признаков. Требуется |
отнести |
|||||
предъявленную строку S длины п к одному из классов. |
|
|
||||||||
Зададим длину |
опорного множества «>, |
равную k и |
выделим |
|||||||
все наборы столбцов длины k (предполагается, что |
все множест |
|||||||||
во объектов с п признаками сведено в таблицу |
Тп т2). |
|
|
|||||||
Берем |
первый |
по порядку набор, составленный |
из столбцов с |
|||||||
ш мерами |
1, 2,..., |
к, |
В предъявленной |
строке и строках 5, ,S2, ... |
||||||
..., St ; а, |
, з ,, ... , |
аг |
выделим |
только |
первые |
к |
столбцов |
(это |
возможно, так как перестановка столбцов в исходной таблице не
приводит к потере |
информативности |
заданных |
описаний). Полу |
|||||||
ченные после такой операции строки |
обозначим |
через SX, S 2,... |
||||||||
..., St ; з, , з, |
,..., зг ; 5 . Обозначим |
через |
Г| |
2...... ь |
число строк |
|||||
из S , , S.2 ,..., |
5 1 , |
совпадающих |
с |
S , а через |
ГД 2....k — число |
|||||
строк из j , , з., ,..., зг , тоже совпадающих с5 |
. |
Построим |
вели |
|||||||
чины Г‘(, |
, ^ . 1 - I' ,2........ Я для |
всех |
наборов |
й, |
... , г‘Л |
|||||
длины k (эги величины соответствуют оценкам Г,(ш) и Г2 (ш), |
вве |
|||||||||
денным в п. 4 ). |
|
величины |
|
|
|
|
|
|
|
|
Теперь, естественно, |
|
|
|
|
|
|
|
|||
|
|
Г, (5) = |
|
|
|
‘а |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
и |
|
|
|
|
|
|
|
|
|
|
|
Г, (S) = |
|
|
|
|
|
|
|
|
|
являющиеся оценками, полученными |
по всем |
наборам длины /г, |
||||||||
назвать ‘ целом голосов, |
поданных |
строкой |
5 |
соответственно за |
первый и второй классы.
Отнесение строки 5 к одному из классов можно провести од ним из указанных выше решающих правил (правила 1), 2) п.б).
Кроме того, |
npai ило отнесения |
может быть построено |
с по |
|
мощью рассмотрения удельного числа голосов. |
|
|
||
Например, |
в описанном случае |
Г (S) |
Г |
пазо- |
величины —f— и ■~г ' |
21
вем удельным числом голосов, поданных за классы строкой S соответственно.
с |
r’t (5) ^ Г3 (5 ) |
О |
Если |
—-t— > --у |
, то строка о относится |
первый и второй
к первому классу;
если |
Г |
— ко второму; |
при —*•—■•= |
---- отнесение |
|
Е |
т. е. |
алгоритм |
t |
К~ |
|
не производится, |
отказывается |
от распознавания |
|||
строки 5. |
в § 3 этой |
главы будет показано, |
что величины Г,(5) |
||
Ниже, |
|||||
и ГДА), т. е. оценки Гц(5) могут бытъ легко вычислены. |
|||||
Константы б| |
и б2 (правило 2) п. 6) могут выбираться опреде |
ленным образом. В этом случае они будут представлять собой пе ременные параметры решающего правила и соответственно алго ритма голосования. Следовательно, с помощью надлежащего выбо ра значении 6i и 62 можно обеспечивать соответствующую степень «строгости» отнесения строки по данному правилу. По-видимому, для более тонкого распознавания эти условия (выбор 8\ и б2) должны быть более жесткими.
Например, параметры о, и 5, можно выбрать^в процессе обу чения (на контрольном материале) следующим образом. Фикси руются некоторые о, и В2. Проводится прогноз на контрольном материале. За каждый неправильный прогноз начисляется одно штрафное очко, за отказ от прогноза — половина штрафного очка. Подсчитывается общее число штрафных очков. Осматрива ется окрестность В, и о2 и каждый раз вычисляется сумма числа
штрафных очков. |
Если |
при таком осмотре суммарный |
штраф |
|
оказался меньше |
всего |
при порогах 8, и 62, то они |
закрепляют |
|
ся. В противном случае |
следует переход в точку |
о1, 8,, |
в ко |
торой суммарный штраф меньше и т. д.
Алгоритмы вычисления оценок при надлежащем подборе голо сующих множеств и параметров обеспечивают высокую точность отнесения строки 5 к классу, которому она действительно принад лежит. Приводим пример. Пусть дана таблица объектов
1 2 3 4 5 G |
|
|
||||||
0 |
0 |
0 |
0 |
0 |
0 |
ОбъектьГкласса |
Ki |
|
0 |
1 |
0 |
0 |
1 |
1 |
|||
|
|
|||||||
1 |
1 |
0 |
1 |
1 |
1 |
|
|
|
0 |
1 0 |
1 0 |
1 |
|
К3 |
|||
1 |
1 |
1 1 |
1 |
1 |
Объекты класса |
|||
1 |
1 0 |
0 |
0 |
1 |
|
|
||
1 |
1 |
0 |
0 |
0 |
0 |
Строка 5 |
|
В качестве голосующих наборов рассмотрим наборы столбцов <1, 2>, <3, 4>, <5, 6>. Две строки будем считать похожими, если они совпадают.

Оставляем в таблице сначала столбцы 1, 2, затем 3, 4 и, нако нец, 5, 6. Получаем таблицы:
0 |
0 |
0 |
0 |
0 |
0 |
|
0 |
1 |
0 |
0 |
1 |
1 |
* 1 |
1 |
1 |
0 |
1 |
1 |
1 |
|
" o’ |
1 |
0 |
1 |
0 |
1 |
|
1 |
1 |
1 |
1 |
.1 |
1 |
■Кг |
1 |
1 |
0 |
0 |
0 |
1 |
|
1 |
1 |
0 |
0 |
0 |
0 |
S ' . |
Анализируем первую из сокращенных таблиц. Число совпа дении S' со строками первого класса равно 1, второго клас
са — 2, |
т. е. |
l’[ „ = (J, |
I^i;, = |
2. |
Аналогично |
Г* , = |
2, |
|
= |
1, |
|||||
Г’ 6=1 , |
Гд 6 = 0. |
Следовательно, |
Г1(5 )= 4 , Г,(5) |
= |
3. |
|
|
|
|||||||
Если решающее правило относит строку по |
простому |
боль |
|||||||||||||
шинству голосов, то в нашем примере |
строка S будет |
отнесена |
|||||||||||||
к классу Л', (Г, (5) > |
Г2 (5)): |
если же |
использовать |
правило |
1) |
||||||||||
п. 6, то при о, = 1 строка 5 также будет относиться |
к |
первому |
|||||||||||||
классу |
(так |
как |
Г, ( S ) ( S |
) = |
1. |
При больших |
значениях |
о, |
|||||||
алгоритм откажется от распознавания. |
Правило 2) п. б такое же |
||||||||||||||
отнесение производит при б, = 1 и |
|
|
4 |
|
невыполнении |
||||||||||
|
|
При |
|||||||||||||
хотя бы одного |
условия (например, 3, > |
1 или |
82 > |
-^-j |
отнесе |
||||||||||
ние не будет произведено. |
|
|
|
|
нет необходимости |
при |
|||||||||
Очевидно, что для данного примера |
|
||||||||||||||
влекать при отнесении удельное число |
голосов, |
так |
как |
число |
|||||||||||
объектов в обоих классах совпадает. |
t |
г или г > |
t, |
то |
отне |
||||||||||
Если таблица организована так, что |
|||||||||||||||
сение следует проводить на |
основе |
сравнения |
удельного |
числа |
|||||||||||
голосов. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
§ 3. Теоремы о вычислении оценок
Из анализа • этапов задания алгоритмов вычисления оценок явствует, что эффективность применения этих алгоритмов во многом зависит от того, насколько просто решается задача под счета голосов Гц (S). Приведем ряд теорем, позволяющих успеш
но решить эту задачу.
1. Примем в качестве системы опорных множеств совокуп ность всех подмножеств множества (1, 2, ..,, п]. мощности к.
Функцию близости зададим таким образом:
1, если u'S - u>Sq, 0, если mS ф u>S0.
23
Положим также, что
*T ( S' 5?) = г ш5’ ш5? ) :
■„(» ) |
2 |
»г (5.5,); |
г , - |
2 г„С). |
|
||
|
?=тц_1+1 |
|
|
М^еЯд |
|
|
|
Используем решающее правило |
|
(О |
|
|
|||
|
|
|
|
||||
|
|
|
|
1’° Г„ - Г. > о1при и ==у, |
|||
|
|
и, |
если |
г,0 |
">82 |
1 < |
J < /, |
[Г, (S), r 2(S), |
г, (S)] = • |
|
I |
||||
|
V |
г . |
|
|
|||
|
|
|
|
у=1 |
|
|
|
|
|
О, |
если |
хотя |
бы одно |
из |
усло |
|
|
|
вии 1°, 2° не выполнено. |
|
|||
Мы описали трехпараметрическое семейство алгоритмов |
(ал |
горитмы зависят от параметров к, о,, о2).
Предположив, что признаки принимают значения 0, 1 и обоз
начив через г (S, |
число совпадающих столбцов в |
строках S |
|
и S?(r(.S, |
S9) = n — p(S, Sqy где p(S, SQ) — есть |
расстояние |
|
Хеммиига j, |
для рассматриваемого семейства алгоритмов покажем |
справедливость следующей теоремы.
Теорема 1. Число голосов, поданных строкой S за класс Ки , равно
г „ (S) = |
ти |
|
л ; |
с : |
|
|
1 |
r (.S,S<l |
Д о к а з а т е л ь с т в о . Изопределения алгоритма следует, что
т„
г U(' Sг) =
I
Вычислим величину
У |
V г ^о)5, |
|
М„ е 9Л |
+i |
|
2 |
г (ш-S, ш5?). |
(И.1) |
Af, |
|
|
2 |
r (lu5' “О - |
М_ 6 £2д |
|
24
Напомним, |
что множество |
й л есть |
совокупность |
всех |
под |
||||||||||||||
множеств |
мощности |
k |
множества |
{1, |
2, |
, |
п\. |
Строки |
5 |
и S q |
|||||||||
совпадают |
на |
г (S, |
S?) разрядов. |
Величина |
г (wS, |
|
отлична |
||||||||||||
от нуля в том и только в том случае, когда единичные коорди |
|||||||||||||||||||
наты |
вектора |
ш будут |
находиться |
среди |
г (S, |
S') совпадающих |
|||||||||||||
разрядов строк 5 и S . Очевидно, |
что число векторов, удовлет- |
||||||||||||||||||
ворягощих этому |
условию, |
будет |
равно |
|
|
|
. Поэтому |
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
Г |
(5, |
8 |
д ) |
|
|
|
|
|
|
|
2 |
г [^S, |
uS |
|
) = С * |
|
|
. |
|
|
|
(И-2) |
||||
|
|
|
|
'И~ в |
V |
|
|
|
|
|
г (5. SQ) |
|
|
|
|
|
|||
Из (II. 1) И (II.2) |
легко |
следует доказательство |
теоремы. |
|
|
||||||||||||||
2. |
Сохранив все другие условия п. 1, примем |
в качестве сис |
|||||||||||||||||
темы опорных множеств совокупность всех |
|
непустых |
подмно |
||||||||||||||||
жеств |
11 , |
2, ..., я). |
В |
этом |
случае |
имеет |
место |
следующая |
|||||||||||
теорема. |
|
Число голосов, поданных строкой i за класс /\и , |
|||||||||||||||||
Теорема 2. |
|||||||||||||||||||
равно |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Г , д й = |
2 |
|
12' |
( |
’ ’ - Ч - |
|
|
|
|||||||
|
|
|
|
|
|
<7=т и - 1 + 1 |
|
|
|
|
|
|
|
|
|
|
|||
Д о к а з а т е л ь с т в о . Обозначим |
через |
Ул систему всех |
под |
||||||||||||||||
множеств |
мощности |
k |
множества |
|
|1, |
2, |
..., |
п\. |
|
Очевидно, |
|
||||||||
|
|
|
|
|
|
о |
— |
[ I |
q* |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
".-1 |
~ |
.и , |
|
д- |
|
|
|
|
|
|
|
|
|
Как и в теореме |
1, |
имеем |
|
д—i |
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
г „ (5 )= |
2 |
|
|
2 |
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
М„е S,1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ти ш |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
V |
|
|
V |
|
Г U . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
jLi ■ |
|
Jm*l |
|
\ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
<7='»U-1+! |
M„ e CA |
|
|
|
|
|
|
|
|
|
|
||||
Кроме того, |
|
|
|
|
U) |
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
V |
V |
|
|
|
,s,.) |
= |
|
|
|
|
|
||||
|
|
|
|
"и |
П |
|
|
|
|
Us, |
|
|
|
|
|
|
( И З ) |
||
|
|
|
|
V |
V |
|
V |
|
г |
|
|
|
|
|
|
« - ' Л „ - | т 1 * = 1 ЛГ_е S*
Л
25
Использовав выражение (11.2) и свойство коэффициентов би нома Ньютона, получим
П |
|
|
cr (S'Sq)= |
У V г (ш5, |
) = С. |
+ С; |
|
*=1 .М^,еС4 |
|
(S, s q ) |
(S, S ' ) |
--- 2 Г 0s' Sl?) — 1.
Подставив последний результат в (II.3), придем к доказатель1ству теоремы.
3.Пусть признаки принимают значения из числового отрезк
(о, |
b ) |
или |
каждый |
признак |
i имеет |
свои отрезок значений |
|||||||||
( ar |
b/). Для каждого из таких |
признаков введем порог точнос |
|||||||||||||
ти Sp г.,,..., |
|
(некоторые заданные |
положительные |
числа). |
|||||||||||
Две строки |
S, |
= ( Д, =4, ••• , |
’„); |
=(_?,, ....... |
f)J |
|
будем |
||||||||
считать |
похожими, |
если |
|
|
|
|
|
|
|
|
|
||||
В качестве, системы опорных множеств возьмем совокупность |
|||||||||||||||
всех подмножеств |1, 2, ..., п\ мощности к. |
|
|
|
|
|
||||||||||
Введем расстояние |
(S,. |
Д>), |
равное |
числу невыполненных |
|||||||||||
неравенств |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Справедлива следующая теорема. |
|
|
|
гп ' |
|
|
|||||||||
|
строкой |
S |
за |
|
.класс |
||||||||||
Теорема |
3. |
Число |
голосов, |
поданных |
|
||||||||||
Ки , |
равно |
|
|
|
|
т„ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
_ |
у |
ск ~ . |
|
|
|
|
|
||
|
|
|
|
г « (5 ) - |
2 i. |
|
|
|
|
|
|||||
|
|
|
|
|
|
*7=ти—1~ 1 n~?(s s fi) |
|
|
|
|
|
||||
Доказательство этой теоремы |
полностью |
аналогично |
доказа |
||||||||||||
тельству теоремы |
1. |
|
|
|
|
теоремы |
3, |
но |
в качестве |
||||||
4. |
Пусть |
выполняются все условия |
|||||||||||||
системы |
опорных множеств |
рассматривается |
совокупность |
всех |
|||||||||||
непустых подмножеств (1, 2, ..., |
п). В этом |
случае |
имеет |
место |
|||||||||||
теорема 4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
<7=Л1ц_1-1
справедливость которой доказывается аналогично доказательству теоремы 2.
5. В качестве системы опорных множеств рассмотрим все подмножества мощности k множества |1, 2, ..., /г|.

Функцию близости r^inS, |
wSq ) введем следующим образом. |
||||
Пусть oS = |
( alf a2, ..., |
at ), |
= ( ри p2, ..., |
?fc). |
Предполо |
жим также, |
что заданы |
параметры sp s.,, ..., |
sft, г и |
функция |
|
близости |
|
|
|
|
|
л ^ , ^ ) = Г 'еслир_(5-£' )<‘'
1 0, если p(S, S 9) > s.
Как и при доказательстве теоремы 1, изменим порядок сумми
рования в формуле для |
Г, (5): |
|
|
|
|
|||
|
г . (S )= |
|
у |
|
|
|
|
|
|
М _ 6 9 Л |
|
|
|
|
|||
|
|
|
|
|
|
|||
|
|
ти |
|
|
|
|
|
|
|
= |
2 |
|
2 |
r ( w s , * s q). |
|
|
|
|
Q=mu-l + l м~ eSA |
|
|
|
|
|||
|
|
|
|
из |
|
|
|
|
Выясним при каких |
векторах |
ш величина |
г (<oS, wS9) отлич |
|||||
на от нуля. |
Выделим |
в строках S |
и Sq |
разряды, для |
которых |
|||
выполняются |
неравенства | |
а. — Г11 |
с с.. Число |
таких |
разрядов, |
|||
очевидно, равно п — p(S, 5 |
). Для |
того, |
чтобы функция близос |
ти была отлична от нуля, необходимо и достаточно, чтобы из /г
единичных |
координат |
вектора |
ш не |
менее |
/г — е-коордииат |
нахо |
||||||||
дились среди |
n — p(S, |
S |
') |
выделенных |
ранее |
|
координат, а |
|||||||
остальные координаты |
могут быть произвольными. |
Число |
таких |
|||||||||||
векторов ш равно: |
|
|
|
ф ck~i |
|
|
|
|
|
|||||
с* |
ч-с*~7 |
-с^ |
|
|
-с2 |
+•••+■■ |
||||||||
n - ~ ( S . S q ) |
|
п - 7 ( S . S q ) |
7 ( S , S q ) |
|
n - ~ ? ( S , S q ) |
? ( S , S q ) |
|
|||||||
+ ----------------'r C |
k ~ |
l |
- c ; |
_ |
|
= |
2 |
c k ~ |
l |
- |
c ~ |
• |
||
|
|
n - 7 ( S . S q ) |
n - ? ( S , S q ) |
).=0 |
n - p |
(S, S Q ) |
p (S, S q ) |
|
||||||
Учтя последнее равенство и заметив, что класс Ки составля |
||||||||||||||
ют строки |
Sm |
х, Sm |
i+2, ..., |
Sniii, |
получим |
доказательство |
||||||||
теоремы 5: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
r „ ( S ) = |
2 |
2 |
С""~ |
|
- С |
|
|
|
|||||
|
|
|
|
|
' . - 0 |
n - p ( 5 , S 9 ) |
|
p ( S , S q ) |
|
|
27.
6. Рассмотрев ту же схему с той лишь разницей, что в ка честве системы опорных множеств берется совокупность всех возможных поднаборов системы (1, 2,..., а], и использовав свойства биномиальных коэффициентов, легко доказать теоре му 6:
х=о ? (s. sq)
§ 4. Задачи, решаемые алгоритмами вычисления оценок
Охарактеризуем круг возможных задач, которые могут быть ре шены с помощью алгоритмов вычисления оценок. Существенным моментом в их решении является эффективное использование ос новной количественной оценки, названной числом голосов. Дока занные же выше теоремы позволяют построить схему строгого сче та этой количественной оценки.
1.Основная задача распознавания образов. Как было указано
вглаве I, основная задача распознавания образов заключается в отнесении вновь предъявляемого (контрольного) объекта 5 к одно му из классов, заранее заданных своими эталонами. В классе ал
горитмов вычисления оценок данная задача решается следующим
образом. |
число |
голосов |
поданных |
объектом |
|||
Подсчитывается |
|||||||
5 за |
классы Л',, |
К,, т. е. ГдА), |
Г2 (А), ..., Г;(А). |
С по |
|||
мощью решающих |
правил, |
сформулированных |
в п. 6 |
§ 2 |
этой |
||
главы, |
определяется значение /-'[Т, (3), |
J'2(S), |
..., Г, (S)] и |
про |
изводится отнесение 5 в соответствующий класс.
При надлежащем подборе параметров б| и бг решающих пра вил алгоритмов вычисления оценок можно обеспечить качество распознавания новою объекта с удовлетворительной степенью точности, которая, как правило, согласуется с требованиями экс пертов.
2. Задача самопроизвольной классификации. Самопроизвольная классификация возникает при невозможности заранее задать пли сформировать эталонную таблицу объектов, т. е. когда необходимо осуществить некоторое удовлетворительное разбиение заданного множества объектов на классы, используя лишь информацию, со держащуюся в таблице описаний.объектов.
Алгоритмами вычисления оценок эта задача решается с при менением некоторых количественных мер. характеризующих
информативность как |
признаков, так п самих объектов. |
Инфор |
||||
мативность признака |
оценивается |
с iiomouu ю меры |
важности |
|||
(информационного |
веса) признака |
p{i), |
вводимой ниже в гл. III. |
|||
Информативность |
же |
/ ( i y) объекта |
получается |
как |
сумма |
28
произведений информационных весов признаков на значение са
мих признаков:
П
1(s i) = H / ’ W v /=1
Вычисленные для всех заданных объектов 5,, So, . ., S т информа ционные веса 1 (S i), l(So), . .., I(Sm) упорядочиваются затем по убыванию.
Разбиение объектов на классы в этом случае, основывается на том предположении, что при упорядочении I(S\) объекты по зна чениям последних будут группироваться по рангам. Например, первому рангу будут соответствовать объекты с большими инфор мационными весами, последнему /-му рангу — с малыми. При этом, как правило, колебание информационных весов объектов одного ранга оказывается значительно меньшим, чем колебание между соседними рангами, что и позволяет объекты одного ранга отнести в одни класс. В классе алгоритмов вычисления оценок разбиение, полученное с помощью ранжирования, является промежуточным этапом самопроизвольной классификации. Окончательное же раз биение (окончательный результат решения задачи) выдается лишь после того, Как с помощью стандартных процедур голосования по указанной в п. 1 схеме будет подтверждена принадлежность объ екта своему классу.
(3. Задача вычисления количественной оценки важности призна ков объектов распознавания. При решении проблемы распознава ния образов возникает задача оценить с помощью некоторой ко личественной меры информативность признаков, участвующих в описании объектов. С помощью алгоритмов вычисления оценок эта информативность оценивается мерой важности, подробно описан
ной в главе III.
Мера важности играет определяющую роль в решении различ
ных |
задач математической геологии, медицинской диагностики |
и т. |
д. Именно в классе алгоритмов вычисления оценок эта мера, |
с одной стороны, вводится естественным образом и, с другой,— эф фективно вычисляется.
, 4. Задача отбора и упорядочения признаков в системах распо знавания. Она всегда возникает в практике распознавания обра зов, связана с формированием иеизбыточного описания объектов
иможет быть кратко сформулирована следующим образом. Имеется исходное (например, заданное специалистами) описа
ние объектов, подлежащих распознаванию. Необходимо для целей распознавания оставить такой набор признаков, который, с одной стороны, включал бы наиболее существенные признаки и, с дру гой,— обеспечил бы эффективное (в определенном смысле) распо знавание.
Алгоритмы вычисления оценок решают эту задачу через анализ информационных весов признаков и некоторую последовательную процедуру исключения малоинформативных признаков. Контроль
29