Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Журавлёв, Ю. И. Алгоритмы вычисления оценок и их применение [монография]

.pdf
Скачиваний:
53
Добавлен:
19.10.2023
Размер:
5.37 Mб
Скачать

за исключением признаков осуществляется слежением за измене­ нием значения функционала качества, зависящего от числа ошибок распознавания и отказов от распознавания. Подробно этот вопрос освещен в § 5 главы III.

5. Другие возможные задачи. По мере накопления опыта по практическому применению .алгоритмов, вычисления оценок, повидимому, круг решаемых этими алгоритмами задач будет все более расширяться. Алгоритмы вычисления оценок могут быть с успехом использованы для решения и множества интересных при­ кладных задач. Сформулируем две из них.

(1.

3 а д а ч а

у т о ч н е н и я т а к с о н о м и ч е с к и х

р а з б и е-

н и й.

Пусть в

результате применения того или иного

алгоритма

таксономии получено некоторое разбиение исходного множества на таксоны (классы), однако нет полной уверенности в том, что раз­ биение осуществлено оптимальным (п некотором смысле) обра­ зом. Поэтому необходимо уточнить полученное разбиение.

Такое уточнение может быть проведено по основной схеме голо­ сующих процедур следующим образом.

Подсчитывается число голосов, поданных первым объектом, на­ ходящимся в первом классе исходного таксономического разбие­ ния, за сбой и все последующие классы. Если по решающим пра­ вилам алгоритмов вычисления оценок этот объект дает приоритет своему классу, то он оставляется в нем; если нет, то запоминается номер того класса, за который он «проголосовал». Подобная про­ цедура проводится со всеми остальными объектами таблицы, после чего объекты переставляются согласно зафиксированным номерам классов. В итоге получается новая классификация. Такие уточне­ ния классификаций производятся до тех пор, пока не будет достиг­ нуто разбиение, обеспечивающее экстремальное значение задан­ ного функционала.

Подробно метод уточнения таксономических разбиений с по­ мощью алгоритмов вычисления оценок приведен в § 5 главы Y и в работе [33].

\ 2. 3 а д а ч а о ц е н к и к а ч е с т в а э к с п е р т о в , ф о р м и р у ю - щ и х т а б л и ц у о бучения . Формальное решение задачи распо­ знавания возможно лишь после того, как эксперты или группа экс­ пертов сформируют таблицу обучения. Успех распознавания в большей степени зависит не только от формальной математической модели, но и от того, насколько удачно подобран исходный мате­ риал. Таким образом, возникает задача оценки качества экспертов, участвовавших в формировании исходного материала. В какой-то степени эта задача может быть решена с помощью алгоритмов вычисления оценок. Для этого привлекаются так называемые внеш­ ние параметры, характеризующие объекты в таблицах, сформиро­ ванных экспертами, а также вычисляется некоторая количественная мера, называемая оценкой качества эксперта. При определении данной меры в основном используются рассмотренные ранее голо­ сующие процедуры (подробно об этом см. § 5 гл. V и работу [19]).

Г л а в а III

МЕРЫ ВАЖНОСТИ ОБЪЕКТОВ В СЛОЖ НЫХ СИСТЕМАХ

§ 1. Важность объекта в системе. Мера важности

Во многих прикладных задачах (анализ и синтез динамических систем, транспортная задача, распознавание образов) требуется ввести способ измерения важности отдельных компонент сложной системы.

Существуют различные подходы к введению этой величины. Рассмотрим подход [32], основанный на следующем естественном соображении. Предположим, что задана некоторая система, пред­ назначенная для решения некоторого класса задач. На множестве задач определена функция, задающая эффективность решения задачи системой, из которой удаляется блок или несколько блоков. Для новой системы функция эффективности в общем случае будет другой.

Среднее изменение функции эффективности следует считать мерой важности блока или совокупности блоков данной системы.

Дадим точное определение понятия важности объекта в системе. Пусть система 5 состоит из блоков Bv В2, ..., Вп . Задано

измеримое множество (Z) задач, решаемых системой.

Для каж­

дого элемента Ze{Z)

определена

функция x(Z), которую мы

назовем функцией эффективности решения задачи Z

системой S.

Удалим из

последней

блоки В^,

Вг . Систему,

получен­

ную после

их

удаления,

обозначим

через

S*.

 

Рассмотрим

функцию

тг (Z) — эффективность решения задачи

Z системой

S1 и u. (Z) — меру множества

{Z }. Величину

 

 

^

f [ x ( Z ) - T i(Z)]#(Z[

(in.i)

' f z !

назовем мерой важности (весом) совокупности блоков Bt , Д-2, ..., В ^ и обозначим через р{В^, В^, ...,

Если выделенная система состоит из одного блока В., то по­ лучим меру важности фиксированного блока Bt в системе S.

31

Понятие меры важности, введенное соотношением (ill.l), предпо­ лагает равноправие всех задач, решаемых системой. В действи­ тельности сами задачи Z часто распадаются на более или менее

важные.

Если считать, что на множестве (Z) задана функция v (Z), определяющая важность задачи Z, то вместо (III.1) естественно написать величину

1

(Z) ' l (Z)b(Z)rfM ^l-

(III.2)

!* {Z}

 

 

В ряде случаев вместо функции t(Z) удобнее рассматривать другую t (Z) — время решения задачи Z системой S. В этом случае следует задавать вес при помощи выражения

[ t { Z ) - H Z ) ] ^ Z ) d * [ Z \ .

(III.3)

§2. Примеры введения меры важности объектов в

сложных системах

Пусть задана двухполюсная транспортная сеть — ориентиро­ ванный связный граф без петель, в котором выделены две вер­

шины — входная

л'0 и выходная

х.

Каждой дуге

и сети

сопос­

тавлены два числа: / (и) — длина дуги

и

с (и) — ее

пропускная

способность.

время

перевозки

T(z)

груза г по сети

при

не­

Минимальное

которых ограничениях

задается

формулой

 

 

 

 

 

 

 

г - Л +

 

У -f (u ) I ( и )

 

 

 

 

 

Т(г) =

 

и

<■ U

 

 

 

 

(1И.4)

 

2

 

?(")

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

е U Л

 

 

 

 

 

 

 

где '£(//) — поток

по транспортной

сети; суммирование в числи­

теле ведется по всем дугам и сети,

в

знаменателе — по

всем

дугам и, выходящим

из входной

вершины [22].

 

величины

В качестве множества (Z) рассмотрим допустимые

грузов, которые могут поступить

на вход

сети и

принять,

на­

пример, значения

из отрезка (а,

Ь).

В

качестве функции важнос­

ти можно использовать, к примеру, величину q (г) — вероятность поступления груза величины z на вход сети.

Удалим из сети дугу а. Тогда по новой сети время перевозки

груза Ти (z) определится формулой, аналогичной (III.4). Согласно

32

(Ш.З), в качестве меры важности дуги естественно рассматривать величину

7 " (20 — 7 »

q (2:)dz.

(III.5)

|о. *|

Применяя алгоритмы В. А. Евстигнеева, нетрудно построить приближенный метод для вычисления интегралов вида (III.5).

2. Опишем реализацию булевых функций схемами из функ­ циональных элементов [53]. Обозначим через р (Е) сложность функционального элемента Е. Число аргументов булевой функ­ ции <р, реализуемой элементом Е, i (Е). Предположим, что булевые функции, зависящие от и переменных, реализуются схе­ мами, составленными из элементов E v Е.,,..., Е . Тогда справед­

лива теорема О. Б. Лупанова, которая формулируется следующим образом: если р (£\) > 0, то почти все булевые

функции от п переменных реализуются схемами с асимптотичес­ кой сложностью

*(£,.

Е>.......Е, ) - т .

где

 

с (£ - Ег.......Е,)

i ,, i j i p p r r

 

i ( E j ) > 2

Используя ранее введенные определения, а также сформули­ рованный выше результат О. Б. Лупанова, нетрудно определить важность элемента Е. в системе Ev Я2, ..., Е .

Если после удаления элемента Ej система становится функ­ ционально неполной, то считается, что важность элемента £у

бесконечно большая. В противном случае под важностью эле­ мента Ej следует понимать величину

с {Ev

Е2, ..., Ед) - с (Ev

Е,, ..., Ej_v

EJ+l----- Е q).

 

 

 

Если на

элементе Ej

не

реализуется

минимум

величины

P(Ej )

, или

реализуется на

нескольких элементах,

то

важ-

; . р ч

1\ cj )

 

 

 

 

В этом случае

удаление

из сис­

ность элемента Ej равняется 0.

темы элемента Е} не приводит к асимптотическому

усложнению

реализаций почти всех булевых функций.

Элемент

имеет

нену­

левую важность в том и только в том случае,

когда

на

нем и

только

на

нем

реализуется

минимум

величины

 

. ^ £ . ^ 1 i

Здесь минимум

берется

по всем элементам

Ej, зависящим

не

менее чем от двух переменных.

3—го

33

 

§3. Мера важности признаков в задаче распознавания

образов

Решение основной задачи распознавания образов может быть проведено различными методами, например, корреляционными, методами, использующими теорию статистических решении, а так­ же алгоритмами «Обобщенный портрет», «КОРА-2», «КОРА-3»

и др. [8, 11, 49].

Все эти методы и алгоритмы были применены при решении ряда прикладных задач и показали удовлетворительную работоспособ­ ность. Общей отличительной их особенностью является то, что при реализации процесса распознавания в явном виде не используется понятие важности (существенности) определяющих объекты при­ знаков. Поэтому не вводится также понятие меры важности (ин­ формационного веса) признаков и, естественно, не производится

еевычисление.

Вто же время за последние годы все более широко распростра­ няются методы [7, 20, 30—32, 69], в которых основным этапом яв­ ляется вычисление и рассмотрение информационных весов призна­ ков. На основании последних фактически реализуются все дальней­ шие процедуры вплоть до различения классов или же отнесения произвольного объекта (строки таблицы Тпт ) к одному из классов.

Опишем некоторые из существующих методов вычисления ин­ формационного веса признака.

1.Вычисление информационного веса признака по частоте встре

чаемости. Пусть задано т объектов, каждый из которых описыва­ ется набором из а признаков. Алфавит признаков бинарный.

Предположим, что в таблицу сведены все объекты, на которых выполнены значения цели (например, все строки соответствуют районам, где обнаружены месторождения полезных ископаемых).

Выделим столбец с номером i (I-й признак). Пусть в нем со­ держится т1 единиц и т — т1 нулей. Мерой важности (информа-

ционным весом) i-го

признака

назовем величину

тч

 

— , i — 1,

2,..., п. Для введения

такой меры есть некоторое

основание.

Если признак часто выполняется

на объектах,

то

его

можно

считать существенным.

Однако такое введение

меры

никак не

обосновано формально-логическими построениями, поэтому рас­ сматриваемый метод имеет ряд недостатков. Так, хотя признак может встречаться нечасто, но если он выполнен, то интересующее нас явление сопутствует ему в сильно выраженной форме. При вве­ денной через частоту встречаемости мере значимость такого при-

mi

знака, равная — , окажется малой, что совершенно не соответст­

вует истинному положению вещей.

Следовательно, описанный подход к определению веса по час­ тоте, по-видимому, может давать удовлетворительные результаты в простейших случаях хорошо организованных таблиц объектов.

34'

2. Вычисление информационного веса посредством анализа тупиковых тестов. Согласно И. А. Чегис и С. В. Яблонскому [72], понятие тест и тупиковый тест вводится следующим обра­ зом.' Пусть задано семейство функций {/), определенных на множестве М, а также выделены некоторые пары

(Л /").

/'£{/). /" G!/!•

 

 

Подмножество М' с М называется тестом, если для

любой

выделенной пары ( / ', / " ) выполняется условие f ф / "

на

мно­

жестве М'. Тест именуется тупиковым, если никакая

его

часть

не является тестом.

Тпт (таблицы обучения)

понятия

В применении к таблицам

теста и тупикового теста интерпретируются следующим образом. Пусть задана таблица Twn объектов, разбитая на классы ЛГ1,

/С,, ..., Кг

Каждый объект S е Тпт характеризуется

набором п.

признаков, причем изображения всех объектов различны.

Набор

признаков iv i2, ..., ik образует тест, если

после уда­

ления из таблицы всех признаков (столбцов), за исключением перечисленных, изображения объектов, относящихся к разным классам А'., остаются различными.

В данном случае тупиковый тест представляет собой результат локально-максимального сжатия исходной таблицы, при котором еще возможно различение объектов из разных классов. При даль­ нейшем сжатии таблицы это свойство теряется. Тупиковые тесты составляют как бы неизбыточные описания объектов, характерна зуемых строками таблицы.

Различных неизбыточных описаний — тупиковых тестов у од­ ной таблицы может быть довольно много. Так, в работе [58] показано, что доля таблиц, для которых число тупиковых тес­

тов больше

logm

(s-^0, m

оо), стремится к

единице,

если log log т = 0 (log п)

и т ф ] ^ п .

Из этого следует,

что дей­

ствительно число тупиковых тестов у „типичных“ таблиц доста­ точно велико.

Естественно предположить, что если некоторый признак (соот­ ветствующий ему столбец) войдет в большое число таких неизбы­

точных описаний, то он окажется важным.

 

 

Пусть

Это приводит к введению следующей меры важности.

k — общее число тупиковых тестов для таблицы

Тат, k (^—чис­

ло тупиковых

тестов, содержащих

столбец, соответствующий

г-му признаку.

Величина р ( г )= - ^ р -

называется

важностью г-го

признака в распознавании объектов или, по-другому,

р(1)

есть

информационный вес признака.

 

то

>величина

Если, например, обозначить признак через а

p{i) оценивает важность признака а. при распознавании. Распо- '

ложйв признаки аг г = 1, 2.......

п в последовательности по убы­

35

ванию/>((), можно заметить, что признаки, получившие меньший номер, оказываются более важными.

При исследовании конкретных таблиц, описывающих совокуп­ ность объектов, обычно выясняется, что признаки распадаются по значениям p(i) на группы, причем колебание величины p(i) между группами велико по сравнению с колебаниями внутри них. Следо­ вательно. признаки по информационной ценности часто распада­ ются на четко очерченные ранги. Наиболее существенны при изу­ чении объектов и явлении признаки первого ранга, менее сущест­ венны — второго.

Введенная таким образом мера не зависит от кодировки, не меняется при замене в столбце единиц на нули и, наоборот, может быть использована для решения и основной задачи распознавания образов (классификации). С ее помощью были успешно решены задачи распознавания в геологии, при диагностике психических заболевании, при классификации социологического материала и др.

Из изложенного выше ясно, что основным моментом при вычи­ слении информационного веса по данному методу является выде­ ление и подсчет числа всех тупиковых тестов таблицы.

И. А. Чегис и С. В. Яблонский [72] впервые описали общий ал­ горитм построения тупиковых тестов при рассмотрении задачи логического контроля электрических схем. Реализация модифика­ ции этого алгоритма на ЭВМ применительно к задаче вычисления информационных весов признаков была осуществлена Т. Л. Слуц­ кой [66]. Однако алгоритм И. А. Чегис и С. В. Яблонского, как и все его модификации, требует большого числа операций, памяти ЭВМ, поэтому применим лишь для сравнительно небольших таблиц.

Кроме того, мера важности, введенная через тесты, обладает следующими недостатками.

1.Такая мера важности эвристическая и никак не обосновы­ вается. Введение ее основано большей частью на интуиции и хоро­ шем совпадении с результатами экспериментов.

2.Мера введена для весьма частного случая систем — системы, признаков, описывающей объекты, подлежащие распознаванию.

Введенная мера может быть обобщена на системы подобного типа, однако совершенно неясно, каким образом можно распрост­ ранить тестовое понятие меры важности на объекты, образующие

системы другой природы.

Построение эффективного универсального алгоритма, выделяю­ щего все тупиковые тесты, вряд ли возможно, так как эта задача родственна задаче построения всех тупиковых дизъюнктивных нор­ мальных форм (д. н. ф.) булевых функций. Как показывают ис­ следования [25], данная задача неразрешима в классе эффектив­

ных алгоритмов.

Таким образом, мера важности признака при ее вычислении прямо по определению может быть сосчитана лишь в ограничен­ ном числе случаев. Вместе с тем, возникает необходимость выво­

зе

дить информационные веса признаков по таблицам, содержащим большое число строк и столбцов.

Ниже в п. 3 настоящего параграфа для признаков объектов распознавания вводится мера важности, использующая основные положения § 1 гл. III и позволяющая преодолеть (иногда частично) указанные трудности. В. А. Слепян [65] было показано, что вводи­ мый таким образом информационный вес «почти всегда» хорошо аппроксимирует информационный вес, введенный через тесты

таблицы.

Существует еще ряд методов определения меры важности при­ знаков, которые могут быть объединены в группу теоретико-инфор­ мационных методов. В работе Мерилла и Грина [77] описан так на­ зываемый критерий «добротности» признака, связываемый с рас­ хождением между любыми двумя классами образов. Льюис [76] в качестве такого критерия предлагает функцию в виде энтропии или средней информации о классах образов. Несколько иная про­ цедура отбора признаков описана в работе Ватанабе [14].

3.Мера важности признака в классе алгоритмов вычисле­

ния оценок. Рассмотрим опять

множество объектов

S v

S2,

, ..., S m, сведенных в таблицу

Тпт1 (предполагается априори, что

известно разбиение объектов на

классы, и принадлежность

объ­

ектов к классу дается схемой,

приведенной в § 1 гл. II).

 

Применим голосующие процедуры к самим строкам

таблицы

и подсчитаем величины:

 

 

 

 

 

г .

 

 

1\ (S2)- -

Г: 15т.)

 

 

м * , ) .

Г2(52> -

г з ( ^ , )

 

 

 

 

 

 

 

>

 

 

г ,(5,).

г, (5,),...,

r . a , , )

 

 

( V

 

h)>

 

I\(S J

 

 

 

 

 

1 2

 

 

 

 

(S/n.+l)’ r i

 

г ,(5.J

Г,

(S

щ- l+l)>

r . ( v l + 2>

•••> r i(Sm)

1

\

Г,

(S

 

 

 

Г2 (5яи +2)’

••->

Г2(Sm)

2

[ т1-l+l)’

Гл(S

т1-1+1

\

r i(5 m7_1+2)' ••••

r , ( s . )

ы

 

(III.6)

(III.7)

(1II.8)

Вычеркнем теперь из таблицы Тпт1 столбец с номером i и удалим его также из голосующих множеств. Строки Sv S2, ...,

37

, Sm перейдут в строки

,

Slm (верхний индекс

i в

написании строки означает, что из строки удален i

признак).

Реализуя процедуру

голосования

для

 

сокращения

таблицы,

вычисляем величины Ги ^S‘ j, где д =

1,

2,

..., т\

и — 1,

2,...,

I,

, упорядочение

которых

приведет к схеме,

аналогичной

схемам

(III.6)—(Ш.8),

с той лишь

разницей, что

вместо S

будут пред­

ставлены Sq .

Количества голосов Гц будут меньше, чем соответствую-

Щие Гц(5?).

Если признак i (удаленный столбец с номером i) существен­ ный, то число голосов в среднем уменьшается сильно, и наобо­ рот. Степень уменьшений, обработанную надлежащим образом, следует считать мерой важности изучаемого признака.

Информационный вес г-го признака вводим следующим обра­ зом.

Составляем разности

Вводим величину

Аналогично поступаем и с другими классами:

т — m t _

Величина

С

называется информационным весом г'-го признака. Окончательно выражение (III.9) выписывается так:

i

38

Получим еще другую формулу для вычисления информацион­ ных весов с использованием тех же голосующих процедур.

Назовем числом правильно поданных голосов число голосов, поданных строкой (строками) класса за своп класс.

Берем теперь общее число правильно поданных голосов в при­ сутствии 1-го столбца по отношению к общему числу голосов. За­ тем аналогичную величину вычислим после удаления /-го столбца. Разность этих двух величин составляет информационный вес.

Рассмотрим величины из (III.6) — (III.8). Просуммируем их:

 

т I

 

 

1 = 2

р - н )

 

</«1 м=1

 

Затем просуммируем правильно поданные голоса

тх

nii

т

i ' - 2 r,(s,')+

2 r2(s,) + -..+

У, ПОР-

7 - 1

q=mL+l

+l

Положим

Рассмотрим далее аналогичные величины и для случая с ис­ ключенным /-м столбцом, т. е.

т I

 

 

i = 2 2 r „ ( s ) ) ,

 

 

 

 

<7=1 и=1

4

'

 

и

 

tiLs

 

 

т

 

=

2

r 1 (s‘, )

+

- - - + 2

г , ( s ') .

 

' - 2 г , р ; ) +

 

7 = 1

7 = ' И 1 + 1

'

 

7 =

+ l

Положим

 

 

 

 

 

Величину

 

0 = и !

L.

 

 

 

 

 

 

 

 

 

р (г) = 0 — 0

 

(III.12)

также можно принять в качестве информационного веса /-го при­ знака. Такое определение информационного веса в содержа­ тельном смысле соответствует изменению эффективности, упоми­

навшемуся в §

1.

 

 

выпишем его окончательный вид:

 

Для выражения (IIL12)

 

 

 

 

 

ти

о, ( 4 )

ГЛ 4 )

 

« = 2

^

Д

 

у

(Ш.13)

 

1

 

i

 

---,

тп — т„ 1

п=П

 

 

 

 

 

//=1

U

 

Н 1

2

0 ( 4 )

2

0 ( 4 )

 

 

 

 

 

 

/= 1

 

i=1

 

 

39

Соседние файлы в папке книги из ГПНТБ