Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Журавлёв, Ю. И. Алгоритмы вычисления оценок и их применение [монография]

.pdf
Скачиваний:
53
Добавлен:
19.10.2023
Размер:
5.37 Mб
Скачать

для процедуры 3 —

Л', ,

 

Q (3) = ^

 

4 - т2 +

2ml

Imk [ п (г) — £] +

 

 

 

i-1 ^

 

 

 

 

 

 

 

-г 3//ш + п {k

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а 5

 

 

 

 

Процедура 2

 

 

 

 

Число объектов, отнесенных

Р азмер-

Точность

Средняя

Значение

Истин­

точность

 

к классу

 

 

ность

распознава­

распозна­

функци­

ный

 

 

 

 

призна­

ния

вания

онала каче­

класс

 

 

 

 

кового про­

 

 

ства

 

I

| п

III

I V

странства

%

 

 

 

 

 

16

0

4

0

 

80

1

 

I

144

70

0,3

п

0

12

0

8

60

ш

3

0

7

10

 

40

 

 

I V

0

0

0

20

 

100

I

 

 

 

 

2

 

 

 

 

I

1S

0

0

 

90

]

 

и

0

13

6

7

116

70

80

0,2

III

0

0

12

8

 

60

 

 

I V

0

0

0

20

 

100

 

 

 

 

 

 

 

 

 

1

 

I

19

0

1

0

 

95

1

 

II

0

14

0

6

8S

75

S5

0,15

I I I

0

0

14

6

 

75

 

 

I V

1

0

0

19

95

1

 

 

19

0

0

1

 

95

 

I

 

 

0,05

и

0

18

0

2

72

90

95

I I I

0

0

19

Т

 

95

 

 

I V

0

0

0

20

 

100

 

 

Анализ этих оценок показывает, что стоимость реализации про­ цедур существенно зависит от количества итераций, необходимых для получения сокращенного признакового пространства в преде­ лах заданного значения функционала качества распознавания.

В этом плане самой эффективной оказывается процедура 3. Целесообразность применения ее обоснована еще и тем, что зача­ стую при формировании таблиц обучения с привлечением группы экспертов ставится условие, диктующее необходимость отбора признаков из множества наиболее высокоинформативных.

В заключение еще раз отметим, что формирование неизбыточ­ ных описаний объектов распознавания, в том числе из области ме­ дицинской диагностики, естественно, не является самоцелью, а по-

Т а б л н ц а 6

Процедура 3

 

Число объектов,

отнесенных

Размер­

Точность

Средняя

 

Истин­

ность

точность

Значение

 

к классу

 

призна­

распозна­

распозна­

ный

 

 

 

 

кового

вания

вания

функциона­

класс

 

 

 

 

простран­

 

 

ла качества

 

I

и

III

IV

ства

 

%

 

 

 

 

 

 

 

 

 

 

 

 

1

 

1

10

0

7

3

10

50

 

 

п

4

10

0

6

22

55,5

0,445

ш

10

0

8

2

 

50

J

 

IV

0

0

0

20

 

100

 

 

 

 

 

 

 

 

I

 

1

16

0

4

0

 

80

 

 

11

3

17

0

0

35

85

84

0,26

III

6

0

14

0

 

70

J

 

IV

0

0

0

20

 

100

 

 

 

 

 

 

 

 

1

 

I

18

0

2

0

 

90

 

 

11

0

18

0

2

60

90

90

С,1

III

0

4

16

0

 

80

 

 

IV

1

0

0

19

 

95

 

 

зволяет в последующем резко повысить оперативность при обсле­ довании и составлении таблицы контроля и в конечном итоге существенно убыстряет получение решения основной задачи распо­ знавания образов.

§3. Возможность использования алгоритмов вычисления оценок при решении задач идентификации технологических объектов

Комплексная автоматизация и оптимальное управление техно­ логическими процессами в различных отраслях промышленности (химической, биохимической, металлургической и т. д.) в большин­ стве случаев требуют построения математических моделей иссле­ дуемых объектов. Такие модели являются, как правило, результа­ том соответствующей идентификации и представляют собой сово­ купность математических зависимостей, отражающих ход и характер протекания специфических процессов в технологическом объекте.

В зависимости от того, для какого объекта проводится иденти­ фикация, различаются и методы моделирования. Если модель

91

строится для вновь проектируемого технологического процесса, то применяют аналитические методы или методы, связанные с прове­ дением так называемых активных экспериментов на лабораторных или полупромышленных (пилотных) установках — аналогах про­ цессов. Если же идентификации подлежит процесс действующего производства, то указанные методы моделирования зачастую не­ приемлемы. В таких случаях привлекают методы и возможности пассивного эксперимента с использованием аппарата регрессионно­ го и корреляционного анализов.

В то же время данный подход требует накопления на действую­ щем объекте достаточного статистического материала, на котором далее исследуются взаимосвязь основных технологических пара­ метров и их связь с функцией цели. Результатом такого анализа является получение коэффициентов парной корреляции между па­ раметрами, по значениям которых выносится суждение о степени существенности параметров с точки зрения их влияния на функцию цели. Отобранные наиболее существенные параметры используют­ ся при построении регрессионной или корреляционной моделей объекта.

Однако процесс построения таких моделей требует весьма гро­ моздких математических вычислений, связанных с многократным анализом параметров на существенность и многократным пере­ строением моделей в случае получения дополнительной информа­ ции об объекте.

В этой связи можно использовать возможности алгоритмов вы­ числения оценок при определении меры важности (существенности) параметров для получения набора наиболее информативных пара­ метров и рекомендовать проведение регистрационного эксперимен­ та на данном наборе небольшой длины. Это позволит, с одной стороны, на основе малого регистрационного эксперимента опера­ тивно выделить наиболее существенные параметры и, с другой,— облегчить условия и сократить время осуществления основного регистрационного эксперимента за счет исключения из рассмотре­ ния несущественных (малоинформативных) параметров.

Для подтверждения изложенных соображений приведем пример использования алгоритмов вычисления оценок при идентификации одного объекта биохимического производства.

Рассматривался процесс получения гидролизата в гидролизаппарате цеха гидролиза Янгиюльского биохимического завода [4]. На основе предварительного изучения объекта был составлен пе­ речень следующих в общем случае взаимосвязанных технологиче­ ских параметров: Х[ — расход пара в гидролизаппарате; хд — рас­ ход воды на варку; x3 — расход кислоты; х* — скорость выдачи гидролизата из гидролизаппарата; х5 — вес жидкости в гидролиз­ аппарате; xg — температура в гидролизаппарате; х1 — концентра­ ция кислоты; Xg — давление пара на магистрали; хд — давление в гидролизаппарате; хю — уровень жидкости в гидролизаппарате; Хц — температура в водогрейной колонне; лг]2 — количество сырья;

92

,v13 — сдувка; хц — время процесса варки гидролиза в гидролиз-

аппарате.

Малый регистрационный эксперимент заключался в накопле­ нии информации о приведенных параметрах по 40 реализациям процесса варки, причем эксперимент был поставлен таким образом, что обеспечивалась возможность выделения класса хороших и пло­ хих (по технологическим нормам) варок.

Вся накопленная информация систематизировалась в виде таб­ лицы Тпт[ где 7г=14, /?г = 40, 1 = 2. К первому классу были отнесены 20 хороших варок и ко второму — 20 плохих.

Р

-

 

/

 

 

 

• .

 

0,75

-

 

 

0.5-

 

 

0.75

.

'

*

I I I

■ I I I-- L I I

I__I , 1 1-

3 1

7 2 И 8

8 9 14

4 5 12 10 13 i

 

Рис.

3.

 

По указанной таблице с использованием формулы (ШЛО) были вычислены информационные веса всех параметров, пронормиро­ ванные и упорядоченные значения которых приведены на рис. 3.

Для обоснованного выбора длины голосующего набора k, а так­ же подтверждения целесообразности применения в подобных слу­ чаях формулы (IV.8) на ЭВМ был исследован характер зависимо­

сти ДГ=f(k), т. е.

т1

АГ =

 

2 г , ( 5? )

 

 

I

--------------,

 

т,

 

 

V

V г (S

\

 

и—19=1

где в числителе стоит сумма голосов, поданных объектами первого класса (mi = 20) за свой класс, в знаменателе — общая сумма голосов, поданных теми же объектами за первый и второй классы.

Характер зависимости ГД=f(k), показанный на рис. 4, отра­ жает перераспределение голосов, поданных объектами первого класса за свой и чужой классы при различных значениях k. Есте­

ственно, необходимо

выбрать такое k,

при котором ДГ = ДГтах-

Как видно из рис. 4,

максимальное ДГ достигается при k = 7. При

вычислении информационных весов было

принято k = 5, выведен-

93

ное по формуле (IV.8) и, как оказалось, лежащее в области опти­ мальных значений.

Таким образом, из исходной совокупности четырнадцати пара­ метров после анализа их информационных весов выявлена группа наиболее информативных (существенных) параметров, состоящая

из параметров хь л'2, х з

и х 7. Результаты, полученные при регист­

аГ

рационном

анализе,

хорошо согла­

суются

с

оценками

мер важности

 

этих параметров [4,

47].

 

 

 

 

Существенные параметры х\, д>,

0,8

х3, х7 были использованы далее для

построения математической

модели

 

 

рассматриваемого

процесса

гидро­

ОБ

лиза [47].

 

 

 

 

 

 

Для

оптимального управления

 

объектом с применением его модели

0.4

был осуществлен поиск в простран­

 

стве входных параметров

х\,

х2, хз

0,2

(параметр

х7 не варьировался

вви­

ду того, что он определяется

зада­

 

 

нием параметров х2 и х3). Для

про­

 

цесса основными показателями

оп­

Птимальности являются: у\ — содер-

 

 

Рис

4

 

 

жание редуцирующих веществ (РВ)

 

 

 

 

 

 

в гидролизате, х4 — скорость выдачи

 

 

 

 

 

 

гидролизата

из

гидролизаппарата.

За оптимальные значения параметров Х|, х2,

х3 принимались такие,

при которых обеспечивался

 

 

 

 

 

 

 

 

 

min Q

I.

о

 

j

 

 

 

 

 

 

 

 

 

 

где у* , х4 — отклонения у

и x i

от своих

технологически обо­

снованных

максимальных

величин.

 

 

min Q*

Поиск в

пространстве

параметров с целью получения

проводился

с помощью модернизированного

алгоритма

случай­

ного поиска „с возвратом"

[5, 6 ]. Оптимальные значения

сущест­

венных параметров

применительно к конкретной технологиче­

ской

ситуации оказались

следующими: х хопт = 2,56 т\

х2опт —

\0,2м3-, х.!опт =

65 л\

х4опт=14,9

м3/час\

у, опт = 4,516%; QonT =

67,3

м3%,1час

(характеристика содержания

РВ во всем

объеме

выходного

продукта — гидролизата).

 

 

 

§ 4. Выбор алгоритма методом вычисления оценок

При решении различных задач технической кибернетики, напри­ мер, при идентификации, оптимальном управлении, распознава­ нии образов и т. д., обычно представляется возможным использо­

94

вать тот или иной алгоритм из совокупности алгоритмов, в прин­ ципе решающих поставленную задачу. В каждом конкретном случае выбранный алгоритм решает задачу с той или иной сте­ пенью эффективности. Так, при идентификации алгоритмы можно различать по их способности обеспечивать изоморфность матема­ тической модели и объекта; при оптимальном управлении — по времени вывода объекта на заданный режим с соблюдением огра­ ничений на характер переходных процессов в системе; в распозна­ вании образов — по количественным показателям правильного отнесения предъявленного объекта к своему классу и т. д. Поэтому разработка методов выбора наилучшего (в определенном смысле) алгоритма имеет немаловажное значение.

Создание единого универсального метода выбора — задача не­ разрешимая или, во всяком случае, чрезвычайно трудная. В то же время для специальных классов задач эта проблема при соответ­ ствующих условиях может быть разрешена. Например, при по­ строении самонастраивающихся моделей объектов алгоритм обу­ чения может выбираться из классов детерминированных или статистических алгоритмов поиска, при решении задач распозна­ вания образов — из класса корреляционных алгоритмов [49], из класса алгоритмов, использующих принцип вычисления оценок [30—32], или из других. Притом разрабатываемый метод должен использовать некоторые положения, общие и одинаково пригодные для любых алгоритмов, выбранных из рассматриваемого класса. Следовательно, речь идет о некотором формальном методе выбора, который опирается на совместный логический анализ совокупности допустимых алгоритмов и предъявленных объектов (задач), иден­ тифицированных своими множествами признаков.

Здесь описывается один из возможных подходов к решению задачи выбора алгоритма, основанный на вычислении оценки меры близости признаковых пространств алгоритмов и объектов [45].

Пусть дан объект S<°>, для которого необходимо решить задачу (идентификации, оптимального управления, распознавания и т. д.). Объект 5<°) представлен совокупностью своих признаков, т. е.

5 (0) = S(0)(a-1iS(0), a4s(0), . . . , ^ s(0)),

(V.2)

где A'is(0), (i 1, п)

— признак объекта.

 

 

Имеется также множество алгоритмов

 

 

S(A)

= SiA) (S^>, S {A), ... ,

’),

(V.3)

в принципе решающих

поставленную для

объекта 5 <0)

задачу,

причем SjA) е 5(Л), (/ =

1, т) — конкретный алгоритм, решающий

задачу с определенной степенью эффективности.

 

Требуется для

объекта 5 (0) выбрать алгоритм SfA) е S(A\ ре­

шающий задачу наилучшим (в определенном смысле) образом.

95

Остановимся подробнее на организации признаковых прост­ ранств объектов и алгоритмов и конкретизируем поставленную задачу.

Любой объект при постановке той или иной задачи подвергает­ ся тщательному изучению, в результате которого выявляются та­ кие ее характеристики и специфические особенности, как непре­ рывность, дискретность, многопараметричность, наличие помех по каналам, блуждание параметров, нелинейность, нестационарность во времени и т. д. Чем тщательнее проведено изучение, тем более полным оказывается набор таких характеристик объекта. Если теперь тем или иным способом внести количественные аналоги для этих характеристик, то получится множество числовых парамет­ ров, которые можно назвать множеством Х(°> признаков объекта. Притом предполагается, что для отличных друг от друга двух объ­ ектов будут различаться и множества признаков как по количест­ венному значению последних (хотя бы по некоторым из них), так и по числу признаков во множестве. Более того, даже множество признаков одного и того же объекта может изменяться во времени. Это является следствием изменения характеристик объекта во времени или получения новой информации о нем путем более тон­ кого изучения (во множестве признаков могут добавляться допол­ нительные элементы). Тогда уместно говорить о признаковом про­ странстве объектов.

На практике трудность получения количественных оценок для каждого признака объекта бывает различной. Если для некоторых признаков их значения устанавливаются сравнительно легко, то для других требуется проведение на объекте тщательных, порой, длительных экспериментов. Иногда вообще не удается определить значение того или иного признака (объект «недоступен» по этому признаку), что весьма нежелательно, так как, с одной стороны, такой признак нельзя с абсолютной уверенностью отбросить как несущественный, с другой,— неизвестно его количественное выра­ жение, и поэтому во множестве признаков объекта этот признак представляется прочерком. Е[аличие же последних приводит к уве­ личению неопределенности при выборе алгоритма, решающего за­ дачу для объекта с данным множеством признаков.

Алфавит, из которого выбираются значения признаков, может быть различным. Существенных ограничений здесь не ставится. Очевидно, алфавит должен отображать и вытекать из физической сущности признака. Если для некоторого признака удается обна­ ружить лишь его строгое наличие или строгое отсутствие для дан­ ного объекта, то его значение соответственно будет равным 1 или 0. Другой признак принимает свое значение из некоторого числового

интервала,

например, от 3 до 15.

алгоритмов

Рассмотрим теперь

элементы множества

из (V.3).

 

 

 

Каждый

алгоритм Sy

изучается с точки зрения его «способно­

сти» решать задачу для

объекта с заданным множеством призна­

96

ков. Например, если многоэкстремальность является одним из признаков объекта, то алгоритм также должен быть наделен при­ знаком, характеризующим его способность или неспособность ре­ шать многоэкстремальную задачу (в первом случае значение этого признака будет равно 1, во втором ■— 0). Если некоторый признак объекта количественно выражает ограничения на качество пере­ ходного процесса, то алгоритм должен иметь признак, характери­ зующий его работоспособность в условиях указанных ограничений. Числовое значение этого признака есть мера удовлетворения дан­ ным алгоритмом поставленного условия.

Изучив аналогичным образом признаковые пространства ряда объектов определенного класса, можно сформировать множество признаков алгоритмов, решающих в принципе поставленную зада­ чу для этого класса объектов. При таком упорядочении алгоритмов и определении их признаковых пространств выбор наилучшего ал­ горитма может трактоваться как задача распознавания наиболее «подходящего» алгоритма, выбираемого на основании вычисления оценок меры близости признаковых пространств алгоритмов и предъявляемого объекта.

В свою очередь «подходящий» алгоритм в дальнейшем совер­ шенствуется с помощью поиска в пространстве обобщенных пара­ метров точки, оптимизирующей некоторый выбранный критерий [60]. Заметим, что обобщенные параметры заранее могут не вклю­ чаться во множество признаков алгоритма.

Итак, идентифицированные

своими

признаками алгоритмы

представляются следующим образом:

 

S[A)=

1, s['4),

«2. S<A), ...,

*lv 4Л)).

5 ^ ’ =

( “). 4 Л)> a2. sw ,

 

5(Л,=

f «1 Д4>, “о SM>, •- •

«Й1 )

т

Длины признаковых последовательностей у разных алгоритмов и у объекта в общем случае различны, т. е. L ,. L. ===п. Однако

при этом часто ограничиваются рассмотрением общих совпадаю­ щих по размерности частей признаковых пространств. С учетом этого в дальнейшем принято, что Z,. = Lj — п.

'■ Алгоритмы из (V.4) могут быть сведены в таблицу Тпт , где по строкам размещены сами алгоритмы, а по столбцам — их признаки. Элемент а'. (г = 1 , //.; / = 1 , т), стоящий в таблице 1 пт на пересечении j-i\ строки и i-ro столбца, представляет со­ бой числовое значение i-го признака алгоритма 5*Л) е 5 (Л).

Пусть теперь предъявлен объект

(строка) 5 (0)

вида (V.2),

для которого необходимо выбрать

„подходящий"

алгоритм в

7-60

97

Тпт. Такой выбор (с учетом сказанного выше) можно осущест­ вить на основании вычисления меры близости признаковых про­ странств объекта и алгоритмов по простым формулам.

Так, в случае, когда все признаки принимают свои значения из бинарного алфавита, меры близости признака алгоритма и соот­ ветствующего признака объекта подсчитываются следующим об­ разом:

 

 

 

 

 

 

 

 

0,

если о.

(А) =

а.

ДО)

 

(V.5)

 

 

P(“i. *)Л)-

s(0)) =

*

 

1.

S j

 

1, S

1

 

 

 

1 ,

если а.

с(А)=д а

 

(0).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

'• sj

'

х. S

I

 

 

здесь <j.l ^(а)— значение

г-го

признака

алгоритма,

 

 

 

 

a,

s(0) — значение

г-го признака

объекта.

 

 

 

 

 

Если

провести

подсчет

р

согласно

(V.5)

для всех

признаков,

то можно

получить

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Р

 

5 <0,j

= 2

 

р (

8(Л), мг . б-(о)),

 

 

 

 

(V.6)

что, очевидно,

является расстоянием Хемминга между алгоритмом

объектом S(0)

,

рассматриваемым

как

вершины

/г-мерного

единичного куба.

Фактически

р [S\A\

S (())j — есть

мера

близости

алгоритма

S jA)l

и объекта 5 (0)

по

множеству

признаков.

Проведя

сравнение

объекта

5 10)со

всеми

алгоритмами

SjA)

 

из

таблицы

Тпп, можно получить ряд

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p(S »’, S lc’).......»(S™ S,M)

 

 

 

(V.7)

оценок мер близости и в качестве наиболее „подходящего1* алго­ ритма для данного объекта выбрать такой, у которого р = pminЕсли же признаки принимают свои значения из произвольных

алфавитов, то соотношение (V.5)переписывается следующим образом:

 

1 ,

если

|o.L SW

— \

s(0)| >

е{

 

U .

(0)

 

 

 

 

 

 

5 ; А ) > а 1. S

если

|ai, s(A) — ч

s(0) |< s if

(у д)

 

0 ,

где е( — малая положительная величина (порог по г-му

признаку).

Используя

П

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Р (SA, s (0)) = 2

Р ( ai. i f ) ,

s(°)),

 

 

(V.9)

98

можно получить ряд

(S[A\ S m ) , ? ( S ^ , S m ), ..., P( S " \ S m)

(V.10)

оценок мер близости и в качестве наиболее „подходящего" ал­

горитма для данного объекта выбрать такой, у которого р = рт1п. Выбор алгоритма с помощью соотношении (V.6), (V.9) и рядов (V.7), (V. 10) является, в общем, тривиальным и не учитывает не­ которые практические ситуации, например, возможную корреля­ цию между признаками. Поэтому для вычисления меры близости алгоритма и объекта можно предложить более эффективную про­ цедуру, учитывающую возможную корреляцию и основанную на использовании понятия меры важности (информационного веса)

каждого признака.

Информационный вес i-го признака ^ для бинарной таблицы

Тпт и 5 <0)j вычисляется

по формуле

 

т - 1

т

 

-- Cu „k- p ( sW l iM )I)

 

 

п -

Р ( slf),

,(V .ll)

j=1 t=j+i

 

 

 

где S ^ 1 1, 5<(Л> ‘ — строки

таблицы

Tnm с исключенным

i-м приз­

наком. В выражении (VЛ1) число р подсчитывается по

формуле

(V.6) для бинарных признаков или по формуле (V.9)

в случае

произвольного

алфавита.

 

 

 

Предполагая равенство информационных весов признаков алго­

ритмов и объекта, можно образовать разность

 

*/

= t=1Р W H s w

- ' l i P

(г' К 6-(0 )

(V.12)

и получить

ряд

R.,, ... ,

R m

 

 

Я,,

(V.13)

значений этой разности по всем алгоритмам.

алго­

Естественно теперь в качестве наиболее „подходящего

ритма для данного объекта выбирать такой, у которого R= R m]n.

Заметим, что в рядах (V.7), (V.10) и (V.13) два или несколько членов могут принять равные между собой минимальные значе­ ния. По-видимому, для этого объекта может быть использован любой из соответствующих алгоритмов, или выбор осуществляется на основе дальнейшего, более тонкого анализа.

Итак, если путем комплексного изучения множеств алгоритмов и объектов удается как-то разумно организовать их признаковое пространство, то выбор для объекта (задачи) «подходящего» (в определенном смысле) алгоритма можно осуществить, используя возможности алгоритмов вычисления оценок.

99

Соседние файлы в папке книги из ГПНТБ