Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Распознавание образов.doc
Скачиваний:
8
Добавлен:
01.05.2025
Размер:
2.78 Mб
Скачать

Глава 6. Распознавание образов на основании метода потенциальных функций

При построении систем классификации образов основной задачей является определение решающих функций. Они задают в пространстве образов границы, разделяющие образы, принадлежащие различным классам. Рассмотрим подход к определению решающих функций и разделяющих границ, основанный на использовании понятия потенциальной функции [6].

Допустим, что необходимо разделить два класса ω1 и ω2. Выборочные образы, принадлежащие обоим классам, представлены векторами или точками в n-мерном пространстве образов. Если ввести аналогию между точками, представляющими выборочные образы, и некоторым источником энергии, то в любой из этих точек потенциал достигает максимального значения и быстро уменьшается при переходе во всякую точку, отстоящую от точки, представляющей выборочный образ хк. На основе этой аналогии можно допустить существование эквипотенциальных контуров, которые описываются потенциальной функцией К(х, xk) Можно считать, что кластер, образованный выборочными образами, принадлежащими классу ω1, образует «плато», причем выборочные образы размещаются на вершинах некоторой группы холмов. Подобную геометрическую интерпретацию можно ввести и для образов класса ω2. Эти два «плато» разделены «долиной», в которой, как считается, потенциал падает до нуля. На основе таких интуитивных доводов создан метод потенциальных функций, позволяющий при проведении классификации определять решающие функции.

6.1. Получение решающих функций

Решающие функции для классификации образов можно получить из потенциальных функций для векторов, представляющих выборочные образы хк, k=1, 2, 3,…, в пространстве образов. Потенциальную функцию для любой точки хк, соответствующей выборочному образу, можно представить выражением

(6.1)

где функции , i= 1, 2,…, полагаются для удобства ортонормированными, а действительные числа λi i=1, 2,…, отличные от нуля, выбраны таким образом, чтобы потенциальная функция К(х,хк) для образов хкω1ω2 была ограничена.

Решающую функцию d(x) можно построить, исходя из последовательности потенциальных функций К(х,х1), К(х,х2),…, соответствующей последовательности образов обучающей выборки х1, х2,…, предъявляемых системе в процессе обучения. Решающую функцию d(x), связанную с потенциальными функциями К(х,хк) множеством ортогональных функций , можно представить в виде ряда

(6.2)

Коэффициенты сi, i=1, 2, …, входящие в (6.2), неизвестны и могут быть определены по обучающей выборке образов с помощью итеративной процедуры. Решающая функция d(x) является относительно гладкой функцией, и в малой области число её экстремумов невелико; значения d(x) в близко расположенных точках мало отличаются. Ниже будет показано, что решающая функция, определяемая формулой (6.2), связана с потенциальной функцией (6.1) рекуррентным соотношением

(6.3)

где k – номер шага итерации, а rk+1 – коэффициент, смысл которого будет ясен ниже. Решающую функцию d(x) можно непосредственно получить из потенциальной функции. Следовательно, дальнейшее обсуждение будет посвящено определению потенциальных функций.

На этапе обучения выборочные образы предъявляются системе, которая последовательно вычисляет значения соответствующих потенциальных функций. Кумулятивный потенциал на k-ом шаге итерации определяется совокупностью значений отдельных потенциальных функций. Этот кумулятивный потенциал, который мы будем обозначать через Kk(x), определен таким образом, чтобы при неправильной классификации образа хк+1 из обучающей выборки производилась коррекция значения кумулятивного потенциала. Если же этот образ классифицируется правильно, то на данном шаге итерации значение кумулятивного потенциала не изменяется. Кумулятивный потенциал вводится следующим образом.

В начале этапа обучения исходное значение кумулятивного потенциала К0(х) полагается для удобства записи равным нулю. При предъявлении первого образа х1 из обучающей выборки значение кумулятивного потенциала корректируется согласно следующему соотношению:

Поскольку, однако, К0(х)=0, результат первого вычисления кумулятивного потенциала можно представить как

В этом случае кумулятивный потенциал просто равен значению потенциальной функции для выборочного значения х1. Потенциал предполагается положительным для образов, принадлежащих классу ω1, и отрицательным для образов, принадлежащих классу ω2. В таком случае кумулятивный потенциал К1(х) представляет начальный вариант разделяющей границы.

При предъявлении второго образа х2 обучающей выборки значение кумулятивного потенциала определяется следующим образом:

1. Если х2ω1 и К12)>0 или х2ω2 и К12)<0, то

К2(х)= К1(х).

Последнее означает, что кумулятивный потенциал не изменяется, если точка, представляющая выборочный образ, лежит с «правильной» стороны разделяющей границы, определенной кумулятивным потенциалом К1(х).

2. Если х2ω1 и К12)≤0, то

К2(х)= К1(х)+К(х,х2)=±К(х,х1)+К(х,х2 )

3. Если х2ω2 и К12)≥0, то

К2(х)= К1(х) – К(х,х2)=±К(х,х1) – К(х,х2).

Возникновение этих двух ситуаций означает, что при расположении точки, представляющей выборочный образ х2, с «неправильной» стороны разделяющей границы, определенной кумулятивным потенциалом К1(х), значение кумулятивного потенциала увеличивается на величину К(х,х2) для образа х2ω1 и уменьшается на величину К(х,х2) для образа х2ω2.

При предъявлении третьего образа х3 обучающей выборки кумулятивный потенциал определяется аналогично.

1. Если х3ω1 и К23)>0 или х3ω2 и К23)<0, то

К3(х)= К2(х).

Другими словами, в тех случаях, когда разделяющая граница, определенная кумулятивным потенциалом К2(х), обеспечивает правильную классификацию, кумулятивный потенциал не изменяется.

2. Если х3ω1 и К23)≤0, то

К3(х)= К2(х)+К(х,х3)=±К(х,х1) ±К(х,х2)+К(х,х3). (6.4)

3. Если х3ω2 и К23)≥0, то

К3(х)= К2(х) – К(х,х3)=±К(х,х1)±К(х,х2) – К(х,х3). (6.5)

Другими словами, в тех случаях, когда разделяющая граница, определенная кумулятивным потенциалом К2(х), не обеспечивает правильной классификации, значение кумулятивного потенциала увеличивается на величину К(х,х3) в зависимости от принадлежности образа х3 классу ω1 или ω2. Член К(х,х2), входящий в уравнения (6.4) и (6.5), будет, естественно, отсутствовать, если образ х2 классифицируется правильно.

Пусть, наконец, Кк(х) – значение кумулятивного потенциала, полученное после предъявления k образов из обучающей выборки х1, х2,, хк. Кумулятивный потенциал Кк+1(х), возникающий после предъявления (k+1)-го выборочного образа, определяется так:

  1. Если хк+1ω1 и Ккк+1)>0 или хк+1ω2 и Ккк+1)<0, то

Кк+1(х)= Кк(х). (6.6)

  1. Если хк+1ω1 и Ккк+1)≤0, то

Кк+1(х)= Кк(х)+К(х,хк+1). (6.7)

  1. Если хк+1ω2 и Ккк+1)≥0, то

Кк+1(х)= Кк(х) – К(х,хк+1). (6.8)

Уравнения (6.6) – (6.8) определяют алгоритм итеративного потенциала. Этот алгоритм можно записать как

Кк+1(х)=Кк(х)+rк+1К(х,хк+1), (6.9)

где коэффициенты rк+1 при корректирующем члене определяются соотношениями

Если алгоритм дает правильную классификацию, то коэффициент rк+1=0. Если же алгоритм классифицирует образ неправильно, то коэффициент rк+1=+1 или (-1) в зависимости от принадлежности соответствующего образа классу ω1 или классу ω2.

Исключив, из заданной обучающей последовательности {x1, x2,…,xk,…} те образы, при классификации которых значения кумулятивных потенциалов не подвергаются изменению, т.е. образы, для которых выполняются условия Кjj+1)>0 при хj+1ω1 или Кjj+1)<0 при хj+1ω2, можно сформировать последовательность { }. Элементами этой редуцированной обучающей последовательности являются выборочные образы, обеспечивающие исправление ошибок. В таком случае рекуррентные уравнения (6.7) и (6.8) дают следующее выражение для определения значения кумулятивного потенциала Кк+1(х) после предъявления обучающей выборки:

(6.10)

где

(6.11)

Коэффициент αj называют показателем класса, поскольку он указывает, к какому классу принадлежит выборочный образ . Из (6.10) и (6.11) следует, что кумулятивный потенциал, вызванный последовательностью k+1 выборочного образа, равен разности между полным потенциалом, вызванным исправляющими ошибки выборочными образами, принадлежащими классу ω1, и полным потенциалом, вызванным исправляющими ошибки выборочными образами, принадлежащими классу ω2.

Из описанного алгоритма метода потенциальных функций очевидно, что кумулятивный потенциал выполняет роль решающей функции. Другими словами, в тех случаях, когда значение кумулятивного потенциала Ккк+1) больше нуля, если хк+1ω1, либо меньше нуля, если хк+1ω2, значение кумулятивного потенциала не корректируется. С другой стороны, неправильная классификация образа в процессе обучения приводит к изменению потенциальной функции. Следовательно, алгоритм метода потенциальных функций представляет собой итеративную процедуру, обеспечивающую непосредственное определение решающей функции для разделения классов ω1 и ω2; таким образом, положив d(x)=K(x), из уравнения (6.9) получаем

dk+1(x)=dk(x)+rk+1K(x,xk+1), (6.12)

что полностью соответствует формулировке (6.3).

Способ вычисления коэффициента rk+1 формируется в компактном виде так:

где показатель αk+1 определяется выражением (6.11) и функция имеет в данном случае вид =1 или (-1) в зависимости от того, больше нуля значение функции или оно меньше или равно нулю соответственно. Если решающая функция классифицирует образ хк+1 правильно, то rk=0 и в результате значение кумулятивного потенциала не изменяется.

Исходя из (6.2), уравнение (6.12) можно представить в другой рекуррентной форме:

(6.13)

где коэффициенты зависят от числа итераций, выполненных в процессе обучения. Из этого уравнения, а также проведенного выше анализа заключаем, что кумулятивный потенциал также имеет вид

(6.14)

Объединив уравнения (6.12), (6.13) и (6.1), получим формулу

(6.15)

которую можно использовать для итеративного вычисления коэффициентов разложения.