Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
КОНСПЕКТ(ИМС).doc
Скачиваний:
63
Добавлен:
17.09.2019
Размер:
52.58 Mб
Скачать

Процедуры самообученя распознаванию образов

Рассмотрим методы построения дискриминантной функции по заданной (обучающей) выборке применительно к задаче о разделении образов на два класса. Если заданы два множества образов, принадлежащих соответственно классам А и В, то решение задачи построения линейной дискриминантной функции ищется в виде вектора весовых коэффициентов W=(w1,w2,...,wn,wn+1), обладающего тем свойством, что для любого образа выполняются условия

x принадлежит классу A, если [sum(wjxjxj)+ wn+1]>0, j=1,2,…n.

x принадлежит классу B, если [sum(wjxjxj)+ wn+1]<0, j=1,2,…n.

Если обучающую выборку составляют N образов обоих классов, задача сводится к отысканию вектора w, обеспечивающего справедливость системы неравенств Если обучающую выборку составляют N образов обоих классов, задача сводится к отысканию вектора w, обеспечивающего справедливость системы неравенств

x11wi+x21w2+...+xn1wn+wn+1>0;

x12wi+x22w2+...+xn2wn+wn+1<0;

................................................

x1iwi+x2iw2+...+xniwn+wn+1>0;

................................................

x1Nwi+x2Nw2+...+xnNwn+wn+1>0;

здесь xi=(xi1,xi2,...,xin,xin+1) - вектор значений признаков образа из обучающей выборки, знак > соответствует векторам образов x, принадлежащих классу A, а знак < - векторам x, принадлежащих классу B.

Искомый вектор w существует, если классы A и B разделимы и не существует в противном случае. Значения компонент вектора w могут быть найдены либо предварительно, на этапе, предшествующем аппаратной реализации СРО, либо непосредственно самой СРО в процессе ее функционирования. Последний из указанных подходов обеспечивает большую гибкость и автономность СРО. Рассмотрим его на примере устройства, называемого перцентроном. изобретенного в 1957 году американским ученым Розенблатом. Схематичное представление перцентрона, обеспечивающего отнесение образа к одному из двух классов, представлено на следующем рисунке.

Сетчатка S Сетчатка A Сетчатка R

о                        о    x1

о

о                         о     x2

о

о                         о     x3

о                                                      (sum)-------> R (реакция)

о                         о     xi

о

о                         о     xn

о

о                         о     x n+1

Устройство состоит из сетчатки сенсорных элементов S, которые случайным образом соединены с ассоциативными элементами сетчатки A. Каждый элемент второй сетчатки воспроизводит выходной сигнал только в том случае, если достаточное число сенсорных элементов, соединенных с его входом, находятся в возбужденном состоянии. Реакция всей системы R пропорциональна сумме взятых с определенными весами реакций элементов ассоциативной сетчатки.

Обозначив через xi реакцию i-го ассоциативного элемента и через wi - весовой коэффициент реакции i-го ассоциативного элемента, реакцию системы можно записать как R=sum(wjxj), j=1,..,n . Если R>0, то предъявленный системе образ принадлежит классу A, а если R<0, то образ относится к классу B. Описание этой процедуры классификации соответствует рассмотренным нами раньше принципам классификации, и, очевидно, перцентронная модель распознавания образов представляет собой, за исключением сенсорной сетчатки, реализацию линейной дискриминантной функции. Принятый в перцентроне принцип формирования значений x1, x2,...,xn соответствует некоторому алгоритму формирования признаков на основе сигналов первичных датчиков.

В общем случае может быть несколько элементов R, формирующих реакцию перцептрона. В таком случае говорят о присутствии в перцептроне сетчатки R реагирующих элементов.

Схему перцентрона можно распространить на случай, когда число классов более двух, путем увеличения числа элементов сетчатки R до числа различаемых классов и введение блока определения максимальной реакции в соответствии со схемой, представленной на выше приведенном рисунке. При этом образ причисляется к классу с номером i, если Ri>Rj, для всех j.

Процесс обучения перцентрона состоит в подборе значений весовых коэффициентов wj так, чтобы выходной сигнал соответствовал тому классу, которому принадлежит распознаваемый образ.

Рассмотрим алгоритм действия перцентрона на примере распознавания объектов двух классов: A и B. Объектам класса A должно соответствовать значение R = +1, а классу B - значение R = -1.

Алгоритм обучения состоит в следующем.

Если очередной образ x принадлежит классу A, но R<0 (имеет место ошибка распознавания), тогда коэффициенты wj c индексами, которым соответствуют значения xj>0, увеличивают на некоторую величину dw, а остальные коэффициенты wj уменьшают на dw. При этом значение реакции R получает приращение в сторону ее положительных значений, соответствующих правильной классификации.

Если x принадлежит классу B, но R>0 (имеет место ошибка распознавания), то коэффициенты wj с индексами, которым соответствуют xj<0, увеличивают на dw, а остальные коэффициенты wj уменьшают на ту же величину. При этом значение реакции R получает приращение в сторону отрицательных значений, соответствующих правильной классификации.

Алгоритм таким образом вносит изменение в вектор весов w в том и только в том случае, если образ, предъявляемый на k-ом шаге обучения, был при выполнении этого шага неправильно классифицирован, и оставляет вектор весов w без изменений в случае правильной классификации. Доказательство сходимости данного алгоритма представлено в работе [Ту, Гонсалес]. Такое обучение в конечном итоге (при надлежащем выборе dw и линейной разделимости классов образов) приводит к получению вектора w, обеспечивающего правильную классификацию.