Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Алматинский университет энергетики и связи

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

30 Вопросов ИС.docx

Скачиваний:

Добавлен:

01.05.2015

Размер:

4.66 Mб

Скачать

☆

<<< < Предыдущая 12 / 32 3 > Следующая >>>

8.2 Модель персептрона

Структура персептрона представлена на рисунке 2.3.

Рис. 2.3. Структура персептрона

Функционирование персептрона можно описать выражением

. (2.3)

Обратим внимание, что формула (2.3) сводится к более обобщенному выражению (2.1) при . Функция f может быть дискретной ступенчатой функцией - биполярной (т.е. принимающей значения -1 или 1) либо униполярной (принимающей значения 0 или 1). В последующих рассуждениях будем предполагать, что функция активации биполярная и имеет форму

для

. (2.4)

В соответствии с функцией активации персептрон может принимать только два различных выходных значения, поэтому он может классифицировать сигналы, подаваемые на его вход в виде векторов х ~ [х₁ ..., х_n]^T одному из двух классов. Например, одновходовый персептрон может распознавать, является входной сигнал положительным или отрицательным. При наличии двух входов персептрон разделяет плоскость на две полуплоскости. Такая декомпозиция задается прямой линией, определяемой уравнением

. (2.5)

Уравнение (2.5) можно записать в виде

(2.6)

В общем случае, когда персептрон имеет п входов, он разделяет n - мерное пространство входных векторов х на два полупространства. Эти полупространства отделяются друг от друга (n - 1) - мерной гиперплоскостью, которая называется решающей границей (англ. decision boundary) и задается уравнением

. (2.7)

На рисунке 2.4 представлена решающая граница для п = 2. Необходимо отметить, что прямая, разделяющая полуплоскости, всегда перпендикулярна вектору весов w = [w₁, w₂]^T.

Как мы уже отмечали во введении, персептрон можно обучать. В процессе обучения модифицируются веса персептрона. Метод обучения персептрона получил название «обучение с учителем» или «обучение под надзором». Роль учителя заключается в подаче на вход персептрона сигналов x(t)=[x₀(f), x₁(t), ..., х_п(t)]^T, t = 1, 2, ..., для которых известны истинные значения выходных сигналов d(t), t = 1,2, …, называемых эталонными сигналами.

Рис. 2.4. Решающая граница для n=2

Совокупность таких входных выборок соответствующих им значений эталонных сигналов называется обучающей последовательностью. При использовании методов рассматриваемой группы после ввода входных значений рассчитывается выходной сигнал нейрона. После этого веса модифицируются так, чтобы минимизировать погрешность между эталонным сигналом и выходным сигналом персептрона. Такой подход объясняет термин «обучение с учителем», поскольку именно учитель задает эталонные значения. Конечно, существуют алгоритмы обучения сетей без учителя, однако эти алгоритмы мы будем рассматривать несколько позднее. Предлагаемый в настоящий момент алгоритм обучения персептрона состоит из следующих шагов:

Присвоить начальным весам персептрона случайные значения.
На входы нейрона подать обучающий вектор х = x(t)= [x₀(t), x₁(t), ..., x_n(t)]^T, t = 1,2,….
Рассчитать выходное значение персептрона у по формуле (2.3).
Сравнить выходное значение у(t) с эталонным значением d=d(x(t)), содержащимся в обучающей последовательности.
Модифицировать веса следующим образом:

а) если y(x(t)) ≠ d(x(t), то w_i(t +1) = w_i(t)+d(x(t)) x_i (t);

б) если y(x(t)) = d(x(t)), то w_i(t +1) = w_i (t), т.е. значения весов не изменяются.

6. Перейти к шагу 2.

Выполнение алгоритма продолжается до тех пор, пока для всех входных векторов, входящих в состав обучающей последовательности, погрешность на выходе не станет меньше априори заданного уровня. На рисунке 2.5 представлена блок-схема обучения персептрона. Выполнение одного внутреннего цикла этой схемы соответствует одной так называемой эпохе, которую составляют данные, образующие обучающую последовательность. Выполнение внешнего цикла отражает возможность многократного применения одной и той же обучающей последовательности, пока не будет выполнено условие остановки алгоритма.

Рис. 2.5. Блок-схема алгоритма обучения персептрона

. Докажем, что алгоритм обучения персептрона сходится. Теорема о сходимости персептрона формулируется следующим образом:

Если существует набор весов w*=[w₁*,...,w_n*]^T, корректно классифицирующий обучающие векторы х=[x₁,..., х_п]^T, т.е. выполняющий отображение у=d(x), то обучающий алгоритм найдет решение за конечное количество итераций при любых начальных значениях вектора весов w.

Предположим, что обучающая выборка представляет линейно сепарабельные классы, поскольку персептрон можно обучить только в этом случае. Покажем, что существует конечное количество шагов модификации весов, после выполнения которых персептрон будет корректно выполнять отображение у=d(x). Поскольку функция активации персептрона имеет тип «sgn», длина вектора w* может быть произвольной, например, равной 1,т.е. || w*|| = 1. Поэтому в процессе обучения вектор w достаточно модифицировать так, чтобы показанный на рисунке 2.6. угол α был равен 0. Очевидно, в этом случае cos (α) = 1. Из факта, что |w* _° х| > 0 (символ «о» обозначает скалярное произведение векторов) и w* является решением, следует существование такой константы δ > 0, для которой |w*_°х| > δ при любых векторах х, входящих в обучающую последовательность

Рис. 2.6. Иллюстрация выполнения алгоритма обучения

персептрона для n=2

Из определения скалярного произведения следует, что

. (2.8)

Поскольку

(2.9)

то

(2.10)

В соответствии с алгоритмом обучения персептрона веса для заданного входного вектора х модифицируются согласно формуле w' = w + Δw, где Δw = d(х) х. Мы предполагаем, что на выходе появится ошибка и что коррекция весов будет необходима. Заметим, что

w'°w* = w _°w* +d(x)w*_°х, (2.11)

поэтому

w' _°w* = w _°w* + sgn(w*_°x)w*_° x. (2.12)

Истинны следующие суждения:

а) если w*_° х < 0, то sgn(w*_°x) = -l, поэтому sgn(w*_° x) w*_° х= -l(w*_° x) >0;

б) если w* _° х > 0,тo sgn(w* _° x) = 1, поэтому sgn(w* _° х) w* _° х = l(w* _° х) > 0.

Следовательно,

sgn(w* _° х) w* _° х = |w*_°х|. (2.13)

В соответствии с формулами (2.12) и (2.13) можно записать:

w' _° w* = w _° w* + |w*_°х|. (2.14)

Нам также известно, что |w*_° х| > δ, поэтому

w' _°w* > w_°w* + δ. (2.15)

Теперь оценим значение ||w'||², не забывая о том, что мы рассматриваем случай, когда при подаче на вход обучающего вектора х на выходе сети появляется ошибка, т.е.

d(x)=-sgn(w_° x). (2.16)

Очевидно, что

||w'||²=||w + d(x)x||² ||w|| + 2d(x) w_° x +||x||² . (2.17)

С использованием зависимостей (6.16) и (6.17), а также предполагая ограниченность входных сигналов, получаем

||w'||²< ||w||² + ||x||² = ||w||² + C. (2.18)

После t шагов модификации весов сети зависимости (6.15) и (6.18) принимают вид

w(t)_° w* > w_° w* + tδ; (2.19)

||w(t)||²< ||w||² + tC. (2.20)

С использованием формул (2.10), (2.19) и (2.20) получаем

(2.21)

Поэтому должны существовать такие значения t = t_max, для которых cos(α) = 1. Следовательно, существует конечное количество шагов модификации весов, после которых вектор начальных весов будет корректно выполнять отображение у = d(x). Если предположить, что начальные значения весов равны 0, то

t_max =С/δ². (2.22)

Пример 2.1

Рассмотрим пример обучения персептрона. При обсуждении его функционирования мы выяснили, что эта двухвходовая модель нейрона делит плоскость на две полуплоскости (см. рисунок 2.4). Соответственно, если мы разместим на плоскости два класса выборок, которые можно разделить при помощи прямой линии, то персептрон в процессе обучения должен найти эту линию. Для нашего испытания начертим эталонную прямую, обозначенную на рисунке 2.7 символом L. Предположим, что все точки плоскости, лежащие над этой прямой, представляют выборки класса 1, а точки, лежащие под прямой L, представляют класс 2. В обеих полуплоскостях расположено бесконечное множество точек, поэтому мы должны отобрать по несколько представителей каждого класса. Мы хотим, чтобы персептрон после обучения формировал на выходе сигнал «1» для выборок из первого класса и сигнал «-1» - для выборок, принадлежащих второму классу. Применяемая обучающая последовательность представлена в таблице 2.1,

Рис. 2.7. Решающие границы для примера 2.1

Примем следующие начальные значения весов персептрона: w₁ = 2, w₂ = 2, θ = -4. На основании этих параметров и приведенных ранее данных чертим прямую К, которая показывает разделение пространства (решающую границу), найденную персептроном до начала процесса обучения. После 10 эпох выполнения алгоритма обучения (на входы нейрона 10 раз подавались все элементы обучающей выборки) персептрон начал корректно классифицировать входные сигналы, несмотря на то что прямая М не совпадает с прямой L.

Таблица 2.1

<<< < Предыдущая 12 / 32 3 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.05.2015134.66 Кб182192_srs2_politology.doc
#
10.03.2016475.65 Кб52222.doc
#
01.05.201569.93 Кб1924 билет ЗИ в ТКС.docx
#
01.05.201518.89 Кб133 д-ріс.docx
#
01.05.2015675.84 Кб123 лаба метод указ.doc
#
01.05.20154.66 Mб3530 Вопросов ИС.docx
#
23.11.20197.91 Mб7315976.rtf
#
01.05.201533.82 Кб1236 билет по ЗИ.docx
#
01.05.2015619.51 Кб13937_kankov_kak_reshatt_nestandartnije_zadi.pdf
#
10.03.20169.15 Mб242386083.rtf
#
01.05.201521.89 Кб114 д-ріс.docx