Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный Технический Университет Харьковский Политехнический Институт

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

LECT2_распознавание2.doc

Скачиваний:

Добавлен:

31.07.2019

Размер:

782.85 Кб

Скачать

☆

<<< < Предыдущая 1 23 / 43 4 > Следующая >>>

3.3.2. Персептронная функция критерия

Пусть функция критерия будет:

(3.31)

где суммирование осуществляется по неправильно классифицированным векторам образов. Геометрически J_p(w) пропорционально сумме расстояний неправильно классифицированных образов от гиперплоскости.

Возьмем производную от J_p(w) по w(k) :

(3.32)

где w(k) означает величину w на k-ой итерации. Персептронный обучающий алгоритм может быть сформулирован как

w(k+1) = w(k) - (3.33)

w(k+1) = w(k) + (3.34)

где Р - последовательность неправильно классифицированных образов при данном w(k) . Уравнение (3.34) может быть затем интерпретировано в том смысле, что (k+1) весовой вектор может быть получен добавлением умноженной на некоторый множитель сумму неправильно классифицированных образов для

k-ого весового вектора.

Это процедура, называемая "many-at-time" ("большое время"), т.к. мы определяем w^Tz для всех zР, только после того как все образы были классифицированы.

Если мы делаем настройку после каждого неправильно классифицированного образа (мы называем это "one-at-a-time") процедура функция критерия становится

J(w) = -w^Tz (3.35)

J(w) = -z

Алгоритм обучения будет иметь вид

w(k+1) = w(k) +_kz (3.37)

Это правило с фиксированным инкрементом, если _k = с (константа).

3.3.3. Релаксационная функция критерия

Функкция критерия, используемая в этом алгоритме, имеет вид

(3.38)

Р - здесь снова последовательность неправильно классифицированных образов при заданном w. То есть Р состоит из тех z , для которых -w^Tz +b0

или: w^Tz  b. Градиент J_r(w) по w(k) дает

(3.39)

Базовый релаксационный обучающий алгоритм формулируется как

(3.40)

Э то также "many-at-time" алгоритм. Соответствующий "one-at-a-time" алгоритм будет:

(3.41)

который становится алгоритмом частичной коррекции с  = _k .

3.4. Обучение кусочно-линейных машин

В общем случае не существует теорем сходимости для для обучающих процедур коммитет или других кусочно-линейных машин. Одна процедура, которая часто бывает удовлетворительной приводится ниже. Пусть М=2 и имеется R дискриминантных функций, где R - нечетное. Тогда

(3.42)

Классификация в коммитет-машине будет затем выполняться согласно

(3.43)

т ак что

(3.44)

г де:

(3.45)

Отметим, что так как R - нечетное, d(z) не может быть равно 0 и будет всегда нечетным. Так как d(z) равно разнице между числом d_i(z) 0 и d_i(z)  0 для весового вектора w_i (k) для k-ой итерации. В нашем случае мы всегда желаем иметь d_i(z) 0 . Другими словами мы желаем иметь больше весовых векторов, которые дают d_i(z) 0 .

Когда d_i(z)  0, имеет место неправильная классификация. Будет очевидным, что в этом случае будет [ R+d(z) ] / 2 весовых векторов среди w_i (k), i=1,2,...,R, которые дают отрицательные ответы [d_i(z)  0] и [ R-d(z) ] / 2 весовых векторов , которые дают положительные ответы [d_i(z) 0]. Для получения правильной классификации нам необходимо изменить, по крайней мере n ответов w_i (k) от -1 к +1, где n может быть найдено из уравнения:

(3.46)

В первых скобках представлено число d_i , которое сейчас больше нуля, выражение в скобках после минуса представляет число d_i , которое меньше нуля. Минимальная величина n тогда будет

n_min = [d(z) + 1] / 2 , (3.47)

которое дает минимальное число векторов, необходимых для настройки.

Процедура для настройки весового вектора:

1) убираем наименьший отрицательный d_i(z) среди отрицательных d_i(z) ;

2) настраиваем [d(z) + 1] / 2 весовых векторов по следующему правилу:

w_i (k+1) = w_i (k) + сz, (3.48)

таким образом, что из результирующие d_i(z) становятся положительными. Все другие весовые векторы остаются неизменными на этой стадии;

3) если на k-ой стадии машина неправильно классифицирует образ, принадлежащий w₂ , делаем классифицирующие коэффициенты с отрицательной величиной, так что

w_i (k+1) = w_i (k) - сz.

3.5. Практические соображения, касающиеся метода обучения

<<< < Предыдущая 1 23 / 43 4 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.2025146.94 Кб0lebedinsky.doc
#
31.07.2019178.18 Кб3Lec 1-2.doc
#
24.12.20181.31 Mб67Lec 5-1Теория графов.doc
#
31.07.2019506.88 Кб10Lec 5-2 конечние автоматы и языки.doc
#
24.12.2018643.58 Кб9LECT2_распознавание.doc
#
31.07.2019782.85 Кб5LECT2_распознавание2.doc
#
11.11.201949.15 Кб3Lecture 1 - Macroeconomic science & History of...doc
#
11.11.2019160.77 Кб1Lecture 2 - Macroeconomic Indicators in the sys...doc
#
11.11.2019366.08 Кб5Lecture 3 - The Aggregate Demand & Aggregate Su...doc
#
11.11.2019245.25 Кб2Lecture 5 - Macroeconomic instability. Inflatio...doc
#
02.02.20154.49 Mб16Lehrer, Jonahan. How We Decided.pdf