Добавил:

Studfiles2 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Анализ и интерпретация данных

Файл:

Анализ и интерпретация данных / Глава_5.DOC

Скачиваний:

106

Добавлен:

01.05.2014

Размер:

2.76 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 45 / 195 6 7 8 9 10 11 12 13 14 15 16 17 18 19 > Следующая >>>

5.5.2. Доказательство сходимости для случая коррекции по одной выборке

Исследование сходимости алгоритма спуска удобно начать с варианта, более легкого для анализа. Вместо определения по всем выборкам и осуществления коррекции по множеству классифицируемых с ошибкой выборок Y_k выборки будут рассматриваться последовательно, и весовой вектор будет изменяться всякий раз, когда некоторая выборка будет классифицироваться с ошибкой. Для доказательства сходимости подробная характеристика данной последовательности неважна, коль скоро каждая выборка появляется в последовательности бесконечно большое число раз. Наиболее просто убедиться в этом, повторяя выборки циклически.

Два последующих упрощения помогут лучшему пониманию излагаемого материала. Во-первых, временно ограничимся случаем, когда является константой. Это так называемый случай с постоянным приращением. Из соотношения (13) следует, что если — величина постоянная, то она служит лишь для масштабирования выборок. Таким образом, в случае с постоянным приращением можно, без ущерба для общности, положить =1. Второе упрощение состоит лишь в введении обозначений. Когда выборки рассматриваются последовательно, некоторые из них классифицируются с ошибкой. Поскольку весовой вектор изменяют лишь при наличии ошибки, внимание фактически сосредоточивается только на выборках, классифицируемых с ошибкой. Таким образом, последовательность выборок обозначается через y¹, у², . . . , у^k, . . . , где каждый у^k является одной из n выборок y₁, . . ., y_n и каждая выборка y^kклассифицируется с ошибкой. Например, при циклическом повторении выборок y₁, у₂ и у₃, если отмеченные выборки

,,,,,,,,…

классифицируются с ошибкой, то последовательность y¹, у², у³, у⁴, у⁵, . . . обозначает последовательность y₁, у₃, y₁, у₂, у₂,. . . . Исходя из данного объяснения, для образования последовательности весовых векторов может быть записано правило постоянного приращения:

(14)

где для всехk.

Правило постоянного приращения является простейшим из числа многих алгоритмов, которые предлагались для решения систем линейных неравенств. Впервые оно появилось при введении схемы обучения с подкреплением, предложенной Ф. Розенблаттом для его персептронной модели мозга и доказательства сходимости последней, известного под названием теоремы сходимости персептрона.

В частности, можно дать ее геометрическую интерпретацию в весовом пространстве. Поскольку вектор классифицирует у^k с ошибкой, то не будет находиться с положительной стороны у^k, принадлежащего гиперплоскости . Прибавление у^k к вектору смещает весовой вектор непосредственно в направлении к данной гиперплоскости при возможности ее пересечения (рис. 5.10). Независимо от того, пересечется ли гиперплоскость или нет, новое скалярное произведение будет больше прежнего

Рис. 5.10.Шаг, соответствующий правилу постоянного приращения.

произведения на величину ||у^k||², в результате получаем, что вследствие коррекции весовой вектор смещается в нужном направлении.

Покажем теперь, что, если выборки линейно разделяемы, последовательность весовых векторов будет ограничиваться вектором решения. При доказательстве необходимо отметить, что каждая процедура коррекции сдвигает весовой вектор ближе к области решения. То есть следует показать, что если является любым вектором решения, то значение ||a_k₊₁—|| меньше значения ||а_k— ||. Хотя в общем случае данное утверждение оказывается несправедливым, будет показано, что оно выполняется для векторов решения, имеющих достаточную длину.

Пусть — вектор решения, так что величина у_i строго положительна для всех i, a — положительный скалярный коэффициент. Из соотношения (14) следует, что

тогда

Поскольку у^k классифицировался с ошибкой, то , и, таким образом, можно записать следующее выражение:

Так как величина строго положительна, второй член будет по модулю превосходить третий при условии, что значение , достаточно велико. В частности, если положить

(15)

(16)

то

и если выбрать

(17)

то получим следующее выражение:

Таким образом, квадрат расстояния от до при каждой коррекции будет уменьшаться, по крайней мере на величину , и послеk коррекций представится в следующем виде:

Поскольку величина квадрата расстояния не может быть отрицательной, из этого следует, что последовательность коррекций должна быть ограничена числом коррекций, не большим чем k₀, где

(18)

Поскольку коррекция осуществляется всякий раз, когда выборка классифицируется с ошибкой, и поскольку каждая выборка появляется бесконечно большое число раз в последовательности, отсюда следует, что после прекращения процесса коррекций полученный весовой вектор должен правильно осуществлять классификацию всех выборок.

Число k₀ определяет предельное значение числа коррекций. Если a₁=0, получается следующее достаточно простое выражение для k₀:

(19)

Данное выражение показывает, что трудность задачи в основном определяется наличием выборок, наиболее близких к ортогональным по отношению к вектору решения. К сожалению, указанное выражение невозможно использовать при рассмотрении нерешенной задачи, поскольку в данном случае граница должна определяться исходя из неизвестного вектора решения. Очевидно, что в общем случае задачи с линейно разделяемыми множествами могут представлять известные трудности для определения решения в условиях компланарности выборок. Тем не менее, если выборки линейно разделяемы, правило постоянного приращения будет давать решение после конечного числа коррекций.

<<< < Предыдущая 1 2 3 45 / 195 6 7 8 9 10 11 12 13 14 15 16 17 18 19 > Следующая >>>

Соседние файлы в папке Анализ и интерпретация данных

#
01.05.20142.53 Mб114Глава_3.doc
#
01.05.20144.12 Mб108Глава_4.doc
#
01.05.20142.76 Mб106Глава_5.DOC
#
01.05.201410.78 Mб110Глава_6.DOC