Добавил:

Studfiles2 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Анализ и интерпретация данных

Файл:

Анализ и интерпретация данных / Глава_5.DOC

Скачиваний:

106

Добавлен:

01.05.2014

Размер:

2.76 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 56 / 196 7 8 9 10 11 12 13 14 15 16 17 18 19 > Следующая >>>

5.5.3. Некоторые непосредственные обобщения

Правило постоянного приращения можно обобщить с целью выделения связанных между собой алгоритмов. Коротко будут рассмотрены два наиболее интересных варианта. В первом варианте вводится понятие переменного приращения и допуск b и предусматривается коррекция, когда величина является недостаточной для превышения допуска. Алгоритм задается в следующем виде:

(20)

где теперь b для всех k. Можно показать, что, если выборки линейно разделяемы и если

(21)

(22)

(23)

a_k сходится к вектору решения а, удовлетворяющему условию при всех значенияхi. В частности, условия, налагаемые на , выполняются в том случае, если является положительной константой или убывает как 1/k.

Следующим вариантом, представляющим интерес, является первоначально рассмотренный алгоритм градиентного спуска для J_p:

(24)

где Y_k — множество выборок, классифицируемых с ошибкой посредством а_k. Легко видеть, что данный алгоритм будет также давать решение, принимая во внимание, что если является вектором решения для последовательности y₁, . . ., y_n, то он правильно классифицирует корректирующий вектор

Таким образом, если выборки являются линейно разделяемыми, то все возможные виды корректирующих векторов составляют линейно разделяемое множество, и если удовлетворяет соотношениям (21) — (23), то последовательность весовых векторов, получаемая посредством алгоритма градиентного спуска для Jp, всегда будет сходиться к вектору решения.

Интересно заметить, что условия, налагаемые на , удовлетворяются в тех случаях, когда является положительной константой и когда убывает как 1/k или даже возрастает с ростом k. Вообще говоря, предпочтение следует отдавать , уменьшающемуся с течением времени. Это замечание становится особенно существенным, когда есть основание считать, что множество выборок линейно нераз-деляемо, поскольку в данном случае уменьшается отрицательное влияние нескольких «плохих» выборок. Однако то, что в случае разделяемых выборок при увеличении получение решения оказывается все же возможным, кажется довольно странным.

Из данного наблюдения вытекает одно из различий между теоретическим и практическим взглядами на эту проблему. С теоретической точки зрения представляется интересным тот факт, что решение можно получить при наличии конечного числа шагов в случае любого ограниченного множества разделяемых выборок, при любом начальном весовом векторе a₁, при любом неотрицательном значении допуска b и при любом скалярном коэффициенте , удовлетворяющем соотношениям (21) — (23). С практической точки зрения желательно производить разумный выбор указанных величин. Рассмотрим, например, допуск b. Если b намного меньше ||y^k||², т.е. той величины, на которую возрастает в результате коррекции, то очевидно, что b будет оказывать совсем малое влияние. Если b намного превосходит величину ||y^k||², то потребуется большое число коррекций, чтобы добиться выполнения условия >b. Часто в качестве компромиссного подхода используют величину, близкую к ||y^k||². Кроме указанных вариантов выбора и b, большое влияние на результат может оказывать масштабирование компонент вектора у^k. Наличие теоремы сходимости не избавляет от необходимости сознательного подхода при использовании данных методик.

<<< < Предыдущая 1 2 3 4 56 / 196 7 8 9 10 11 12 13 14 15 16 17 18 19 > Следующая >>>

Соседние файлы в папке Анализ и интерпретация данных

#
01.05.20142.53 Mб114Глава_3.doc
#
01.05.20144.12 Mб108Глава_4.doc
#
01.05.20142.76 Mб106Глава_5.DOC
#
01.05.201410.78 Mб110Глава_6.DOC