Двойственное функционирование и быстрое дифференцирование

Добавил:

Valeriya Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Липецкий государственный технический университет

Предмет:

Методы оптимизации

Файл:

Лекции / 2_Дифференцирование в методах нелинейного программирования.doc

Скачиваний:

Добавлен:

20.06.2014

Размер:

427.01 Кб

Скачать

☆

<<< < Предыдущая 1 23 / 33

Двойственное функционирование и быстрое дифференцирование

Основной инструмент при построении двойственного функционирования - формула для дифференцирования «двухслойной» сложной функции нескольких переменных

. (2.2.5)

Итак, пусть G -связный (но не обязательно ориентированно связный) ориентированный граф без ориентированных циклов. Как и выше,v(G) - множество вершинG,e(G) - множество ребер. Пусть, далее, каждой вершинеv(G) сопоставлена метка - символ алфавитаp(), а каждому ребру (,)e(G) сопоставляется метка - конечное множество натуральных чиселP(,) и выполнено условие согласования А: если для данногоv(G) множество входящих ребер (,) непусто, то(являетсяk-местным функциональным символом при некоторомk) и семейство множеств {P(,)|(,)e(G)} при фиксированномобразует разбиение множества номеров {1,...,k}. Для каждой вершиныv(G) обозначим множество входящих в нее реберin(), а выходящих из нее -out().

Пусть указана интерпретация всех символов, отмечающих вершины графа, значения переменных, отвечающих входным вершинам и уравнениям функционирования (2.2.2) определены значения Z() для всех вершин графа. В результате определены значения всех сложных функций, формулы для которых являются термами, соответствующими вершинам графаG. Процесс вычисленияZ() будем называтьпрямым в противовесобратномуилидвойственному, к описанию которого мы переходим.

При заданных Z() для каждой вершины и каждого ребра строятсяпеременные двойственного функционирования (или, более кратко,двойственные переменные). Будем обозначать их() для вершин и(,) - для ребер.

Для выходных вершин () являются независимыми переменными. Пусть их значения заданы. Для вершины, не являющейся выходной, значение() есть сумма значений двойственных переменных, соответствующих выходящим изребрам:

. (2.2.6)

Для ребра (,) значение(,) определяется согласно формуле (5):

. (2.2.7)

Используя (6)-(8), можно записать правила вычисления двойственных переменных для вершин, не использующие двойственных переменных для ребер:

(2.2.8)

Процесс вычисления двойственных переменных организуется послойно от выходных вершин к входным и часто называется процессом обратного распространения(backpropagation) или просто обратным процессом.

Пусть задана интерпретация всех символов, отмечающих вершины графа G, определены значения независимых переменных (а также констант), соответствующих вершинам входного слояи значения независимых переменных двойственного функционирования() для вершин выходного слоя. Тогда для любого

. (2.2.9)

где - соответствующая вершинефункция от независимых переменных и констант, отмечающих вершины нулевого слояG,- соответствующая вершинепеременная или константа, а производные в (2.2.9) берутся при фиксированных значениях прочих переменных и констант.

<<< < Предыдущая 1 23 / 33

Соседние файлы в папке Лекции

#
20.06.2014444.42 Кб1621_Введение.doc
#
20.06.2014427.01 Кб612_Дифференцирование в методах нелинейного программирования.doc
#
20.06.2014352.26 Кб603_Решение систем уравнений.doc
#
20.06.20141.09 Mб1754_Безусловный поиск минимума функции.doc
#
20.06.20141.41 Mб2745_Задача условной оптимизации функции многих переменных.doc
#
20.06.2014151.55 Кб966_Нелинейная задача наименьших квадратов.doc