Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский университет «Высшая школа экономики»

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Lektsii_Vosstanovlen.docx

Скачиваний:

Добавлен:

01.07.2025

Размер:

423.57 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 56 / 146 7 8 9 10 11 12 13 14 > Следующая >>>

Проектирование в условиях неопределенности (адаптивных подход, третий тип систем).

спомним общую постановку задачи для 3-го типа систем:

- это известная нам, выбранная нами функция.

Априорная информация относительно случайного вектора отсутствует. Т. е. матожидание не берется, т. е. надо найти минимум неявно заданного функционала , поскольку, мы не можем взять матожидание, мы не знаем, как он себя ведет.

Вектор в каждый момент времени мы можем измерять (наблюдать), также мы можем измерять , более того мы его можем и изменять, поскольку это вектор зависимый от нас параметров проектирования. На основании этих двух величин, мы можем в каждый момент времени вычислить значение F.

Ставится задача только по данным значениям , и определить экстремум несуществующего функционала , то есть найти . Без адаптации (обучения) нам здесь не обойтись. Целью этого обучения является минимум функционала который мы не знаем.

Адаптивные алгоритмы или алгоритмы обучения.

словия экстремума будет:

Мы можем градиент ввести под знак матожидания, так как осреднение, то есть матожидание берется по , а градиент вычисляется по . Независимые вещи можно выносить под знак интеграла.

это у нас градиент от выбранной нами функции:

Мы берем по многим переменным , поэтому берем частные производные. Производная от скаляра по многим переменным. Это вектор градиента этой функции.

Компоненты этого вектора случайны (они зависят от случайного вектора , то есть зависит конкретной наблюдаемой реализации), но мы можем их вычислять, то есть наблюдать (измерять) в каждый момент времени ( мы знаем, знаем, мы тоже знаем) и это очень важно.

Возникает здравая инженерная идея: Использовать для обучения, то есть для настройки алгоритм той же структуры, что и для первого типа систем, но вместо критерия проектирования J брать функцию F случайную. Выпишем:

В непрерывном случае:

ли же в дискретном случае:

тот алгоритм можно расписать в рекуррентной форме:

стественно мы должны задать для них

. Запишем в общем случае:

Они очень походи на алгоритмы детерминированных и стохастических систем. Но есть очень существенное принципиальное отличие или особенности:

В алгоритмах обучения фигурируют конкретные случайные реализации , которые мы можем вычислять, измерять, наблюдать, как угодно в каждый момент времени. В то время как для тех алгоритмов, мы брали просто производную от критерия проектирования. Здесь мы этого сделать не сможем.
Те алгоритмы для детерминированных и стохастических систем сходились при

(t)

Г [t]

За счет того, что достигалось * функциональный элемент вырабатывал 0 и алгоритм останавливался, то есть на фоне интегратора был 0 и изменение прекращалось.

здесь? Предположим, что нам каким-то образом стало известно * (искомый вектор параметров проектирования), тогда

отя мы не можем взять матожидание, но теоретически это равно 0. Это необходимое условие экстремума. Но в силу случайности вектора сама конкретная реализация

та формула вовсе не обязательно равняется 0, потому что вектор случайный. А если эта величина не равна 0, то при Г (t) , правая величина

следовательно, в силу этого уравнения:

или первая разность:

Т о есть процесс изменения не останавливается, хотя мы вроде как вошли в эту точку. Эта специфика алгоритмов обучения или алгоритмов проектирования при адаптивных системах состоит в том, что элемент матрицы Г должны убывать со временем или с ростом итераций. Как убывать? Не слишком быстро, чтобы процесс затух, не дойдя до точки оптимума; но и не слишком медленно, чтобы процесс проскочил или начал возле нее раскачиваться. Структурная схема алгоритма обучения у нас почти та же самая, но с разницей. На вход у нас поступает , дальше у нас идет с минусом на Г [t] или Г (t), дальше идет либо дигратор, либо интегратор, если непрерывно. Затем получаем вектор , который возвращается на первый функциональный элемент, а на интегратор, или мы подаем , а на вход у нас поступает вектор :

Данная система «/» алгоритм уже не автономна. Это значит, что на нее извне поступает текущая случайная информация в виде вектора . Сразу охватить, то есть обработать эту информацию мы не можем. А можем лишь только наблюдать, измерять в ходе процесса работы системы. На основе чего мы должны найти .

Процесс постепенного извлечения информации или данных нужной нам извлекаемых с конкретной целью – это и есть процесс обучения или адаптации.

<<< < Предыдущая 1 2 3 4 56 / 146 7 8 9 10 11 12 13 14 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
02.06.20151.28 Mб7Lektsii_cherkasova_V_A.doc
#
01.05.20253.71 Mб1Lektsii_mikroekonomika.doc
#
13.11.2019993.28 Кб8Lektsii_po_ekonomike_PI.doc
#
01.03.2025113.09 Кб2Lektsii_po_teorii_organizatsii1.docx
#
14.11.20195.3 Mб13Lektsii_Ust-1-EMI-d-2012.doc
#
01.07.2025423.57 Кб3Lektsii_Vosstanovlen.docx
#
01.07.2025523.27 Кб2LEKTsIYa_2.docx
#
01.07.2025419.84 Кб3LEKTsIYa_3.docx
#
01.07.2025385.92 Кб1LEKTsIYa_4.docx
#
01.07.2025690.98 Кб4LEKTsIYa_5.docx
#
01.07.2025474.99 Кб3LEKTsIYa_6.docx