Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Восточноукраинский национальный университет им. В. Даля

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

177-220.doc

Скачиваний:

Добавлен:

28.04.2019

Размер:

2.01 Mб

Скачать

☆

<<< < Предыдущая 12 / 102 3 4 5 6 7 8 9 10 > Следующая >>>

8. Стохастические оптимальные системы

В стохастических системах управления невозможно предсказать ход протекания процесса по известным управлению и начальному состоянию, так как он зависит еще и от случайных воздействий. Поэтому возможности управления такими системами существенно зависят от информации, получаемой путем измерения и обработки выходной переменной. Задача синтеза стохастической оптимальной системы в общем случае ставится следующим образом. Задаются дифференциальные уравнения объекта, ограничения, краевые условия, уравнения наблюдения, критерий оптимальности и характеристики случайных воздействий и параметров. Требуется найти управление как функцию от измеренных значений выходной переменной на интервале .

Для решения стохастических задач оптимального управления разработаны методы синтеза, основанные на сведении стохастических задач оптимального управления к задачам оптимальной оценки состояния и синтеза детерминированной оптимальной системы управления.

8.1. Метод динамического программирования

Пусть объект описывается уравнением

, (8.1)

где – белый шум с характеристиками

;

, (8.2)

где – означает математическое ожидание величины, - дельта функция Дирака.

При условии, что и , требуется найти допустимое управление , при котором критерий оптимальности

(8.3)

принимает минимальное значение.

Итак, случайное воздействие является белым шумом и входит в уравнение объекта аддитивно; ограничение на правый конец траектории отсутствует, фазовый вектор измеряется полностью и без помех. В этой задаче является марковским процессом (так как случайное воздействие – белый шум), и все будущие состояния полностью определяются начальным состоянием и управлением . Поэтому оптимальное управление должно быть функцией только от текущего состояния и, может быть, времени для нестационарных систем. Здесь имеется в виду, что управление является допустимым, если функция кусочно непрерывна и принимает значения из .

Кроме того, предполагается, что уравнение

при каждом фиксированном имеет единственное решение на интервале . Функции , и предполагаются непрерывными.

Пусть в момент времени фазовый вектор принимает определенное значение. Обозначим значение функционала (8.3) при , указанном значении и некотором фиксированном управлении :

где - условное математическое ожидание величины а при реализации в.

Минимальное значение этого функционала

по определению есть функция Беллмана.

Представим функцию Беллмана в виде

или

. (8.4)

Используем свойство условного математического ожидания

Учитывая это свойство, можно записать

Подставив это выражение в (8.4) и используя принцип оптимальности, получим

Преобразуем последнее слагаемое

Следовательно,

(8.5)

Воспользуемся разложением в ряд Тейлора-Маклорена до членов второго порядка. При этом учтем, что при разложении скалярной функции  от векторного аргумента x мы имеем

Тогда

Используем теперь уравнение (8.1) в приращениях

которое можно подставить в выражение для :

Заметим, что

где каждое слагаемое с очевидностью равно нулю по условию.

Кроме того, для анализа поведения рассмотрим уравнение диффузии ( - коэффициент диффузии)

с начальным условием , где - функция Дирака, которая устанавливает, что при начальная дисперсия распределения равна нулю. Решение этой задачи есть функция

т.е. нормальное распределение, дисперсия которого, как видно из формулы пропорциональна . Тогда в нашем случае .

Таким образом, вычисляя математическое ожидание от мы должны сохранить член (т.к. он ), а все члены, пропорциональные и , отбросить, т.к. они более высокого порядка малости, чем , и отбросить члены, линейные относительно (т.к. напоминаем ). Тогда можно записать

Подставив это в выражение (8.5), и перенося слева в выражение под знак min, получим:

(8.6)

Если для двухмерного случая положить

где , то

Это в точности равно выражению

где (или ) - след матрицы, равный сумме диагональных элементов итоговой матрицы.

Тогда, учитывая, что , можем записать

Подставив полученное выражение в (8.6) и разделив на , и устремив , получим

. (8.7)

Если множество открыто и минимум левой части уравнения (8.7) достигается во внутренней точке , то уравнение Беллмана можно представить в виде системы уравнений:

, (8.8)

. (8.9)

<<< < Предыдущая 12 / 102 3 4 5 6 7 8 9 10 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
28.04.20192.22 Mб17133-176.doc
#
14.08.2019194.43 Кб16139003.rtf
#
16.12.201848.76 Кб416,17,19,20 docx.docx
#
29.08.201984.99 Кб116-19.doc
#
09.03.2016726.06 Кб1116813.rtf
#
28.04.20192.01 Mб11177-220.doc
#
09.09.2019171.49 Кб7198490.rtf
#
25.03.2015214.53 Кб461ISTORIYa_PEDAGOGIKI_SEMINARS_KI_ZANYaTTYa.doc
#
25.03.2015129.02 Кб71_Derzhava.doc
#
09.03.2016431.03 Кб262 Конструкторско – технол. часть.docx
#
25.03.20156.52 Mб532 курс КЛ Философия.doc