Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Восточноукраинский национальный университет им. В. Даля

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

177-220.doc

Скачиваний:

Добавлен:

28.04.2019

Размер:

2.01 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 109 10 > Следующая >>>

9.4. Стохастическая система управления при неполной информации

Пусть объект и наблюдение описываются уравнениями

;

и критерий оптимальности имеет вид

Шум объекта V₀(i) и шум наблюдения V_H(i) представляют последовательности независимых гауссовских случайных величин с нулевыми средними, дисперсионными матрицами Q₀(i) и R₀(i) соответственно. Матрицы F, Q(i), R(i), Q₀(i) и R₀(i) симметричны, причем F0, Q(i)0, R(i)>0, Q₀(i)0, R₀(i)>0 при i₀ii_j-1. Начальное состояние x(i₀)=x⁰ является гауссовской случайной величиной со средним значением и дисперсионной матрицей p₀ и не зависит от шумов V₀(i) и V_H(i).

Требуется найти такое управление

при котором критерий принимает минимальные значения.

Для этой задачи справедлив принцип разделения, поэтому ее решение имеет вид:

(9.26)

(9.27)

Соотношения (9.26) определяют оптимальное управление с обратной связью. Они совпадают с соотношениями (9.13), (9.9), (9.6), определяющими оптимальный регулятор в случае полной информации, за исключением того, что в (9.26) входит оценка вместо x(i).

Оценка получается на выходе фильтра (9.27), совпадающего с фильтром Калмана (9.20) – (9.24). Таким образом, дискретная оптимальная система управления в случае неполной информации, как и аналогичная непрерывная система управления, состоит из оптимального фильтра и оптимального детерминированного регулятора.

Если шумы или значение фазового вектора в начальный момент не являются гауссовскими, то соотношения (9.26), (9.27) определяют линейную оптимальную оценку только в классе линейных систем.

Приложение 1 п1. Функционал и его экстремумы

Функционалом называется отображение функций заданного класса М на множестве действительных чисел, т.е.:

где и класс М определяется свойствами , например класс непрерывных функций, гладких функций и т.п.

Вполне очевидно, что для каждого функционала можно поставить задачу об отыскании такой функции (или некоторого множества функций ), на которой функционал достигает экстремального (минимального или максимального) значения, т.е.

или , –

для глобального экстремума и

или , –

для локального экстремума.

Значение первой вариации функционала равно линейной относительно вариации аргумента частью приращения функционала и является определяющим при отыскании экстремума .

Необходимым условием экстремума функционала является равенство нулю первой вариации функционала

(П1.1)

а знак второй вариации определяет тип экстремума точно так же, как и второй дифференциал для экстремума функции.

Если задан функционал интегрального типа, для которого требуется найти экстремум, т.е.

(П1.2)

причем концы экстремалей функций, на которых достигается экстремум, фиксированы:

, (П1.3)

то условие (П1.1) приводит к уравнению Эйлера

. (П1.4)

Отыскание экстремалей состоит в решении уравнения (П1.4) с граничными условиями (П1.3). Это так называемая простейшая задача вариационного исчисления.

Если концы y(a) и y(b) подвижны, то задача поиска экстремума имеет вид

(П 1.5)

Её решение отыскивается с использованием уравнения Эйлера совместно с условиями трансверсальности

. (П1.6)

Если же не зафиксированы начало х=а и конец х=b, то в этом случае функционал может иметь вид

, (П1.5’)

и для поиска его экстремалей необходимо решать уравнение Эйлера (П1.4) совместно с условиями (П1.6) и дополнительными условиями трансверсальности:

. (П1.7)

Если в (П1.2), (П1.5) и (П1.5’) y(x) есть векторная функция , то уравнение Эйлера (П1.4) является системой уравнений для n координат .

Точно так же векторными являются краевые условия (П1.3) и условия трансверсальности (П1.6). Условия (П1.7) являются скалярными с участием векторов:

, (П1.8)

где Т-символ транспонирования.

В общем n-мерном случае решение задачи поиска вектор-функции , доставляющей экстремум функционалу (П1.2), или (П1.5), или (П1.5’), сводится к следующему:

найти общее решение системы n дифференциальных уравнений Эйлера второго порядка (П1.4);
если задача с фиксированными концами, то найти 2n неопределенных констант интегрирования из 2n краевых условий (П1.3);
если задача с подвижными концами, то константы определяются из 2n условий трансверсальности (П1.6);
если не фиксированы концы x=a и/или x=b, то для их определения дополнительно используют условия трансверсальности (П1.7).

В этой схеме решения отсутствие краевого условия по любой i-й координате в x=a или x=b требует использования соответствующего условия трансверсальности и наоборот. Таким образом, в любой комбинации суммарное число краевых условий и условий трансверсальности должно составлять 2n.

Если в решении допускаются негладкие решения, имеющие конечное число угловых точек (точек разрыва производной y(x)), то в таких точках должны выполняться условия Вейерштрасса-Эрдмана:

, (П1.9)

где с [a,b] является угловой точкой траектории.

Пусть ставится задача об отыскании экстремума функционала

(П1.10)

при фиксированных условиях на концах (П1.3), но с дополнительными голономными и неголономными связями в виде систем уравнений:

(П1.11)

(П1.12)

Тогда для решения задачи прежде всего формируется функция Лагранжа

(П1.13)

где - неопределенные коэффициенты или множители Лагранжа, подлежащие в дальнейшем определению. Коэффициенты, стоящие перед уравнениями голономных связей, являются в общем случае функциями переменной а - константами.

Далее решаем вариационную задачу

(П1.14)

где Из (П1.13) и (П1.14) следует, что один из параметров можно выбрать произвольно, т.к. это не повлияет на результат решения задачи (П1.14). обычно фиксируют выбирая в зависимости от вида экстремума.

Таким образом, задача об условном экстремуме функционала (П1.10) - (П1.12) сводится к задаче о безусловном экстремуме функционала (П1.2) – (П1.3).

Для её решения необходимо решить уравнение (П1.4), которое в этом случае называется уравнением Эйлера-Лагранжа

, (П1.15)

с учетом уравнений связи (П1.11) и (П1.12), т.к. вариации по и приводят (с учетом структуры L в выражении (П1.3)) именно к ним.

В многомерном случае, когда - выражение (П1.15) является системой дифференциальных уравнений с краевыми векторными условиями.

Если сделать подвижными концы траектории и переменными значения a и b, то можно сформулировать задачу:

(П1.16)

при условиях:

(П1.17)

(П1.18)

. (П1.19)

тогда, используя функцию Лагранжа (П1.13) и функцию , где обычно , решается задача

(П1.20)

которая соответствует задаче (П1.5)–(П1.7). Решение состоит из интегрирования дифференциального уравнения (П1.15) совместно с условиями трансверсальности

(П1.21)