Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
177-220.doc
Скачиваний:
11
Добавлен:
28.04.2019
Размер:
2.01 Mб
Скачать

9.2. Стохастическая оптимальная линейная система при полной информации о состоянии

Пусть объект описывается уравнением

(9.14)

и задан критерий оптимальности

, (9.15)

где h(i) - известная функция;

V0(i) - последовательность некоррелированных случайных величин с нулевым средним и дисперсионной матрицей Q0(i);

F, Q, R, Q0 - симметричные матрицы, причем F0, Q0, R>0, Q00. Шум V0(i) не коррелирован с начальным значением x(i0).

Требуется найти оптимальное управление с обратной связью, т.е. управление, доставляющее минимум функционалу (9.15) при произвольном начальном состоянии объекта. Принимается, что фазовый вектор х известен без ошибки. Эта задача является дискретным аналогом непрерывной задачи (8.39) и отличается от задачи (9.1) – (9.2) тем, что объект подвержен случайному воздействию, и критерий оптимальности представляет собой математическое ожидание от функционала, совпадающего с критерием оптимальности в детерминированной задаче. Ее решение совпадает с решением детерминированного аналога, т.е. стохастическое оптимальное управление определяется соотношениями (9.8), (9.9), (9.10), (9.13).

Для вывода уравнений используется метод динамического программирования.

Функция Беллмана определяется следующим образом

Уравнение Беллмана принимает вид (опускается аргумент i)

или

.

Решение этого уравнения ищется в виде (9.5). После необходимых преобразований можно получить соотношения для оптимального управления, что и в детерминированном случае.

9.3. Наблюдатель (фильтр) Калмана

Задача синтеза стохастической оптимальной системы при неполной информации в дискретном случае аналогична задаче в непрерывном случае (принцип разделения). Рассмотрим задачу оптимальной оценки. Пусть объект и наблюдение описываются уравнениями

, (9.16)

; (9.17)

где V0(i), VH(i) - последовательность гауссовских случайных величин с характеристиками:

, (9.18)

где - символ Кронекера ( =1 при i=j и =0 при ij);

x0 - гауссовая случайная величина с характеристиками

(9.19)

где Q0(i), R0(i), p0 - симметричные матрицы, причем Q0(i)0; R0(i)>0; p00.

Случайные последовательности V0(i) и VH(i) называют соответственно шумом объекта и шумом наблюдения или измерения, и они не коррелированны со случайной величиной x0.

Требуется, используя измеренные значения переменной y(i) при j=i0,i0+1,...,i, найти несмещенную оценку вектора x(i), обеспечивающую минимум квадрата ошибки :

.

Напомним, что оценка называется несмещенной, если . Условие R(i0)>0 означает, что ни одна координата выходной переменной не измеряется точно (несингулярная задача).

Решение невырожденной задачи определяется следующим образом:

; (9.20)

(9.21)

; (9.22)

; (9.23)

(9.24)

Здесь является математическим ожиданием вектора x(i) и служит его априорной оценкой, т.е. оценкой, которая получается до измерения y(i); - дисперсионная матрица ошибки т.е. ошибки априорной оценки; - дисперсионная матрица ошибки т.е. ошибки искомой (апостериорной) оценки.

Выражение для оценки содержит, кроме априорной оценки, поправочный член, пропорциональный невязке - разности между измеренным значением переменной y(i) и ее оценкой. При вычислении оценки на каждом шаге нужно начинать с определения априорной дисперсионной матрицы . Далее нужно вычислить матрицу коэффициентов усиления k0(i) и дисперсионную матрицу , затем априорную оценку и в последнюю очередь искомую оценку .Так, матрицы , , и k(i) не зависят от измерений, их можно вычислить заранее при всех необходимых значениях .

Соотношения (9.20) - (9.24) впервые получены Калманом, поэтому оптимальный дискретный линейный фильтр называют фильтром Калмана.

Установим физический смысл и роль k0(i). Для этого рассмотрим случай когда x(i) и y(i) являются скалярными и c(i)=1. При этом соотношения (9.20) - (9.24) принимают вид:

Пусть k0(i)=0. В этом случае и изменение, производимое в i-ый момент, не используется, так как оно не несет никакой информации, т.е. дисперсия его ошибки очень велика

Если k0(i) = 1, то , т.е. оценка определяется полностью последним измерением. Измерения, производимые до i-го момента, а также другая априорная информация никак не используются. Такая ситуация возникает, когда i-е измерение производится без ошибки, или когда очень велики дисперсии ошибки до i-го измерения (или дисперсии шума объекта).

Таким образом, выбором величины k0(i) регулируется влияние априорной и текущей информации на определение оценки . Задача оптимальной оценки состоит в выборе такого k0(i), при котором наилучшим образом используется алгоритм и текущая информация.

Вывод равенств (9.20) - (9.24) начнем с введения равенства

где .

Уравнение (9.21) непосредственно следует из (9.16). Вычитая (9.21) из (9.11), находим

или

.

Так как и VH(i) независимы, то из последнего соотношения следует первая часть равенства (9.23).

Остается доказать, что средний квадрат ошибки V0(i), равный следу матрицы p(i), принимает минимальное значение, если в (9.20) матрица k0(i) определяется соотношением (9.22). Для этого первую часть равенства (9.23) представим в виде

(9.25)

Если k0 определяется из (9.22), первое слагаемое правой части последнего равенства обращается в нуль. Оставшуюся часть обозначим :

Эта матрица, в силу свойств дисперсионных матриц, неотрицательно определена, p  0, следовательно, ее диагональные элементы неотрицательны (последнее следует из неравенств ). Эти элементы получаются из условия при где – диагональные элементы матрицы p. Так как матрица то последнее слагаемое в (9.25) не меньше нуля при произвольной матрице k0. Поэтому след матрицы p будет минимальным при такой матрице k0 , когда первое слагаемое в (9.25) обращается в нуль, т.е. когда k0 определяется (9.22). При этом из (9.25) получаем вторую часть равенства соотношения (9.23).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]