Власов_Методы оптимизации и оптимального управления_2013
.pdfmin(t1 ,t2 ) |
|
|
K(t1 ,t2 ) = Ф(t1,t0 )Q0ФT (t2 ,t0 ) + ∫ |
Ф(t1,τ)B(τ)Q(τ)BT (τ)ФT (t2 ,τ)dτ. |
|
t0 |
|
|
Эти выражения получаются с использованием формул |
|
|
t |
|
|
x(t) = Ф(t,t0 )x0 + ∫Ф(t,τ)B(τ)w(τ)dτ , |
(8.2.2) |
|
t0 |
|
|
∫ f (t)δ(t −t0 )dt = f (t0 ) для любой f (t) и переменой операций ин-
тегрирования и вычисления математического ожидания. Например, вычисление математического ожидания обеих частей
равенства (8.2.2) приводит к результату
M[x(t)] = Ф(t,t0 )M[x0 ] + ∫t |
Ф(t,τ)B(τ)M[w(τ)]dτ = Ф(t,t0 )m0 , |
||
|
|
t 0 |
|
поскольку для белого шума M[w(t)] = 0 . |
|||
Для получения K (t ,t |
2 |
) следует вычислить M[x(t)xT (t)] и вос- |
|
1 |
|
|
|
пользоваться формулой (8.2.2).
8.3. Прогнозирование (оценивание) значений случайных величин с использованием закона распределения
Заменим задачу: вместо точного предсказания значения ξ будем искать такое число q , которое обеспечит наименьшую ошибку предсказания. Используем для этой цели широко распространен-
ный |
критерий ошибки |
J = M[(ξ−q)2 ], |
вычисляемый |
согласно |
|
формуле J = ∫(x − q)2 pξ (x)dx . Приравняем производную |
∂J к ну- |
||||
|
|
|
|
|
∂q |
лю |
(дифференцирование |
производится |
под |
знаком |
интегра- |
ла): ∫(x − q) pξ (x)dx = ∫xpξ (x)dx − q∫pξ (x)dx = 0 . |
С учетом |
опреде- |
|||
ления математического ожидания получим q = M [ξ] . Этот простой
результат можно сразу обобщить. Поскольку законы распределения всегда являются условными, то при использовании критерия
81
ошибки J = M[(ξ −ξ)2 ] , где ξ – оценка для ξ , оптимальной оцен-
кой ξ0 является условное математическое ожидание: |
|
|
|
|
ξ0 = M y [ξ] = ∫pyξ (x)dx . |
|
|
|
(8.2.2) |
8.4. Линейное оценивание значений случайных величин |
||||
Рассматриваются две коррелированные случайные |
величины |
|||
ξ1 , ξ2 , причем величина ξ2 наблюдается, а величина ξ1 |
– нет. Тре- |
|||
буется построить оптимальную линейную оценку ξˆ |
= aξ |
2 |
+b для |
|
1 |
|
|
|
|
величины ξ1 .
Для поиска постоянных коэффициентов минимизируем критерий J = M[(ξˆ1 −ξ1 )2 ] среднеквадратичного отклонения и будем считать известными все моменты первого и второго порядков. За-
писывая J = M[(aξ2 −ξ1 +C)2 ] , где C = aM [ξ2 ] +b − M [ξ1 ] , раскрывая квадрат суммы и пользуясь свойствами математического
ожидания, получим J = a2σ2[ξ |
2 |
] −2aK[ξ ,ξ |
2 |
] +σ2 [ξ |
2 |
] +C2 . |
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|||||
Приравнивая частные производные ∂J |
, |
∂J |
нулю, найдем опти- |
|||||||||||||||||||||||||||
∂C |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∂a |
|
|
|
|
|
|
||
мальные |
|
|
|
|
|
|
|
|
значения |
|
|
|
|
коэффициентов: |
||||||||||||||||
a = |
K[ξ1 ,ξ2 ] |
,C = 0,b = M[ξ ] − |
K[ξ1,ξ2 ] |
M[ξ |
|
] – и вид оценки ξ |
|
: |
||||||||||||||||||||||
|
|
|
|
|
||||||||||||||||||||||||||
|
|
σ2[ξ2 ] |
|
|
|
|
|
|
|
|
1 |
|
|
|
|
σ2[ξ2 ] |
2 |
|
|
|
|
1 |
|
|||||||
ξˆ |
= M[ξ ] + |
|
K[ξ1,ξ2 ] |
|
(ξ |
|
− M[ξ |
|
]) , причем |
минимальное значе- |
||||||||||||||||||||
|
σ2[ξ2 ] |
|
|
|||||||||||||||||||||||||||
1 |
|
|
1 |
|
|
2 |
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
||||||||
ние J0 критерия равно |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
J |
0 |
=σ2[ξ ](1−ρ2 ) , |
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
||
где ρ = |
|
K[ξ1 |
,ξ2 ] |
|
|
– коэффициент корреляции между величина- |
||||||||||||||||||||||||
|
σ2[ξ ]σ2[ξ |
2 |
] |
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
ми ξ1 ,ξ2 .
82
При нормальном законе распределения последние выражения определяют условное математическое ожидание и условную дисперсию величины ξ1 .
Решена [2,3,5] общая задача линейного оценивания случайного вектора ξ(1) , который не наблюдается в некотором эксперименте, по результатам наблюдения другого вектора ξ(2) , коррелированного с ξ(1) . Оценка ξˆ (1) имеет вид
|
|
|
|
|
|
|
ˆ |
(1) |
= m |
+ K K |
−1 |
(ξ |
(2) |
−m ) , |
|
|
|
|
|
|||
|
|
|
|
|
|
|
ξ |
|
2 |
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
1 |
12 |
|
|
|
|
|
2 |
|
|
|
|
|
|
где |
m = M[ξ(1) ], m |
2 |
= M[ξ(2) |
] ; K |
12 |
, K |
2 |
являются блоками кова- |
||||||||||||||
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
риационной матрицы |
Kξ объединенного вектора |
|
ξ(1) |
|
, так |
|||||||||||||||||
ξ = |
|
(2) |
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ξ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
K |
1 |
, K |
12 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
что |
|
|
|
, причем |
K1 |
– |
|
это ковариационная матрица |
||||||||||||||
Kξ = |
|
|
|
|
|
|||||||||||||||||
|
K21 , K2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
вектора ξ(1) , K 2 — ковариационная матрица вектора ξ(2) .
В условиях нормального закона распределения вектора ξ выражение для ξˆ (1) определяет условное математическое ожидание вектора ξ(1) . Кроме того, легко вычисляется условная ковариационная матрица Ky вектора ξ(1) :
K y = K1 − K12 K 2−1K 21 .
Все составляющие вектора ξ(1) оцениваются с минимальными среднеквадратическимиотклонениямиот составляющихвектора ξ(1) .
Контрольные вопросы
1.С какой целью рассматриваются гауссовские случайные процессы?
2.Что такое стационарный случайный процесс?
3.Для чего используется понятие белого шума?
4.Является ли белый шум гауссовским случайным процессом?
5.Что такое стационарный случайный процесс в широком смысле?
83
ГЛАВА 9. ФИЛЬТР КАЛМАНА
9.1. Постановка задачи
Простой пример. Пусть имеется динамическая система, описываемая разностным уравнением xk +1 = 2xk +εk +1 , где εk − независимые случайные возмущающие воздействия с параметрами: M[εk ] = 0, σ2[εk ] =1. Начальное состояние системы известно и равно x0 . Наличие возмущений приводит к тому, что величина x1 яв-
ляется случайной и ее дисперсия равна 1. Величина x2 также явля-
ется случайной, но ее дисперсия равна уже 5. Понятно, что со временем дисперсия состояния увеличивается. Поэтому простым расчетом значения переменной состояния по разностному уравнению не возможно точно контролировать значение этой переменной и приходится ставить средства измерения.
Общей задачей дискретного фильтра Калмана является оценивание переменных состояния известной динамической системы заданного порядка с использованием разностных уравнений и всей совокупности предыдущих результатов наблюдения при действии на систему возмущающего случайного воздействия.
9.2. Основные принципы получения формул дискретного фильтра Калмана
Фильтр Калмана предназначен для оптимального оценивания переменных состояния линейной динамической системы, которая подвергается случайным возмущающим воздействиям. В каждый тактовый момент времени для оценивания используется вся совокупность результатов измерений, которая получена ранее выбранного такта времени. Критерием качества оценивания является средний квадрат отклонения оценки от истинного значения переменной состояния.
Для построения формул фильтра Калмана используются следующие теоретические результаты [8].
84
1.Основные формулы линейного оценивания: оценки условных математических ожиданий и условных ковариационных матриц (рассмотрены выше).
2.Свойство многомерного нормального закона распределения при наложении дополнительного условия наблюдения. Это свойство формулируется следующим образом.
Пусть U – дополнительное условие, при котором рассматривается совместный закон распределения двух случайных векторов x, y (которые рассматриваются при исходных условиях G на-
блюдения). В условиях G известны первые и вторые моменты:
M[x / G],M[ y / G], K[x, y / G] = K11; K12 ,
K21; K22
где K11, K22 – ковариационные матрицы векторов x и y соответственно. Тогда имеют место формулы
M[x / G,U] = M[x / G] + K12 K22−1 ( y −M[ y / G] ,
K[x / G,U ] = K11 − K12 K22−1K12T .
3. Пусть известна ковариационная матрица Kξ случайного вектора ξ и применено линейное преобразование η = Cξ , где C – известная матрица. Тогда Kη = CKξCT . Это следует из определения ковариационной матрицы.
9.3. Получение формул фильтра Калмана
Рассмотрим стационарную систему и средства измерения, описываемые разностными уравнениями:
xk +1 = Fxk +bεk +1 |
, |
|
(9.3.1) |
|
yk +1 = Hxk +1 + Bνk +1 , |
||||
|
||||
где матрицы F, H и векторы b, B |
|
известны, εk – вектор возму- |
||
щающего воздействия, не зависящий от вектора νk ошибок изме-
рений, |
причем M[εk ] = M[νk ] = 0 и дисперсии σ2[ε],σ2[ν] – из- |
вестны; |
x0 – начальное состояние системы, являющееся случайным |
85
вектором с известными математическим ожиданием и ковариационной матрицей m0 , K0 .
Все рассматриваемые случайные величины имеют нормальные законы распределения.
Требуется оптимально оценить значения переменных состояния по всей совокупности предыдущих результатов измерения. Введем вектор yk , состоящий из совокупности векторов y0 , y1 ,..., yk , по которому будем оценивать вектор состояния xk+1 .
Вообще говоря, задача имеет общее решение, правда с использованием ковариационной матрицы очень большой размерности. Фильтр Калмана представляет собой рекуррентный алгоритм оценивания, в котором используется последняя оптимальная оценка
вектора состояния и последний результат измерений. |
|
|
|
|||||||||||||||||||||||
|
Пусть известны оптимальная оценка xˆk |
= mk |
|
|
и ковариационная |
|||||||||||||||||||||
матрица оценок Kk |
= K[xk / yk −1 ] , а также очередной вектор наблю- |
|||||||||||||||||||||||||
дения |
yk . Будем считать, что |
|
yk |
есть дополнительное условие U . |
||||||||||||||||||||||
Тогда |
на |
основе |
|
первого |
|
из выражений |
|
|
(9.3.1) |
получим |
||||||||||||||||
M[xk +1 / U ] = FM [xk |
/ U ] |
или |
|
xˆk +1 = mk +1 = Fmk . Кроме |
|
того, |
||||||||||||||||||||
M[ yk |
/ U ] = Hmk |
|
|
(см. второе уравнение (9.3.1)). Наконец, |
найдем |
|||||||||||||||||||||
блоки условной ковариационной матрицы |
|
|
|
= |
K11; K12 |
|
состав- |
|||||||||||||||||||
K |
k +1 |
|
|
|||||||||||||||||||||||
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
k+1 |
: |
|
|
|
|
|
|
|
T |
|
|
|
T |
|
K21; K22 |
|
|
|
|||
ного вектора m |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
k K = FK[x / U ]F |
|
+bK[ε]b |
|
|
, |
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
11 |
|
|
|
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
K = FK[x / U ]H T , |
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
12 |
|
|
|
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
K |
22 |
= HK[x / U ]H T + BK[ν]BT . |
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Поэтому |
m |
k +1 |
= Fm + R ( y |
k |
− Hm ) , |
|
где |
|
R = K K−1 |
и |
|||||||||||||||
|
|
|
|
|
|
|
|
|
k |
k |
|
|
|
k |
|
|
|
|
|
11 |
22 |
|
||||
K |
k +1 |
= K[x |
/ y ] = K − K K |
|
−1K T . |
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
k +1 |
k |
|
|
11 |
|
12 |
22 12 |
|
|
|
|
|
|
|
|
|
|
|
||||||
Структурная схема – это наблюдатель. Спроектировать фильтр Калмана – это значит построить алгоритм вычисления матрицы
86
обратной связи в наблюдателе для каждого тактового момента времени.
Контрольные вопросы
1.Что такое линейная оценка случайной величины (и значения случайного процесса)?
2.Каково назначение фильтра Калмана?
3.Какова основная особенность вычисления оценок с помощью фильтра Калмана?
4.Что такое условное распределение случайной величины?
5.Что требуется «найти», чтобы сконструировать фильтр Калмана?
87
СПИСОК ЛИТЕРАТУРЫ
1.Базара М., Шетти К. Нелинейное программирование/М.:
Мир,1982.
2.Уилкс С. Математическая статистика/Пер. с англ. М.: Наука,
1967.
3.Рао С. Линейные статистические методы и их применение/Пер. с англ. М.: Наука,1968.
4.Шеффе Г. Дисперсионный анализ/Пер. с англ. М.: Наука,
1980.
5.Власов В.А. Оценки и доверительные интервалы/Учебное пособие. М.: МИФИ, 2006.
6.Теория автоматического управления/Под ред. А.А. Воронова, Часть 2 М.: Высшая школа, 1986.
7.Методы классической и современной теории автоматического управления. Том 2. Статистическая динамика и идентификация систем автоматического управления/Под ред. К.А. Пупкова, Н.Д. Егупова. М.: МГТУ им. Н.Э. Баумана, 2004.
8.Квакернаак Х., Сиван Р. Линейные оптимальные системы управления/Пер. с англ. М.: Мир, 1977.
9.Дорф Р. Бишоп Р. Современные системы управления/ Пер. с англ. - М.: Лаборатория базовых знаний, 2002.
10.Шилов Г.Е. Математический анализ. Специальный курс. Издание второе. М: Гос. изд. физ.– мат. лит. 1961.
11.Эльсгольц Л.Э. Дифференциальные уравнения и вариационное исчисление. М.: Наука, 2000.
12.Демидович А.А. Основы теории оптимальных автоматических систем. М.: Наука, 1968.
13.Свешников А.А. Прикладные методы теории случайных функций. М.: Наука, 1968.
14.Филипчук Е.В., Королев С.А. Алгоритмы фильтрации в информационно - измерительных системах: Учебное пособие. М.:
МИФИ,1987.
88
