
книги из ГПНТБ / Острем К.Ю. Введение в стохастическую теорию управления
.pdf180 Глава 6
y(t), y ( |
t |
— с |
помощью формулы (3.3), |
переписанной в виде |
||||||||
|
|
|
|
eit)={-^=\y{t). |
|
|
|
|
|
(3.8) |
||
|
|
|
|
|
1 + |
cq-1 |
|
|
|
|
|
|
Исключая |
e(t) |
из уравнения '(3.7) |
с помощью |
формулы |
(3.8), |
|||||||
получим |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y(i+\) |
=e(t |
+ 1 ) + |
1 +cq—i |
У (0- |
(3.9) |
||||
|
|
|
Л |
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
Теперь |
пусть |
у — произвольная |
|
функция |
наблюдений |
y(t), |
||||||
у (t—1), |
... .Так как |
e(t-\-l) |
не зависит |
от |
наблюдений, |
имеем |
||||||
Е \y(t |
|
л |
= Ee*(t + 1) + |
Е |
|
_ |
|
|
||||
4- 1 ) - У } 2 |
1 + |
c<7-i У (?) —У |
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|||
Следовательно, |
|
|
|
|
|
|
|
|
|
|||
|
|
|
E[y{t±\)-yY>Ee4S+\)= |
|
|
|
|
1, |
|
|||
где равенство справедливо при условии |
|
|
|
|
||||||||
|
|
|
л |
л |
|
уЦ+Щ=-^±-уЦ). |
|
|
||||
|
|
|
у = |
|
|
|
|
|||||
|
|
|
|
|
|
|
1 + |
eg-1 |
|
|
|
|
Таким образом, оптимальный одношаговый упредитель |
задает |
|||||||||||
ся разностным |
уравнением |
|
|
|
|
|
|
|
|
|||
|
|
|
у (t + 1 \t) + су {t\t - |
\ |
) |
= |
{с-а)у |
(t). |
(ЗЛО) |
Сравните полученную формулу с уравнением (3.6).
Двухшаговый упредитель
Перейдем к определению двухшагового упредителя. Рас смотрим состояние в момент времени t, в который имеются на блюдения y(t), y(t—1),... .Требуется определить y(t-\-2).
Уравнение (3.3) дает
|
|
y(t |
+ 2) = |
1-^-e(t |
+ 2). |
(3.11) |
|
|
|
|
|
1 + aq—1 |
|
|
|
Правая |
часть |
уравнения |
является |
линейной |
функцией |
от |
|
e(t-\-2), е ( ^ + 1 ) , |
e(t), |
e(t—1). |
Стохастические переменные |
e{t), |
|||
e(t—1),... могут |
быть |
определены точно по результатам наблю |
|||||
дений y{t), |
y(t—1) |
Случайные переменные e(t+2) и е ( ^ + 1 ) |
не зависят от наблюдений. Переписывая уравнение (3.11), по лучим
y(t + 2) = e(t+2)+ { с - а ) e{t+\) =
1 + aq-1
|
Стратегии управления, |
|
минимизирующие |
дисперсию |
181 |
|||||||||
|
v |
; |
|
|
|
|
|
l + a q - 1 |
|
|
|
|
|
|
|
= e(t |
+ 2) + |
(c-a)e(t+ |
l |
) |
- |
^ ~ |
a } |
e(t), |
|
||||
где последний член можно вычислить |
|
1 -)- aq-1 |
|
на |
||||||||||
точно |
по результатам |
|||||||||||||
блюдений. Из уравнения |
(3.3) |
имеем |
|
|
|
|
|
|
||||||
|
|
|
в ( / ) |
= |
|
! ± £ Е ± у ( 0 . |
|
|
|
|
||||
|
|
|
|
w |
|
1 + |
c ? - i |
У |
|
|
|
|
|
|
Следовательно, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y(t |
+ 2) = e(t |
+ |
2) + |
(c-a)e(t+l)- |
|
|
|
1 + |
ал{с~а\у(1). |
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
cq— |
|
|
|
Л |
|
|
|
|
|
|
|
|
|
|
|
|
|
Пусть теперь у — функция |
от |
имеющихся |
наблюдений |
y{t), |
||||||||||
y(t—1),... |
. Так |
как &'t-\-\) |
и e(i-\-2) |
не зависят |
от наблюдений, |
|||||||||
получаем |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
E[y(t |
+ 2)-y]* |
= |
E[e*(t |
+ |
2)] + |
(с |
- |
af |
Е [е* (t + 1)] + |
|
||||
|
|
|
- |
Е |
|
|
1 + cq-i |
|
|
' |
|
|
|
|
|
|
|
|
|
|
|
У |
V |
|
|
|
|||
Следовательно, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
E[y{t |
|
+ |
2)-yf>\ |
|
|
|
+(c-af, |
|
|
|||
где равенство справедливо при |
|
|
|
|
|
|
|
|||||||
|
|
£ = |
|
+ 2 | о = - т £ = 4 w o . |
|
|
||||||||
|
|
|
|
|
|
|
|
1 + |
с ? - 1 |
|
|
|
Таким образом, двухшаговый упредитель удовлетворяет следу ющему разностному уравнению:
|
iit |
+ 2\t)=—cy((+l\t-l) |
— a(c — a)y(t). |
|
||
Ошибка |
двухшагового упреждения |
является |
скользящим |
сред |
||
ним второго порядка |
|
|
|
|
||
у(( + |
2|0 = |
y(t + 2)-y(t |
+ 2|0 |
= e(t + 2) + |
( с _ а ) е ( * + |
1). |
Общая постановка задачи
Рассмотрим задачу определения ^-шагового упредителя для
стационарного нормального |
процесса |
{y(t), |
t=6, |
± 1 , |
±2,...} с |
дробно-рациональной спектральной |
плотностью. |
По |
теореме |
||
3.1 гл. 4 для этого процесса |
всегда можно |
найти |
два |
полинома |
182 Глава 6
A(z) |
и |
C(z), |
таких, что спектральную плотность |
ср(<а) |
процес |
|||||||||||
са можно написать в виде |
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
= |
Хь С («"»)<: ( . - ' « ) |
4 , |
С ( У " ) С * ( ^ ) |
|
|
|
|
||||
|
|
|
|
|
|
А (е1 '05 ) Л ( е - ' ш ) |
|
Л (е' а ) Л* (е'т ) |
|
|
|
|
||||
•где Л* — обратный полином, определяемый |
равенством A*{z) |
= |
||||||||||||||
=znA{z-[). |
|
|
В представлении |
(ЗЛ2) полиномы Л и С можно вы |
||||||||||||
брать так, что все нули полинома Л будут расположены |
внутри |
|||||||||||||||
единичного круга, |
а все нули полинома С будут лежать |
внутри |
||||||||||||||
или на границе |
единичного круга. В этой главе мы будем счи |
|||||||||||||||
тать, что полином С не имеет нулей |
на единичной |
окружности. |
||||||||||||||
Полиномы А и С имеют вид |
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
Л (г) = |
zn |
+ alZ'1-1 |
-г • • • + |
ап, |
|
|
(3.13) |
|||
|
|
|
|
|
|
С (z) = zn |
+ clZn~l |
+ |
- - - + |
с „ . |
|
|
(3 . 14 } |
|
||
Из теоремы 3.2 гл. 4 следует, что стохастический процесс |
можно |
|||||||||||||||
представить |
в |
виде |
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
A(q)y(t) |
= |
XC(q)e(t) |
|
|
|
(3.15) |
||||
или |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
А* Or1 ) У (0 = |
АС* («Г1) в (/), |
|
|
(3.15а) |
||||||
где |
{e(t), |
teT} |
— последовательность |
независимых |
нормальных |
|||||||||||
с параметрами |
(0, 1) случайных |
переменных. Найдем |
наил\'ч- |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
л |
|
|
ший |
k |
шаговый |
упредитель, т. е. построим функцию |
y(t-\-k\t) |
||||||||||||
от y(t), |
y{t—1), |
|
такую, что |
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
E[y{t |
+ |
k)-y{t |
+ k\t)\* |
|
|
|
|
|||
достигает наименьшего значения. |
|
|
|
|
|
|
|
|||||||||
Для |
вывода |
формулы |
упредителя |
рассмотрим |
состояние |
в |
||||||||||
момент времени I. При условии, что есть результаты |
измерения |
|||||||||||||||
выходной |
переменной y(t), |
y(t—1),..., |
требуется |
предсказать |
||||||||||||
J/(/+&). Уравнение (3.15) |
дает |
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
y(t + k) = |
% С*(?~2 |
e(t + |
k). |
|
|
(3.16) |
||||
|
|
|
|
|
|
|
|
|
А* («7-1 ) |
|
|
|
|
|
|
Правая часть в уравнении (3.16) является линейной комбина
цией переменных e(t-\-k), e{t-\-k—\), |
e(t+\), e(t), e(t— |
— 1), ... . Случайные переменные e{t), |
e(t—1), ... могут быть вы |
числены точно по результатам измерений. Случайные перемен
ные e(t-\-\), |
eit+k) не зависят от наблюдений. Таким обра |
зом, правая |
часть уравнения (3.16) состоит из членов, которые |
могут быть точно вычислены по наблюдениям, и членов, которые
Стратегии управления, минимизирующие дисперсию |
183 |
не зависят от наблюдений. Для выделения этих двух групп чле
нов перепишем правую часть уравнения |
(3.16) в виде |
|
|
||||||||||||||
%-C*(q-^ e ( t |
+ k) = |
Я [ |
|
> {q-*)e{t |
+ k) + Q~k-^^e(t |
+ |
А ) ] , |
||||||||||
A* (Q |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(3.17) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
9 |
|
|
где F* и О* |
|
полиномы |
|
степени k—1 и п—1 |
соответственно, |
||||||||||||
т. е. |
|
|
F*{z) |
= |
\+flz |
|
+ |
--- + |
fk_,z |
|
|
|
|
(3.18) |
|||
|
|
|
|
|
|
|
|
||||||||||
|
|
|
G*(z) = |
g 0 |
+ |
g1z + --- + |
gn _1 z»- |
|
|
(3.19) |
|||||||
Уравнение (3.16) теперь можно написать в виде |
|
|
|
||||||||||||||
y(t |
+ k) =XF*(q-1)e(t |
|
|
+ k) |
|
|
A* fo-i) |
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
%F* (q-1) |
e (t + k) + % |
G* |
(q-i |
|
e(t). |
|
(3.20) |
|||||||
|
|
|
|
|
|
|
|
|
|
|
A* |
(q-i) |
|
|
|
|
|
Второй член в правой части |
является |
функцией |
переменных |
||||||||||||||
e(t), e(t—1), |
|
и, следовательно, его можно |
вычислить по ре |
||||||||||||||
зультатам наблюдений y{t), |
у |
{I—1),... |
. Получаем |
|
|
||||||||||||
|
|
|
|
Хе (t) |
|
A* |
(q-1) |
У If), |
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
С* |
|
|
|
|
|
|
|
|
и уравнение ,(3.20) сводится к уравнению |
|
|
|
|
|
||||||||||||
|
y(t |
+ k) — XF* |
|
|
e(t + k) + -^f^- |
|
у (t). |
|
(3.21) |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
С* |
|
|
|
|
|
Первый член в правой |
части |
является |
|
линейной функцией |
|||||||||||||
переменных |
e(t-\-l), e{t-\-2), |
|
e(t-\-k), |
которые не зависят от |
|||||||||||||
наблюдений. Второй |
член является |
линейной |
функцией от ре |
||||||||||||||
зультатов |
наблюдений, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
л |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y{t), |
y{i— |
Пусть |
у—произвольная |
|
|
|
|
функция |
переменных |
||||||||||
—1) |
Тогда |
|
|
|
|
|
|
|
|
|
гЛ |
|
|
|
|||
Е [у it + k) - |
yf |
= Е [XF* fa"1) |
е (t + k)\* + E |
|
|
|
|||||||||||
|
У |
С* |
(q-1) |
|
|||||||||||||
|
+ |
2E [XF* fo-i) |
|
e (t + k)] [у - |
|
|
у (t) . |
|
|||||||||
Последний член равен нулю, так как e(t-\-\), |
е ( / + 2 ) , |
... не |
|||||||||||||||
зависят от y(t), |
y(t—1), |
|
|
a e(t) |
имеет нулевое |
математическое |
|||||||||||
ожидание при всех t. Таким образом, имеем |
|
|
|
|
|
||||||||||||
|
Е \У (t + Щ - |
|
у}* = Е [XF* (q-i) e(t + k)]* + |
|
|||||||||||||
|
|
|
|
|
ГЛ |
|
|
|
|
|
|
|
|
|
(3.22) |
||
|
|
|
|
|
|
У- |
|
С* |
|
* |
' |
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
Ш Глава 6
E[y{t + |
k)-yY>K[\+n-r--+fi^, |
|
где равенство достигается при |
|
|
y^y(t + k\t) = |
-^^-y{t). |
(3.23) |
Таким образом, оптимальный й-шаговый упредитель определяет ся разностным уравнением
y(t -f k\t) + Cly(t + k~l\l-l)^--- + cny(t + k — n\t — n) =
= g0y(t) |
+ giy(t-l) |
+ --- + ga-iy(t-n |
+ 1). |
(3.24) |
|||
Ошибка упреждения равна |
|
|
|
|
|
||
y(t + k\t) = |
y(t + k)-y(t |
+ k\t) = %F* fo-*) e(t + |
k) = |
|
|||
= |
% [e(f + |
k) + |
fxe(t + k— 1) - f • • • + |
|
|
||
+ |
fk^e(t+l)}. |
|
|
|
|
(3.25) |
|
Итак, чтобы получить упредитель, надо определить |
коэффици |
||||||
енты полиномов F.(z) и G(z), заданные |
формулами |
(3.18) и |
|||||
(3.19). Уравнение (3.17) дает следующее равенство: |
|
|
|||||
С* (<rl ) = A* (a-1) F* (с?- 1 ) + |
Ч~к G* (<7-1)- |
|
(3.26) |
||||
Если .4* и С* — произвольные |
полиномы от q~l, то |
существует |
|||||
два однозначно определяемых |
полинома F* и G*, которые удов |
||||||
летворяют равенству (3.26). Эти полиномы |
можно определить с |
||||||
помощью операции деления. Полином F* получается как част |
|||||||
ное от деления С* на A*, a q~hG*(q-1) |
является остатком от де |
||||||
ления. |
|
|
|
|
|
|
|
Полиномы F* и G* можно |
определить |
приравниваем |
коэф |
фициентов при различных степенях q~l. При этом
=Й! +
с3 = а2 -Ь a-i fi + /а,
'k-l |
= |
ak-i |
|
|
••• + aifk- -2 |
+ h. |
||
ck |
= |
ак + ak-i |
fi+ak-ih |
+ -- |
• + ai fk-i |
+ |
§0' |
|
'k+l = ak+x + akfi+ak-J2 |
+ -- |
• + |
aifk-i + |
gl, |
||||
с |
= ап + a^Ji |
^%--J2 |
+ -- • + |
an-k+l |
fk—l ~ |
|||
п |
anfi |
|
|
|
|
§n—k+l |
||
0 |
= |
|
|
|
|
|||
0 = |
a„fn-i+g„-v |
|
|
|
|
(3.27) |
||
|
|
|
|
|
Стратегии управления, |
минимизирующие дисперсию |
185 |
|
Таким образом, коэффициенты полипомов F* и G* можно оп |
|||
ределить с помощью рекуррентных соотношений. |
Полученные |
||
результаты сформулированы в теореме 3.1. |
|
|
|
Теорема 3.1. Пусть {y{t), |
teT} — нормальный |
стохастический |
|
процесс с дискретным временем, который имеет |
представление |
||
A*(q-4y(t) |
= XC*(cr>)e(t). |
|
(3.15> |
Все нули полиномов А и С расположены внутри единичного кру га, a {e(t), teT} является последовательностью нормальных с параметрами (0, 1) случайных переменных. Тогда /г-шаговып упредитель, минимизирующий дисперсию ошибки предсказания, за дается разностным уравнением
С* (cr1 ) y(t + k\t) = G* Or1 ) У (t), |
(3.23) |
где полином G(z) степени п—1 определяется равенством
С* fa-1) = А* fa-1) F* (q~l) + а~к G* (с/"1). |
(3.26) |
Ошибка упреждения является скользящим средним порядка k:
y~(t + k\i) = |
lF* (qrl)e(t + k) = |
|
|
|
= |
Я [e(t + k) + /,е (/ + k |
- 1) + • • • + fk_xe{t |
+ |
Щ (3.25), |
и имеет дисперсию |
|
|
|
|
var [у (t + k\t)] = X2 (1 + |
/г + fl + • • • + |
• |
(3.28> |
Замечание J. Наилучший упредитель является линейным, а результат не зависит критически от критерия. Так как распреде ление у нормально, то результат будет тем же, если минимизи ровать критерий
|
Eh(y(t |
+ k)-y), |
|
(3.29) |
|
где h — произвольная симметричная функция. |
|
|
|||
Замечание 2. Предположение о независимости |
e(t) |
и e(s) |
|||
при t^s |
является решающим для |
справедливости |
выражения |
||
(3.22). Если стохастические |
переменные e(t) и e(s) |
зависимы,, |
|||
математическое ожидание от произведения e(t-\-x) |
на |
произ |
|||
вольную |
функцию от y(t), y(t—1) |
не обязательно будет |
равно |
||
нулю при т > 0 . Однако если |
ограничиться для допустимых уч |
редителей линейными функциями наблюдений, выражение для
E[y{t-\rk)—у]2 |
будет содержать только квадратические члены, |
||||
и выражение |
(3.22) |
будет |
справедливо в том |
случае, |
когда |
е(г"+1), 6 (^+2), |
e(t-\-k) |
не коррелированы |
с y(t), |
i/(t— |
|
- 1 ) , - • |
|
|
|
|
|
Замечание |
3. Упредитель |
является динамической системой' |
/г-го порядка с характеристическим полиномом C(z).
386 |
|
|
|
Глава 6 |
|
|
|
|
|
Замечание |
4. Из выражения |
(3.25) следует |
|
|
|
||||
|
|
|
y(t)~y{t\t-\) |
= |
|
|
|
-ke{t). |
|
Таким образом, стохастические переменные Ке являются |
порож |
||||||||
денными |
процесса {y(t), |
teT} |
(сравнить разд. 3 гл. 4). |
|
|||||
Замечание |
5. Следующие |
свойства |
являются решающими |
||||||
при доказательстве теоремы 3.1: |
|
|
|
|
|||||
|
1. Стохастические переменные &[t) |
и e(s) |
независимы при |
||||||
t=s |
и e(t) не зависит от y{t—1), |
y(t—2),.... |
|
|
|
||||
2. Представление (3.15) стохастического |
процесса |
обратимо |
|||||||
в том смысле, что с помощью |
устойчивых разностных |
уравне |
|||||||
ний |
y(t) |
может быть выражено через |
e(t), |
e(t—1), |
|
и на |
|||
оборот. |
(Для выполнения вычислений |
необходимы |
начальные |
||||||
условия |
для |
разностных |
уравнений.) |
|
|
|
|
3. При допущении об устойчивости полиномов А и С и о бес конечной временной протяженности процессов результат стано вится независимым от начальных условий.
Упражнения |
|
|
|
|
|
1. Рассмотреть |
стохастический |
процесс |
{y{t)}, |
определяе |
|
мый уравнением |
|
|
|
|
|
y(t)-l,5y(t- |
1) + 0,5y(t-2) |
= |
|
||
= |
2 [e{t)— |
l,2e(t— |
1) + 0,6e(г! — 2)J, |
|
|
где {e(t)}—последовательность |
независимых нормальных с |
параметрами (0, 1) случайных переменных. Определить fe-шаго- вый упредитель, минимизирующий среднеквадратическую ошиб ку упреждения.
2. Рассмотрим стохастический процесс {y(t)}, |
определяемый |
|||
уравнением |
|
|
|
|
|
y{t) + |
ay(t- |
1) = А, И * ) + « ? ( * — ! ) ] , |
|
где | а | < 1 , |
| с | < 1 |
и {e(t)} |
— последовательность |
независимых |
нормальных с параметрами (0, 1) случайных переменных. Опре делить ^-шаговый упредитель, который минимизирует средне квадратическую ошибку предсказания.
3. Найти двухшаговый упредитель, минимизирующий средне квадратическую ошибку, и определить ошибку упреждения для
стохастического процесса, задаваемого |
равенством |
||
y(t) = |
1 |
e(t) + |
av(t), |
1 -f- |
|
aq—1 |
|
где {e{t), teT} |
и {v(t), teT}—последовательности |
независимых |
нормальных с |
параметрами (0, 1) случайных |
переменных и |
| а | < 1 . |
|
|
|
Стратегии управления, |
минимизирующие дисперсию |
187 |
||||
4. Стохастический |
процесс |
{y<{t), teT} имеет |
представление |
||||
|
у (t) + 0,7 у (t - |
1) = |
е (0 + 2е (/ - |
1), |
|
|
|
где {e(t), |
teT}—последовательность |
независимых |
нормальных |
||||
с параметрами (0, 1) |
случайных |
переменных. |
Определить на |
||||
илучший |
одношаговый упредитель |
и дисперсию |
ошибки |
пред |
сказания. Наилучший упредитель определяется по критерию ми нимума среднеквадратической ошибки упреждения.
5. Рассмотреть стохастический |
процесс {y{t), |
t=t0, |
/п+ |
||||
-4-1, |
. . . } , определяемый равенством |
|
|
|
|
||
|
|
|
t |
|
|
|
|
|
|
y(i)= |
2, §(t; |
k)e(k), |
|
(3.30) |
|
где |
{e(t), i e T} —последовательность независимых |
нормальных |
|||||
с параметрами |
(0, 1) случайных переменных. Если |
g(t, |
t)=£0.. |
||||
то соотношение |
(3.30) всегда обратимо. Пусть обратное |
выраже |
|||||
ние имеет вид |
|
t |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
e(t)= |
£ h(t; |
k)y(k). |
|
|
|
Определить |
/е-шаговый |
упредитель для процесса |
{y{t), |
t— |
= to, . . . } , минимизирующий среднеквадратическую ошибку уп реждения.
Указание. |
Использовать |
метод |
доказательства |
теоремы 3.1. |
||
6. Рассмотреть стохастический |
процесс |
{y{t), |
teT), задавае |
|||
мый соотношением |
|
|
|
|
|
|
|
y { t ) = |
X ^ f l e ( t ) , |
|
|
|
|
|
|
А* (<?-') |
|
|
|
|
где {e(i)}—последовательность |
независимых нормальных с па |
|||||
раметрами |
(0, 1) случайных переменных и |
|
|
|||
|
А{г) = а0га |
+ а1гп-Ч |
|
Ь а я , |
|
|
|
C(z) = c0z'tt |
+ c1 z'"-l+--- |
+ |
cm. |
|
Определить наилучший в среднеквадратической смысле ^-шаго вый упредитель. Наилучший упредитель является динамической системой. Чему равен порядок этой системы?
7. Рассмотреть стохастический процесс {y(t), teT}, имеющий представление
y(i)-2fiy(t- |
1) + 2 , 8 5 у ( / - 2 ) - 1 , 4 0 ( * - 3 ) + |
+ 0,25y(t — 4) = e(t) — 0,7e(t— 1),
где {e(t), teT} — последовательность независимых нормальных случайных переменных. Определить наилучший одношаговый
188 |
Глава 6 |
упредитель для процесса {y{t), teT). Чему равен порядок дина мической системы, представляющей упредитель?
8. Найти представление пространства состояний системы, описываемой с помощью выражения (3.15).
4. СТРАТЕГИИ УПРАВЛЕНИЯ, МИНИМИЗИРУЮЩИЕ ДИСПЕРСИЮ
Получив решение задачи упреждения, обобщим теперь задачу стохастического управления, рассмотренную в разд. 2. Для по становки задачи оптимального управления необходимо указать динамику процесса, среду, критерий и ограничения на закон уп равления.
Динамика процесса
Предполагается, что процесс, которым надо управлять, яв ляется стационарной линейной динамической системой с ди скретным временем порядка т с одним входом и п одним выхо дом у . Связь между входом и выходом можно описать разност ным уравнением порядка т
y{t) + a\y(t- 1) + • • • + |
almy(t- |
т) = b*u(t- |
k) + |
+ b\u(t — k—l)-\ |
+ blmu(t |
— k—m), |
(4.1) |
где интервал дискретизации равен единице времени. Введем оператор сдвига вправо q, полиномы Ау и Ви определяемые ра венствами
А1(г) = г" + а[г"-1-г----+а1п, |
(4.2) |
В1 (г) = Ь\ гт + Ъ\ г — 1 + . . . + Ъ)п, |
(4.3) |
и их обратные полиномы А\ и В\. Тогда соотношение (4.1) мож но представить следующим образом:
A1{q~1) |
Ах(Я) |
Среда
Предполагается, что влияние среды на процесс можно оха рактеризовать возмущениями, которые являются стохастически ми процессами. Так как система линейная, можно использовать принцип суперпозиции и представить все возмущения в виде од ного возмущения, действующего на выходе. Таким образом, про цесс и среда могут быть представлены моделью
Стратегии управления, минимизирующие дисперсию 189
k) + v(t). (4.5)
МП
Если, кроме того, предположить, что возмущение v(i) является стационарным гауссовым процессом с дробно-рациональной спектральной плотностью, то возмущение можно представить в виде
|
|
|
|
|
|
|
А; |
( |
О |
e(t), |
|
|
|
|
(4.6) |
|
где |
{e(t), |
t=0, |
± 1 , |
± 2 , |
...}—последовательность |
одинаково |
||||||||||
распределенных |
независимых нормальных |
с параметрами |
(0, |
1) |
||||||||||||
случайных переменных, а С\ и А2 |
— полиномы. |
уравнением |
||||||||||||||
Итак, |
система и ее среда могут |
|
быть |
описаны |
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(4.7) |
|
Блок-схема представления системы приведена на рис. 6.1. |
|
|
||||||||||||||
Уравнение |
(4.7) |
является, |
|
|
|
|
|
|
|
|
|
|||||
таким |
образом, |
канонической |
|
е |
|
|
|
|
V |
|
|
|||||
формой для дискретной стаци |
|
|
|
|
Аг(Ч) |
|
|
|
||||||||
онарной динамической системы |
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
Лк . |
|
|
||||||||
с одним входом и одним выхо |
|
|
|
|
|
|
|
|
||||||||
дом с |
запаздыванием, |
равным |
|
и |
|
|
В, (1) |
|
|
|||||||
целому |
числу интервалов |
дис |
|
|
|
|
|
|||||||||
|
|
|
|
A, |
W |
|
|
|||||||||
кретизации; система |
подверга |
|
|
|
|
|
|
|||||||||
ется |
воздействию |
стационар |
|
Р и с . |
6.1. |
Блок-схема системы, |
||||||||||
ных |
возмущений с |
дробно-ра |
|
|||||||||||||
циональными |
спектральными |
|
описываемой уравнением |
(4.7). |
|
|||||||||||
|
|
|
|
|
|
|
|
|
||||||||
плотностями. Полиномы |
A2(z) |
|
|
|
|
что их нули будут ле |
||||||||||
и C\(z) |
|
всегда могут быть выбраны так, |
||||||||||||||
жать внутри или на границе единичного круга. |
|
|
А2 |
|||||||||||||
Так как предполагается, что возмущение v стационарно, |
||||||||||||||||
не может иметь нулей на единичной окружности |
|
|
|
|||||||||||||
Для |
упрощения |
анализа перепишем |
уравнение |
(4.7) |
в виде |
|||||||||||
|
|
|
А* (7-1 )У (/) = В* |
fa-1)u(t-k) |
+ |
W* От-1 )е(/), |
(4.8) |
|||||||||
где А, |
В |
и С—полиномы, |
определяемые |
равенствами |
А—А\А2, |
|||||||||||
В=ВХА2 |
|
и C=C\Ai. |
Положим |
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
А (г) = г" + ах |
z"_ 1 |
Н |
|
+ |
ап, |
|
(4.9) |
|||||
1 Если мы можем прямо постулировать представление v |
в форме (4.6), |
|||||||||||||||
нет необходимости предполагать, что все нули А2 |
лежат внутри единичного |
|||||||||||||||
круга. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|