
книги из ГПНТБ / Острем К.Ю. Введение в стохастическую теорию управления
.pdf190 |
|
Глава |
6 |
|
|
|
В(г) = |
Ь0г" + Ь1г«-* |
+ • • • + &„, |
(4.10) |
|
|
С (г) = |
z"~c%zn~l |
-\ |
hc„. |
(4.11) |
Без |
потери общности можно |
предположить, что все |
полино |
мы имеют степень п, так как коэффициенты при высших степе
нях всегда |
можно положить |
равными |
нулю. |
Полином C(z) |
всегда можно |
выбрать так, что |
нули его |
будут |
лежать внутри |
или на границе единичного круга. Допустим также, что полино мы не имеют нулей на единичной окружности.
Критерий
Для задачи управления выбран критерий, по которому мини мизируется дисперсия выходной переменной у.
Допустимые законы управления
Предполагается, что закон управления должен быть таким, что значение и в момент времени t является функцией наблю даемых значений выходной переменной до момента времени t включительно, т. е. у(t), y(t—1), y(t—2),..., и всех предшест вующих сигналов управления u(t—1), u(t—2), ... .
Постановка задачи
Рассмотрим динамическую систему, описываемую уравнени ем (4.8). Требуется найти допустимый закон управления, такой,
что дисперсия выходной |
переменной имеет наименьшее значение. |
|||||||
Оптимальный закон управления называется стратегией |
управ |
|||||||
ления, |
минимизирующей |
дисперсию. |
|
|
|
|
||
Решение |
|
|
|
|
|
|
|
|
Для |
решения |
задачи |
рассмотрим состояние |
в момент |
вре |
|||
мени t. |
Имеются |
результаты измерений |
y(t), |
y(t—1), |
... и |
из |
||
вестны |
все |
предыдущие |
управляющие |
воздействия |
u(t—1), |
|||
u(t-2), |
... . |
|
|
u(t), при котором |
|
|||
Задача |
состоит в определении такого |
дис |
персия выходной переменной имеет наименьшее значение. Из
уравнения (4.8) |
следует, |
что сигнал |
управления u(t) |
влияет на |
|
y{t-\-k) и не влияет на |
предыдущие |
значения |
выходной пере |
||
менной. Рассмотрим |
|
|
|
|
|
y(t + |
k)= |
и (0 - f Л ^ ^ I f |
е (t+k). |
(4.12) |
|
|
A |
(q ') |
A (q-1) |
|
|
Последний член является линейной функцией случайных пере-
Стратегии управления, |
минимизирующие |
дисперсию |
191 |
|
менных e(t-\-k), e(t-\-k—\), |
e(t-\-\), e{t), |
e(t—\), |
... . Из |
урав |
нения (4.8) следует, что e(t—1), ... могут |
быть |
вычислены по |
результатам измерений в момент времени t. Для этого перепи
шем |
выражение (4.12), используя равенство |
|
|
|
|
||||||||||||||
|
|
С* fa-') = A* (q~l) F* (с?-1) + q~k |
G* (q-1), |
|
(4.13) |
||||||||||||||
где F и G — полиномы степеней k—-1 и п—1, |
определяемые фор |
||||||||||||||||||
мулами (3.18) и (3.19). |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
(Сравнить |
|
с выражением (3.20), |
полученным |
при решении |
|||||||||||||||
задачи упреждения.) Следовательно, |
|
|
|
|
|
|
|
|
|
||||||||||
y{t + |
k) = |
KF4.q-4e(t |
+ k) + £b-S-u(t) |
|
|
. |
|
|
|
|
e{t). |
(4.14) |
|||||||
|
|
|
|
|
|
|
|
A |
(q~l) |
|
|
|
|
A |
(q |
') |
|
|
|
Решая уравнение |
(4.3) |
относительно |
Ke(t), |
|
получим |
|
|
||||||||||||
|
|
к |
е |
( 0 |
= |
^ |
C l |
у (t) - |
^ 2 = 1 |
|
q-* и (Q. |
|
(4.15) |
||||||
Исключая |
e(t) |
из |
уравнения |
(4.14) |
с |
помощью |
выражения |
||||||||||||
(4.15), находим |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
y{t + |
k) = |
XF* (q-l)e(t |
|
+ k) |
+ |
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
A*(q-1) |
|
' |
|
A*(q-l)C'(q-l)\ |
u(t) |
|
о'Ог1) У it). |
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||||
С помощью равенства (4.13) второй |
член |
в |
правой |
части |
|||||||||||||||
можно преобразовать. В результате получим |
|
|
|
|
|
||||||||||||||
|
|
y(t |
+ k) |
= |
XF* (с?-1 ) е (t |
+ |
k) |
+ |
^ |
Л . |
|
у |
(/) |
+ |
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
С- |
(q~l) |
|
|
|
|
||
|
|
|
|
|
|
|
|
с* (я-1) |
|
|
|
' |
|
|
|
|
|
(4.16) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Пусть теперь |
|
u(t)—произвольная |
|
функция |
от y{t), |
y(t—1), ... |
|||||||||||||
и u{t—1), |
u(t—2), |
... . Тогда |
|
|
|
|
|
|
|
|
|
|
|
||||||
|
Еу2 |
(t H • k) = E [IF* (с/-1) e (t + k)Y- + |
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
G- Or1)y(t) |
|
B* (q-')F* |
(«Г1) |
u(t) |
(4.17) |
|||||||
|
|
|
|
|
|
L C* (q-1) |
|
|
|
|
C'(q~l) |
|
|
|
|
||||
Смешанные произведения равны нулю, так как e(t-\-l), |
e{t-\-2). |
||||||||||||||||||
e(t-\-k) |
не |
зависят |
от |
y{t), |
y(t—1),... |
|
и |
(t—2),... |
. Следова |
||||||||||
тельно, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ey*(t |
+ |
k)>%* |
[1 + / а |
+ |
Л + |
. . . |
+ |
/ э _ ] ] , |
|
(4.18) |
|||||||
где равенство имеет место при |
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
В* (с?-1) F* (с/-1) и (t) + |
G* fa"1) у (0 |
= |
0, |
|
(4.19) |
192 Глава 6
что дает требуемый закон управления. Выводы сформулирова
ны |
в теореме |
4.1. |
|
|
|
|
|
|||
|
Теорема |
4.1. Рассмотрим |
процесс, |
описываемый |
уравнением |
|||||
|
|
А* |
Or1) |
У (t) = В* (с/-1) u(t-k) |
+ ХС* (сг1) |
е ((), |
(4.8) |
|||
где |
{e(t), |
teT}— |
последовательность |
независимых |
нормальных |
|||||
с параметрами |
(0, 1) случайных переменных. Пусть |
все нули |
||||||||
полинома |
C(z) |
расположены |
внутри |
единичного |
круга. Тогда |
|||||
закон управления, минимизирующий дисперсию, имеет вид |
||||||||||
|
|
|
|
5* |
(a-1) F* fa-') |
и it) = - |
G* (a-1) y(f), |
|
|
(4.19) |
где полиномы F и G степеней k—1 и п—1 соответственно опре деляются по формуле
С* ( г 1 ) |
= Л* ( г 1 ) |
F* (о-1 ) + |
<Г* G* (</-'). |
|
(4-13) |
||||
Ошибка управления |
для оптимальной |
системы |
равна |
скользя |
|||||
щему среднему порядка /г: |
|
|
|
|
|
|
|
||
у (/) = XF* {q~l)e |
(0 = К \е (/) + fx е (t - |
1) |
+ |
|
|||||
|
|
4---- + |
/ й _ , в ( / - * + 1 ) ] . |
|
|
(4.20) |
|||
Замечание |
1. Теорема |
остается |
справедливой, |
если только |
|||||
предположить, |
что |
e(t) |
и |
e(s) |
не |
коррелированы |
при 1Фа |
и рассматривать линейные законы управления. |
|
|
||||
Замечание |
2. Сравнение |
с решением |
задачи |
упреждения в |
||
разд. 3 показывает, что член из выражения |
(4.16) |
|
|
|||
|
С («Г1) |
' |
С (с-1) |
' |
|
|
можно интерпретировать как А-шаговый упредитель для |
y(t-\-k), |
|||||
основанный |
на наблюдениях |
y(t), y(t—1),..., а |
ошибка |
управ |
||
ления равна |
ошибке /г-шагового упреждения. Таким образом, |
|||||
из теоремы 4.1 следует, что |
закон управления, |
минимизирую |
||||
щий дисперсию, вытекает |
из |
определения |
^-шагового |
упреди- |
теля и последующего выбора управляющей переменной, такой, что предсказываемая выходная переменная совпадает с желае мой выходной переменной. Итак, задачу стохастического управ ления можно разделить на две задачи: упреждения и управле ния. Поэтому теорему 4.1 называют теоремой разделения.
Замечание 3. При использовании стратегии, минимизирую щей дисперсию, ошибка управления является скользящим сред ним порядка к. Поэтому ковариационная функция ошибки уп равления будет равна нулю для значений аргумента, больших к. Это замечание очень удобно для использования, когда требу ется проверить систему в действии для того, чтобы найти, явля ется ли используемая стратегия управления оптимальной
Стратегии управления, минимизирующие дисперсию 193
Замечание |
4. Полюсы |
замкнутой |
системы равны |
нулям по |
|||
линома |
C*(z). |
|
|
|
|
|
|
Приведем пример определения стратегии управления, мини |
|||||||
мизирующей дисперсию. |
|
|
|
|
|
||
Пример 1 |
|
|
|
|
|
|
|
Рассмотрим систему, описываемую уравнением |
|
||||||
|
|
Л 0? |
') |
|
|
А (<? J) |
|
где |
|
Л * ( Т ' ) |
= 1 - 1 , 7 7 - » |
+0, 7 < г 2 . |
|
||
|
|
|
|||||
|
|
В* (стх) = 1 +0,5 « г 1 |
, |
|
|||
|
|
С * ^ - 1 ) = 1 + |
1,5^-! |
|
|
||
Сначала |
рассмотрим случай |
k=l. |
Для определения |
стратегии |
|||
управления |
используем равенство |
(4.13): |
|
С* (q-1) = А* (с/"1 ) F* (q~l) + q-1 G* (q~l).
Получим
(1 + 1,5 <r' + 0,9 <г2) = (1 - 1,7 q-1 + 0,7 <г2) + q~l (g0+gl q~^).
Приравнивание коэффициентов при одинаковых степенях дает
1,5 = — l,7 + g-a,
0,9 = 0,7 + g l .
Следовательно, g0=3,2; gi = 0,2. Таким образом, стратегия уп равления, минимизирующая дисперсию, задается следующим образом:
" W = — . / и * / п = |
r ^ W |
В* ( Т 1 ) F* Or1) |
1 + 0 . 5 9 - 1 |
или |
|
ы(/) = — 0,5w(^— 1) — 3,2 г/ (0 — 0,2 у (t — 1).
Используя оптимальную стратегию, по теореме 4.1 и выражению (4.20) находим, что ошибка управления равна
0(0 = * Со
наследуем изменение характеристик оптимальной системы при введении в систему дополнительного времени запаздывания. При этом равенство (4.13). принимает вид
(1 + 1,5 ^ + 0,9 q-*) = (1 - 1,7 q-i + 0,7 q~2) (1 + f, q-*) +
13-403
100
-7001 |
l |
l |
I |
I |
1 |
I |
I |
I |
l |
I |
0 |
|
|
|
|
50 |
|
|
|
|
100 |
Время, t
P и c. 6.2. Моделирование выходного сигнала системы при управляю щем сигнале, равном нулю (пример 1).
20
!
1
i
& - 2 ,
50 |
WO |
Время, t |
|
Р и с . 6.3. Моделирование выходного и управляющего сигналов си стемы при k = \ и стратегии управления, минимизирующей диспер
сию (пример 1).
•Сравнение с рис. 6.2 показывает, что данная стратегия управления значительно уменьшает дисперсию выходного сигнала.
Стратегии управления, минимизирующие |
дисперсию |
195 |
|||
Приравнивание коэффициентов дает |
|
|
|
||
1,5 |
= |
- 1 , 7 + ^ , |
|
|
|
0,9 |
= |
0 , 7 - 1 , 7 / 4 + |
£ 0 , |
|
|
0 = |
0,7/i + gi. |
|
|
|
|
Решая эти уравнения, получаем / i = |
3,2; |
g-0 =5,64; gi ——2,24. |
Стратегия управления, минимизирующая дисперсию, теперь
имеет вид |
о* От1 ) |
|
|
|
5,64 —2,249.—1 |
|||
и (Л = |
-y{t) = |
~ |
||||||
|
|
1 + 3 , 7 9 - 1 + |
1,6<7- |
|||||
|
5* (q~l) |
F* |
(q-1) |
|
|
|||
|
|
|
|
|
||||
Следовательно, |
|
|
|
3Ju(t— l)—l,6u(t — 2). |
||||
и (0 = - 5 , 6 4 ^ ( 0 |
+2,24^ ( / - 1 ) |
|||||||
|
|
|
||||||
Ошибка управления равна |
|
|
|
|
||||
|
y(t) = e (t) + |
he (t - |
1) = |
e (t) + 3,2e (t - |
1). |
|||
Дисперсия ошибки управления равна |
|
|
||||||
|
|
var#(/) = |
1 - Ь / 2 = 11,24. |
|
I
H
|
|
100 |
Р и с . 6.4. Моделирование выходного и управляющего сигналов |
системы при |
|
k=2 и |
стратегии управления, минимизирующей дисперсию |
(пример 1). • |
Сравнение |
с рис. 6.3 показывает у х у д ш е н и е работы, обусловленное введением дополнитель |
|
|
ного запаздывания . |
|
13*
196 |
|
Глава |
6 |
Итак, |
из этого примера |
следует, что ошибка управления зна |
|
чительно увеличивается |
при введении в систему дополнитель |
||
ного времени запаздывания. |
|
||
На |
рисунках 6.2—6.4 показаны |
модели выходного сигнала, |
когда управляющий сигнал равен нулю, а также модели управ
ляющих и выходных |
сигналов для системы при /г= 1 и к —2 и |
|
стратегии управления, минимизирующей |
дисперсию. |
|
Упражнения |
|
|
1. Рассмотреть систему, описываемую |
уравнением |
|
0(0 = |
1 г и ( * - ! ) + 1 + |
0 Jq~] е{(), |
где {e{t)} — последовательность независимых нормальных с параметрами (0, 1) случайных переменных. Определить страте гию управления, минимизирующую дисперсию.
2. Рассмотреть систему, описываемую уравнением
y(t) |
+ ay(t— |
l) = bu(t — k) + l \e{t) + ce(t — 1)], |
|
где {e(t), |
teT}—последовательность |
независимых нормальных |
|
с параметрами (0, 1) |
случайных |
переменных. Определить стра |
тегии управления, минимизирующие дисперсию, и ошибки управ
ления при k—\, 2 и |
3. |
|
|
|
|
3. Рассмотреть детерминированную систему, заданную урав |
|||||
нением |
|
|
|
|
|
A' {q-l)y(t) |
= |
B'{g-')u(t~k). |
|
||
Показать, что стратегия |
управления |
|
|||
и® |
= |
»/ |
Gif*< |
ч У { 1 ) ' |
( 4 - 2 1 ) |
|
|
В* |
(q-1) F* ОТ1 ) |
|
|
где полиномы F и G определяются |
равенством |
|
имеет следующее свойство: данная стратегия приводит за k шагов выходной сигнал системы к нулю. Стратегия (4.21) на зывается апериодической.
4. Рассмотреть систему
А* [д~1) У (0 = В' [a'1) u(t-k) + %С* (Г 1 ) е (t).
•Определить дисперсию выходной переменной, когда управление •системы осуществляется по апериодической стратегии (4.21), описанной в упражнении 3. Показать, что ошибка управления является скользящим средним, и сравнить полученную диспер сию с минимальной дисперсией.
|
Стратегии управления, минимизирующие |
дисперсию |
197 |
5. |
Рассмотреть систему, заданную с помощью |
уравнения |
|
(4.7). |
Показать, что стратегия управления, |
минимизирующая |
дисперсию, будет всегда содержать операцию интегрирования,
если полином А% имеет простой нуль при z=\ |
и если |
А\(\)ф§. |
6. Показать, что числа /,-, определенные |
равенством |
(4.13), |
можно интерпретировать как импульсную реакцию дискретной динамической системы с импульсной передаточной характери стикой C(z)IA(z).
7. Определить стратегию управления, минимизирующую дис персию, и дисперсию ошибки управления для системы, описы
ваемой уравнением |
|
у (0 + 0,50 (t - 1) = е (0 + |
2е (t- 1) - f и (t - 1). |
8. Рассмотреть систему, описываемую уравнением |
|
y(t) = —[-—u(t-l)+ |
e(t), |
1 + 2 ? - 1 |
1 — 0,2?—1 |
где {e(t)} —последовательность |
независимых нормальных с па |
раметрами (0, 1) случайных переменных. Определить стратегию
управления, минимизирующую дисперсию, для этой |
системы. |
|||
(Сравнить с упражнением |
1.) |
|
|
|
9. Цифровой вариант |
регулятора |
описывается уравнением |
||
u(t)=u(t-\) |
+ |
K\(l + j - ) |
У®-У (t-Vh |
(4-22) |
где К, h, Т — положительные числа. Найти наиболее общую систему вида (4.8), для которой алгоритм (4.22) может служить стратегией управления, минимизирующей дисперсию.
10. Рассмотреть равенство полиномов
|
|
C(z)=A(z)F(z) |
+ |
B(z)G(z), |
|
|
|
|
|
где А, |
В |
и С — заданые полиномы степеней пА, |
пв |
и пс |
|
соответ |
|||
ственно. Допустим, что Пс<пА-\-пв—1. |
Показать, |
что |
сущест |
||||||
вуют единственные полиномы F и G степеней пр=Пв—1 |
|
и Пв= |
|||||||
пА—1, |
которые удовлетворяют |
данному равенству. |
Показать |
||||||
также, |
что существует много полиномов степеней |
nF>i%B—1 и |
|||||||
nG>nA—1, |
удовлетворяющих данному равенству. |
|
|
|
|||||
11. |
Рассмотреть систему |
(4.8). |
Показать, |
что существует |
|||||
стратегия управления, такая, что ошибка управления |
равна |
||||||||
ошибке упреждения выхода на / шагов вперед, когда |
l>k. |
||||||||
Указание. Использовать |
равенство |
|
|
|
|
C*{z-')=A'[z-')F\{z-x)+z-'G\{z-1).
12. Определить стратегию управления, минимизирующую дисперсию, для системы (4.8), когда допустимые стратегии та-
198 |
Глава 6 |
|
|
ковы, что u(t) |
является функцией от y(t—1), |
y(t—2), |
u(t—1), |
u{t—2),... . |
|
|
|
13. Найти |
представление пространства |
состояний |
системы, |
описываемой уравнением (4.12).
5. ЧУВСТВИТЕЛЬНОСТЬ ОПТИМАЛЬНОЙ СИСТЕМЫ
Хорошо известно, что оптимальные решения при некоторых условиях могут быть очень чувствительны к изменениям пара метров. Проведем исследование этого вопроса в нашем частном случае. Для этого предположим, что система задается уравнени ем (4.8), которое можно переписать в виде
А°(q) у (0 = В"(q)u(t-k) |
+ А°С°(q)е(t), |
(5.1) |
а закон управления определяется в предположении, что модель системы имеет вид
A (q) y(f) = B (q) u(t~k) + KC (q) e (t), |
(5.2) |
где коэффициенты А, В и С немного отличаются от А0, В0 и С0. Отметим, что обе модели (5.1) и (5.2) имеют один и тот ж е порядок п. Стратегия управления, минимизирующая дисперсию, для модели (5.2) задается выражением
„( 0 = |
91^1 |
у( 0 = |
_ J^sL у ( 0 i |
(5.3) |
W |
В* («Г1) F * (q-1) |
|
B(q)F(q)yy" |
' |
где F и G — полиномы степеней к—1 |
н п—1, определяемые ра |
|||
венством (4.13). |
|
|
|
|
Исследуем теперь, что происходит, когда управление систе мой (5.1) осуществляется по закону (5.3). Подставляя выраже
ние (5.3) в уравнение |
(5.1), получим |
|
|
|
|
||||
|
A°{q) |
В" (?) G (q) |
y(t) |
= |
X°C°(q)e(t). |
(5.4) |
|||
|
|
|
|||||||
|
|
|
B(q)F(q) |
J ' |
|
|
|
|
|
Применим |
оператор qn+k~l |
к равенству |
(4.13) |
и используем оп |
|||||
ределение обратного полинома. Находим |
|
|
|||||||
|
|
qk-1C(q)=A(q)F(q) |
|
+ |
G(q). |
|
(5.5) |
||
Уравнения |
(5.4) |
и (5.5) дают |
|
|
|
|
|
||
[дк~1В° |
(q) С (q) + |
(Л° (?) В (q) - A (q) Я» (q)) F (q)] у (t) |
= |
||||||
= WB(q)C°(q)F(q)e(f). |
|
|
|
|
(5.6) |
||||
Следовательно, |
характеристическое |
уравнение |
системы |
имеет |
|||||
вид |
|
|
|
|
|
|
|
|
|
гк-1В° |
(г) С (г) + |
[А0 |
(г) В {z) —A |
(z) 5° (г)] F(z) = 0. |
(5.7) |
Стратегии управления, |
минимизирующие |
дисперсию |
199 |
||
Если А=А°, |
В=В° и С = С ° , |
характеристический полином |
сво |
||
дится к выражению zh~lB°(z) |
C°(z). Таким образом, для неболь |
||||
ших изменений параметров колебания системы |
(5.6) близки к |
||||
колебаниям, |
соответствующим zh-lB°(z)C°(z), |
и п |
т. е. к—1 |
коле |
|
баниям для |
полюсов в начале координат |
колебаниям |
для |
полюсов в нулях полинома В0. Кроме того, когда расчетные па раметры равны истинным параметрам, левую и правую части уравнения (5.6) можно сократить на коэффициент °Ѱ. Отсюда следует, что если А=А°, В = В°, С = С ° , колебания, соответст вующие °Ѱ, не связаны с входным сигналом е ИЛИ соответст вующие переменные состояния при тех же условиях неуправляе мы входной переменной е. Следовательно, если закон управле ния определяется исходя из модели, которая отличается от истинной, входной сигнал может возбуждать все колебания, со ответствующие решениям характеристического уравнения (5.7). При этом устойчивость этих колебаний не имеет особого значе ния. Однако, если некоторые колебания неустойчивы, можно по лучать бесконечно большие ошибки, когда модель, используемая для определения закона управления, сколь угодно мало отли чается от истинной модели. Это происходит в том случае, если полином °Ѱ имеет нули вне или на границе единичного кру га. Из теорем представления для стационарных случайных про
цессов (теорема 3.2 гл. 4) следует, что С0 |
всегда можно |
выбрать |
|
и что его нули будут лежать внутри или |
на границе единично |
||
го круга. Таким образом, для полинома |
С° единственный |
кри |
|
тический случай возможен тогда, когда |
С0 имеет нули |
на |
еди |
ничной окружности. Полином 5° будет иметь нули вне единич ного круга, если система не является минимально-фазовой. Сле довательно, когда динамическая система, которой необходимо управлять, не является минимально-фазовой или числитель спектральной плотности возмущения имеет нули на единичной окружности, стратегия управления, минимизирующая диспер сию, будет чрезвычайно чувствительна к изменениям параметров модели. В этой ситуации практически важно найти законы уп
равления, которые не чувствительны к |
изменениям |
параметров |
и дают дисперсии, близкие к минимальным. |
|
|
Квазиоптимальные стратегии |
|
|
Известно много способов получения |
стратегий |
управления, |
не чувствительных к изменениям параметров. Рассмотрим один из них. Для уяснения идеи допустим, что В (z) может быть пред ставлено в виде
S(z) |
= |
B 1 ( ? )52 (z), |
(5.8) |
где В\—полином степени |
щ, |
все нули которого лежат |
внутри |