Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Острем К.Ю. Введение в стохастическую теорию управления

.pdf
Скачиваний:
39
Добавлен:
24.10.2023
Размер:
10.97 Mб
Скачать

190

 

Глава

6

 

 

 

В(г) =

Ь0г" + Ь1г«-*

+ • • • + &„,

(4.10)

 

С (г) =

z"~c%zn~l

-\

hc„.

(4.11)

Без

потери общности можно

предположить, что все

полино­

мы имеют степень п, так как коэффициенты при высших степе­

нях всегда

можно положить

равными

нулю.

Полином C(z)

всегда можно

выбрать так, что

нули его

будут

лежать внутри

или на границе единичного круга. Допустим также, что полино­ мы не имеют нулей на единичной окружности.

Критерий

Для задачи управления выбран критерий, по которому мини­ мизируется дисперсия выходной переменной у.

Допустимые законы управления

Предполагается, что закон управления должен быть таким, что значение и в момент времени t является функцией наблю­ даемых значений выходной переменной до момента времени t включительно, т. е. у(t), y(t—1), y(t2),..., и всех предшест­ вующих сигналов управления u(t—1), u(t2), ... .

Постановка задачи

Рассмотрим динамическую систему, описываемую уравнени­ ем (4.8). Требуется найти допустимый закон управления, такой,

что дисперсия выходной

переменной имеет наименьшее значение.

Оптимальный закон управления называется стратегией

управ­

ления,

минимизирующей

дисперсию.

 

 

 

 

Решение

 

 

 

 

 

 

 

 

Для

решения

задачи

рассмотрим состояние

в момент

вре­

мени t.

Имеются

результаты измерений

y(t),

y(t—1),

... и

из­

вестны

все

предыдущие

управляющие

воздействия

u(t—1),

u(t-2),

... .

 

 

u(t), при котором

 

Задача

состоит в определении такого

дис­

персия выходной переменной имеет наименьшее значение. Из

уравнения (4.8)

следует,

что сигнал

управления u(t)

влияет на

y{t-\-k) и не влияет на

предыдущие

значения

выходной пере­

менной. Рассмотрим

 

 

 

 

y(t +

k)=

и (0 - f Л ^ ^ I f

е (t+k).

(4.12)

 

A

(q ')

A (q-1)

 

 

Последний член является линейной функцией случайных пере-

Стратегии управления,

минимизирующие

дисперсию

191

менных e(t-\-k), e(t-\-k—\),

e(t-\-\), e{t),

e(t—\),

... . Из

урав­

нения (4.8) следует, что e(t—1), ... могут

быть

вычислены по

результатам измерений в момент времени t. Для этого перепи­

шем

выражение (4.12), используя равенство

 

 

 

 

 

 

С* fa-') = A* (q~l) F* (с?-1) + q~k

G* (q-1),

 

(4.13)

где F и G — полиномы степеней k—-1 и п—1,

определяемые фор­

мулами (3.18) и (3.19).

 

 

 

 

 

 

 

 

 

 

 

 

(Сравнить

 

с выражением (3.20),

полученным

при решении

задачи упреждения.) Следовательно,

 

 

 

 

 

 

 

 

 

y{t +

k) =

KF4.q-4e(t

+ k) + £b-S-u(t)

 

 

.

 

 

 

 

e{t).

(4.14)

 

 

 

 

 

 

 

 

A

(q~l)

 

 

 

 

A

(q

')

 

 

Решая уравнение

(4.3)

относительно

Ke(t),

 

получим

 

 

 

 

к

е

( 0

=

^

C l

у (t) -

^ 2 = 1

 

q-* и (Q.

 

(4.15)

Исключая

e(t)

из

уравнения

(4.14)

с

помощью

выражения

(4.15), находим

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y{t +

k) =

XF* (q-l)e(t

 

+ k)

+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A*(q-1)

 

'

 

A*(q-l)C'(q-l)\

u(t)

 

о'Ог1) У it).

 

 

 

 

 

 

 

 

 

 

 

С помощью равенства (4.13) второй

член

в

правой

части

можно преобразовать. В результате получим

 

 

 

 

 

 

 

y(t

+ k)

=

XF* (с?-1 ) е (t

+

k)

+

^

Л .

 

у

(/)

+

 

 

 

 

 

 

 

 

 

 

 

 

 

С-

(q~l)

 

 

 

 

 

 

 

 

 

 

 

 

с* (я-1)

 

 

 

'

 

 

 

 

 

(4.16)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пусть теперь

 

u(t)—произвольная

 

функция

от y{t),

y(t—1), ...

и u{t—1),

u(t—2),

... . Тогда

 

 

 

 

 

 

 

 

 

 

 

 

Еу2

(t H • k) = E [IF* (с/-1) e (t + k)Y- +

 

 

 

 

 

 

 

 

 

 

 

 

G- Or1)y(t)

 

B* (q-')F*

(«Г1)

u(t)

(4.17)

 

 

 

 

 

 

L C* (q-1)

 

 

 

 

C'(q~l)

 

 

 

 

Смешанные произведения равны нулю, так как e(t-\-l),

e{t-\-2).

e(t-\-k)

не

зависят

от

y{t),

y(t—1),...

 

и

(t—2),...

. Следова­

тельно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ey*(t

+

k)>%*

[1 + / а

+

Л +

. . .

+

/ э _ ] ] ,

 

(4.18)

где равенство имеет место при

 

 

 

 

 

 

 

 

 

 

 

 

 

В* (с?-1) F* (с/-1) и (t) +

G* fa"1) у (0

=

0,

 

(4.19)

192 Глава 6

что дает требуемый закон управления. Выводы сформулирова­

ны

в теореме

4.1.

 

 

 

 

 

 

Теорема

4.1. Рассмотрим

процесс,

описываемый

уравнением

 

 

А*

Or1)

У (t) = В* (с/-1) u(t-k)

+ ХС* (сг1)

е ((),

(4.8)

где

{e(t),

teT}

последовательность

независимых

нормальных

с параметрами

(0, 1) случайных переменных. Пусть

все нули

полинома

C(z)

расположены

внутри

единичного

круга. Тогда

закон управления, минимизирующий дисперсию, имеет вид

 

 

 

 

5*

(a-1) F* fa-')

и it) = -

G* (a-1) y(f),

 

 

(4.19)

где полиномы F и G степеней k—1 и п—1 соответственно опре­ деляются по формуле

С* ( г 1 )

= Л* ( г 1 )

F* (о-1 ) +

<Г* G* (</-').

 

(4-13)

Ошибка управления

для оптимальной

системы

равна

скользя­

щему среднему порядка /г:

 

 

 

 

 

 

 

у (/) = XF* {q~l)e

(0 = К \е (/) + fx е (t -

1)

+

 

 

 

4---- +

/ й _ , в ( / - * + 1 ) ] .

 

 

(4.20)

Замечание

1. Теорема

остается

справедливой,

если только

предположить,

что

e(t)

и

e(s)

не

коррелированы

при 1Фа

и рассматривать линейные законы управления.

 

 

Замечание

2. Сравнение

с решением

задачи

упреждения в

разд. 3 показывает, что член из выражения

(4.16)

 

 

 

С («Г1)

'

С (с-1)

'

 

 

можно интерпретировать как А-шаговый упредитель для

y(t-\-k),

основанный

на наблюдениях

y(t), y(t—1),..., а

ошибка

управ­

ления равна

ошибке /г-шагового упреждения. Таким образом,

из теоремы 4.1 следует, что

закон управления,

минимизирую­

щий дисперсию, вытекает

из

определения

^-шагового

упреди-

теля и последующего выбора управляющей переменной, такой, что предсказываемая выходная переменная совпадает с желае­ мой выходной переменной. Итак, задачу стохастического управ­ ления можно разделить на две задачи: упреждения и управле­ ния. Поэтому теорему 4.1 называют теоремой разделения.

Замечание 3. При использовании стратегии, минимизирую­ щей дисперсию, ошибка управления является скользящим сред­ ним порядка к. Поэтому ковариационная функция ошибки уп­ равления будет равна нулю для значений аргумента, больших к. Это замечание очень удобно для использования, когда требу­ ется проверить систему в действии для того, чтобы найти, явля­ ется ли используемая стратегия управления оптимальной

Стратегии управления, минимизирующие дисперсию 193

Замечание

4. Полюсы

замкнутой

системы равны

нулям по­

линома

C*(z).

 

 

 

 

 

Приведем пример определения стратегии управления, мини­

мизирующей дисперсию.

 

 

 

 

 

Пример 1

 

 

 

 

 

 

 

Рассмотрим систему, описываемую уравнением

 

 

 

Л 0?

')

 

 

А (<? J)

 

где

 

Л * ( Т ' )

= 1 - 1 , 7 7 - »

+0, 7 < г 2 .

 

 

 

 

 

 

В* (стх) = 1 +0,5 « г 1

,

 

 

 

С * ^ - 1 ) = 1 +

1,5^-!

 

 

Сначала

рассмотрим случай

k=l.

Для определения

стратегии

управления

используем равенство

(4.13):

 

С* (q-1) = А* (с/"1 ) F* (q~l) + q-1 G* (q~l).

Получим

(1 + 1,5 <r' + 0,9 2) = (1 - 1,7 q-1 + 0,7 2) + q~l (g0+gl q~^).

Приравнивание коэффициентов при одинаковых степенях дает

1,5 = — l,7 + g-a,

0,9 = 0,7 + g l .

Следовательно, g0=3,2; gi = 0,2. Таким образом, стратегия уп­ равления, минимизирующая дисперсию, задается следующим образом:

" W = — . / и * / п =

r ^ W

В* ( Т 1 ) F* Or1)

1 + 0 . 5 9 - 1

или

 

ы(/) = — 0,5w(^— 1) — 3,2 г/ (0 — 0,2 у (t — 1).

Используя оптимальную стратегию, по теореме 4.1 и выражению (4.20) находим, что ошибка управления равна

0(0 = * Со­

наследуем изменение характеристик оптимальной системы при введении в систему дополнительного времени запаздывания. При этом равенство (4.13). принимает вид

(1 + 1,5 ^ + 0,9 q-*) = (1 - 1,7 q-i + 0,7 q~2) (1 + f, q-*) +

13-403

100

-7001

l

l

I

I

1

I

I

I

l

I

0

 

 

 

 

50

 

 

 

 

100

Время, t

P и c. 6.2. Моделирование выходного сигнала системы при управляю­ щем сигнале, равном нулю (пример 1).

20

!

1

i

& - 2 ,

50

WO

Время, t

 

Р и с . 6.3. Моделирование выходного и управляющего сигналов си­ стемы при k = \ и стратегии управления, минимизирующей диспер­

сию (пример 1).

•Сравнение с рис. 6.2 показывает, что данная стратегия управления значительно уменьшает дисперсию выходного сигнала.

Стратегии управления, минимизирующие

дисперсию

195

Приравнивание коэффициентов дает

 

 

 

1,5

=

- 1 , 7 + ^ ,

 

 

 

0,9

=

0 , 7 - 1 , 7 / 4 +

£ 0 ,

 

 

0 =

0,7/i + gi.

 

 

 

Решая эти уравнения, получаем / i =

3,2;

g-0 =5,64; gi —2,24.

Стратегия управления, минимизирующая дисперсию, теперь

имеет вид

о* От1 )

 

 

 

5,64 —2,249.—1

и (Л =

-y{t) =

~

 

 

1 + 3 , 7 9 - 1 +

1,6<7-

 

5* (q~l)

F*

(q-1)

 

 

 

 

 

 

 

Следовательно,

 

 

 

3Ju(t— l)—l,6u(t — 2).

и (0 = - 5 , 6 4 ^ ( 0

+2,24^ ( / - 1 )

 

 

 

Ошибка управления равна

 

 

 

 

 

y(t) = e (t) +

he (t -

1) =

e (t) + 3,2e (t -

1).

Дисперсия ошибки управления равна

 

 

 

 

var#(/) =

1 - Ь / 2 = 11,24.

 

I

H

 

 

100

Р и с . 6.4. Моделирование выходного и управляющего сигналов

системы при

k=2 и

стратегии управления, минимизирующей дисперсию

(пример 1). •

Сравнение

с рис. 6.3 показывает у х у д ш е н и е работы, обусловленное введением дополнитель­

 

ного запаздывания .

 

13*

196

 

Глава

6

Итак,

из этого примера

следует, что ошибка управления зна­

чительно увеличивается

при введении в систему дополнитель­

ного времени запаздывания.

 

На

рисунках 6.2—6.4 показаны

модели выходного сигнала,

когда управляющий сигнал равен нулю, а также модели управ­

ляющих и выходных

сигналов для системы при /г= 1 и к —2 и

стратегии управления, минимизирующей

дисперсию.

Упражнения

 

 

1. Рассмотреть систему, описываемую

уравнением

0(0 =

1 г и ( * - ! ) + 1 +

0 Jq~] е{(),

где {e{t)} — последовательность независимых нормальных с параметрами (0, 1) случайных переменных. Определить страте­ гию управления, минимизирующую дисперсию.

2. Рассмотреть систему, описываемую уравнением

y(t)

+ ay(t—

l) = bu(t — k) + l \e{t) + ce(t — 1)],

где {e(t),

teT}—последовательность

независимых нормальных

с параметрами (0, 1)

случайных

переменных. Определить стра­

тегии управления, минимизирующие дисперсию, и ошибки управ­

ления при k—\, 2 и

3.

 

 

 

 

3. Рассмотреть детерминированную систему, заданную урав­

нением

 

 

 

 

 

A' {q-l)y(t)

=

B'{g-')u(t~k).

 

Показать, что стратегия

управления

 

и®

=

»/

Gif*<

ч У { 1 ) '

( 4 - 2 1 )

 

 

В*

(q-1) F* ОТ1 )

 

где полиномы F и G определяются

равенством

 

имеет следующее свойство: данная стратегия приводит за k шагов выходной сигнал системы к нулю. Стратегия (4.21) на­ зывается апериодической.

4. Рассмотреть систему

А* [д~1) У (0 = В' [a'1) u(t-k) + %С* 1 ) е (t).

•Определить дисперсию выходной переменной, когда управление •системы осуществляется по апериодической стратегии (4.21), описанной в упражнении 3. Показать, что ошибка управления является скользящим средним, и сравнить полученную диспер­ сию с минимальной дисперсией.

 

Стратегии управления, минимизирующие

дисперсию

197

5.

Рассмотреть систему, заданную с помощью

уравнения

(4.7).

Показать, что стратегия управления,

минимизирующая

дисперсию, будет всегда содержать операцию интегрирования,

если полином А% имеет простой нуль при z=\

и если

А\(\)ф§.

6. Показать, что числа /,-, определенные

равенством

(4.13),

можно интерпретировать как импульсную реакцию дискретной динамической системы с импульсной передаточной характери­ стикой C(z)IA(z).

7. Определить стратегию управления, минимизирующую дис­ персию, и дисперсию ошибки управления для системы, описы­

ваемой уравнением

 

у (0 + 0,50 (t - 1) = е (0 +

2е (t- 1) - f и (t - 1).

8. Рассмотреть систему, описываемую уравнением

y(t) = —[-—u(t-l)+

e(t),

1 + 2 ? - 1

1 — 0,2?—1

где {e(t)} —последовательность

независимых нормальных с па­

раметрами (0, 1) случайных переменных. Определить стратегию

управления, минимизирующую дисперсию, для этой

системы.

(Сравнить с упражнением

1.)

 

 

9. Цифровой вариант

регулятора

описывается уравнением

u(t)=u(t-\)

+

K\(l + j - )

У®-У (t-Vh

(4-22)

где К, h, Т — положительные числа. Найти наиболее общую систему вида (4.8), для которой алгоритм (4.22) может служить стратегией управления, минимизирующей дисперсию.

10. Рассмотреть равенство полиномов

 

 

C(z)=A(z)F(z)

+

B(z)G(z),

 

 

 

 

где А,

В

и С — заданые полиномы степеней пА,

пв

и пс

 

соответ­

ственно. Допустим, что Пс<пА-\-пв—1.

Показать,

что

сущест­

вуют единственные полиномы F и G степеней пр=Пв—1

 

и Пв=

пА—1,

которые удовлетворяют

данному равенству.

Показать

также,

что существует много полиномов степеней

nF>i%B—1 и

nG>nA—1,

удовлетворяющих данному равенству.

 

 

 

11.

Рассмотреть систему

(4.8).

Показать,

что существует

стратегия управления, такая, что ошибка управления

равна

ошибке упреждения выхода на / шагов вперед, когда

l>k.

Указание. Использовать

равенство

 

 

 

 

C*{z-')=A'[z-')F\{z-x)+z-'G\{z-1).

12. Определить стратегию управления, минимизирующую дисперсию, для системы (4.8), когда допустимые стратегии та-

198

Глава 6

 

 

ковы, что u(t)

является функцией от y(t—1),

y(t—2),

u(t—1),

u{t—2),... .

 

 

 

13. Найти

представление пространства

состояний

системы,

описываемой уравнением (4.12).

5. ЧУВСТВИТЕЛЬНОСТЬ ОПТИМАЛЬНОЙ СИСТЕМЫ

Хорошо известно, что оптимальные решения при некоторых условиях могут быть очень чувствительны к изменениям пара­ метров. Проведем исследование этого вопроса в нашем частном случае. Для этого предположим, что система задается уравнени­ ем (4.8), которое можно переписать в виде

А°(q) у (0 = В"(q)u(t-k)

+ А°С°(q)е(t),

(5.1)

а закон управления определяется в предположении, что модель системы имеет вид

A (q) y(f) = B (q) u(t~k) + KC (q) e (t),

(5.2)

где коэффициенты А, В и С немного отличаются от А0, В0 и С0. Отметим, что обе модели (5.1) и (5.2) имеют один и тот ж е порядок п. Стратегия управления, минимизирующая дисперсию, для модели (5.2) задается выражением

( 0 =

91^1

у( 0 =

_ J^sL у ( 0 i

(5.3)

W

В* («Г1) F * (q-1)

 

B(q)F(q)yy"

'

где F и G — полиномы степеней к—1

н п—1, определяемые ра­

венством (4.13).

 

 

 

 

Исследуем теперь, что происходит, когда управление систе­ мой (5.1) осуществляется по закону (5.3). Подставляя выраже­

ние (5.3) в уравнение

(5.1), получим

 

 

 

 

 

A°{q)

В" (?) G (q)

y(t)

=

X°C°(q)e(t).

(5.4)

 

 

 

 

 

 

B(q)F(q)

J '

 

 

 

 

Применим

оператор qn+k~l

к равенству

(4.13)

и используем оп­

ределение обратного полинома. Находим

 

 

 

 

qk-1C(q)=A(q)F(q)

 

+

G(q).

 

(5.5)

Уравнения

(5.4)

и (5.5) дают

 

 

 

 

 

[дк~1В°

(q) С (q) +

(Л° (?) В (q) - A (q) Я» (q)) F (q)] у (t)

=

= WB(q)C°(q)F(q)e(f).

 

 

 

 

(5.6)

Следовательно,

характеристическое

уравнение

системы

имеет

вид

 

 

 

 

 

 

 

 

 

гк-1В°

(г) С (г) +

0

(г) В {z) —A

(z) 5° (г)] F(z) = 0.

(5.7)

Стратегии управления,

минимизирующие

дисперсию

199

Если А=А°,

В=В° и С = С ° ,

характеристический полином

сво­

дится к выражению zh~lB°(z)

C°(z). Таким образом, для неболь­

ших изменений параметров колебания системы

(5.6) близки к

колебаниям,

соответствующим zh-lB°(z)C°(z),

и п

т. е. к1

коле­

баниям для

полюсов в начале координат

колебаниям

для

полюсов в нулях полинома В0. Кроме того, когда расчетные па­ раметры равны истинным параметрам, левую и правую части уравнения (5.6) можно сократить на коэффициент °Ѱ. Отсюда следует, что если А=А°, В = В°, С = С ° , колебания, соответст­ вующие °Ѱ, не связаны с входным сигналом е ИЛИ соответст­ вующие переменные состояния при тех же условиях неуправляе­ мы входной переменной е. Следовательно, если закон управле­ ния определяется исходя из модели, которая отличается от истинной, входной сигнал может возбуждать все колебания, со­ ответствующие решениям характеристического уравнения (5.7). При этом устойчивость этих колебаний не имеет особого значе­ ния. Однако, если некоторые колебания неустойчивы, можно по­ лучать бесконечно большие ошибки, когда модель, используемая для определения закона управления, сколь угодно мало отли­ чается от истинной модели. Это происходит в том случае, если полином °Ѱ имеет нули вне или на границе единичного кру­ га. Из теорем представления для стационарных случайных про­

цессов (теорема 3.2 гл. 4) следует, что С0

всегда можно

выбрать

и что его нули будут лежать внутри или

на границе единично­

го круга. Таким образом, для полинома

С° единственный

кри­

тический случай возможен тогда, когда

С0 имеет нули

на

еди­

ничной окружности. Полином 5° будет иметь нули вне единич­ ного круга, если система не является минимально-фазовой. Сле­ довательно, когда динамическая система, которой необходимо управлять, не является минимально-фазовой или числитель спектральной плотности возмущения имеет нули на единичной окружности, стратегия управления, минимизирующая диспер­ сию, будет чрезвычайно чувствительна к изменениям параметров модели. В этой ситуации практически важно найти законы уп­

равления, которые не чувствительны к

изменениям

параметров

и дают дисперсии, близкие к минимальным.

 

Квазиоптимальные стратегии

 

 

Известно много способов получения

стратегий

управления,

не чувствительных к изменениям параметров. Рассмотрим один из них. Для уяснения идеи допустим, что В (z) может быть пред­ ставлено в виде

S(z)

=

B 1 ( ? )52 (z),

(5.8)

где В\—полином степени

щ,

все нули которого лежат

внутри