Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Зубов В.И. Математические методы исследования систем автоматического регулирования

.pdf
Скачиваний:
44
Добавлен:
25.10.2023
Размер:
12.11 Mб
Скачать

Пусть задана некоторая область S фазового

пространства

(хъ . . ., хп). Положим

 

J(U) = p{X(T)£S}.

(20.3)

Функционал J представляет собой вероятность попадания пра­ вого конца стохастического движения, описываемого системой (20.1), в область 5. Задача состоит в том, чтобы найти управления ии . . ., иг так, чтобы функционал J имел наибольшее возможное значение при условии |« /| ^ 1 .(/ = 1, . . ., г). Решение этой задачи в общем случае затруднительно. Дадим способы ее решения в некоторых конкретных случаях. Прежде всего найдем математи­ ческие ожидания и дисперсии компонент вектора X (t). Имеем

 

t

Е IX (t)]

— Z (t) Е [Х(0)] +

 

 

 

 

 

 

+

j Z{t) Z-1 (т) [BM + f + СЕ [ Y ] ] dx.

(20.4)

 

о

 

 

 

 

Компоненты вектора Е [X ] будем обозначать через аъ

. . ., ап.

Легко видеть,

что

каждая

компонента представляется

в форме

 

 

t

г

 

 

as = а,0) (0 + j

S

c*i V, т) Uj (x)dx (s = 1, ..., n).

(20.5)

 

 

0

/=1

 

 

Дисперсии компонент вектора X определяются по формулам

D\ (t) =

Е lx,

(f) as (t)f (s = 1, . . ., n).

(20.6)

Из формулы (20.6) вытекает, что дисперсии компонент вектора X определяются через корреляционные и взаимно-корреляционные функции вероятностных процессов у ъ . . ., ут и не зависят от управлений иъ . . ., иг. Будем считать, что компонента х х век­ тора X (t) распределена по нормальному закону с математическим

ожиданием Е [х± (01 =

«1 (0 и дисперсией

(/). Положим

•Ми) = р { К ( Л |< /} .

 

Функционал J ± есть

вероятность попадания

правого конца

стохастического движения системы (20.1) X (Т) в n-мерный слой

—/ <

^

I. Требуется управления иъ .

 

. ., иг выбрать так, что­

бы / X(U)

имел

наибольшее

возможное

значение при

условии

\Uj\

1 (/

= 1,

. . ., г). Функционал J 1

(U) может быть представ­

лен в форме

1

(X—fli (Г))г

 

 

 

 

 

 

 

 

A(U) =

2й\ (Т)

 

dX.

(20.7)

 

 

 

( Т)

 

 

 

 

 

 

 

 

—г

Из (20.7) вытекает, что J г (U) имеет наименьшее возможное значение тогда и только тогда, когда | ах (Т)| достигает наимень­ шего возможного значения, так как J 2 (U) монотонно возрастает

200

при убывании аг (Т), если ах > 0 , и при возрастании аг (Т), если

f l i

( Т ) < 0.

 

 

 

Обозначим оптимальное управление через и р (/ = 1, . . г).

Если

1

г

 

а Р (Т) > 0

 

a P r n - J S и ( 7 \ т ) |* > о ,

то

будет

о

У=1

 

 

“Г = — sign cv {T, t).

Если

т г

а[0) (Т) < 0 и а Р(Т) + J

2 | сц (Т , т) | dt < 0,

о

/=1

то

и}0) = sign сч (7\ т).

Итак, в рассмотренных случаях

u P = - s ig n И 0) (Г)с1/(7’, *)]•

При этих управлениях оптимальное значение вероятности попа­

дания

дается формулой

 

 

 

 

Х-<40) (T)+sign а р

Т г

Т 2

 

[ ^

I С у (Т, х) | dx

 

 

 

0 1=1

 

 

 

2d \

( Т )

 

Л ( и (0)) =

V 2nD1(Г)

-dX .

 

 

 

Если

же

 

 

 

 

г

г

 

 

 

а Р (Т) > 0 и а Р — J 2 Pi/(7\

т )И т < 0 ,

 

о

/=1

 

 

то оптимальных управлений существует, вообще говоря, бесконеч­ ное множество. В качестве одного из них можно взять то же самое управление, что и выше, однако задав его на [0, t0]. На проме­ жутке же По, Т] движение объекта при таком управлении должно быть автономным:

и( 10) = — Sign а[0)Су (Т, t), 16 [0, t0y,

«Г = 0 , te [U, т\,

где 10 — наименьшее значение t, при котором

 

t

г

„ ( 0

)

2 м т>r) \ dx-

а\

j

 

0

1=1

201

Если ai0) (Т) <С 0, то t0 выбирается

как наименьшее значение t,

при котором

 

 

t o

Г

 

а\0)(Т) + J

V | Clj(T,

r)\dx — 0.

о

/=1

 

Автономное движение объекта можно осуществлять не только на последнем участке движения, но и на любом другом участке Ui, t2 ] или на какой-либо совокупности таких участков, од­ нако участки автономного движения должны удовлетворять сле­ дующему необходимому условию. Обозначим объединение этих

участков через А, а дополнение до промежутка [0, Т] — через А.

Если управление п)0) имеет

вид u f ] = — sign a{0) iT)

cij (T, t)

при t £

А и uj0) = 0

при

А, то оно будет оптимальным при

 

 

 

 

Г

 

 

 

 

 

а{0) (Т) -

sign аГ (Г) J

J

! ci/ (Т, r)\dx = 0.

 

 

 

 

л /=1

 

 

 

 

Пусть

а,- (/ =

1, . . .,

я),

как и выше, есть математические

ожиданиях!, . . .,

хп. Тогда величины «у могут быть представлены

в форме

 

 

 

т г

 

 

 

 

 

а, — aj0) +

Ъцщ dt

(j = 1....... п).

 

 

 

j

^

(20.8)

 

 

 

 

 

0

i=l

 

 

 

Пусть,

как и ранее, dj (/ =

1, . . .,

п) — дисперсии х ъ

. . ., хп.

Предположим, что случайные величины хх (Т), . . ., хп (Т) неза­

висимы и нормально распределены.

Тогда их совместная функция

распределения

 

 

 

 

 

 

F

. . ., Kk) = F, (Хх) F2 (К2) . . . Fk (к/г),

где Fj (к/)

есть

функция

распределения случайной величины

X/ (Т) (/ =

1, . . ., k), так

как

 

 

 

 

 

 

ъ

{x~ aiYl

 

 

 

Ff {h) =

 

 

2d j

dx.

 

 

V 2л dj

 

Положим

 

 

 

 

 

 

 

J (U) =

p{x1(7’)....... xk(T)£S],

где p — вероятность события, заключенного в фигурные скобки. Множество 5 есть ^-мерный параллелепипед

l j Ху 5 ^ /у- ( / = 1 , . . ., k , l j >■ 0 ) .

Функционал J может быть представлен тогда в виде У(и) = Л ( и )/2(и )-.-Л (и ),

202

где

 

 

 

 

Ч - (х~а/)2

y,(U) =

V 2TLd:

dX.

 

 

- ч

Выше было найдено программное управление, оптимальное по

вероятности в случае k =

1. Поставим задачу построения програм­

много оптимального управления для k >• 1. Для его отыскания можно предложить различные методы последовательных прибли­

жений. Отметим некоторые из них. Предположим, что U(0> = = («i°\ . . ., Ur0)) представляет собой оптимальное управление. Функции и}°> могут принимать одно из трех значений: — 1; 0; +1-

Выберем некоторую точку т £ [0, Т ] так, чтобы управление и)о) принимало то же значение в промежутке [т — е, т + е]. Иначе говоря, предположим, что точка т не является точкой переключения

для управления u f \ а величина е7- = «}0) (т) может быть равна либо + 1, либо— 1. Построим управление u f ] следующим образом: u f ] = —е/ при t £ \ t — е, f + е] и wj0) = п)0) при t £ [0, Т ]

иtZ (t — е, t + е).

Рассмотрим управление

и ™ = м °».......

Так как U(0) — оптимальное управление, то необходимо будет

 

 

J (U(0)) гз» J (U(0))

 

при любом выборе достаточно малого 8 > 0 .

Если обозначить а;-

через a, (U), то будем иметь

 

 

ai = a, (U(0)) + б7 = а, (0 (0)) (/ =

1 ,.. ., k).

Функционал

J (U)

будет

аналитической

функцией величин

бц . . ., 8k при

U =

0 (0).

Если разложить этот функционал

в ряд по степеням б1; . . ., 8k и ограничиться лишь линейными членами разложения, то получим

/( О (0)) =

4 и (0)) + Ц с А . + ---

( i = i , . . „ щ,

где

 

i=i

 

 

 

 

 

 

 

Ci =

dJ ( U ) (0)

 

 

 

 

dbi

•=в*=°

 

 

 

Следовательно,

 

 

 

 

Ci =

r J , ( 0 (0))

Ji (U(0))

6=...=6k=0

 

L 5 61

 

20 3

Из последней формулы вытекает, что

Н , —ai (и (О)))2

(/,-«*,(U<°>))2

2d1,

/(и<°>)

С; =

Ji (и<°>) •

V 2 л d i

Отсюда следует, что число ct имеет

тот же знак, что и число

а{ (Um ), т. е.

 

sign ct = — sign at (Ui0)).

Предположим, что при любом достаточно малом е )> О

k

 

 

 

2j ci&i 4=0.

 

 

 

 

 

t=i

 

 

 

 

 

 

 

 

 

 

 

 

 

k

Тогда

вследствие

оптимальности

 

управления

U(0) с,Д <1 0.

Найдем фактическое выражение для бг:

 

/ = 1

 

 

 

 

 

 

т + е

 

 

 

т + е

6/ = a

, ( 0 (0)) - f l i ( U

(0)) =

—J

Bj2 b l , ( t ) d t =

~ 2

j и ) ° % ( Г )си ,

 

 

 

 

Х — Е

 

 

 

X — S

откуда

 

 

 

 

 

 

 

 

 

k

 

т + е /

А

\

 

 

 

2

сД =

— 2

|

^

Cibij J u p

dt.

 

 

i=l

 

x—e \ i=l

/

 

 

Из условия оптимальности управления U(0), как уже отмеча­ лось, следует, что

т + е k

JS CibijUp d t> 0 .

Х— Е 1 = 1

Значит,

 

k

 

и }0) = sign

<?Ay-

(20.9)

t=l

Это выражение для оптимального управления фактически сов­ падает с тем, которое было получено при k = 1, если иметь в виду, что при k = 1 имеется лишь одна величина сх, знак которой совпа­

дает со знаком —ах (U(0)) и, следовательно, с —а(0) в том случае, когда участок автономного движения отсутствует и

u p = — sign(a(0)6/).

(20.10)

При"* > 1 формулу (20.10) можно использовать для построе­ ния последовательных приближений.

204

Возьмем некоторое управление

Вычислим

с помощью и х

величины сп , . . Cki подобно тому,

как съ

. . .,

с* вычисляются

через U{0). Положим далее

k

 

 

 

 

 

 

 

uj2) = sign

% с п Ьч, *£[0,

Т].

 

Управление

i=i

 

 

 

 

 

 

 

llw =

(“Р , • ■

и ? )

 

 

образует второе приближение. С этим управлением поступаем так же, как и с U(I). В результате получаем последовательность

U(1), U(2), . . ., U(r), . . ., образующую последовательные при­ ближения, вопрос о сходимости которых остается открытым. Систему равенств (20.10) можно рассматривать как систему нели­ нейных интегральных уравнений, служащих для определения оп­ тимальных управлений. Тогда описанный выше способ последова­ тельных приближений можно рассматривать как обычный способ для решения этой системы интегральных уравнений.

От системы интегральных уравнений (20.10) можно перейти к системе алгебраических уравнений для определения постоян­

ных Сг, . . Ck-

 

С/ = фг- (сь . . ., с4) (£ = 1, . . ., k).

(20.11)

Уравнения (20.11) получаются, если в формулы, определяющие величины с{, подставить выражение (20.10). Уравнения (20.11) можно решать каким-либо приближенным способом. Например, можно воспользоваться каким-либо методом направленного поиска минимума функции

 

V =

к

[Ci — ф, (cl t ...,

ck)]2.

 

 

2

 

 

 

i=i

 

 

 

Если с[п\

. . ., с*п) — n-е

приближение

для

решения системы

(20.11), то

функции

 

 

 

 

 

р п) =

sign

S с\п)Ьц (/ =

1 ,...,

г)

 

 

 

1=1

 

 

можно рассматривать как n-е приближение к оптимальному про­ граммному управлению.

Исследуем далее тот случай, когда случайные функции у1(t),.. .

• • •> Ут (0 не зависят от t и, следовательно, являются случайными

величинами.

Обозначим

их

. . ., \m. Пусть Flt . . Fm

функции распределения

величин

Предположим, что

случайные

величины

. . ., независимы, а начальные дан­

ные, определяющие решение системы уравнений (20.1), либо детер­

минированы, либо включены в число величин glt

. . ., \т. Сов­

местная функция

распределения величин g1( . . .,

F

. . ., Кт) = Ft (К) . . . F m (Кт).

 

205

С помощью этой функции можно построить функцию распределе­ ния G (X) случайной величины х х (Т). Пусть

ГП Т Г

 

*i (Т) =

2

Y& +

J S

+

«10)-

 

 

 

г=

1

о / = 1

 

 

 

В пространстве пг

переменных

Хт возьмем

область

S (X), определяемую неравенством х г (Т) с

X.

Тогда

 

 

G(X)=

J dF (Хь . . Xm) =

 

 

 

 

 

S (К)

 

 

 

 

-j-с»

-J-oo

 

 

л,

xi W>)

 

 

 

 

 

 

 

= 1

d F i(b )J

dF2£ 2) . . .

 

 

dFm(lm).

(20.12)

Из (20.12) вытекает, что функция распределения G (X) может быть представлена также в виде

_ ( х - в{ ° ) - | 2 ^ й

^

Поставим задачу отыскания программного управления U(0), которое доставляет функционалу

/(U ) = /){|X1|< /}

наибольшее возможное значение. Обозначим через а и (3 соответ­ ственно наименьшее и наибольшее значение величины

< * + } 2 ah dt

О.

через а* обозначим точку промежутка [а, р], в которой функция

б ( — — а ) — д ( -----

- — а )

 

имеет наибольшее возможное значение

как функция

[а, р ].

Тогда, если а* совпадает с одним из чисел а и р, то оптимальное управление дается формулой

ы<0) = — sign [(al0) — a)bj] ( / = 1, . . г).

(20.13)

Если же а < а* < р , то оптимальное программное управление может использоваться лишь на части траектории движения. Пусть

управление «}0) определяется формулой (20.13) в точках управле­ ния. В моменты, когда движение автономно, и]0) = 0. Тогда уча-

206

стки, на которых происходит управление, определяются равен­ ством

а{0} + | 2 b ju f dt = а*,

о/=1

Таким образом, и в этом случае при произвольных законах распределения случайных величин, входящих в систему (20.1), задача построения оптимального управления решается полностью.

Для величин х г (Т), . . ., хь. (Т) можно найти совместную функцию распределения G (+ , . . ., Kk) через функции F u . . .

. . ., Fm. С помощью этой функции можно построить функционал

J (U ) = Р ( + i i < l i

........\ x k (Т)| < lk).

Этот функционал есть вероятность попадания стохастического решения системы (20.1) при t = Т в область

1+ 1< tj (/ = 1, • • k), Л+ (—ОО, +оо) (/ = k + 1, . . .,п).

Для такого функционала можно, как и ранее, предложить метод последовательных приближений к оптимальному программному управлению.

21. Программная настройка коэффициентов усиления

Законы управления часто формируются как линейные комби­ нации некоторых выражений. Коэффициенты этих линейных ком­ бинаций называют коэффициентами усиления системы управле­ ния. После того как структура закона управления выбрана, основ­ ная задача при проектировании системы управления сводится к отысканию таких коэффициентов усиления, при которых каче­ ство системы управления будет наивысшим возможным или же будет удовлетворять заданным требованиям.

Во многих случаях коэффициенты усиления во все время дви­ жения сохраняют свое постоянное значение. Поставим вопрос, как найти закон программного изменения этих коэффициентов во времени, для того чтобы повысить качество системы управления. Дадим способ решения одной из таких задач.

Пусть движение управляемого объекта описывается системой

дифференциальных

уравнений

 

 

 

 

X -

A

(t,

U) X +

f (0 +

C(t) Y(0,

(21.1)

где

 

 

 

 

 

 

 

A (t,

U)

= A (0

+

S f ii

(0 ut (0-

(21-2)

 

 

 

 

 

i=l

 

 

Будем считать,

что

матрицы

А (/), Вс (i) (i — 1,

. . ., /') С (t)

и вектор f (t) обладают теми же свойствами, что и в предыдущем параграфе. Пусть по-прежнему управления их (/), . . ., и, (t)

207

являются кусочно-непрерывными функциями, заданными на [О, Т], и удовлетворяют ограничению

гг

 

 

 

 

 

 

 

 

(21.3)

 

 

 

О

(=1

 

 

 

 

Компоненты

вектора Y

(/) = (уг (t), . . .,

ym (t)

будем по-преж­

нему считать вероятностными процессами.

Положим

 

 

 

 

as

Е (a*s),

 

 

 

 

 

ds =

Е (xs — as)2

(s =

1,

. . n).

 

Здесь x

x

n

есть

стохастическое

решение

системы (21.1),

заданное при

t £ [О, Т ]

и удовлетворяющее начальным данным

x s |<=о — Xs,

где xs (s = 1, . . п) — случайные величины.

Математическое ожидание as, дисперсия ds, фазовые коорди­ наты xs являются функциями времени и зависят от выбора управ­ лений иъ . . иг. Обозначим через Z(t, и) матрицу фундаменталь­ ной системы решений для однородной системы уравнений

■§ = A(t,U )X .

(21.4)

Тогда

a = Z(t, U ) a o + J Z ( / f U ) Z - i (т , U ) [f (т ) + ( ( т ) Е (Y ( т ) )] dx,

(21.5)

где

 

(ai,

. . ., ап)\

 

(а°и . . ., ап);

а

=

а0 =

 

 

as = Е К )

(s = 1, . . ., п).

Пользуясь

(21.5),

найдем

 

 

ds =

Е [xs — щ]2 = Е

2 ^

(4 U ) K - f l s ° ) - f

t

г

 

 

 

i=l

 

J

S

X s l (t,

T, U) 2

cij (т) [у, E (yj)\ dx

0

i=1

 

/=i

 

Здесь

{zsi(t,

г,

U)} =

{Z(t,

U)Z(t, U)}s;;

 

СЦ есть элемент матрицы C; s, i = 1, . . ., n\ j = 1, . . ., m.

Если считать, что случайные величины xi, . . х„ попарно независимы между собой и с величинами у и . . ., ут, которые при каждом t также предполагаются взаимно независимыми, то будет

п

t

t

т

ds — ^

Zsi (4 U) di -f-~ |

J

^ 4/ (4 4, h) kj (4, h) dti dt2,

i=i

0

0

/=1

208

т г
| 2 ViU°l dt =h о 1=1

где

 

 

 

 

 

kj (tu t2)

E { [yj (tx) -

E [yj (fj]] [у,- (t2) -

E [y, (/*)]]},

a

 

 

 

 

 

h i

2

Xsi

Zsi (^’

h

h )cij(t2)^'

Рассмотрим

в фазовом

пространстве

случайный вектор

(х1 (Т), . . ., хп (Т)). Будем считать, что его компоненты распре­ делены по нормальному закону с математическими ожиданиями as

и дисперсиями ds. Пусть в фазовом пространстве задана некоторая область 5. Положим

J(V) = p \ x ( T ) e s } .

Вероятность попадания вектора X (Т) в область S будет функ­ ционалом, значения которого зависят от управлений иъ . . .,

Назовем управления ц?, . . ., иг оптимальными, если они до­ ставляют функционалу наибольшее возможное значение при усло­ вии (21.3).

Рассмотрим важный случай, когда область S определяется

неравенствами

 

 

 

 

— L <

х г <

L.

 

(21.6)

Тогда

L

(X -

а ,)2

 

 

 

/(U) = - p L = f e

 

dX.

(21.7)

У 2л dx

J

 

 

 

Положим, что оптимальное управление по отношению к функ­ ционалу (21.7) существует. Естественно предположить, что для этого оптимального управления имеет место равенство

т г

J 2

“ ? ( * ) < * * = *

О i=l

 

ип удовлетворяющих

и что для любых управлений их, . . .,

ограничению

 

 

Т

г

 

/С — 6 < J 2 «г (0 dt

К,

о

1=1

 

будет

 

 

J(U0) ^ J ( U ) ,

где б — некоторая положительная постоянная. Тогда каковы бы ни были допустимые управления vlt . . ., vn являющиеся кусоч­ но-непрерывными функциями, заданными на [О, Г] и удовлетво­ ряющими ограничению

14 В. И. Зуб01

209

 

Соседние файлы в папке книги из ГПНТБ