Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Методы оптимизации в статистических задачах управления

..pdf
Скачиваний:
19
Добавлен:
20.10.2023
Размер:
8.04 Mб
Скачать

Рассмотрим более подробно случай линейного объекта, опи­ сываемого уравнением

 

X = Ах + Вии +

Виѵ + I,

X (0)

= х 0,

 

(535)

где А,

Ви, Вѵ— известные

матрицы;

g (t) — случайные

воз­

мущения, представляющие векторный «белый» шум.

 

 

Критерий игры примем в виде

 

 

 

 

 

(

 

т

 

 

1

 

 

/ = М |х*

(Т) Кх (Т) + I (u*Juu +

v*Jvv) dt |,

 

 

1

 

 

 

 

)

 

где Л и

J и— положительно определенные матрицы;

Jv — отри­

цательно определенная матрица.

 

 

 

 

Управление и основано на измерении

 

 

 

 

 

 

Уи =

Сих + т]„ (t),

 

 

(53б)

а управление ѵ — на измерении

 

 

 

 

 

 

Уѵ

Сѵх -(- т)0 (і) •

 

 

 

Статические характеристики х°, g (t), у\а (t) и

цѵ (t)

пред­

полагаются известными обоим игрокам.

 

 

 

 

В рассматриваемом случае в соответствии с формулой (474)

можно

записать:

 

 

 

 

 

 

 

Я (ф, X,

и, V, t)

= фо (u*Juu +

v*J0v) +

 

 

+

ф* (Ах +

Вии + Вѵѵ +

g);

 

 

=Ф, ф (Г) = -2 Л * (7),

фо = — 1.

Подставляя уравнение (536) в формулу (533) и дифференцируя полученное выражение по и (t), получим по аналогии с выраже­ нием (488)

и (0 = В*Ли (t),

где ф„ (f) означает оценку ъектора ф (t) на основании информа­ ции yu (t).

Аналогично из

уравнений

(534) получаем

 

V (t) =

ВІф0 (t),

 

где ф„ (t)— оценка

ф (t) по

информации

yv (t).

Для объекта, описываемого уравнения

(535), и системы урав­

нений для вектора ф (t) аналогично формулам (504) и (505) полу-

217

чаем систему уравнений для оценок фц, ф0, хц, х0, где индексы и, V обозначают наблюдаемые процессы уи и уѵ, по которым опре­ деляются оценки:

~df~ == Ахи-f- Ваи -f- Bvvu-j- DUXXCURU \^Уи — Cuxuj',

= Axy -f- Buuv -|- BuV -f- DVXXCVRU I УѵCvxvJ,

^ =

- Л*$„ + D ^ C l R - 1

[yu - C u X u ] ;

~

А "фг, —}- DVtyXCvRv

\yv Cvxv\•

Здесь через vu и иѵ обозначены оценки управлений н и м при наблюдениях zu и гѵ соответственно, а через Duxx, DvXX, Du^x, Dzrtyx— дисперсионные матрицы оценок по информации уи, уѵ.

Трудности в решении этой задачи заключаются в предвари­

тельном определении оценок управлений противника ѵи и иѵ. Иногда виды этих оценок могут определяться в условиях за­ дачи [7].

6. Оптимальное управление линейным объектом со случайными коэффициентами типа «белый» шум

Вопросам оптимального управления объектами со случайными свойствами посвящены работы ряда авторов [7, 49, 52, 65, 125, 130, 146, 150, 157]. В этих работах принимаются различные предположения относительно свойств стохастического объекта и применяются различные методы синтеза системы управления. В этом параграфе рассматривается задача оптимального управ­ ления линейным объектом со случайными коэффициентами типа «белый» шум:

X = А гх + А ги + / х,

где X — вектор п измерений; А х и А 2 — матрицы случайных коэф­ фициентов типа «белый» шум размерности [п, п] и [п, q] соот­ ветственно; и — вектор управляющего воздействия q измерений, зависящий от t их; / г — п-мерное входное воздействие, содержа­ щее неслучайную составляющую и случайные отклонения типа «белый» шум. Наличие мультипликативной помехи в канале уп­ равления может быть вызвано неточностью реализации блока управления, особенностями канала связи и другими факторами.

Предполагается, что фазовые координаты объекта измеряются точно, поэтому управляющее воздействие зависит от перемен-

218

ных t их . Оно является оптимальным, если достигается минимум функционала

I т

I = М I J [х* (т) V (т) X (т) + и* (т) J (т) и (т) dx -|-

Іо

 

+ х * ( Т ) А х ( Т ) ^

(537)

где / (т), V (т) и Л — симметричные положительно

определен­

ные матрицы.

 

Используя обозначение для второй начальной моментной

функции Г (t) = М [х (t) л;* (/)] фазовых координат,

функционал

(537) можно записать в следующем виде:

 

т

 

/ = J [tr (Г (т) V (т)) + и* (т) J (т) и (г)] dx + tr (Г (Г) Л). (538)

о

 

Если удается построить дифференциальное уравнение конеч­

ного порядка, которому удовлетворяет матрица Г (і),

0 < t < Т,

то исходная стохастическая задача оптимального управления мо­ жет быть сведена к эквивалентной детерминированной задаче. Существенно, что дифференциальное уравнение должно однозначно определять ДГ (t) = Г (t + Д) — Г (f) при фиксированных зна­ чениях Г (t) = Г и u (t, х) = и. Для нахождения дифференциаль­ ного уравнения относительно Г (t) воспользуемся приемом, опи­ санным в п. 3 гл. II. Вектор коэффициентов сноса марковского процесса х (t), который нетрудно рассчитать по формуле (203), оказывается зависящим от переменных t, х, и, и'х, где матрица их

имеет элементы , г = 1 , 2 , . . ., q, j = 1, 2, . . ., п.

Матрица коэффициентов диффузии зависит от t, х, и. Вы­ числения показывают, что дифференциальные уравнения для Г (t) содержат, кроме текущего значения управляющего воздействия и, его производные ѵ = и'х. Таким образом, известные значения и ч Т в момент времени t не определяют однозначно АГ (t). Величина ДГ (t) вычисляется при известных значениях и, ѵ, Г в момент t. Это означает, что должны оптимизироваться совместно функции

и (t,

х) и

V (t, х),

которые взаимозависимы, что влечет суще­

ственные

трудности

при

решении

задачи оптимизации.

В

поставленной

выше

задаче

оптимального

управления на

и (t,

х) не наложено ограничений. Сузим класс возможных управ­

лений, ограничивая их линейными управлениями вида

 

 

и (ßi х) = ßo (0

+ ßi (0 X,

(539)

где ß0 (t) — вектор

переменных

коэффициентов

q измерений;

ßx (t) — матрица переменных коэффициентов размерности [q, п\.

Тогда

синтез оптимальной системы сводится к определению

ßo (0,

ßa (t).

219

Подставим управление (539) в исходную формулу:

X = (Л! + А і) X + А 2ßo + /ф.

Обозначая

А х + А 2ß1 = А ;

А 2ßo + fi — f.

получим, что фазовые координаты л: удовлетворяют уравнению

X — Ах + f,

где матрица А и вектор / состоят из коэффициентов типа «белый» шум с известными характеристиками (198)—(200). Как показано в п. 3 гл. II матрица Г (t) определяется совместным решением уравнений (205), (207).при начальных условиях

т (0) =

т 0\ Г (0) = Г0.

(540)

Теперь задача сведена

к оптимизации функционала

(538)

при неголономных связях (205) и (207). Эта задача может решаться с помощью принципа максимума. Указанный подход иллюстри­ руется ниже на примерах.

со

Пример. Рассмотрим управление простейшим

объектом первого порядка

случайным коэффициентом

усиления:

 

 

 

X =

ах + \u, X (0) =

х0,

(541)

где

I (f) — белый шум со средним значением

і; =

const и интенсивностью S.

Требуется найти управление в классе линейных функций фазовой координаты х

 

 

 

 

и (t, х)

=

ßo (t)

+

ßj (t) X,

 

(542)

оптимизирующее квадратичный функционал

 

 

 

 

 

 

/ = М IJ [их2

(т) + ы2 (т) ] dr +

Хх2 ( Т )|.

 

(543)

 

Подставляя уравнение

(542)

в

формулу

(543),

получим

 

 

 

/ = 44 Ij [м 2 (т) +

ß^ (т) +

2ß0 (т)

ßj

(т) X (т) + ßf (т) х2 (т)]

dr +

+

Хх2 (Г)j= I [(р +

ß2 (т)) Г (т) + 2ß0 (т) ßx (т) т (т) + ß^ (т)] Л +

(Г).

 

После подстановки уравнения (542) в выражение (541) уравнение объекта

управления принимает вид

 

 

 

 

 

 

 

 

 

 

і =

[а + ßx (t)

l { t ) ] x

(t) + I

(0 ß„ (0-

 

 

 

Приводя

параметры

рассматриваемого

объекта

в соответствие

с

принятой

в п.

3 гл. II

системой обозначений,

получим:

 

 

 

 

а (0 = а + ßi (t) I (t);

/ « = S (t) ßo (0;

2 2 0

 

Al [а (0] = S (0

= a + ß i (Of;

 

 

Mf (О =

Tß„ (0;

М [а (t) а (г)] =

R (t) 8 (t — т) =

ßt2 (t) S8 (t — r);

M

If (0 f CO] =

(0 6 (* - 0

=

ß2 (0 S8 (* - x);

Al [2

(0 f (T)] = G (t) 8 (t

t) =

ßo

(0 ß , (0 Sö (t - T).

Тогда согласно формулам (205), (207) m (t) и Г (t) удовлетворяют следующей

системе дифференциальных уравнений:

т = «X+

ßi (0 5 + - 9-.ßi (О S

т + 6ß0 (t) +

ßo (0 ßi (0 5;

 

Г = 2 [а +

ßj (t) I + ß2 (t) S]

Г +

 

(544)

 

+ 2

 

 

 

 

 

 

І ßo (0 + -ö -ßo(0 ßi(OS

m +

ßo(0

 

 

 

m (0) = x0;

Г (0) = x\.

 

 

 

Функция Гамильтона определяется выражением

 

 

 

H( t ,

 

^2) = (u + ß 2)r + 2 ß 0ß1m + ß2 +

 

+ *1

а + ßil + -у- ßi5 ) m +

+ y~ ßoßi5

+

+ Ф2

2 (а + ßxg

ß25) Г +

2 (gß 0 +

-J -

ßoßjS) m +

ßflS] ,

где ißj (0 и ij)2 (t) удовлетворяют дифференциальным уравнениям (472):

- Фх = 2ß0ßi + Ф! ( а +

ßtI +

ß?s) +

2ф2 (ißo +

- f -

ßoßlS

 

 

v ßi ~h 2ф2 ( а +

 

 

 

(545)

Фг =

ß il +

ßi^).

 

 

 

Фі СП = 0; ф2 СП =

 

 

 

 

 

Алгебраические уравнения

 

 

 

 

 

 

а я

=

2ß1m -f- 2ß0 + Фі

 

+ у -

ßi-S^ +

 

ößo

 

 

 

 

 

 

 

 

 

 

f

^ 2 ((2l +

3ß1S )m + 2 ß o5 ] = 0 ;

 

(546)

dH

 

 

 

 

 

1

 

 

2ß0m +

Фл [(I +

ßxS) m +

ß0S

+

— 2ßjr +

у

+

Ф2 [2 (I +

2ßxS) Г +

3ß0Sm] = 0

 

 

совместно с краевой задачей (544), (545) определяют оптимальные значения коэф­ фициентов ßo (0, ßi (О-

221

Решение краевой задачи упрощается, если сузить класс управлений, по­ ложив ß0 (t) = 0. В этом случае т (t) и Г (t) удовлетворяют уравнениям

т —

а +

ßj[| 4— ß?s) яг;

 

Г =

2 (а + ßji+ßfs) Г,

(547)

 

m (0) =

х 0; Г (0) =

 

Сопряженные уравнения (545) принимают вид

— 'Фі—'Фі(^а + ßil + ~2~ ßiS) ;

(548)

- ф2= о + ß? + Щ (а + ßil+ ß?s),

^ і ( Л

=

0 ,

4>-я-(-Г- -)Л ,.

Второе из алгебраических уравнений (546) дает выражение для оптимального коэффициента ßi (і)

1+ 2^2S•

(549)

Уравнения (547), (548) для переменных яг, Г, фх, ф2 разделились. Таким образом, для определения оптимального управления

и (t, X) = ßx (t) X

необходимо решение уравнения (548) для ф2 (t) и использование формулы (549).

Пример. Рассмотрим задачу оптимального управления объектом второго порядка:

=

х 2,

х х ( 0 )

=

х 10;

х 2 ~ ( « +

І ( 0 ) * 2 + bu,

х 2 ( 0 )

=

х 20,

где I (і) — центрированный стационарный «белый» шум интенсивности S. Как и в предыдущем примере, оптимальное управление ищется в классе

линейных

управлений

 

 

 

 

 

 

и ( / , х)

= ßj (t) x 1 +

ß2 (t) x 2.

 

(550)

Оптимизируется функционал

 

 

 

 

 

Т

 

 

 

 

 

 

J { v n x \ (т) +

v l2x x (T) x2 (t) +

v22x \ (t)

4- u2 (x)) dx.

(551)

 

o

На рис. 48 показана структурная схема

Объект управления

рассматриваемой системы управления. Объект

 

 

управления выделен штриховой линией.

 

 

Применение результатов п. 3 гл. II и

 

 

уравнения

(550) дает

следующие дифферен­

 

 

циальные уравнения для статистических ха­

 

 

рактеристик

выходных координат

объекта

 

 

управления:

 

 

 

 

 

щ

0

 

1

m 1

 

 

т 2

6 ß 1

6 ß 2 + - 2 - 5

m 2

Рис. 48. Блок-схема системы со

 

 

m i (0 )

X10

 

случайным

коэффициентом | (t)

 

 

m 2 (0 )

X 20

 

222

Yu

 

0

2

0

Y11

Y12

=

6ßl

— ß + 6ß2 -42~ ^

1

Y12

Y22

 

0

26ßi

— 2 ( ä — 6ß2 — 5)

y22

Y1 1

(0)

 

*10

 

 

 

X2

Y1 2

(0)

=

*10*20

Y22

(0)

 

*20

С учетом формулы

(550) квадратичный функционал

(551)

преобразуется

к виду

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

1 I [ ( » 1 1 +

ßl) Yll + ( »

1 2 +

2ßiß2) Ѵі2 +

( v 22 +

ß2) Y2

2] ^т-

о

 

 

 

 

 

 

 

Максимизация функции Гамильтона

 

 

 

 

н — ( f U + ßl) Ѵп + ( » 1 2 +

2ßlß2) Ѵі2

+

( » 2 2 +

ß2) Y22

'

+ 2фцѴі2 + Фі

^ ß i Y u +

^ —

a + ^ ß 2 +

~ 2

s ' j Y12 + Y22 +

+ Ф22 [26ßiYi2 + 2 (— а + 6ß2 + S) y22]

приводит к следующим выражениям для оптимальных значений коэффициен­ тов ßj и ß2:

ßi — ~2~ ^Фіг!

(552)

ß2 = 6ф22.

Функции фгу, і, j = 1, 2 удовлетворяют системе уравнений

Ф11

0

 

6ßi

 

 

0

 

Ф12 =

2

а +

6ß2 -j— — S

26ßi

(553)

Ф22

0

 

1

 

 

— 2 (a — öß2 — 5)

 

 

 

Ф11

 

»n +

ßi

 

 

 

 

 

 

 

 

Ф12

+ »12 +

ßlß2

 

 

 

Ф22

 

»22 ~b ß2

 

 

 

Ф11 (T)

 

0

 

 

 

 

Ф12 (T)

=

0

 

 

 

 

Ф22 (Y7)

 

0

 

 

На рис. 49 показаны графики коэффициентов ßj (t), ß2 (t), полученные пу’ тем моделирования уравнений (552), (553) на вычислительной машине. При мо"

делировании были приняты следующие значения параметров: а = 1, 6 = 1 ,

»11 = »22 ~ 0, ѵ12 = 1 .

223

Интенсивность мультипликативной помехи S варьировалась в пределах от О до 1, что отмечено на графиках. Сочетание параметров ѵи ѵ22 = 0, ѵ12 — 1 практически означает, что требуется минимизировать конечное состояние объекта при интегральном ограничении на управляющее воздействие

т

1 = М 0,5х\ (Т) + I «2 (т) d%

О

Время управления Т полагалось равным 5 с.

Пример. Рассмотрим систему управления, содержащую мультипликативную помеху в канале управления:

%2»

-^і (0)

х10;

Х2 = ах2 + (6 + I (t))u,

х2 (0) =

х20,

где £ (f) — центрированный стационарный «белый» шум интенсивности S.

Как и в предыдущем примере, поставим задачу оптимизации конечного со­

стояния

при интегральном

квадратичном ограничении на управление:

 

 

/ = М

 

 

(554)

При

управлении конечным состоянием

объекта целесообразно

[16]

ввести

новые переменные

 

 

 

 

 

 

г (t) = Ф (Г,

t) X (t).

 

(555)

Здесь матрица Ф (Т, t)

является решением дифференциального уравнения

 

Ф (Т, t) = —Ф (Т, t) А;

 

 

 

 

Ф (Т, Т) =

Е,

.

(556)

224

где А — матрица управляемого объекта; в данном примере

0 1

А:

0 —а

Поскольку в соответствии с формулами (555), (556) г (Т) = х (Т), то кри терий оптимальности (554) можно представить в форме

т

І = М U \ (Т) + I и2 (т) d%

(557)

о

где г (0 удовлетворяет дифференциальному уравнению

2 = Ф (Т, t) Ви\

О

В =

b + l(t)

В рассматриваемом примере уравнения для г (t) в скалярной форме прини­ мают следующий вид:

гі ( 0 = А ± Ж [ і _ е - й 7 - о ] и.

(558)

(t) = lb + 6 (01 e- -a (T'-O

zi (0) = z10; г2 (0)

Задача минимизации (557) при условии (558) рассматривалась в первом из примеров (541)—(543) при более общих предположениях. Оптимальное управле­

ние в классе линейных однородных управлений

 

« =

ßi (0 zi

 

определяется из уравнений

 

 

 

ßi = - Ф1 +

bk (t)

 

2i|)S£2(0

і =

[■fbk №

.

1+2ф5й2(0 ’

ф (T) =

—%,

 

где

 

 

 

k(t) =

1

„ - a (T - t)

 

 

 

 

15 А. М. Батков

V

ПРИЛОЖЕНИЕ

ю

О)

 

Т А Б Л И Ц А З Н А Ч Е Н И Й П А Р А М Е Т Р А х П Р И Р А З Л И Ч Н Ы Х k И е 2

Величина парам етра х при

значении N

Значение

 

 

 

 

 

параметра

 

 

 

 

 

г

2

3

4

5

6

1

k == 50;

7

8

9

10

20

50

100

II h!o

О О

 

 

 

 

 

1,0

1,000

1,000

1,000

1,000

1,000

1,000

1,000

1,000

1,000

1,000

1,000

1,000

1,000

0,9

1,072

0,996

0,998

0,998

0,998

0,998

0,998

0,998

0,998

0,998

0,998

0,998

0,998

0 ,8

0,8 6 8

0,988

0,988

0,988

0,988

0,988

0,992

0,992

0,992

0,992

0,992

0,992

0,992

0,7

0,834

0,970

0,976

0,976

0,976

0,976

0,976

0,976

0,976

0,976

0,976

0,976

0,976

0 ,6

1,312

0,944

0,960

0,960

0,960

0,968

0,968

0,968

0,968

0,968

0,968

0,968

0,968

0,5

1,390

0,920

0,940

0,950

0,950

0,950

0,950

0,950

0,950

0,950

0,950

0,950

0,950

0,4

0,676

0,892

0,928

0,928

0,940

0,940

0,940

0,940

0,940

0,940

0,940

0,940

0,940

0,3

1,546

0,874

0,916

0,930

0,930

0,930

0,930

0,930

0,930

0,930

0,930

0,930

0,930

0 ,2

1,624

1,752

0,9040

0,920

0,936

0,936

0,936

0,936

0,936

0,936

0,936

0,952

0,952

0,1

1,702

1,792

0,928

0,964

0,964

0,964

0,964

0,964

0,982

0,982

0,982

0,982

0,982

0 ,0

1,760

1,800

1,74

1,060

1,060

1,060

1,060

1,060

1,060

1,060

1,060

1,080

1,080

Соседние файлы в папке книги из ГПНТБ