Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Острем К.Ю. Введение в стохастическую теорию управления

.pdf
Скачиваний:
50
Добавлен:
24.10.2023
Размер:
10.97 Mб
Скачать

10

Введение

 

дискретным

временем, описываемые соотношениями

вход-вы­

ход, такими, как весовые и передаточные функции.

Входными

сигналами этих систем служат случайные процессы второго по­ рядка.

Теоремы представления позволяют значительно упростить исследование, так как в этом случае большой класс задач мож­ но свести к анализу линейных систем с белым шумом на входе. Даны аналогичные результаты для систем с непрерывным вре­ менем.

Предметом обсуждения в гл. 5 является расчет квадратич­ ных функций от переменных состояния для линейных систем. Используя результаты теории аналитических функций, получа­ ют рекуррентные формулы для вычисления квадратичной функ­ ции потерь. Выявлена связь между анализом устойчивости и вычислением квадратичной функции потерь. В качестве иллюст­ рации параметрической оптимизации объектов, зависящих от времени, рассматривается задача восстановления переменных состояния динамической системы с использованием математиче­ ской модели.

Гл. 6 посвящена самому простому классу задач стохастиче­ ского управления: линейным системам с одним входом и одним выходом и с критерием минимального среднеквадратического отклонения на выходе в устойчивом состоянии. Эта частная за­ дача дает хорошее представление о структуре оптимальных ре­ шений, так как теорема разделения может быть доказана без особых математических трудностей. Решение иллюстрирует яв­ ную связь между оптимальной фильтрацией и оптимальным уп­ равлением. При этом получают новый алгоритм решения зада­ чи фильтрации для объектов с дробно-рациональными спект­ ральными плотностями. В этой главе даны также приложения рассмотренной теории.

В гл. 7 изложена теория фильтрации и упреждения. Дана по­ становка задачи и описаны общие свойства решения. Рассмот­ рены необходимые свойства гауссовых процессов и выведены рекуррентные формулы Калмана. Дана геометрическая интер­ претация результатов и анализ свойств ошибок упреждения. До­

казана дуальность задач оптимального упреждения и

управ­

ления.

 

 

Общая проблема квадратичного управления обсуждена

в

гл. 8. Двумя способами доказана теорема разделения

для

си­

стем с дискретным временем.

 

 

Г л а в а 1

СТОХАСТИЧЕСКОЕ УПРАВЛЕНИЕ

1.ВВЕДЕНИЕ

Вданной главе сделана попытка изложить основы стохасти­ ческой теории управления. В разд. 2 кратко рассмотрены основы теории управления. Особое внимание уделяется обсуждению де­ терминированной теории управления, основной недостаток ко­ торой состоит в том, что в ней не обеспечивается необходимое различие между разомкнутыми и замкнутыми системами. Это

обусловлено в основном тем, что в рамках детерминированной теории управления пренебрегают помехами. В разд. 3 обсужда­ ются некоторые трудности, возникающие при описании помех. В разд. 4 изложены основы стохастической теории управления и приведены наиболее важные выводы из нее.

2. ТЕОРИЯ УПРАВЛЕНИЯ С ОБРАТНОЙ СВЯЗЬЮ

Теория управления возникла как средство для анализа и син­ теза систем управления. Ранние разработки были связаны с центробежными регуляторами, простыми схемами регулирова­ ния для промышленных объектов, электронными усилителями и системами управления стрельбой. По мере развития теории ока­ зывалось, что ее методы применимы к целому ряду разных си­ стем, как технических, так и не технических. В теории управле­ ния использовались результаты различных ветвей прикладной математики. Задачи управления в свою очередь приводили к но­ вым результатам в прикладной математике.

На ранних этапах развития теории большое внимание уделя­ лось теории устойчивости, построенной на теореме Рауса—Гур- вица. Эта теорема является наглядным примером взаимодей­ ствия между теорией и практикой. Действительно, задачу об ус­ тойчивости Гурвицу предложил Стодола, который столкнулся с этой проблемой на практике при разработке регуляторов для паровых турбин.

Для анализа усилителей с обратной связью использовались методы теории аналитических функций, что привело в результа­ те (помимо всего прочего) к знаменитому критерию Найквиста.

После второй мировой войны специалисты по управлению столкнулись с некоторыми задачами, для решения которых тре-

12

Глава 1

бовались

очень точные характеристики объектов. Кроме того,

многие из подлежащих исследованию объектов управления ока­ зались очень сложными. Это привело к новой формулировке за­

дачи синтеза

как задачи оптимизации и дало возможность не

только использовать

вариационные методы, но и улучшить их.

В результате

была

создана детерминированная теория опти­

мального управления, которая в совокупности с цифровыми вы­ числительными машинами представляет мощный метод решения задач управления. При использовании теории оптимального уп­ равления нередко оказывается, что проблемы устойчивости не

представляют особого интереса, ибо часто оптимальная

система

устойчива при довольно общих условиях.

 

 

 

 

В

детерминированной теории

оптимального управления не

вводится различие между программным управлением

(разомк­

нутая

система)

и управлением

с

обратной

связью

•(замкнутая система); оптимальная обратная связь есть

просто

функция, которая отображает пространство состояний

в прост­

ранство переменных

управления

(следовательно,

переходные

процессы в цепи оптимальной обратной связи не

принимаются

во внимание); при постановке и решении

задачи

никогда явно

не вводится информация, достаточная для вычисления истинно­ го значения сигнала управления.

Проиллюстрируем эти особенности на примере.

Пример 1

Рассмотрим систему

 

 

 

=

«

(2.1)

dt

 

 

4 '

с начальным условием

 

 

 

*(0)

=

1.

(2.2)

Предположим, что управление этой системой желательно осуществлять таким образом, чтобы характеристики системы удовлетворяли критерию минимума значения функционала

со

 

/ = [[*«(*) + и * (*)]#•

(2.3)

Легко показать, что минимальное значение критерия (2.3) равно 1 и что это значение получается как для программного управления

«(*)

=

- е " ' ,

(2.4)

так и для стратегии управления

вида

(2.5)

u{t) = —х

 

(/).

Стохастическое управление

13

Уравнение .(2.4) описывает управление без обратной связи, так как значение сигнала управления определяется только апри­ орными данными, т. е. независимо от того, как протекает про­ цесс. Уравнение (2.5) представляет закон управления с обрат­ ной связью, так как значение сигнала управления в момент t зависит от состояния объекта в этот момент.

Таким образом, приведенный пример показывает, что разомк­ нутая система (2.4) и замкнутая система (2.5) эквивалентны в том смысле, что функция потерь (2.3) для них имеет одно и то же значение. Однако их характеристики устойчивости раз­ личны.

Система (2.1) с управлением (2.5) с обратной связью асимп­ тотически устойчива, в то время как система (2.1) с програм­ мным управлением (2.4) просто устойчива. Таким образом, на практике управление с обратной связью (2.5) и управление без обратной связи (2.4) сильно различаются. Это можно обнару­ жить, например, если ввести помехи или считать, что управление осуществляется по модели, коэффициенты которой определены с ошибками.

Некоторые указанные выше особенности детерминированной теории управления весьма нежелательны в теории, предназна­ ченной для применения в управлении с обратной связью. При разработке детерминированной теории оптимального управле­ ния серьезной критике подвергался тот факт, что в ней не раз­ личаются разомкнутые и замкнутые системы и не учитываются динамические характеристики цепи обратной связи. Например, с помощью этой теории невозможно было получить стратегию, которая соответствовала бы хорошо известным регуляторам, используемым в промышленных установках.

Эти ограничения детерминированной теории управления объясняются тем, что в ней используются нереальные модели для помех. Если даже так называемые помехи и вводятся, то всегда предполагается, что они описываются априорно известной функцией. В этом случае для системы, управление которой пред­ ставляется дифференциальным уравнением с единственным ре­ шением", знание начального состояния очевидно эквивалентно знанию состояния системы в произвольный момент времени. По­ этому не различаются между собой разомкнутые и замкнутые системы, и предположение о заданном начальном условии при­ водит к тому, что истинное значение состояния известно в любой момент времени. Кроме того, когда известно состояние системы, оптимальное управление будет функцией, которая отображает пространство состояний системы в пространство состояний пере­ менных управления. Как показано ниже, проблема учета дина­ мических характеристик цепи обратной связи возникает в том

14

Глава

1

•случае, когда

состояние системы

неизвестно и оно должно быть

восстановлено по измерениям выходных сигналов.

Тем, кто занимался практическими работами в области уп­ равления, было известно с самого начала развития теории уп­ равления, как важно учитывать влияние помех. Многие класси­ ческие методы синтеза также давали возможность эвристически

оперировать с помехами. Приведем выдержку

из

книги

А. К. Холла ': «Я хорошо помню то время, когда М Т И 2

и фирма

«Сперри» совместно работали над системой управления

авиаци­

онного радиолокатора. В воскресенье, 7 декабря 1941

г. двое из

нас проработали весь день в лаборатории Гардн Сити и, следо­ вательно, не слышали о нападении на Пирл-Харбор до поздне­ го вечера. Мы были обескуражены, потому что хотя мы и созда­ ли хорошую систему для испытаний, но совершенно забыли о важности шумов, и в результате наша система была нестабиль­ на и совершенно неудовлетворительна. Попытки найти решение проблемы привели нас к использованию частотных методов. Ме­ нее чем через три месяца у нас была усовершенствованная си­ стема, которая была устойчива, имела удовлетворительные пе­ реходные характеристики и на порядок меньшую величину раз­ броса. У меня этот случай породил большое доверие к частот­ ным методам».

Упражнения

 

 

 

 

 

 

 

 

1. В

примере 1 показать,

что сигнал

управления

(2.4) и

за­

кон управления :(2.5) оптимальны.

 

 

 

 

 

Замечание.

Доказать

сначала

следующее тождество:

 

т

 

 

 

 

 

т

 

 

 

J

2 (/) +

х2(/)] dt =

х* (0) -

х 2 (Т) +

^[x(t)

+ x (t))2 di.

 

о

 

 

 

 

 

6

 

 

 

2. В

примере 1 предположить,

что оптимальный

сигнал

уп­

равления и оптимальный

закон

управления

определяются

мо­

делью вида

 

 

 

 

 

 

 

 

 

 

 

dx

аи,

 

 

 

 

 

 

 

-

 

 

 

 

dt

где а имеет значение, близкое к 1, когда управление действи­ тельно осуществляется по уравнению (2.1). Определить значе­ ние критерия (2.3) для систем, получаемых при регулировании по разомкнутому циклу и регулировании по замкнутому циклу.

1

Hall А. С, «Frequency Response*

(R. Oldenburger, ed.), Macmillan, New

York,

1956.

институт в США. — Прим. ред.

2

Массачусетский технологический

 

Стохастическое

управление

15

3. Сравнить характеристики регулирования по разомкнутому

(2.4)

и замкнутому циклам (2.5), когда система фактически опи­

сывается уравнением

 

 

 

 

dx

= и

+ V,

 

 

 

 

dt

 

 

 

где

v — неизвестная помеха.

В

частности, пусть

v — неизвест­

ная

константа.

 

 

 

3. ПРЕДСТАВЛЕНИЕ ПОМЕХ

Необходимость введения более реальных моделей помех тре­ бует соответствующих методов их представления. Особенности реальных помех состоят в том, что невозможно точно предска­ зать их значение. Поэтому нелегко построить математическую модель, обладающую таким свойством. Например, нельзя моде­ лировать помехи аналитическими функциями, ибо если известно значение аналитической функции на произвольно малом интер­ вале, то значение этой функции для всего интервала можно опре­ делить ее аналитическим продолжением.

Попытаемся использовать статистические понятия для пост­ роения моделей помех. Например, можно попытаться моделиро­ вать помехи в следующем виде:

 

 

 

* ( 0 =

 

t adt)li,

 

 

(3-1)

 

 

 

 

 

i=l

 

 

 

 

где

a2(t),

 

an(t)

—известные функции, a

— случайная

величина.

 

 

 

 

 

 

 

 

 

Тогда, если линейные уравнения

 

 

 

 

 

х (У = а,

& + а2 Ь + • • • + ап Цг) 1п,

 

 

х (t2)

= а, (4) 1г +

а2

(Q Ь + • • • + ап

(t2) %п,

(3.2)

 

хОп)

= а1 (О & +

аг

(У | 2

+ •.. + ап

(/„)

1п

 

имеют

решение,

частные

реализации

стохастических величин | ь

£г, • • •. кп можно точно определить из наблюдений x(t\.), x(t2),

...

x(tn)

и, таким образом, точно предсказать значения х.

По­

этому

помехи,

описываемые уравнением (3.1), называются

пол­

ностью

детерминированными

стохастическими

процессами

или

вырожденными

(сингулярными)

 

случайными

процессами.

 

Более удачной может оказаться попытка моделировать поме­ хи в виде последовательности случайных величин. Простым при­

мером служит процесс авторегрессии

{x(t)},

определяемый

сле­

дующим выражением:

 

 

 

x{t+\)

= ax{t) + e(t),

t = t0,

t0+l,...,

(3.3)

16

Глава 1

гдех(*о) = 1, | а | < 1

и {e{t), t=t0, t0-\-\, ...} есть последова­

тельность независимых нормальных случайных величин с пара­

метрами

(0,

о). Предполагается

также, что e(t)

не зависит от

x(t)

для всех t. Допустим, например, что на основании наблюде­

ний x(t)

надо предсказать

значение x(t-\-l).

Естественно

x(t-{:

+ 1)

представить величиной

ax(t).

Тогда ошибка

предсказания

равна e(t),

т. е. случайной

величине с нулевым средним

значе­

нием и дисперсией а2.

 

 

 

 

 

Еще один подход к задаче моделирования

помех состоит в

том, чтобы описывать их случайными процессами. Теория слу­ чайных процессов фактически частично выросла из попыток мо­ делирования флуктуации, наблюдаемых в физических системах. Эта теория достигла совершенства благодаря вкладу таких вы­ дающихся ученых, как Крамер, Хинчин, Колмогоров и Винер.

Задачи прогнозирования имеют большое значение в теории

случайных процессов. В дальнейшем будет показано,

что они

тесно связаны и с задачами управления.

 

 

Упражнения

 

 

 

1. Помехи описываются

выражением

 

 

 

x(t) = a cos (t),

 

 

где

а — случайная переменная. Каким

образом можно

предска­

зать

значения х?

 

 

 

2. Помехи описываются выражением

(3.3). Показать, что про-

 

л

оптимален в том смысле, что

миними­

гноз вида x(t-j-l) =ax(t)

зирует среднеквадратическую ошибку предсказания

E[x(t-{-l)—

-x(t+l)]*.

4.СТОХАСТИЧЕСКАЯ ТЕОРИЯ УПРАВЛЕНИЯ

Вэтом разделе рассмотрены основные задачи и результаты стохастической теории управления, а также кратко изложена история ее развития.

Стохастическая теория управления изучает динамические системы, описываемые разностными или дифференциальными уравнениямиfc "учётом действующих помех^которые рассматри­

ваются как Стохастические процессы.^ Эта теория разработана для того, чтобы получить ответы на следующие вопросы:

Каковы статистические свойства параметров системы? (Ана­ лиз.)

Как подстраивать параметры (если, например, имеем систе­ му и регулятор с заданной структурой, но неизвестными пара-

Стохастическое управление

17

метрами), чтобы оптимизировать систему относительно заданно­ го критерия? (Параметрическая оптимизация.)

Как при заданных системе и критерии найти такой закон управления, который минимизирует заданный критерий? (Стоха­ стическое оптимальное управление.)

Методы решения подобных задач были разработаны относи­ тельно недавно. Во время второй мировой войны в Массачу- •сетском технологическом институте в США стохастическая тео­ рия управления применялась для синтеза систем управления •стрельбой. В работе [11] рассмотрена схема следящего радио­

локатора,

использующего параметрическую оптимизацию.

Одним

из краеугольных камней стохастической теории уп­

равления

является теория _фильтрации и упреждения, разрабо­

танная Винером и Колмогоровым. Эта теория дает возможность

выделять сигнал на фоне помех. Однако в теории

Винера—Кол­

могорова необходимо решать интегральное

уравнение (уравне­

ние Винера — Хопфа), что сужает область

ее

применения. В

реальных задачах уравнение Винера — Хопфа редко имеет ана­ литическое решение, а решение численными методами представ­ ляет собой громоздкую трудоемкую процедуру.

Большое влияние на развитие стохастической теории управ­

ления

оказало

использование

цифровых

вычислительных ма­

шин

как

для

анализа, так и для

синтеза.

Значительный

вклад

в решение проблемы фильтрации сделали

Калман и Бьюси. В

их теории

задачи упреждения

и фильтрации решаются

рекур­

рентными

методами, что позволяет

использовать цифровые вы­

числительные машины. Результаты Калмана и Бьюси распрост­ раняются и на нестационарные процессы. На основании теории Калмана — Бьюси прогноз дается в виде выходной переменной линейной динамической системы, когда управление осуществля­ ется по наблюдениям. Чтобы определить коэффициенты этой

.динамической системы, необходимо решить уравнение Риккати с заданными начальными условиями. Уравнение Риккати анало­ гично уравнению, которое рассматривали в теории оптимально­ го управления линейными детерминированными системами с квадратичным критерием. Действительно, задача прогнозирова­ ния и проблема управления по квадратичному закону представ-

.ляют собой математически двойственную задачу. Этот вывод представляет большой интерес как с теоретической, так и с практической точек зрения. Если одна из задач решена, то, об­ ращаясь к принципу двойственности, легко решить и другую задачу. Для решения задач фильтрации и детерминированного управления могут быть использованы также одни и те же прог­ раммы для вычислительных машин.

Стохастическое оптимальное управление в значительной сте­

пени базируется на

основных положениях динамического

про-

- . 2 — 4 0 3

. v

_

 

 

f

ГОС. ПУБЛИЧНАЯ

,

 

! И Л У Ч Ч О - Т Е Х Н И Ч Е С К А Я ;

 

1

г - ц - з - лиотгкА С С С Р

 

18

 

Глава 1

 

 

граммнровання. Для линейных систем с

квадратичным крите­

рием решение дается так называемой теоремой разделения,

ко­

торая

позволяет

составлять оптимальную

стратегию из

двух

частей

(рис. 1.1):

оптимального фильтра,

который вычисляет

оценки состояния в виде условного среднего при заданных на­

блюдениях выходных сигналов,

и линейной обратной связи (от

оцениваемого состояния к сигналу управления).

 

Среда

 

 

и

Вычисление

XА

Объект

 

оценки

 

 

 

Линейная

обратная

связь Оптимальная стратегия

Р и с . 1.1. Блок-схема, иллюстрирующая теорему разделения.

 

 

 

Л

 

 

 

и — сигнал

управления; у—выходная

переменная; х — оценка переменной состояния.

Оказывается, что при этом линейная

обратная

связь

такая

же, какой

она получалась

бы

при отсутствии помех и точного-

измерения

состояния системы.

Линейная

обратная

связь

может

быть найдена путем решения задачи детерминированного управ­ ления. Условное среднее значение состояния характеризует вы­

ходную переменную

фильтра

Калмана,

который по

существу

представляет математическую

модель

системы, когда

управле­

ние осуществляется

по наблюдениям. Характеристики

фильтра

зависят от помех и динамических свойств системы, но не зави­ сят от критерия.

Таким образом, теорема разделения обеспечивает связь меж­ ду теорией фильтрации и теорией стохастического оптимального- 'управления. Впервые теорема разделения была опубликована в работе [18]. Подобный результат известен в эконометрике под. названием принципа определенной эквивалентности.

Таким образом, оптимальная стратегия решения задачи сто­ хастического управления для линейных систем с квадратичным критерием состоит из линейной динамической системы с возмож­ но зависящими от времени параметрами. К этому классу стра­ тегии относятся стратегии, которые на протяжении многих лег

Стохастическое управление

19

уже использовались на практике, но их получение осуществля­ лось частными методами.

Поскольку переход к системам с многими входами и выхода­ ми не вызывает трудностей, то линейная стохастическая теория управления представляет собой мощное средство решения за­ дач управления. Результатом этой теории является решение в «замкнутой форме» в том смысле, что параметры оптимальной стратегии получаются при решении уравнения Риккати с задан­ ными начальными условиями. Для решения подобных уравне­ ний известны численные алгоритмы. Иногда эти задачи могут быть не удобны для численного решения.

Линейная стохастическая теория управления обладает осо­ бенностями, которые необходимы для теории регулирования с обратной связью. Например, в ней проводится различие между разомкнутыми и замкнутыми системами; работа системы кри­ тически зависит от информации, получаемой в тот момент, ког­ да определяется сигнал управления (так, задержка измеряемо­ го сигнала ведет к ухудшению работы системы).

Оптимальная обратная связь представляет собой линейную динамическую систему.

5. ЗАМЕЧАНИЯ И ЛИТЕРАТУРА

Список ранних работ и полный обзор разработок в теории управления даны в работе [1] . Обзор классической и современ­ ной теории управления приведен в работе [2].

Вводные

главы

по

детерминированной

теории

управления

можно найти

в книгах

[3—5]. Более сложный анализ проведен

в работах [6, 7].

 

 

 

 

 

Стохастическая

теория управления

изложена

в

работах

[ 8 - 1 0 ] .

 

 

 

 

 

 

Ранние примеры

применения стохастической теории

управ­

ления даны в работе [11]. Трудности первых попыток модели­ рования помех показаны в работах [12—14].

Теорию фильтрации можно найти в работе [15]. Теория Калмана — Бьюси изложена в работах [16, 17]. Теорема разде­ ления доказана в работе [18]. Принцип эквивалентности осве­ щен в работах [19, 20].

1.Bellman R., Kalaba R. (eds.), Mathematical Trends in Control Theory, Dover, New York, 1963.

2.Astrom K. J., Reglerteori, Almqwist and Wiksell, Uppsala, 1968 (in Swe­ dish).

3. Athans M., Falb P., Optimal

Control, McGraw-Hill, New

York,

1966.

4. Bellman R., Introduction to

the Mathematical Theory of

Control

Processes,

1, Academic Press, New

York,

1967.

 

 

•5. Bryson A. E . , Jr., Ho,

Iu-Chi., Applied Optimal Control,

Blaisdell

Waltham.

Massachusetts, 1969.