книги из ГПНТБ / Острем К.Ю. Введение в стохастическую теорию управления
.pdf10 |
Введение |
|
дискретным |
временем, описываемые соотношениями |
вход-вы |
ход, такими, как весовые и передаточные функции. |
Входными |
|
сигналами этих систем служат случайные процессы второго по рядка.
Теоремы представления позволяют значительно упростить исследование, так как в этом случае большой класс задач мож но свести к анализу линейных систем с белым шумом на входе. Даны аналогичные результаты для систем с непрерывным вре менем.
Предметом обсуждения в гл. 5 является расчет квадратич ных функций от переменных состояния для линейных систем. Используя результаты теории аналитических функций, получа ют рекуррентные формулы для вычисления квадратичной функ ции потерь. Выявлена связь между анализом устойчивости и вычислением квадратичной функции потерь. В качестве иллюст рации параметрической оптимизации объектов, зависящих от времени, рассматривается задача восстановления переменных состояния динамической системы с использованием математиче ской модели.
Гл. 6 посвящена самому простому классу задач стохастиче ского управления: линейным системам с одним входом и одним выходом и с критерием минимального среднеквадратического отклонения на выходе в устойчивом состоянии. Эта частная за дача дает хорошее представление о структуре оптимальных ре шений, так как теорема разделения может быть доказана без особых математических трудностей. Решение иллюстрирует яв ную связь между оптимальной фильтрацией и оптимальным уп равлением. При этом получают новый алгоритм решения зада чи фильтрации для объектов с дробно-рациональными спект ральными плотностями. В этой главе даны также приложения рассмотренной теории.
В гл. 7 изложена теория фильтрации и упреждения. Дана по становка задачи и описаны общие свойства решения. Рассмот рены необходимые свойства гауссовых процессов и выведены рекуррентные формулы Калмана. Дана геометрическая интер претация результатов и анализ свойств ошибок упреждения. До
казана дуальность задач оптимального упреждения и |
управ |
|
ления. |
|
|
Общая проблема квадратичного управления обсуждена |
в |
|
гл. 8. Двумя способами доказана теорема разделения |
для |
си |
стем с дискретным временем. |
|
|
Г л а в а 1
СТОХАСТИЧЕСКОЕ УПРАВЛЕНИЕ
1.ВВЕДЕНИЕ
Вданной главе сделана попытка изложить основы стохасти ческой теории управления. В разд. 2 кратко рассмотрены основы теории управления. Особое внимание уделяется обсуждению де терминированной теории управления, основной недостаток ко торой состоит в том, что в ней не обеспечивается необходимое различие между разомкнутыми и замкнутыми системами. Это
обусловлено в основном тем, что в рамках детерминированной теории управления пренебрегают помехами. В разд. 3 обсужда ются некоторые трудности, возникающие при описании помех. В разд. 4 изложены основы стохастической теории управления и приведены наиболее важные выводы из нее.
2. ТЕОРИЯ УПРАВЛЕНИЯ С ОБРАТНОЙ СВЯЗЬЮ
Теория управления возникла как средство для анализа и син теза систем управления. Ранние разработки были связаны с центробежными регуляторами, простыми схемами регулирова ния для промышленных объектов, электронными усилителями и системами управления стрельбой. По мере развития теории ока зывалось, что ее методы применимы к целому ряду разных си стем, как технических, так и не технических. В теории управле ния использовались результаты различных ветвей прикладной математики. Задачи управления в свою очередь приводили к но вым результатам в прикладной математике.
На ранних этапах развития теории большое внимание уделя лось теории устойчивости, построенной на теореме Рауса—Гур- вица. Эта теорема является наглядным примером взаимодей ствия между теорией и практикой. Действительно, задачу об ус тойчивости Гурвицу предложил Стодола, который столкнулся с этой проблемой на практике при разработке регуляторов для паровых турбин.
Для анализа усилителей с обратной связью использовались методы теории аналитических функций, что привело в результа те (помимо всего прочего) к знаменитому критерию Найквиста.
После второй мировой войны специалисты по управлению столкнулись с некоторыми задачами, для решения которых тре-
12 |
Глава 1 |
бовались |
очень точные характеристики объектов. Кроме того, |
многие из подлежащих исследованию объектов управления ока зались очень сложными. Это привело к новой формулировке за
дачи синтеза |
как задачи оптимизации и дало возможность не |
|
только использовать |
вариационные методы, но и улучшить их. |
|
В результате |
была |
создана детерминированная теория опти |
мального управления, которая в совокупности с цифровыми вы числительными машинами представляет мощный метод решения задач управления. При использовании теории оптимального уп равления нередко оказывается, что проблемы устойчивости не
представляют особого интереса, ибо часто оптимальная |
система |
||||||
устойчива при довольно общих условиях. |
|
|
|
|
|||
В |
детерминированной теории |
оптимального управления не |
|||||
вводится различие между программным управлением |
(разомк |
||||||
нутая |
система) |
и управлением |
с |
обратной |
связью |
||
•(замкнутая система); оптимальная обратная связь есть |
просто |
||||||
функция, которая отображает пространство состояний |
в прост |
||||||
ранство переменных |
управления |
(следовательно, |
переходные |
||||
процессы в цепи оптимальной обратной связи не |
принимаются |
||||||
во внимание); при постановке и решении |
задачи |
никогда явно |
|||||
не вводится информация, достаточная для вычисления истинно го значения сигнала управления.
Проиллюстрируем эти особенности на примере.
Пример 1
Рассмотрим систему |
|
|
|
— |
= |
« |
(2.1) |
dt |
|
|
4 ' |
с начальным условием |
|
|
|
*(0) |
= |
1. |
(2.2) |
Предположим, что управление этой системой желательно осуществлять таким образом, чтобы характеристики системы удовлетворяли критерию минимума значения функционала
со |
|
/ = [[*«(*) + и * (*)]#• |
(2.3) |
Легко показать, что минимальное значение критерия (2.3) равно 1 и что это значение получается как для программного управления
«(*) |
= |
- е " ' , |
(2.4) |
так и для стратегии управления |
вида |
(2.5) |
|
u{t) = —х |
|
(/). |
|
Стохастическое управление |
13 |
Уравнение .(2.4) описывает управление без обратной связи, так как значение сигнала управления определяется только апри орными данными, т. е. независимо от того, как протекает про цесс. Уравнение (2.5) представляет закон управления с обрат ной связью, так как значение сигнала управления в момент t зависит от состояния объекта в этот момент.
Таким образом, приведенный пример показывает, что разомк нутая система (2.4) и замкнутая система (2.5) эквивалентны в том смысле, что функция потерь (2.3) для них имеет одно и то же значение. Однако их характеристики устойчивости раз личны.
Система (2.1) с управлением (2.5) с обратной связью асимп тотически устойчива, в то время как система (2.1) с програм мным управлением (2.4) просто устойчива. Таким образом, на практике управление с обратной связью (2.5) и управление без обратной связи (2.4) сильно различаются. Это можно обнару жить, например, если ввести помехи или считать, что управление осуществляется по модели, коэффициенты которой определены с ошибками.
Некоторые указанные выше особенности детерминированной теории управления весьма нежелательны в теории, предназна ченной для применения в управлении с обратной связью. При разработке детерминированной теории оптимального управле ния серьезной критике подвергался тот факт, что в ней не раз личаются разомкнутые и замкнутые системы и не учитываются динамические характеристики цепи обратной связи. Например, с помощью этой теории невозможно было получить стратегию, которая соответствовала бы хорошо известным регуляторам, используемым в промышленных установках.
Эти ограничения детерминированной теории управления объясняются тем, что в ней используются нереальные модели для помех. Если даже так называемые помехи и вводятся, то всегда предполагается, что они описываются априорно известной функцией. В этом случае для системы, управление которой пред ставляется дифференциальным уравнением с единственным ре шением", знание начального состояния очевидно эквивалентно знанию состояния системы в произвольный момент времени. По этому не различаются между собой разомкнутые и замкнутые системы, и предположение о заданном начальном условии при водит к тому, что истинное значение состояния известно в любой момент времени. Кроме того, когда известно состояние системы, оптимальное управление будет функцией, которая отображает пространство состояний системы в пространство состояний пере менных управления. Как показано ниже, проблема учета дина мических характеристик цепи обратной связи возникает в том
14 |
Глава |
1 |
•случае, когда |
состояние системы |
неизвестно и оно должно быть |
восстановлено по измерениям выходных сигналов.
Тем, кто занимался практическими работами в области уп равления, было известно с самого начала развития теории уп равления, как важно учитывать влияние помех. Многие класси ческие методы синтеза также давали возможность эвристически
оперировать с помехами. Приведем выдержку |
из |
книги |
А. К. Холла ': «Я хорошо помню то время, когда М Т И 2 |
и фирма |
|
«Сперри» совместно работали над системой управления |
авиаци |
|
онного радиолокатора. В воскресенье, 7 декабря 1941 |
г. двое из |
|
нас проработали весь день в лаборатории Гардн Сити и, следо вательно, не слышали о нападении на Пирл-Харбор до поздне го вечера. Мы были обескуражены, потому что хотя мы и созда ли хорошую систему для испытаний, но совершенно забыли о важности шумов, и в результате наша система была нестабиль на и совершенно неудовлетворительна. Попытки найти решение проблемы привели нас к использованию частотных методов. Ме нее чем через три месяца у нас была усовершенствованная си стема, которая была устойчива, имела удовлетворительные пе реходные характеристики и на порядок меньшую величину раз броса. У меня этот случай породил большое доверие к частот ным методам».
Упражнения |
|
|
|
|
|
|
|
|
|
1. В |
примере 1 показать, |
что сигнал |
управления |
(2.4) и |
за |
||||
кон управления :(2.5) оптимальны. |
|
|
|
|
|
||||
Замечание. |
Доказать |
сначала |
следующее тождество: |
|
|||||
т |
|
|
|
|
|
т |
|
|
|
J |
[х2 (/) + |
х2(/)] dt = |
х* (0) - |
х 2 (Т) + |
^[x(t) |
+ x (t))2 di. |
|
||
о |
|
|
|
|
|
6 |
|
|
|
2. В |
примере 1 предположить, |
что оптимальный |
сигнал |
уп |
|||||
равления и оптимальный |
закон |
управления |
определяются |
мо |
|||||
делью вида |
|
|
|
|
|
|
|
|
|
|
|
|
dx |
аи, |
|
|
|
|
|
|
|
|
— |
- |
|
|
|
|
|
dt
где а имеет значение, близкое к 1, когда управление действи тельно осуществляется по уравнению (2.1). Определить значе ние критерия (2.3) для систем, получаемых при регулировании по разомкнутому циклу и регулировании по замкнутому циклу.
1 |
Hall А. С, «Frequency Response* |
(R. Oldenburger, ed.), Macmillan, New |
York, |
1956. |
институт в США. — Прим. ред. |
2 |
Массачусетский технологический |
|
Стохастическое |
управление |
15 |
|
3. Сравнить характеристики регулирования по разомкнутому |
||||
(2.4) |
и замкнутому циклам (2.5), когда система фактически опи |
|||
сывается уравнением |
|
|
|
|
|
dx |
= и |
+ V, |
|
|
— |
|
||
|
dt |
|
|
|
где |
v — неизвестная помеха. |
В |
частности, пусть |
v — неизвест |
ная |
константа. |
|
|
|
3. ПРЕДСТАВЛЕНИЕ ПОМЕХ
Необходимость введения более реальных моделей помех тре бует соответствующих методов их представления. Особенности реальных помех состоят в том, что невозможно точно предска зать их значение. Поэтому нелегко построить математическую модель, обладающую таким свойством. Например, нельзя моде лировать помехи аналитическими функциями, ибо если известно значение аналитической функции на произвольно малом интер вале, то значение этой функции для всего интервала можно опре делить ее аналитическим продолжением.
Попытаемся использовать статистические понятия для пост роения моделей помех. Например, можно попытаться моделиро вать помехи в следующем виде:
|
|
|
* ( 0 = |
|
t adt)li, |
|
|
(3-1) |
||
|
|
|
|
|
i=l |
|
|
|
|
|
где |
a2(t), |
|
an(t) |
—известные функции, a |
— случайная |
|||||
величина. |
|
|
|
|
|
|
|
|
|
|
Тогда, если линейные уравнения |
|
|
|
|
||||||
|
х (У = а, |
& + а2 (У Ь + • • • + ап Цг) 1п, |
|
|||||||
|
х (t2) |
= а, (4) 1г + |
а2 |
(Q Ь + • • • + ап |
(t2) %п, |
(3.2) |
||||
|
хОп) |
= а1 (О & + |
аг |
(У | 2 |
+ •.. + ап |
(/„) |
1п |
|
||
имеют |
решение, |
частные |
реализации |
стохастических величин | ь |
||||||
£г, • • •. кп можно точно определить из наблюдений x(t\.), x(t2), |
... |
|||||||||
x(tn) |
и, таким образом, точно предсказать значения х. |
По |
||||||||
этому |
помехи, |
описываемые уравнением (3.1), называются |
пол |
|||||||
ностью |
детерминированными |
стохастическими |
процессами |
или |
||||||
вырожденными |
(сингулярными) |
|
случайными |
процессами. |
|
|||||
Более удачной может оказаться попытка моделировать поме хи в виде последовательности случайных величин. Простым при
мером служит процесс авторегрессии |
{x(t)}, |
определяемый |
сле |
|
дующим выражением: |
|
|
|
|
x{t+\) |
= ax{t) + e(t), |
t = t0, |
t0+l,..., |
(3.3) |
16 |
Глава 1 |
гдех(*о) = 1, | а | < 1 |
и {e{t), t=t0, t0-\-\, ...} есть последова |
тельность независимых нормальных случайных величин с пара
метрами |
(0, |
о). Предполагается |
также, что e(t) |
не зависит от |
||||
x(t) |
для всех t. Допустим, например, что на основании наблюде |
|||||||
ний x(t) |
надо предсказать |
значение x(t-\-l). |
Естественно |
x(t-{: |
||||
+ 1) |
представить величиной |
ax(t). |
Тогда ошибка |
предсказания |
||||
равна e(t), |
т. е. случайной |
величине с нулевым средним |
значе |
|||||
нием и дисперсией а2. |
|
|
|
|
|
|||
Еще один подход к задаче моделирования |
помех состоит в |
|||||||
том, чтобы описывать их случайными процессами. Теория слу чайных процессов фактически частично выросла из попыток мо делирования флуктуации, наблюдаемых в физических системах. Эта теория достигла совершенства благодаря вкладу таких вы дающихся ученых, как Крамер, Хинчин, Колмогоров и Винер.
Задачи прогнозирования имеют большое значение в теории
случайных процессов. В дальнейшем будет показано, |
что они |
|||
тесно связаны и с задачами управления. |
|
|
||
Упражнения |
|
|
|
|
1. Помехи описываются |
выражением |
|
|
|
|
x(t) = a cos (t), |
|
|
|
где |
а — случайная переменная. Каким |
образом можно |
предска |
|
зать |
значения х? |
|
|
|
2. Помехи описываются выражением |
(3.3). Показать, что про- |
|||
|
л |
оптимален в том смысле, что |
миними |
|
гноз вида x(t-j-l) =ax(t) |
||||
зирует среднеквадратическую ошибку предсказания |
E[x(t-{-l)— |
|||
-x(t+l)]*.
4.СТОХАСТИЧЕСКАЯ ТЕОРИЯ УПРАВЛЕНИЯ
Вэтом разделе рассмотрены основные задачи и результаты стохастической теории управления, а также кратко изложена история ее развития.
Стохастическая теория управления изучает динамические системы, описываемые разностными или дифференциальными уравнениямиfc "учётом действующих помех^которые рассматри
ваются как Стохастические процессы.^ Эта теория разработана для того, чтобы получить ответы на следующие вопросы:
Каковы статистические свойства параметров системы? (Ана лиз.)
Как подстраивать параметры (если, например, имеем систе му и регулятор с заданной структурой, но неизвестными пара-
Стохастическое управление |
17 |
метрами), чтобы оптимизировать систему относительно заданно го критерия? (Параметрическая оптимизация.)
Как при заданных системе и критерии найти такой закон управления, который минимизирует заданный критерий? (Стоха стическое оптимальное управление.)
Методы решения подобных задач были разработаны относи тельно недавно. Во время второй мировой войны в Массачу- •сетском технологическом институте в США стохастическая тео рия управления применялась для синтеза систем управления •стрельбой. В работе [11] рассмотрена схема следящего радио
локатора, |
использующего параметрическую оптимизацию. |
Одним |
из краеугольных камней стохастической теории уп |
равления |
является теория _фильтрации и упреждения, разрабо |
танная Винером и Колмогоровым. Эта теория дает возможность
выделять сигнал на фоне помех. Однако в теории |
Винера—Кол |
|
могорова необходимо решать интегральное |
уравнение (уравне |
|
ние Винера — Хопфа), что сужает область |
ее |
применения. В |
реальных задачах уравнение Винера — Хопфа редко имеет ана литическое решение, а решение численными методами представ ляет собой громоздкую трудоемкую процедуру.
Большое влияние на развитие стохастической теории управ
ления |
оказало |
использование |
цифровых |
вычислительных ма |
|||
шин |
как |
для |
анализа, так и для |
синтеза. |
Значительный |
вклад |
|
в решение проблемы фильтрации сделали |
Калман и Бьюси. В |
||||||
их теории |
задачи упреждения |
и фильтрации решаются |
рекур |
||||
рентными |
методами, что позволяет |
использовать цифровые вы |
|||||
числительные машины. Результаты Калмана и Бьюси распрост раняются и на нестационарные процессы. На основании теории Калмана — Бьюси прогноз дается в виде выходной переменной линейной динамической системы, когда управление осуществля ется по наблюдениям. Чтобы определить коэффициенты этой
.динамической системы, необходимо решить уравнение Риккати с заданными начальными условиями. Уравнение Риккати анало гично уравнению, которое рассматривали в теории оптимально го управления линейными детерминированными системами с квадратичным критерием. Действительно, задача прогнозирова ния и проблема управления по квадратичному закону представ-
.ляют собой математически двойственную задачу. Этот вывод представляет большой интерес как с теоретической, так и с практической точек зрения. Если одна из задач решена, то, об ращаясь к принципу двойственности, легко решить и другую задачу. Для решения задач фильтрации и детерминированного управления могут быть использованы также одни и те же прог раммы для вычислительных машин.
Стохастическое оптимальное управление в значительной сте
пени базируется на |
основных положениях динамического |
про- |
|
- . 2 — 4 0 3 |
. v |
_ |
|
|
f |
ГОС. ПУБЛИЧНАЯ |
, |
|
! И Л У Ч Ч О - Т Е Х Н И Ч Е С К А Я ; |
||
|
1 |
г - ц - з - лиотгкА С С С Р |
|
18 |
|
Глава 1 |
|
|
граммнровання. Для линейных систем с |
квадратичным крите |
|||
рием решение дается так называемой теоремой разделения, |
ко |
|||
торая |
позволяет |
составлять оптимальную |
стратегию из |
двух |
частей |
(рис. 1.1): |
оптимального фильтра, |
который вычисляет |
|
оценки состояния в виде условного среднего при заданных на
блюдениях выходных сигналов, |
и линейной обратной связи (от |
|
оцениваемого состояния к сигналу управления). |
|
|
Среда |
|
|
и |
Вычисление |
XА |
Объект |
|
|
оценки |
|
|
|
|
|
Линейная
обратная
связь Оптимальная стратегия
Р и с . 1.1. Блок-схема, иллюстрирующая теорему разделения.
|
|
|
Л |
|
|
|
и — сигнал |
управления; у—выходная |
переменная; х — оценка переменной состояния. |
||||
Оказывается, что при этом линейная |
обратная |
связь |
такая |
|||
же, какой |
она получалась |
бы |
при отсутствии помех и точного- |
|||
измерения |
состояния системы. |
Линейная |
обратная |
связь |
может |
|
быть найдена путем решения задачи детерминированного управ ления. Условное среднее значение состояния характеризует вы
ходную переменную |
фильтра |
Калмана, |
который по |
существу |
представляет математическую |
модель |
системы, когда |
управле |
|
ние осуществляется |
по наблюдениям. Характеристики |
фильтра |
||
зависят от помех и динамических свойств системы, но не зави сят от критерия.
Таким образом, теорема разделения обеспечивает связь меж ду теорией фильтрации и теорией стохастического оптимального- 'управления. Впервые теорема разделения была опубликована в работе [18]. Подобный результат известен в эконометрике под. названием принципа определенной эквивалентности.
Таким образом, оптимальная стратегия решения задачи сто хастического управления для линейных систем с квадратичным критерием состоит из линейной динамической системы с возмож но зависящими от времени параметрами. К этому классу стра тегии относятся стратегии, которые на протяжении многих лег
Стохастическое управление |
19 |
уже использовались на практике, но их получение осуществля лось частными методами.
Поскольку переход к системам с многими входами и выхода ми не вызывает трудностей, то линейная стохастическая теория управления представляет собой мощное средство решения за дач управления. Результатом этой теории является решение в «замкнутой форме» в том смысле, что параметры оптимальной стратегии получаются при решении уравнения Риккати с задан ными начальными условиями. Для решения подобных уравне ний известны численные алгоритмы. Иногда эти задачи могут быть не удобны для численного решения.
Линейная стохастическая теория управления обладает осо бенностями, которые необходимы для теории регулирования с обратной связью. Например, в ней проводится различие между разомкнутыми и замкнутыми системами; работа системы кри тически зависит от информации, получаемой в тот момент, ког да определяется сигнал управления (так, задержка измеряемо го сигнала ведет к ухудшению работы системы).
Оптимальная обратная связь представляет собой линейную динамическую систему.
5. ЗАМЕЧАНИЯ И ЛИТЕРАТУРА
Список ранних работ и полный обзор разработок в теории управления даны в работе [1] . Обзор классической и современ ной теории управления приведен в работе [2].
Вводные |
главы |
по |
детерминированной |
теории |
управления |
|
можно найти |
в книгах |
[3—5]. Более сложный анализ проведен |
||||
в работах [6, 7]. |
|
|
|
|
|
|
Стохастическая |
теория управления |
изложена |
в |
работах |
||
[ 8 - 1 0 ] . |
|
|
|
|
|
|
Ранние примеры |
применения стохастической теории |
управ |
||||
ления даны в работе [11]. Трудности первых попыток модели рования помех показаны в работах [12—14].
Теорию фильтрации можно найти в работе [15]. Теория Калмана — Бьюси изложена в работах [16, 17]. Теорема разде ления доказана в работе [18]. Принцип эквивалентности осве щен в работах [19, 20].
1.Bellman R., Kalaba R. (eds.), Mathematical Trends in Control Theory, Dover, New York, 1963.
2.Astrom K. J., Reglerteori, Almqwist and Wiksell, Uppsala, 1968 (in Swe dish).
3. Athans M., Falb P., Optimal |
Control, McGraw-Hill, New |
York, |
1966. |
|
4. Bellman R., Introduction to |
the Mathematical Theory of |
Control |
Processes, |
|
1, Academic Press, New |
York, |
1967. |
|
|
•5. Bryson A. E . , Jr., Ho, |
Iu-Chi., Applied Optimal Control, |
Blaisdell |
Waltham. |
|
Massachusetts, 1969. |
|
|
|
|
