
книги / Теория автоматического управления техническими системами
..pdf9.9. Сведение задачи оптимального управления к задаче математического программирования
Для сведения задачи оптимального управления к задаче ма тематического программирования прежде всего рассмотрим ин теграл, входящий в критерий оптимального управления (9.3). Этот интеграл можно представить как предел суммы
*к |
N |
Д/Ч*(9. и(0; (]dt= iim |
WWi-ti-x). |
где для каждого из интервалов t{—1{-\ при i—1, ..., N выбра но некоторое значение U9t удовлетворяющее условию
Дифференциальные уравнения состояния при такой дискретизации по времени примут вид
l,mj-[x(/i)-x(^.1)l=/[x(^1. u(^i-i). U-хЪ
гдеА<=^— J, i=l, 2, ..., IV; N-voo.
Аналогично можно записать ограничения (9.4) в виде <?.[*('/), и(/0)^0;
О2[х(/0, u(/i)]=0, i—0, 1,.... N. |
|
||
Условия FK(xK)^0 на конце интервала и второй член FK(xK) в выраже |
|||
нии (9.3) |
являются функциями только одной части в пространстве |
состоя |
|
ний и поэтому остаются неизменными. |
|
||
Таким |
образом, задача оптимального управления сводится к следую |
||
щей задаче математического программирования. Найти экстремум выраже |
|||
ния |
( |
N |
|
«tr |
|
||
|
llm 2^1* т , « (<Л. U4 ('/-*<+.)+F*[* (<«)]} |
|
|
|
|ЛГ-*-соД |
|
|
удовлетворяющего условиям |
|
||
ИшJ■1х(^,)-х(</_,)]=/ [ X ц ( ^ ) . <!-«]; |
|
||
д/->0 |
|
* |
(9.75) |
At=ti—//_i: i=l, 2, ..., N; N-+oo; |
|||
F«[x(/w)]>0 |
|
при наличии ограничений
Gi[x(*<), и(Л)]^0; G2[x(ti), u(f,)]=0; t'=0, 1, ..., JV; N-+oo.
Задача, описываемая системой уравнений и неравенств (9.75), отличает ся от обычной задачи математического программирования лишь тем, что она содержит бесконечное, а не конечное число переменных.
9.10.Формулировка задачи оптимального управления
вдискретной форме
Для решения задачи оптимального управления на ЭВМ ее необходимо привести к дискретной форме. Разделим весь вре
менной интервал [fo, /к] на N в общем случае неодинаковых ин тервалов
TiS=U—tt-u i= 1, 2......N, £ Ti=T=tK—to. i=*1
Часто T, a также все т, заранее неизвестны. Критерий опти |
|
мального управления типа (9.3) примет вид суммы |
|
N |
|
I = 2 FI*(О. «(<-1); Ч т,+ Ял-[х (Л0). |
|
/=1 |
рассмат |
При этом каждую (скалярную) составляющую хи |
|
ривают для каждого дискретного момента времени |
U как от |
дельную переменную. Таким образом, общее число переменных
равно N(n-\-m-\-\,) где N —число рассматриваемых моментов времени; п, т —размерности векторов состояния и управления соответственно.
Естественно, что уравнения состояния должны удовлетво ряться в любой момент времени. Если решение уравнений со стояния в аналитической форме не известно, что имеет место в большинстве,задач, то необходимо произвести их численное интегрирование. Для этого уравнения состояния (9.1) дискрети зируют и записывают в виде разностных уравнений:
х(i+1)—х(i)= t<+i/[x(i), u(t); fj; i=0, 1, ..., N—1. (9.76)
Уравнения (9.76) можно рассматривать как nN ограничений в виде равенств, которые, однако, вследствие дискретизации яв ляются приближенными. Заметим, что уравнения (9.76) получе ны при помощи достаточно простого подхода. Применяя более совершенные разностные схемы, можно улучшить точность ре шения.
Итак, задача оптимального управления может быть сформу лированаNследующим образом. Найти экстремум выражения
2 Hx(i). u(i-l); Mt,+F„[x(A0] /=1
при ограничениях на переменные состояния х и управления и: FK[x(N)]>0; ОДО, «(0;
G2[x(i), u(i); f,]=0, i= 1, ..., N,
если известно, что переменные состояния удовлетворяют следу ющим уравнениям:
x(;+i)—x(0=Tj+iflx(0. «(0; il; i=о, 1, ..., N—1.
Рассмотрим применение метода математического програм мирования в случае непрерывных линейных систем. Предполо жим, что объект управления можно описать системой линейных дифференциальных уравнений п-го порядка:
х=Ах+Ви, |
(9.77) |
где матрицы А и |
В стационарные. |
Причем критерий оптимального управления можно представить в виде линейной или квадратичной формы (9.25).
Решение уравнений состояния (9.77) можно представить в замкнутой форме:
/
Х({)= Ф (*, g х(0)+ 1 Ф(t, т) Bu (т) dx.
о
где Ф(/, т) —[пХ^]-мерная переходная матрица состояния. Переходя к дискретному времени, получим для интервала
времени между моментами t,-1 и /3- выражение
х(У)= Ф(tj, ^.i)x(y'-l)+ |
|
0 |
(9.78) |
+ [ ф(^1,т)ВиС/-1)йГт, у = 1, .... jV. |
Ч-i
Для линейных систем Ф(t)= eAi
и
* (<,. *п)= Ч» И,- *н)= еА('-0-.>= в*1;.
Уравнения (9.78) можно теперь переписать в виде ограничи вающих равенств:
х(Л—еА,'х(у—1)—\ еА<,/-.-х)Ва(/ —1)dr=0, |
(9.79) |
|
;=1 |
‘y-, |
|
N. |
|
Если учесть, что размерность вектора х равна п, то уравнения (9.79) образуют систему из tiN ограничивающих равенств. Век тор и(/—1) предполагается постоянным в интервале
Итак, задача линейного оптимального управления в терми нах математического программирования может быть сформули рована следующим образом. Найти экстремум критерия
( Л7 ^
extr 2^[х(У),и(;-г
и-l J
при условии, что переменные управления и переменные состоя ния удовлетворяют ограничениям в виде неравенств
Uimai—IU,I>0; |
1, ...» т; |
Ximax—lXi|>0, /=1, ...» П, FK[x[N)]^О,
а переменные состояния х удовлетворяют равенствам
х(/)—еАх/х(/—1) —[ eA(^~1_T)Bu (J—1) dx—O,
*hi
/ = 1......N.
Ограничения (9.4) общего вида заменены ограничениями вида 1
согласно которым ограничены абсолютные значения переменных состояния и управления.
Контрольные вопросы
1.Сформулируйте задачуоптимального управления.
2.Что представляет собой вариационное исчисление? Типовая задача вариационного исчисления?
3.Что такое «квадратичный критерий оптимального управ ления»?
4.Каковы необходимые условия для оптимального управле ния в случае нелинейного объекта и линейного критерия?
5.Сформулируйте задачу и назовите методы математическо
го программирования.
6. Как формулируется задача оптимального управления в дискретной форме?
7.Что представляют собой оптимальные ПИ-регуляторы?
8.Что такое принцип максимума?
10. ОСНОВЫ АНАЛИЗА И СИНТЕЗА САУ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ
Анализ и синтез САУ при учете лишь заданных, детерми нированных воздействий не может дать полного представления об их свойствах. Возмущающие воздействия или помехи пред ставляют собой случайные функции реального времени. Поэто му теорию САУ можно считать полной тогда, когда в рассмот рение вводят не только детерминированные, но и случайные воздействия1.
Основные источники возмущений или помех, действующих на систему, приведены на рис. 10.1. Во-первых, это -возмущаю щие воздействия или помехи, присутствующие во входном сиг нале, которые приводятк возникновению дополнительной ошиб ки в САР. Во-вторых, это возмущения, приложенные непосред ственно к самому объекту регулирования. В-третьих, это по мехи, являющиеся результатом «шумовых» свойств элементов
1Солодовников В. В. Статистическая динамика линейных систем авто матического управления. М.: Физматгиз, 1960. 656 с.
Рис. 10.1. Источники возмущений и помех, действующих на САУ
и устройств САР, и прежде всего, измерительных и чувстви тельных элементов. Заметим, что точность САР не может бытьвыше точности элементов, входящих в состав системы.
10.1. Постановка задачи анализа динамической точности САР
При анализе качества САР предполагалось, что воздействия представляют заданные функции времени. Иногда допущение, что воздействие, вызвавшее переходный процесс, является за данной функцией времени, т. е. функцией значение которой в любой будущий момент времени однозначно определяется ее изменениями в предыдущий момент времени, не дает возмож ности описать реальные условия работы системы и правильно подойти к выбору ее характеристик. Зависимость воздействий, которым подвержена система, от времени заранее нельзя уста новить. Воздействия, приложенные к САР, представляют со бой случайные непрерывно изменяющиеся функции времени, так как знание конкретного значения воздействия в любой опре деленный момент времени не позволяет однозначно определить закон изменения воздействия Впоследующие мометы. Методы анализа и синтеза САР при наличии случайных непрерывно изменяющихся воздействий имеют большой практический инте рес [19, 20]. Проблема динамической точности является проб лемой анализа и синтеза систем автоматического регулирова
ния, находящихся под влиянием таких непрерывно |
изменяю |
щихся воздействий, когда понятие о переходном |
процессе |
теряет смысл и полной характеристикой неустановившегося про
цесса, происходящего в системе, может служить абсолютное значение разности |е(^)| между требуемым и действительным значениями регулируемой величины в заданном интервале Это направление теории автоматического регулиро
вания базируется на методах теории вероятностей и матема тической статистики.
В качестве первого примера САР, находящейся под влиянием помех (шумов), которые накладываются на управляющие воздействия (полезный входной сигнал), можно рассмотреть систему самолет —автопилот. Вней по
лезными могут быть сигналы, поступающие на вход автопилота и задающие |
||||
требуемуютраекториюдвижения самолета, а помехами являются непрерыв |
||||
ные случайные изменения лобового сопротивления и подъемной силы само |
||||
лета вследствие хаотического изменения потока воздуха, колебаний плотно |
||||
сти атмосферыидругих причин. |
|
|
|
|
Вторым примеромможет служить система регулирования скорости тур- |
||||
богенератора. Вней задающим воздействием служит постоянный сигнал, со |
||||
ответствующий номинальному значениюскорости, а возмущающим —непре |
||||
рывные колебания нагрузки, создаваемые подключенной к генератору внеш |
||||
ней цепью. Эти колебания зависят только от потребителей |
и заранее не |
|||
могут быть предугаданы. |
|
|
|
|
Третий пример —следящая система радиолокационной станции. JBэтой |
||||
системе задающим воздействием является входной сигнал, который зави |
||||
сит от движения цели и не может быть точно предугадан. Возмущающими |
||||
воздействиями являются флуктуации входного сигнала и помехи, которые |
||||
накладываются на входной полезный сигнал. Они вызваны непрерывным из |
||||
менениемкоэффициента отражения самолета (из-за рыскания |
и качки само |
|||
лета, вращения винтов и др.). Закон |
изменения |
флуктуаций |
во |
времени |
вследствие сложности явления также не может быть точно определен. |
||||
Кроме полезного сигнала ипомех на входе следящей сисгемы радиоло |
||||
катора, в ней образуются шумы, которые накладываются на |
этот |
полезный |
||
сигнал. Шумывозникают, например, в приемнике, в контактах, потенциомет |
||||
рах идругих частях следящей системы. Зеркало антенны радиолокационной |
||||
станции находится под влиянием ветровой нагрузки, которая также пред |
||||
ставляет собой случайнуюфункциювремени. |
|
|
|
|
Однимиз основных свойств системыуправления является помехоустой |
||||
чивость, которая может характеризоваться средним значением |
ошибки (меж |
|||
ду требуемы идействительным значениями регулируемой величины), вызы |
||||
ваемой случайными возмущающими |
воздействиями |
или помехами. |
|
10.2. Случайные величины и функции, стохастические процессы
Величину, которая в зависимости от результатов опыта может принимать те или иные числовые значения, называют ■случайной. Чтобы задать такую величину, необходимо указать все возможные ее значения и поставить им в соответствие ве роятности, с которыми случайная величина принимает эти значения.
Функцией распределения вероятностей (или, просто, функ цией распределения случайной величины |) называют функцию F(x), равную вероятности Р события, состоящего в том, что
эта случайная величина примет значение меньшее, чем х, т. е. F(x)=P(l<x), где х —все значения на числовой оси (рис. 10.2,а).
Рис. 10.2. Основные характеристики |
случайной величины: |
а —функция распределения; б—плотность |
распределения вероятностей |
Функция распределения, являющаяся неубывающей, прини мает значения, заключенные между нулем и единицей, т. е.
и стремится к нулю при неограниченном уменьшении х, а к еди нице—при неограниченном возрастании х, т. е.
11mF (л;) = 0, *-*-—00
IimF (л:) = 1. Г-*оо
Если функция распределения дифференцируема, то ее всег да можно представить в виде
F(i)= W(x)dx,
где
W(x)=dF(x)ldx.
Производную от функции распределения вероятностей W(x) называют плотностью распределения вероятностей слу чайной величины.
Плотность распределения вероятностей является неотрица тельной функцией, т. е.
W(x)^0.
Вероятность события, состоящего в том, что случайная величина примет значение, заключенное в интервале [а, &], равна определенному интегралу от плотности распределения вероятностей на этом интервале, т. е.
ъ
P(a,b)=^ W (x)dx
а
(рис. 10.2,6).
Интеграл от плотности распределения вероятностей равен единице, т. е.
оо
$ W(x)dx= 1. —00
Случайные функции. Функцию, значение которой при каж дом значении независимой переменной является случайной величиной, называют случайной. Случайные функции, для кото рых независимой переменной является время t, называют сто хастическими процессами. Регистрацию в той или иной форме случайной функции называют реализацией случайной функции.
Предположим, что исследователь располагает совокуп
ностью, или ансамблем случайных функций |
характеризую |
щих изучаемый стохастический процесс (например, процесс изменения ошибки следящей системы при влиянии помех) в момент thнекоторым множеством значений случайной величи ны !*. Если фиксировать момент tht то для данного ансамбля
реализаций (рис. 10.3) можно найти плотность распределения
1 |
|
|
|
|
\Af\JUAipAr-nd K J \ / ^ - |
t |
|||
|
I |
Г I |
|
|
|
|
|
|
t |
|
|
|
|
t |
|
|
|
|
t |
|
t, |
*з |
|
|
Рис. 10.3. Графики случайных |
функций | (t) |
|
||
W(x, th). Сечения |
ансамбля реализаций случайной |
функции |
||
при ряде значений |
времени tb .... th, |
..., tn дают |
n-мерную |
случайную величину.
Таким образом, случайную функцию можно рассматривать как многомерную случайную величину, характеризуемую мно гомерной плотностью распределения вероятностей. Важными характеристиками случайной величины являются ее так назы ваемые моменты, которые можно вычислить на основании мно гомерных плотностей распределения вероятностей.
Пусть | —случайная переменная. Если известна одномер ная плотность распределения вероятностей №|(я, t), то момен том первого порядка, или математическим ожиданием случай ной функции, называют
т=М [!(<)(= ^ xW, (Je, t)dx.
Далее, зная двухмерную плотность распределения W2(xь х2, th t2), можно найти момент второго порядка, или математическое ожидание
M [£ (^i)» £ (^2)] —^ ^ xxx2W2(xj, x<ii t\y t2) dx\dx2 —00—00
ИT. Д.
Пусть S=(li, ^2*•••* ^n)—«-мерная случайная величина. |
||
Тогда |
моментом я-го порядка называют выражение |
|
М\Ш> Ш* •••>£(*«)]= |
||
|
00 |
оо |
= |
5 • • • |
5 х'*2• • • х№п(х1>• • • »*л; h......tjdx, ........ |
Ввиду трудности определения или вычисления моментов высокого порядка обычно ограничиваются лишь двумя первыми моментами, а именно математическим ожиданием (моментом первого порядка)
m=\x(t)Wx(x,t)dx |
(10.1) |
—00 |
|
и моментом второго порядка, который называют корреляцион ной функцией и обозначают
R{t\* ^2)= ^ ч*^1-^2^2 (*^iI ЛС2»Л» h)dX\dxi. |
(10.2) |
Теорию стохастических процессов, изучающую лишь те свой ства, которые определяются двумя первыми моментами, т. е. т и R(tlt t2), называют корреляционной теорией случайных
функций.
Введем еще несколько определений.
Центрированной, или несмещенной, корреляционной функ цией называют центральный момент второго порядка случай
ных величин l(/i), %{h), т. е.
/?„ (<„ <s) = At{[x(M - т.х(Л)1 \Х(<!) - и, (<2)Н
- J J [x(ti)-mAt\)\[x(tà-mx(h)\ Wi(x„х,; <„ t,Jdxtdx, —00—00
Дисперсией ах2 случайного процесса называют математи ческое ожидание квадрата отклонения x(t) от mx(t), т. е.
Mit(/) =о.2(О =М[х(/)-mx(t)Iz=
•= l [х-тх (ü)]2 W, (x, t)dx. |
(10.3) |
Взаимной корреляционной функцией двух стохастических процессов называют их смешанный момент второго порядка
= ^ 5 x,y2Wi(xv ÿ2; <„ h)dxxdy2, |
(10.4) |
—O—00 |
|
a центрированной взаимокорреляционной функцией | называют выражение
Rxу (*1. *2) = М {[х- т х(*i)] [У- Щ (*2)]}=
= ] $ [*■-т* (*1)] [»- W] Wt(x.t ; у. h) dxdy. (10.5)
Математическое ожидание, корреляционная функция, дис персия и взаимокорреляционные функции, определяемые выра жениями (10.1)—(10.5) соответственно, являются основными характеристиками случайных функций и стохастических про
цессов.
10.3. Стационарные и эргодические случайные процессы
Математическое описание и экспериментальное исследование случайных процессов, на которые не наложено никаких огра ничений, представляют значительные трудности. Поэтому обыч но рассматривают случайные процессы, удовлетворяющие опре деленным допущениям. Значительное внимание уделяется так называемым стационарным случайным процессам.
Случайный процесс £(/) называют стационарным, если ма
тематическое ожидание, или |
момент первого |
порядка т, для |
|
случайной |
переменной | при различных значениях параметра |
||
t постоянно, т. е. |
|
|
|
|
00 |
|
|
M[l]= ^ xW {х, tf)ûDc=const, |
|
||
|
—00 |
R(tv t2) зависит |
только от раз |
а корреляционная функция |
|||
ности аргументов, т. е. |
|
|
|
R(t, |
т)= J J x1(t+ т)х2(t) W to; х2; г)dxxdx2. |
В корреляционной теории случайная функция характеризу ется моментами первого и второго порядка—математическим
ожиданием и корреляционной функцией. Математическое ожи дание является средним значением по множеству реализаций случайной функции, т. е.
М [g (t)]= \xW (х, t)dx= 1Пх (it).