Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Теория автоматического управления техническими системами

..pdf
Скачиваний:
84
Добавлен:
12.11.2023
Размер:
15.06 Mб
Скачать

9.9. Сведение задачи оптимального управления к задаче математического программирования

Для сведения задачи оптимального управления к задаче ма­ тематического программирования прежде всего рассмотрим ин­ теграл, входящий в критерий оптимального управления (9.3). Этот интеграл можно представить как предел суммы

N

Д/Ч*(9. и(0; (]dt= iim

WWi-ti-x).

где для каждого из интервалов t{—1{-\ при i—1, ..., N выбра­ но некоторое значение U9t удовлетворяющее условию

Дифференциальные уравнения состояния при такой дискретизации по времени примут вид

l,mj-[x(/i)-x(^.1)l=/[x(^1. u(^i-i). U-хЪ

гдеА<=^— J, i=l, 2, ..., IV; N-voo.

Аналогично можно записать ограничения (9.4) в виде <?.[*('/), и(/0)^0;

О2[х(/0, u(/i)]=0, i—0, 1,.... N.

 

Условия FK(xK)^0 на конце интервала и второй член FK(xK) в выраже­

нии (9.3)

являются функциями только одной части в пространстве

состоя­

ний и поэтому остаются неизменными.

 

Таким

образом, задача оптимального управления сводится к следую­

щей задаче математического программирования. Найти экстремум выраже­

ния

(

N

 

«tr

 

 

llm 2^1* т , « (<Л. U4 ('/-*<+.)+F*[* (<«)]}

 

 

|ЛГ-*-соД

 

удовлетворяющего условиям

 

ИшJ■1х(^,)-х(</_,)]=/ [ X ц ( ^ ) . <!-«];

 

д/->0

 

*

(9.75)

At=ti—//_i: i=l, 2, ..., N; N-+oo;

F«[x(/w)]>0

 

при наличии ограничений

Gi[x(*<), и(Л)]^0; G2[x(ti), u(f,)]=0; t'=0, 1, ..., JV; N-+oo.

Задача, описываемая системой уравнений и неравенств (9.75), отличает­ ся от обычной задачи математического программирования лишь тем, что она содержит бесконечное, а не конечное число переменных.

9.10.Формулировка задачи оптимального управления

вдискретной форме

Для решения задачи оптимального управления на ЭВМ ее необходимо привести к дискретной форме. Разделим весь вре­

менной интервал [fo, /к] на N в общем случае неодинаковых ин­ тервалов

TiS=U—tt-u i= 1, 2......N, £ Ti=T=tK—to. i=*1

Часто T, a также все т, заранее неизвестны. Критерий опти­

мального управления типа (9.3) примет вид суммы

 

N

 

I = 2 FI*(О. «(<-1); Ч т,+ Ял-[х (Л0).

 

/=1

рассмат­

При этом каждую (скалярную) составляющую хи

ривают для каждого дискретного момента времени

U как от­

дельную переменную. Таким образом, общее число переменных

равно N(n-\-m-\-\,) где N —число рассматриваемых моментов времени; п, т —размерности векторов состояния и управления соответственно.

Естественно, что уравнения состояния должны удовлетво­ ряться в любой момент времени. Если решение уравнений со­ стояния в аналитической форме не известно, что имеет место в большинстве,задач, то необходимо произвести их численное интегрирование. Для этого уравнения состояния (9.1) дискрети­ зируют и записывают в виде разностных уравнений:

х(i+1)—х(i)= t<+i/[x(i), u(t); fj; i=0, 1, ..., N—1. (9.76)

Уравнения (9.76) можно рассматривать как nN ограничений в виде равенств, которые, однако, вследствие дискретизации яв­ ляются приближенными. Заметим, что уравнения (9.76) получе­ ны при помощи достаточно простого подхода. Применяя более совершенные разностные схемы, можно улучшить точность ре­ шения.

Итак, задача оптимального управления может быть сформу­ лированаNследующим образом. Найти экстремум выражения

2 Hx(i). u(i-l); Mt,+F„[x(A0] /=1

при ограничениях на переменные состояния х и управления и: FK[x(N)]>0; ОДО, «(0;

G2[x(i), u(i); f,]=0, i= 1, ..., N,

если известно, что переменные состояния удовлетворяют следу­ ющим уравнениям:

x(;+i)—x(0=Tj+iflx(0. «(0; il; i=о, 1, ..., N—1.

Рассмотрим применение метода математического програм­ мирования в случае непрерывных линейных систем. Предполо­ жим, что объект управления можно описать системой линейных дифференциальных уравнений п-го порядка:

х=Ах+Ви,

(9.77)

где матрицы А и

В стационарные.

Причем критерий оптимального управления можно представить в виде линейной или квадратичной формы (9.25).

Решение уравнений состояния (9.77) можно представить в замкнутой форме:

/

Х({)= Ф (*, g х(0)+ 1 Ф(t, т) Bu (т) dx.

о

где Ф(/, т) —[пХ^]-мерная переходная матрица состояния. Переходя к дискретному времени, получим для интервала

времени между моментами t,-1 и /3- выражение

х(У)= Ф(tj, ^.i)x(y'-l)+

 

0

(9.78)

+ [ ф(^1,т)ВиС/-1)йГт, у = 1, .... jV.

Ч-i

Для линейных систем Ф(t)= eAi

и

* (<,. *п)= Ч» И,- *н)= еА('-0-.>= в*1;.

Уравнения (9.78) можно теперь переписать в виде ограничи­ вающих равенств:

х(Л—еА,'х(у—1)—\ еА<,/-.-х)Ва(/ —1)dr=0,

(9.79)

;=1

‘y-,

 

N.

 

Если учесть, что размерность вектора х равна п, то уравнения (9.79) образуют систему из tiN ограничивающих равенств. Век­ тор и(/—1) предполагается постоянным в интервале

Итак, задача линейного оптимального управления в терми­ нах математического программирования может быть сформули­ рована следующим образом. Найти экстремум критерия

( Л7 ^

extr 2^[х(У),и(;-г

и-l J

при условии, что переменные управления и переменные состоя­ ния удовлетворяют ограничениям в виде неравенств

Uimai—IU,I>0;

1, ...» т;

Ximax—lXi|>0, /=1, ...» П, FK[x[N)]^О,

а переменные состояния х удовлетворяют равенствам

х(/)—еАх/х(/—1) —[ eA(^~1_T)Bu (J—1) dx—O,

*hi

/ = 1......N.

Ограничения (9.4) общего вида заменены ограничениями вида 1

согласно которым ограничены абсолютные значения переменных состояния и управления.

Контрольные вопросы

1.Сформулируйте задачуоптимального управления.

2.Что представляет собой вариационное исчисление? Типовая задача вариационного исчисления?

3.Что такое «квадратичный критерий оптимального управ­ ления»?

4.Каковы необходимые условия для оптимального управле­ ния в случае нелинейного объекта и линейного критерия?

5.Сформулируйте задачу и назовите методы математическо­

го программирования.

6. Как формулируется задача оптимального управления в дискретной форме?

7.Что представляют собой оптимальные ПИ-регуляторы?

8.Что такое принцип максимума?

10. ОСНОВЫ АНАЛИЗА И СИНТЕЗА САУ ПРИ СЛУЧАЙНЫХ ВОЗДЕЙСТВИЯХ

Анализ и синтез САУ при учете лишь заданных, детерми­ нированных воздействий не может дать полного представления об их свойствах. Возмущающие воздействия или помехи пред­ ставляют собой случайные функции реального времени. Поэто­ му теорию САУ можно считать полной тогда, когда в рассмот­ рение вводят не только детерминированные, но и случайные воздействия1.

Основные источники возмущений или помех, действующих на систему, приведены на рис. 10.1. Во-первых, это -возмущаю­ щие воздействия или помехи, присутствующие во входном сиг­ нале, которые приводятк возникновению дополнительной ошиб­ ки в САР. Во-вторых, это возмущения, приложенные непосред­ ственно к самому объекту регулирования. В-третьих, это по­ мехи, являющиеся результатом «шумовых» свойств элементов

1Солодовников В. В. Статистическая динамика линейных систем авто­ матического управления. М.: Физматгиз, 1960. 656 с.

Рис. 10.1. Источники возмущений и помех, действующих на САУ

и устройств САР, и прежде всего, измерительных и чувстви­ тельных элементов. Заметим, что точность САР не может бытьвыше точности элементов, входящих в состав системы.

10.1. Постановка задачи анализа динамической точности САР

При анализе качества САР предполагалось, что воздействия представляют заданные функции времени. Иногда допущение, что воздействие, вызвавшее переходный процесс, является за­ данной функцией времени, т. е. функцией значение которой в любой будущий момент времени однозначно определяется ее изменениями в предыдущий момент времени, не дает возмож­ ности описать реальные условия работы системы и правильно подойти к выбору ее характеристик. Зависимость воздействий, которым подвержена система, от времени заранее нельзя уста­ новить. Воздействия, приложенные к САР, представляют со­ бой случайные непрерывно изменяющиеся функции времени, так как знание конкретного значения воздействия в любой опре­ деленный момент времени не позволяет однозначно определить закон изменения воздействия Впоследующие мометы. Методы анализа и синтеза САР при наличии случайных непрерывно изменяющихся воздействий имеют большой практический инте­ рес [19, 20]. Проблема динамической точности является проб­ лемой анализа и синтеза систем автоматического регулирова­

ния, находящихся под влиянием таких непрерывно

изменяю­

щихся воздействий, когда понятие о переходном

процессе

теряет смысл и полной характеристикой неустановившегося про­

цесса, происходящего в системе, может служить абсолютное значение разности |е(^)| между требуемым и действительным значениями регулируемой величины в заданном интервале Это направление теории автоматического регулиро­

вания базируется на методах теории вероятностей и матема­ тической статистики.

В качестве первого примера САР, находящейся под влиянием помех (шумов), которые накладываются на управляющие воздействия (полезный входной сигнал), можно рассмотреть систему самолет —автопилот. Вней по­

лезными могут быть сигналы, поступающие на вход автопилота и задающие

требуемуютраекториюдвижения самолета, а помехами являются непрерыв­

ные случайные изменения лобового сопротивления и подъемной силы само­

лета вследствие хаотического изменения потока воздуха, колебаний плотно­

сти атмосферыидругих причин.

 

 

 

 

Вторым примеромможет служить система регулирования скорости тур-

богенератора. Вней задающим воздействием служит постоянный сигнал, со­

ответствующий номинальному значениюскорости, а возмущающим —непре­

рывные колебания нагрузки, создаваемые подключенной к генератору внеш­

ней цепью. Эти колебания зависят только от потребителей

и заранее не

могут быть предугаданы.

 

 

 

 

Третий пример —следящая система радиолокационной станции. JBэтой

системе задающим воздействием является входной сигнал, который зави­

сит от движения цели и не может быть точно предугадан. Возмущающими

воздействиями являются флуктуации входного сигнала и помехи, которые

накладываются на входной полезный сигнал. Они вызваны непрерывным из­

менениемкоэффициента отражения самолета (из-за рыскания

и качки само­

лета, вращения винтов и др.). Закон

изменения

флуктуаций

во

времени

вследствие сложности явления также не может быть точно определен.

Кроме полезного сигнала ипомех на входе следящей сисгемы радиоло­

катора, в ней образуются шумы, которые накладываются на

этот

полезный

сигнал. Шумывозникают, например, в приемнике, в контактах, потенциомет­

рах идругих частях следящей системы. Зеркало антенны радиолокационной

станции находится под влиянием ветровой нагрузки, которая также пред­

ставляет собой случайнуюфункциювремени.

 

 

 

Однимиз основных свойств системыуправления является помехоустой­

чивость, которая может характеризоваться средним значением

ошибки (меж­

ду требуемы идействительным значениями регулируемой величины), вызы­

ваемой случайными возмущающими

воздействиями

или помехами.

 

10.2. Случайные величины и функции, стохастические процессы

Величину, которая в зависимости от результатов опыта может принимать те или иные числовые значения, называют ■случайной. Чтобы задать такую величину, необходимо указать все возможные ее значения и поставить им в соответствие ве­ роятности, с которыми случайная величина принимает эти значения.

Функцией распределения вероятностей (или, просто, функ­ цией распределения случайной величины |) называют функцию F(x), равную вероятности Р события, состоящего в том, что

эта случайная величина примет значение меньшее, чем х, т. е. F(x)=P(l<x), где х —все значения на числовой оси (рис. 10.2,а).

Рис. 10.2. Основные характеристики

случайной величины:

а —функция распределения; б—плотность

распределения вероятностей

Функция распределения, являющаяся неубывающей, прини­ мает значения, заключенные между нулем и единицей, т. е.

и стремится к нулю при неограниченном уменьшении х, а к еди­ нице—при неограниченном возрастании х, т. е.

11mF (л;) = 0, *-*-—00

IimF (л:) = 1. Г-*оо

Если функция распределения дифференцируема, то ее всег­ да можно представить в виде

F(i)= W(x)dx,

где

W(x)=dF(x)ldx.

Производную от функции распределения вероятностей W(x) называют плотностью распределения вероятностей слу­ чайной величины.

Плотность распределения вероятностей является неотрица­ тельной функцией, т. е.

W(x)^0.

Вероятность события, состоящего в том, что случайная величина примет значение, заключенное в интервале [а, &], равна определенному интегралу от плотности распределения вероятностей на этом интервале, т. е.

ъ

P(a,b)=^ W (x)dx

а

(рис. 10.2,6).

Интеграл от плотности распределения вероятностей равен единице, т. е.

оо

$ W(x)dx= 1. —00

Случайные функции. Функцию, значение которой при каж­ дом значении независимой переменной является случайной величиной, называют случайной. Случайные функции, для кото­ рых независимой переменной является время t, называют сто­ хастическими процессами. Регистрацию в той или иной форме случайной функции называют реализацией случайной функции.

Предположим, что исследователь располагает совокуп­

ностью, или ансамблем случайных функций

характеризую­

щих изучаемый стохастический процесс (например, процесс изменения ошибки следящей системы при влиянии помех) в момент thнекоторым множеством значений случайной величи­ ны !*. Если фиксировать момент tht то для данного ансамбля

реализаций (рис. 10.3) можно найти плотность распределения

1

 

 

 

 

\Af\JUAipAr-nd K J \ / ^ -

t

 

I

Г I

 

 

 

 

 

 

t

 

 

 

 

t

 

 

 

 

t

 

t,

 

 

Рис. 10.3. Графики случайных

функций | (t)

 

W(x, th). Сечения

ансамбля реализаций случайной

функции

при ряде значений

времени tb .... th,

..., tn дают

n-мерную

случайную величину.

Таким образом, случайную функцию можно рассматривать как многомерную случайную величину, характеризуемую мно­ гомерной плотностью распределения вероятностей. Важными характеристиками случайной величины являются ее так назы­ ваемые моменты, которые можно вычислить на основании мно­ гомерных плотностей распределения вероятностей.

Пусть | —случайная переменная. Если известна одномер­ ная плотность распределения вероятностей №|(я, t), то момен­ том первого порядка, или математическим ожиданием случай­ ной функции, называют

т=М [!(<)(= ^ xW, (Je, t)dx.

Далее, зная двухмерную плотность распределения W2(xь х2, th t2), можно найти момент второго порядка, или математическое ожидание

M [£ (^i)» £ (^2)] —^ ^ xxx2W2(xj, x<ii t\y t2) dx\dx2 —00—00

ИT. Д.

Пусть S=(li, ^2*•••* ^n)—«-мерная случайная величина.

Тогда

моментом я-го порядка называют выражение

М\Ш> Ш* •••>£(*«)]=

 

00

оо

=

5 • • •

5 х'*2• • • х№п(х1>• • • »*л; h......tjdx, ........

Ввиду трудности определения или вычисления моментов высокого порядка обычно ограничиваются лишь двумя первыми моментами, а именно математическим ожиданием (моментом первого порядка)

m=\x(t)Wx(x,t)dx

(10.1)

—00

 

и моментом второго порядка, который называют корреляцион­ ной функцией и обозначают

R{t\* ^2)= ^ ч*^1-^2^2 (*^iI ЛС2»Л» h)dX\dxi.

(10.2)

Теорию стохастических процессов, изучающую лишь те свой­ ства, которые определяются двумя первыми моментами, т. е. т и R(tlt t2), называют корреляционной теорией случайных

функций.

Введем еще несколько определений.

Центрированной, или несмещенной, корреляционной функ­ цией называют центральный момент второго порядка случай­

ных величин l(/i), %{h), т. е.

/?„ (<„ <s) = At{[x(M - т.х(Л)1 \Х(<!) - и, (<2)Н

- J J [x(ti)-mAt\)\[x(tà-mx(h)\ Wi(x„х,; <„ t,Jdxtdx, —00—00

Дисперсией ах2 случайного процесса называют математи­ ческое ожидание квадрата отклонения x(t) от mx(t), т. е.

Mit(/) =о.2(О =М[х(/)-mx(t)Iz=

•= l [х-тх (ü)]2 W, (x, t)dx.

(10.3)

Взаимной корреляционной функцией двух стохастических процессов называют их смешанный момент второго порядка

= ^ 5 x,y2Wi(xv ÿ2; <„ h)dxxdy2,

(10.4)

—O—00

 

a центрированной взаимокорреляционной функцией | называют выражение

Rxу (*1. *2) = М {[х- т х(*i)] [У- Щ (*2)]}=

= ] $ [*■-т* (*1)] [»- W] Wt(x.t ; у. h) dxdy. (10.5)

Математическое ожидание, корреляционная функция, дис­ персия и взаимокорреляционные функции, определяемые выра­ жениями (10.1)—(10.5) соответственно, являются основными характеристиками случайных функций и стохастических про­

цессов.

10.3. Стационарные и эргодические случайные процессы

Математическое описание и экспериментальное исследование случайных процессов, на которые не наложено никаких огра­ ничений, представляют значительные трудности. Поэтому обыч­ но рассматривают случайные процессы, удовлетворяющие опре­ деленным допущениям. Значительное внимание уделяется так называемым стационарным случайным процессам.

Случайный процесс £(/) называют стационарным, если ма­

тематическое ожидание, или

момент первого

порядка т, для

случайной

переменной | при различных значениях параметра

t постоянно, т. е.

 

 

 

00

 

 

M[l]= ^ xW {х, tf)ûDc=const,

 

 

—00

R(tv t2) зависит

только от раз­

а корреляционная функция

ности аргументов, т. е.

 

 

R(t,

т)= J J x1(t+ т)х2(t) W to; х2; г)dxxdx2.

В корреляционной теории случайная функция характеризу­ ется моментами первого и второго порядка—математическим

ожиданием и корреляционной функцией. Математическое ожи­ дание является средним значением по множеству реализаций случайной функции, т. е.

М [g (t)]= \xW (х, t)dx= 1Пх (it).