Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Егоров С.В. Элементы идентификации и оптимизации управляемых систем учеб. пособие

.pdf
Скачиваний:
5
Добавлен:
24.10.2023
Размер:
9.47 Mб
Скачать

проварьированное значение функционала в первом прибли­ жении равно

Л (б) = Л (£/• + гС) = Л (U*) +

 

 

 

дХ(Т)

 

к

£>] + _££х

dGy

+

d G x

\

ег|+

д^ 1

е П Л ,

d X

дХ

 

 

6U

 

где г](0 >Ф(0 » £(0 — векторы вариаций соответственно тра­ ектории, множителей Лагранжа и управления. Так как Л (е) достигает минимума при е = 0, то условие стационарности функционала запишется как

М> (Х(Г))

 

rfe

1=0

д Х (Г)

Л (П +

 

 

 

 

 

dG

dG,

+

ал1 ■»! +

ах

', + ^r® + ^ # t' d' = a (|-39)

Интегрируя второе слагаемое, получаем для задачи с за­ крепленными концами (ЗК)

*?х

ц d? =

*1

££x ц dt

д Х

дХ

#' \ дХ

 

 

у

aG,

 

 

d

 

- I

'

r( dt,

 

ах

поскольку в рассматриваемом случае вариация траектории

«а концах исключается:

п(М = ч (П = о .

Учитывая это и произвольность вариаций ц, •0, £, получаем окончательно, что выполнение условия (1-39) возможно лишь в случае, если

 

d

dG

X (T) = Х т - д л и 3K,

дХ

dt

sr = 0, X(t0) = Xti,

{

d X

 

дОх

= F(X, X, t/) 0,

(1-40)

д\

 

 

 

дОх = 0. dU

41

Таким образом, необходимое условие оптимальности при­ водит к уравнениям Эйлера—Лагранжа (1-40). Заметим, что первое уравнение в (1-40) является дифференциальным уравнением второго порядка (уравнение Эйлера), а его ре­ шение — интегральная кривая X(t, С\, Сг), называемая экстремалью, содержит две постоянные С\ и Сг, которые оп­

ределяются из двух очевидных для данной задачи краевых условий. В этой связи отметим, что для задач с подвижными концами (ПК) краевые условия имеют более сложный вид и называются условиями трансверсальности (УсТ). Эти ус­

ловия находятся из общего условия экстремума (1-39) и тре­ бования, что оптимальная траектория по-прежнему удовлет­ воряет уравнению Эйлера, т. е. является экстремалью. В самом деле, если экстремум функционала в задаче с под­ вижными концами достигается на некоторой траектории

X(t)., то экстремум тем более достигается по отношению к

более узкому классу траекторий, имеющих общие гранич­

ные точки с X (t), а следовательно, эта траектория должна

удовлетворять основному, необходимому условию экстрему­

ма — уравнению Эйлера. Поэтому уравнения (1-40)

справед­

ливы и в задачах с подвижными концами, однако

краевые

условия имеют в них другой вид. Например, для

задачи с

закрепленным левым и свободным правым концом

(но при

фиксированном Т) из (1-39) получаем о учетом уравнения

Эйлера условия трансверсальности в виде

д Ф ( Х ( Т ) )

д О }

= 0.

(1-41)

X(t0) = Xо,

+ д х

д Х ( Т )

t - T

 

 

 

 

Более полный список краевых условий будет дан ниже. А здесь отметим лишь, что необходимое условие оптималь­ ности для динамической задачи привело нас к так называе­ мой двухточечной краевой задаче (ДКЗ) для дифферен­

циальных уравнений, поскольку краевые условия уравнения Эйлера задаются в двух точках (решение второго уравнения в (1-40) является одноточечной краевой задачей — задачей Коши, поскольку существенным является лишь начальное ус­ ловие X(t0) —Хо, а конечное условие в задаче с закреплен­

ным концом выполняется автоматически, если найдено соот­ ветствующее решение уравнения Эйлзра). Так как диффе­ ренциальные уравнения второго порядка интегрируются в аналитическом виде лишь в исключительных случаях, то чис­

42

ленное решение ДКЗ является весьма сложной проблемой, методы решения которой обсуждаются в гл. 5.

Если функция G,. не зависит от X (функция G и уравне­

ния объекта не содержат X), то уравнения (1-40) превра­

щаются в конечные уравнения, и вариационная задача вы­ рождается в конечную задачу оптимизации, рассмотренную ранее.

Уравнения Эйлера—Лагранжа (1-40) можно переписать в канонической форме дифференциальных уравнений первого порядка. Покажем это для часто встречающегося на практи­ ке случая, когда функционал (1-27) имеет вид

 

т

 

 

/= Ф (Х (Г ))+ [ G(X,

U, t)dt,

(1-42)

 

t0

 

 

а уравнения объекта — связи

(1-28)

приведены к нормаль­

ной форме

 

 

 

X = F (X ,U ,t),

X(to)=X о,

(1-43)

где конечное условие для состояния может быть и не задано. Определим скалярную функцию, называемую гамильто­ нианом (для консервативных систем гамильтонианом назы­

вают полную механическую энергию):

Н (X, и, Л, t) = G (X, и, t) + ATF(X, и, t).

(1 -44)

Учитывая, что G ^-H -A ^X , уравнения Эйлера—Лагран­

жа перепишем в канонической форме

’ А=-

Х =

дН —ип

{ dU

-мд?

п о »к•

Л(Т)

Х(7)- см. табл. 1-1.

(1-45)

При этом начальное условие для Л неизвестно. Эта за­ дача, очевидно, также является двухточечной краевой зада­ чей, поскольку для системы 2п дифференциальных уравне­

ний первого порядка (два векторных первых уравнения в (1-45)) имеется 2п краевых условий: п начальных условий для X(t) и п конечных условий для X(t) и A(t). В табл. 1-1

приведены конечные условия для Л и Л для различных за­ дач: с закрепленным, подвижным или свободным концом

43

траектории. Например, для задачи № 2 имеем (п + п\) урав­ нений для определения п\ неизвестных коэффициентов а* и п неизвестных конечных условий для jX и А, а в задачах со свободным концом (№ 3, 7) имеем п конечных условий

для Л.

Уравнения (1-45) можно переписать в виде канонических уравнений Гамильтона

(1-46)

см. табл. 1-1, где Н* = Н(Х, U*, Л,J), a U* удовлетворяет

показывает, что гамильтониан (вдоль оптимальной траектории не зависит от времени).

Вопрос о достаточных условиях оптимальности рассмот­ рен в гл. 5.

Надо отметить, что уравнения Эйлера не существуют, если не выполняются условия непрерывности и гладкости, а также, что в задачах, где управление не входит в функцию стоимости G, можно получить решения 7/*= + °о , не имею­ щие практического смысла. В этом случае налагаются до­ полнительные условия.

' Пункт 4. Задачи математического программирования.

В последние 20 лет значительно возрос интерес к новому классу задач, которые, как правило, не поддаются решению классическими методами. Часто их называют задачами ма­ тематического программирования. Первоначально они появи­

лись при решении экономических проблем, затем появились их аналоги при управлении производственными процессами и техническими системами, в административном управлении, военном деле и т. д. Эти задачи отличаются от классических появлением ограничений в форме неравенств.

Будем называть неклассическими конечными задачами оп­ тимизации задачи вида:

Найти значения переменной

U — (м,, .

. ., иш ),

которая дает

экстремум целевой функции

 

 

 

G — О (СУ)

 

(1-47)

при связях (1-26) и ограничениях вида

 

 

hi (U) <0

7= 1,...,

т г.

(1-48)

44

 

 

 

 

 

 

 

Таблица 1-t

 

Постановка задачи

 

 

Необходимые условия

 

 

 

оптимальности — ур. (1-46)

 

 

 

 

 

за­

Уравнение

Функционал

Конечное

Конечное

 

 

 

дачи

 

Конечное значение X (Т )

 

объекта (1-28)

(1-27)

время Т

состояние Х ( Т )

 

 

 

 

 

1

 

G = G (X, U,

t)

Хт

 

 

Условий нет

2

 

Ф = 0

 

Йт ! ФЛг (X) = 0

V

а*

; (А, (Г) нормально

 

 

 

Задано

k — 1.........л, < п

L A

д Х

Х( Т)

 

 

 

k=\

 

 

3

G = G ( X,

U, t)

R п

Ф = Ф ( Х ( Г ) )

4

к = F ( X , и , t) G — G { X , U, t )

 

'

х т

5

Ф = 0

 

 

х = ф (0

6

G = G ( X , U, /)

Не задано

й т «Ф* (X . 0 = 0

Ф = Ф (X (Т), Т )

k =

1,..., л, < п

 

 

7

 

 

 

R n

к й т в точке Х ( Т )

<ЭФ I

'д Х |х(Г)

Условий нет Условий нет

у !

<?Ф

дФ

2 ^ ак д Х Х( Т)

д Х х ( Т )

к = 1

 

 

дФ

дХ Х ( Т )

П р и м е ч а н и я : X r — фиксированная точка в

пространстве R " вещественных чисел;

QT — подпространство из R n

размерности п — п й

<f (f) — заданная вектор-функция времени.

Ограничения со знаком легко переписать в виде ограни­ чений со знаком ^ домножением обеих частей неравенства

на —1.

Будем называть неклассическими вариационными задача-

м и о п т и м и з а ц и и

за д а ч и вида:

 

 

 

Найти

функцию

U(t) —

(u\(t)............

иin (0) 1

которая даст

экстремум

функционалу (1-27)

при

связях

(1-28) с условиями (1-29),

а также при ограничениях на управление

 

 

 

 

h£(U, t) < 0»

г — 1, .

т г

(1-49)

и ограничениях на координаты

 

 

 

 

 

 

gk (X,t)< 0,

k = l , . ... П

(1-50)

Появление ограничений типа неравенств приводит к по­ явлению областей Qu, Q* допустимого изменения соответст­ вующих переменных. При этом экстремальные значения функций и функционалов очень часто достигаются именно на границах этих областей (например, в задачах линейного программирования, линейного быстродействия и др.), где не выполняются условия стационарности типа (1-30), (1-39), что делает невозможным применение классических методов. Очевидно, последние неприменимы также и в тех задачах,

где, например, не существуют

dG

dF

производные

, —j j в

каких-либо точках области

т.

е. не выполняются условия

непрерывности и гладкости. Таким образом, локальный ми­ нимум, например, функции G(U), который может иметь

место: 1) во внутренних точках области Q„; 2) в точках Qu, где производные не существуют; 3) на границах области может быть найден с помощью классических методов только для первого случая. Аналогичное положение наблюдается и при решении вариационных задач.

Пункт 5. Выводы

Задачи экстремизации функций являются задачами ста­ тической оптимизации, для которых характерно отсутствие временного фактора при математической формулировке за­ дачи. Наоборот, в системах с существенной динамикой, с существенным временем протекания переходных процессов задачи оптимизации формулируются как задачи акстремизации функционалов.

Необходимые условия оптимальности для классических задач статической оптимизации приводят к решению систем

46

конечных уравнений, а для классических задач динамичес­ кой оптимизации — к решению двухточечных краевых за­ дач для дифференциальных уравнений.

Неклассмческие задачи оптимизации решаются специаль­ ными методами, рассмотренными в гл. 4, 5.

Задачи оптимизации, возникающие при автоматическом управлении, существенно отличаются от задач оптимизации неавтоматизированных систем: если в последних ограничи­ ваются лишь нахождением оптимальных управлений как функций времени, то в автоматических системах требуется решить задачу синтеза управляющего устройства, формиру­

ющего оптимальное управление как функцию состояния системы (иногда и времени).

Г л а в а 2

ХАРАКТЕРИЗАЦИЯ УПРАВЛЯЕМЫХ СИСТЕМ

Законы природы могут быть сформулированы или как дифференциальные уравнения, или как «вариационные прин­ ципы», согласно которым определенные величины принимают экстремальные значения при данных условиях,

(Г. Вейль, «Полвека математики»)

П,р,и характеризации системы, т. е. при математическом или другом формализованном ее описании, предметом ис­ следования является форма связи между переменными сис­ темы.

Как указано выше, уравнения связи отражают те кон­ кретные законы природы, которым подчиняются протекаю­ щие в системе процессы. Поскольку формы записи таких связей многообразны, можно стремиться к оптимальной ха­ рактеризации системы в пространстве переменных, описы­

вающих ее. Так, характеризацию можно рассмотреть с точки зрения: наглядности или простоты физического смысла свя­ зей между переменными, простоты нахождения параметров связей, простоты анализа системы при решении конкретных задач, простоты ^синтеза оптимального управления. Обычно нельзя удовлетворить всем требованиям одновременно, тем более, что они часто субъективны, поэтому на различных этапах анализа могут применяться различные формы харак­ теризации, которые, очевидно, связаны между собой, по­ скольку относятся к одной и той же системе.

Характеризация управляемой системы (в отличие от си­ стем вообще) должна отражать лишь связи между управляе­ мыми переменными и воздействиями, наиболее существенно влияющими на них.

Задание критерия оптимальности для управляемой систе­ мы и установление ограничений на некоторые ее перемен­ ные позволяют выделить интересующие нас выходные пере­ менные и наметить структуру модели управления системой.

48

Такая модель должна быть гомоморфна исследуемой систе­

ме, т. е., являясь упрощенной моделью, сохранять интере­ сующие нас соотношения между переменными, в данном случае—между входными и выходными воздействиями. Осте­ пени адекватности модели объекту судят по близости вы­ ходных-переменных модели и объекта при совпадающих входных воздействиях и начальных условиях. Хотя дальней­ шая идентификация системы основана на максимальном уве­ личении такой близости, .необходимо быть уверенным, что принятая характеризация управляемой системы может в принципе обеспечить требуемую точность модели. Поэтому одновременно с характеризацией обычно проводят объек­ тивную идентификацию — определение точности модели,

исходя из заданных характеристик системы или класса сис­ тем и принятого способа характеризации, что позволяет су­ дить о пригодности принятого способа характеризации.

§ 2-1. Классы моделей динамических систем

По виду уравнений связи между переменными динами­ ческие системы делятся на одномерные и многомерные, ли­ нейные и нелинейные, с голономными и неголономными связями, с сосредоточенными и распределенными параметра­ ми, на стационарные и нестационарные.

Одномерная система имеет одно входное и выходное воз­ действия, многомерная — больше одного.

Система называется линейной, когда для нее выполняется

принцип суперпозиции:

 

 

если на систему действует одновременно нес­

 

колько воздействий, то реакция системы

равна

(2-1)

сумме реакций, вызываемых каждым из

воздей-

ствий в отдельности.

 

 

Поскольку математической моделью системы является оператор, которым эта система, описывается, то математиче­ ски оператор г, например (1-3), линеен, если он обладает

свойством аддитивности

 

F(Y, \U, Z )= F(Y , 0, 0) + jF(0, U, 0)+ F(0, 0, Z),

(2-la)

и свойством однородности

 

F(c'Y, cU, cZ)=cF(Y, U, Z).

(2-16)

4—1303

49

Из (2-1а) в свою очередь следует, что при разложений любой переменной на сумму некоторых составляющих мож­ но, например, записать

F(Y, 0, 0) =/7(2 У„,0, 0)= 2 F (Y k, 0, 0) и т. д.

кк

Системы, не удовлетворяющие принципу суперпозиции, являются нелинейными. С математической точки зрения, линейные системы описываются линейными уравнениями (алгебраическими, разностными, дифференциальными и др.). Хотя на практике не существует линейных систем, однако в большинстве случаев многие из них могут рассматриваться как линейные в ограниченных диапазонах изменения пере­ менных. Характерной особенностью таких систем является возможность их описания с помощью аналитических функ­ ций, т. е. имеющих в каждой точке конечные производные и, следовательно, разложимых в ряд Тейлора.

Деление на системы о голономными и неголономными связями (термины введены Герцем) между переменными

осуществляется в зависимости от того, могут ли эти связи быть выражены в форме, содержащей непосредственно сами переменные (holos, греч. — единый, целый) или их беско­ нечно малые приращения. Математически голономные связи могут быть записаны в виде конечных уравнений, а неголономные связи — в виде дифференциальных, интегральных или интегро-дифференциальных.

Если переменные системы изменяются во времени и про­ странстве, их относят к системам с распределенными пара­ метрами; если только во времени, — к системам с сосредо­ точенными параметрами. Математически неголономные си­ стемы d сосредоточенными параметрами обычно описывают-,

ся обыкновенными дифференциальными уравнениями, где аргументом является время, а системы с распределенными параметрами — уравнениями в частных производных, где независимыми переменными являются пространственные координаты и время.

Системы, у которых связи (их структура или параметры) изменяются во времени, называются нестационарными.,

Простейшими системами являются одномерные стацио­ нарные сосредоточенные линейные системы с голономными связями, более сложны для анализа системы многомерные, нестационарные, с неголономными связями, с распределен­ ными параметрами, наибольшую сложность вызывает анализ

50

Соседние файлы в папке книги из ГПНТБ