![](/user_photo/_userpic.png)
книги из ГПНТБ / Егоров С.В. Элементы идентификации и оптимизации управляемых систем учеб. пособие
.pdfпроварьированное значение функционала в первом прибли жении равно
Л (б) = Л (£/• + гС) = Л (U*) +
|
|
|
дХ(Т) |
|
|
к |
£>] + _££х |
dGy |
+ |
d G x |
\ |
ег|+ |
д^ 1 |
е П Л , |
|||
d X |
дХ |
|
|
6U |
|
где г](0 >Ф(0 » £(0 — векторы вариаций соответственно тра ектории, множителей Лагранжа и управления. Так как Л (е) достигает минимума при е = 0, то условие стационарности функционала запишется как
М> (Х(Г))
|
rfe |
1=0 |
д Х (Г) |
Л (П + |
|
|
|||
|
|
|
dG |
dG, |
+ |
ал1 ■»! + |
ах |
', + ^r® + ^ # t' d' = a (|-39) |
Интегрируя второе слагаемое, получаем для задачи с за крепленными концами (ЗК)
*?х |
ц d? = |
*1 |
££x ц dt |
д Х |
дХ |
#' \ дХ |
|
|
|
у |
aG, |
|
|
d |
|
|
- I |
' |
r( dt, |
|
ах |
поскольку в рассматриваемом случае вариация траектории
«а концах исключается:
п(М = ч (П = о .
Учитывая это и произвольность вариаций ц, •0, £, получаем окончательно, что выполнение условия (1-39) возможно лишь в случае, если
|
d |
dG |
X (T) = Х т - д л и 3K, |
дХ |
dt |
sr = 0, X(t0) = Xti, |
{ |
d X |
|
||
дОх |
= F(X, X, t/) — 0, |
(1-40) |
|
д\ |
|
|
|
дОх = 0. dU
41
Таким образом, необходимое условие оптимальности при водит к уравнениям Эйлера—Лагранжа (1-40). Заметим, что первое уравнение в (1-40) является дифференциальным уравнением второго порядка (уравнение Эйлера), а его ре шение — интегральная кривая X(t, С\, Сг), называемая экстремалью, содержит две постоянные С\ и Сг, которые оп
ределяются из двух очевидных для данной задачи краевых условий. В этой связи отметим, что для задач с подвижными концами (ПК) краевые условия имеют более сложный вид и называются условиями трансверсальности (УсТ). Эти ус
ловия находятся из общего условия экстремума (1-39) и тре бования, что оптимальная траектория по-прежнему удовлет воряет уравнению Эйлера, т. е. является экстремалью. В самом деле, если экстремум функционала в задаче с под вижными концами достигается на некоторой траектории
X(t)., то экстремум тем более достигается по отношению к
более узкому классу траекторий, имеющих общие гранич
ные точки с X (t), а следовательно, эта траектория должна
удовлетворять основному, необходимому условию экстрему
ма — уравнению Эйлера. Поэтому уравнения (1-40) |
справед |
ливы и в задачах с подвижными концами, однако |
краевые |
условия имеют в них другой вид. Например, для |
задачи с |
закрепленным левым и свободным правым концом |
(но при |
фиксированном Т) из (1-39) получаем о учетом уравнения
Эйлера условия трансверсальности в виде
д Ф ( Х ( Т ) ) |
д О } |
= 0. |
(1-41) |
X(t0) = Xо, |
+ д х |
||
д Х ( Т ) |
t - T |
|
|
|
|
|
Более полный список краевых условий будет дан ниже. А здесь отметим лишь, что необходимое условие оптималь ности для динамической задачи привело нас к так называе мой двухточечной краевой задаче (ДКЗ) для дифферен
циальных уравнений, поскольку краевые условия уравнения Эйлера задаются в двух точках (решение второго уравнения в (1-40) является одноточечной краевой задачей — задачей Коши, поскольку существенным является лишь начальное ус ловие X(t0) —Хо, а конечное условие в задаче с закреплен
ным концом выполняется автоматически, если найдено соот ветствующее решение уравнения Эйлзра). Так как диффе ренциальные уравнения второго порядка интегрируются в аналитическом виде лишь в исключительных случаях, то чис
42
ленное решение ДКЗ является весьма сложной проблемой, методы решения которой обсуждаются в гл. 5.
Если функция G,. не зависит от X (функция G и уравне
ния объекта не содержат X), то уравнения (1-40) превра
щаются в конечные уравнения, и вариационная задача вы рождается в конечную задачу оптимизации, рассмотренную ранее.
Уравнения Эйлера—Лагранжа (1-40) можно переписать в канонической форме дифференциальных уравнений первого порядка. Покажем это для часто встречающегося на практи ке случая, когда функционал (1-27) имеет вид
|
т |
|
|
/= Ф (Х (Г ))+ [ G(X, |
U, t)dt, |
(1-42) |
|
|
t0 |
|
|
а уравнения объекта — связи |
(1-28) |
приведены к нормаль |
|
ной форме |
|
|
|
X = F (X ,U ,t), |
X(to)=X о, |
(1-43) |
где конечное условие для состояния может быть и не задано. Определим скалярную функцию, называемую гамильто нианом (для консервативных систем гамильтонианом назы
вают полную механическую энергию):
Н (X, и, Л, t) = G (X, и, t) + ATF(X, и, t). |
(1 -44) |
Учитывая, что G ^-H -A ^X , уравнения Эйлера—Лагран
жа перепишем в канонической форме
’ А=-
Х =
дН —ип
{ dU
-мд?
п о »к•
Л(Т) —
Х(7)- см. табл. 1-1.
(1-45)
При этом начальное условие для Л неизвестно. Эта за дача, очевидно, также является двухточечной краевой зада чей, поскольку для системы 2п дифференциальных уравне
ний первого порядка (два векторных первых уравнения в (1-45)) имеется 2п краевых условий: п начальных условий для X(t) и п конечных условий для X(t) и A(t). В табл. 1-1
приведены конечные условия для Л и Л для различных за дач: с закрепленным, подвижным или свободным концом
43
траектории. Например, для задачи № 2 имеем (п + п\) урав нений для определения п\ неизвестных коэффициентов а* и п неизвестных конечных условий для jX и А, а в задачах со свободным концом (№ 3, 7) имеем п конечных условий
для Л.
Уравнения (1-45) можно переписать в виде канонических уравнений Гамильтона
(1-46)
см. табл. 1-1, где Н* = Н(Х, U*, Л,J), a U* удовлетворяет
показывает, что гамильтониан (вдоль оптимальной траектории не зависит от времени).
Вопрос о достаточных условиях оптимальности рассмот рен в гл. 5.
Надо отметить, что уравнения Эйлера не существуют, если не выполняются условия непрерывности и гладкости, а также, что в задачах, где управление не входит в функцию стоимости G, можно получить решения 7/*= + °о , не имею щие практического смысла. В этом случае налагаются до полнительные условия.
' Пункт 4. Задачи математического программирования.
В последние 20 лет значительно возрос интерес к новому классу задач, которые, как правило, не поддаются решению классическими методами. Часто их называют задачами ма тематического программирования. Первоначально они появи
лись при решении экономических проблем, затем появились их аналоги при управлении производственными процессами и техническими системами, в административном управлении, военном деле и т. д. Эти задачи отличаются от классических появлением ограничений в форме неравенств.
Будем называть неклассическими конечными задачами оп тимизации задачи вида:
Найти значения переменной |
U — (м,, . |
. ., иш ), |
которая дает |
экстремум целевой функции |
|
|
|
G — О (СУ) |
|
(1-47) |
|
при связях (1-26) и ограничениях вида |
|
|
|
hi (U) <0 |
7= 1,..., |
т г. |
(1-48) |
44
|
|
|
|
|
|
|
Таблица 1-t |
№ |
|
Постановка задачи |
|
|
Необходимые условия |
||
|
|
|
оптимальности — ур. (1-46) |
||||
|
|
|
|
|
|||
за |
Уравнение |
Функционал |
Конечное |
Конечное |
|
|
|
дачи |
|
Конечное значение X (Т ) |
|||||
|
объекта (1-28) |
(1-27) |
время Т |
состояние Х ( Т ) |
|
||
|
|
|
|
||||
1 |
|
G = G (X, U, |
t) |
Хт |
|
|
Условий нет |
2 |
|
Ф = 0 |
|
Йт ! ФЛг (X) = 0 |
V |
а* |
; (А, (Г) нормально |
|
|
|
Задано |
k — 1.........л, < п |
L A |
д Х |
Х( Т) |
|
|
|
k=\ |
|
|
3 |
G = G ( X, |
U, t) |
R п |
Ф = Ф ( Х ( Г ) )
4 |
к = F ( X , и , t) G — G { X , U, t ) |
|
' |
х т |
|
5 |
Ф = 0 |
|
|
х = ф (0 |
|
6 |
G = G ( X , U, /) |
Не задано |
й т «Ф* (X . 0 = 0 |
||
Ф = Ф (X (Т), Т ) |
k = |
1,..., л, < п |
|||
|
|
||||
7 |
|
|
|
R n |
к й т в точке Х ( Т )
<ЭФ I
'д Х |х(Г)
Условий нет Условий нет
у ! |
<?Ф |
дФ |
2 ^ ак д Х Х( Т) |
д Х х ( Т ) |
|
к = 1 |
|
|
дФ
дХ Х ( Т )
П р и м е ч а н и я : X r — фиксированная точка в |
пространстве R " вещественных чисел; |
QT — подпространство из R n |
размерности п — п й |
<f (f) — заданная вектор-функция времени.
Ограничения со знаком легко переписать в виде ограни чений со знаком ^ домножением обеих частей неравенства
на —1.
Будем называть неклассическими вариационными задача-
м и о п т и м и з а ц и и |
за д а ч и вида: |
|
|
|
||
Найти |
функцию |
U(t) — |
(u\(t)............ |
иin (0) 1 |
которая даст |
|
экстремум |
функционалу (1-27) |
при |
связях |
(1-28) с условиями (1-29), |
||
а также при ограничениях на управление |
|
|
||||
|
|
h£(U, t) < 0» |
г — 1, . |
т г |
(1-49) |
|
и ограничениях на координаты |
|
|
|
|
||
|
|
gk (X,t)< 0, |
k = l , . ... П 2« |
(1-50) |
Появление ограничений типа неравенств приводит к по явлению областей Qu, Q* допустимого изменения соответст вующих переменных. При этом экстремальные значения функций и функционалов очень часто достигаются именно на границах этих областей (например, в задачах линейного программирования, линейного быстродействия и др.), где не выполняются условия стационарности типа (1-30), (1-39), что делает невозможным применение классических методов. Очевидно, последние неприменимы также и в тех задачах,
где, например, не существуют |
dG |
dF |
|
производные |
, —j j в |
||
каких-либо точках области |
т. |
е. не выполняются условия |
непрерывности и гладкости. Таким образом, локальный ми нимум, например, функции G(U), который может иметь
место: 1) во внутренних точках области Q„; 2) в точках Qu, где производные не существуют; 3) на границах области может быть найден с помощью классических методов только для первого случая. Аналогичное положение наблюдается и при решении вариационных задач.
Пункт 5. Выводы
Задачи экстремизации функций являются задачами ста тической оптимизации, для которых характерно отсутствие временного фактора при математической формулировке за дачи. Наоборот, в системах с существенной динамикой, с существенным временем протекания переходных процессов задачи оптимизации формулируются как задачи акстремизации функционалов.
Необходимые условия оптимальности для классических задач статической оптимизации приводят к решению систем
46
конечных уравнений, а для классических задач динамичес кой оптимизации — к решению двухточечных краевых за дач для дифференциальных уравнений.
Неклассмческие задачи оптимизации решаются специаль ными методами, рассмотренными в гл. 4, 5.
Задачи оптимизации, возникающие при автоматическом управлении, существенно отличаются от задач оптимизации неавтоматизированных систем: если в последних ограничи ваются лишь нахождением оптимальных управлений как функций времени, то в автоматических системах требуется решить задачу синтеза управляющего устройства, формиру
ющего оптимальное управление как функцию состояния системы (иногда и времени).
Г л а в а 2
ХАРАКТЕРИЗАЦИЯ УПРАВЛЯЕМЫХ СИСТЕМ
Законы природы могут быть сформулированы или как дифференциальные уравнения, или как «вариационные прин ципы», согласно которым определенные величины принимают экстремальные значения при данных условиях,
(Г. Вейль, «Полвека математики»)
П,р,и характеризации системы, т. е. при математическом или другом формализованном ее описании, предметом ис следования является форма связи между переменными сис темы.
Как указано выше, уравнения связи отражают те кон кретные законы природы, которым подчиняются протекаю щие в системе процессы. Поскольку формы записи таких связей многообразны, можно стремиться к оптимальной ха рактеризации системы в пространстве переменных, описы
вающих ее. Так, характеризацию можно рассмотреть с точки зрения: наглядности или простоты физического смысла свя зей между переменными, простоты нахождения параметров связей, простоты анализа системы при решении конкретных задач, простоты ^синтеза оптимального управления. Обычно нельзя удовлетворить всем требованиям одновременно, тем более, что они часто субъективны, поэтому на различных этапах анализа могут применяться различные формы харак теризации, которые, очевидно, связаны между собой, по скольку относятся к одной и той же системе.
Характеризация управляемой системы (в отличие от си стем вообще) должна отражать лишь связи между управляе мыми переменными и воздействиями, наиболее существенно влияющими на них.
Задание критерия оптимальности для управляемой систе мы и установление ограничений на некоторые ее перемен ные позволяют выделить интересующие нас выходные пере менные и наметить структуру модели управления системой.
48
Такая модель должна быть гомоморфна исследуемой систе
ме, т. е., являясь упрощенной моделью, сохранять интере сующие нас соотношения между переменными, в данном случае—между входными и выходными воздействиями. Осте пени адекватности модели объекту судят по близости вы ходных-переменных модели и объекта при совпадающих входных воздействиях и начальных условиях. Хотя дальней шая идентификация системы основана на максимальном уве личении такой близости, .необходимо быть уверенным, что принятая характеризация управляемой системы может в принципе обеспечить требуемую точность модели. Поэтому одновременно с характеризацией обычно проводят объек тивную идентификацию — определение точности модели,
исходя из заданных характеристик системы или класса сис тем и принятого способа характеризации, что позволяет су дить о пригодности принятого способа характеризации.
§ 2-1. Классы моделей динамических систем
По виду уравнений связи между переменными динами ческие системы делятся на одномерные и многомерные, ли нейные и нелинейные, с голономными и неголономными связями, с сосредоточенными и распределенными параметра ми, на стационарные и нестационарные.
Одномерная система имеет одно входное и выходное воз действия, многомерная — больше одного.
Система называется линейной, когда для нее выполняется
принцип суперпозиции: |
|
|
если на систему действует одновременно нес |
|
|
колько воздействий, то реакция системы |
равна |
(2-1) |
сумме реакций, вызываемых каждым из |
воздей- |
|
ствий в отдельности. |
|
|
Поскольку математической моделью системы является оператор, которым эта система, описывается, то математиче ски оператор г, например (1-3), линеен, если он обладает
свойством аддитивности |
|
F(Y, \U, Z )= F(Y , 0, 0) + jF(0, U, 0)+ F(0, 0, Z), |
(2-la) |
и свойством однородности |
|
F(c'Y, cU, cZ)=cF(Y, U, Z). |
(2-16) |
4—1303 |
49 |
Из (2-1а) в свою очередь следует, что при разложений любой переменной на сумму некоторых составляющих мож но, например, записать
F(Y, 0, 0) =/7(2 У„,0, 0)= 2 F (Y k, 0, 0) и т. д.
кк
Системы, не удовлетворяющие принципу суперпозиции, являются нелинейными. С математической точки зрения, линейные системы описываются линейными уравнениями (алгебраическими, разностными, дифференциальными и др.). Хотя на практике не существует линейных систем, однако в большинстве случаев многие из них могут рассматриваться как линейные в ограниченных диапазонах изменения пере менных. Характерной особенностью таких систем является возможность их описания с помощью аналитических функ ций, т. е. имеющих в каждой точке конечные производные и, следовательно, разложимых в ряд Тейлора.
Деление на системы о голономными и неголономными связями (термины введены Герцем) между переменными
осуществляется в зависимости от того, могут ли эти связи быть выражены в форме, содержащей непосредственно сами переменные (holos, греч. — единый, целый) или их беско нечно малые приращения. Математически голономные связи могут быть записаны в виде конечных уравнений, а неголономные связи — в виде дифференциальных, интегральных или интегро-дифференциальных.
Если переменные системы изменяются во времени и про странстве, их относят к системам с распределенными пара метрами; если только во времени, — к системам с сосредо точенными параметрами. Математически неголономные си стемы d сосредоточенными параметрами обычно описывают-,
ся обыкновенными дифференциальными уравнениями, где аргументом является время, а системы с распределенными параметрами — уравнениями в частных производных, где независимыми переменными являются пространственные координаты и время.
Системы, у которых связи (их структура или параметры) изменяются во времени, называются нестационарными.,
Простейшими системами являются одномерные стацио нарные сосредоточенные линейные системы с голономными связями, более сложны для анализа системы многомерные, нестационарные, с неголономными связями, с распределен ными параметрами, наибольшую сложность вызывает анализ
50