
Т4 Управление в ДС
.pdf
решаемой задачи. Обзор методов построения фильтров Калмана приводится в работе [4].
4.3 Типовые регуляторы
При рассмотрении методов управления в динамических системах, прежде всего, обратим внимание на то, что с общей точки зрения следует различать математическую теорию управления и практическую технологию управления. Математическая теория исходит из заданной математической модели объекта управления. При этом синтез управления рассматривается как некоторая теорема – решение обратной математической задачи, из которой следует искомый закон управления, удовлетворяющий заданным условиям. Для практической технологии объектом управления является реальный объект действительности. Знание - как управлять данным объектом, является дополнительным к знанию – как происходят процессы в реальном объекте. При этом системное знание представляет собой логическое единство знания реальных процессов, происходящих в объекте управления и окружающей его среде, в совокупности с практическими методами управления указанными процессами.
Из приведенного достаточно очевидного утверждения следует важное положение - управление сложными объектами является самостоятельным разделом знания, отражающим опыт теории и практики управления, в общем случае не вытекающим однозначно из знания математической модели собственно объекта управления. Поэтому в прикладных исследованиях говорят о конструировании управления, а саму науку управления относят к инженерным наукам, понимаемым в самом широком смысле.
Рассмотрим типовые законы автоматического управления.
Одним из базовых законов здесь является ПИД закон регулирования, который основан на формировании управления пропорционально текущей, интегральной и дифференциальной ошибке управления:
u(t) K1e(t) K2 e(t)dt K3e(t) , где |
e(t) yp (t) y(t) . |
(1) |
4 Шмидт, Дж. Линейные и нелинейные методы фильтрации / Дж. Шмидт // Фильтрация и стохастическое управление в динамических системах / под ред. К.Т.
Леондеса. - М.: Мир, 1980. – С. 49-73.
Пер. с англ. CONTROL AND DYNAMIC SYSTEMS: Advances in Theory and Applications / ed. C.T. Leondes. – New York, San Francisco and London: Academic Press. – 1976.
338
Здесь yp (t) - задающее воздействие, определяющее расчетное значение
выходной реакции объекта управления, y(t) - наблюдаемое значение выходной реакции объекта, e(t) - текущая ошибка управления, u(t) - собственно управляющее воздействие, K1, K2 , K3 - коэффициенты
пропорциональности.
Структура закона управления (1) является достаточно естественной. Действительно, естественным является то, что управление пропорционально наблюдаемой ошибке управления. Далее, существуют объекты управления, для которых имеет значение не только текущая ошибка управления, но и кумулятивная ошибка – накопление ошибки в течение наблюдаемого периода. Данное условие отражает интегральная составляющая закона управления (1). Качество управления повышается, если знать не только текущую ошибку управления, но и прогноз ошибки. Прогноз ошибки управления отражает дифференциальная составляющая закона (1).
Приведенные соображения концептуально обосновывают структуру ПИД закона регулирования. Количественными параметрами закона (1) являются коэффициенты пропорциональности K1, K2 , K3 , а также
постоянная времени фильтра, например, экспоненциального, используемого для оценки составляющих ошибки регулирования на фоне помех. Рациональный выбор значений данных коэффициентов составляет содержание методов расчета систем управления, удовлетворяющих заданным требованиям критериев качества.
Опираясь на ПИД закон, можно построить более общие формы законов управления.
Так, более общей формой закона (1) является прогнозирующее управление, в структуру которого прогноз ошибки управления включен в явном виде:
|
t пр |
|
|
|
u(t) K1e(t) K2 e(t)dt K3 |
|
e(t )d , |
e(t) yp (t) y(t) . |
(2) |
t
где пр - интервал прогноза.
Еще более общую форму закона управления в виде разложения в ряд по базовым функциям можно получить, исходя из следующих соображений.
В общем случае поведение линейного стационарного регулятора описывается выражением
|
|
u(t) e(t )r( )d , |
(3) |
0 |
|
где r( ) - весовая функция, представляющая передаточные свойства регулятора.
339

Предположим, что существует разложение ошибки управления в ряд по базовым функциям
ne |
|
e(t ) i (t) i ( ) , |
(4) |
i 0 |
|
где i ( ) - базовые функции, по которым осуществляется разложение
ошибки управления;
i (t) - спектральные составляющие ошибки управления.
Подставляя разложение (4) в (3) получим выражение управления через спектральные составляющие ошибки управления
ne |
|
|
u(t) Ki |
i (t) , |
(5) |
i 0 |
|
|
где |
|
|
|
|
|
Ki i ( )r( )d , |
i 0, 1, 2, . . . ne . |
(6) |
0 |
|
|
Выражение (5) дает структуру управления, исходя из тенденций изменения ошибки управления. Тенденции изменения ошибки управления определяются спектральными составляющими ошибки.
Действительно, пусть базовыми функциями являются степенные функции
0 ( ) 1, |
1 ( ) , |
2 ( ) 2 , |
, n ( ) ne . |
(7) |
|
|
|
e |
|
Тогда спектральные составляющие ошибки управления представляют собой производные от ошибки различных порядков
0 (t) e(t) , |
1 (t) e(t) , |
2 |
(t) e(t) , . . . , n |
(t) e(ne ) (t) . |
(8) |
|
|
|
e |
|
|
Для других |
базовых |
функций интерпретация спектральных |
составляющих ошибки управления может быть иной. Так, например, для гармонических функций спектральные составляющие представляют собой текущие амплитуды гармоник соответствующих частот. Однако, вне зависимости от интерпретации структура формирования управления, исходя из тенденций изменения ошибки управления, представляется достаточно естественной.
Структура формирования управления (5) справедлива и для нестационарных систем. Отличие состоит в том, что коэффициенты пропорциональности Ki в структуре закона регулирования в
нестационарном случае являются функциями времени.
Другой подход к формированию управления базируется на использовании координат пространства состояний (фазового пространства) объекта управления. Управление в данном случае формируется на основе измерения переменных состояния динамической системы – объекта управления, например:
340
nx |
|
u(t) Ki xi (t) . |
(9) |
i 1 |
|
Здесь xi (t) - текущие значения переменных состояния |
динамической |
системы, Ki - коэффициенты пропорциональности. |
|
Внелинейном случае используются самые разнообразные законы управления. Например, это может быть релейное управление, управление с переменной структурой, которое переключается в зависимости от событий, возникающих в объекте управления, и др.
Вобщем случае объекты управления являются многомерными. В многомерных системах вырабатывается множество управлений, которые в общем случае зависят друг от друга.
Для линейных стационарных регуляторов общий закон управления можно представить в виде
|
|
|
ui (t) ei |
(t )rii ( )d uaj (t )rij ( )d , |
i 1, 2, . . . , ny ; (10) |
0 |
j, j i 0 |
|
где |
|
|
|
ei (t) ypi (t) yi (t) ; |
(11) |
|
|
|
|
uai (t) ei (t )rii ( )d . |
(12) |
|
0 |
|
Схема регулятора (10) отражает идею автономного регулирования, которая для многосвязных систем является естественной. Действительно, требования к точности регулирования задаются на основе рассмотрения отдельных ошибок регулирования ei (t) , составляющих общий вектор
ошибок e(t) . При этом независимые вариации отдельных задающих воздействий ypi (t) должны приводить к соответствующим независимым вариациям выходной реакции объекта y(t) без существенного нарушения требований к общему вектору ошибок e(t) . Другими словами задающие воздействия изменяют свои значения как единый вектор yp (t) , компоненты
которого изменяются независимо, соответственным образом должен изменяться и вектор реакций объекта y(t) . Однако, для многосвязных объектов изменение управляющих воздействий на одном входе в общем случае приводит к существенным изменениям на всех его выходах. С инженерной точки зрения управлять таким объектом практически невозможно. Поэтому закон управления (10) содержит в своем составе не только собственный сепаратный канал регулирования (12), но и корректирующие добавки, зависящие от собственных управлений, вырабатываемых на других сепаратных каналах регулирования. Корректирующие добавки компенсируют «паразитное» влияние одних
341

каналов регулирования на другие и обеспечивают автономный характер регулирования по отдельным сепаратным каналам.
С учетом соотношений (4)-(6) закон управления (10) может быть представлен в виде
n |
|
nij |
|
|
ii |
|
Kijl jl (t) , |
|
|
ui (t) Kiil |
il (t) |
i 1, 2, . . . , ny . |
(13) |
|
l 1 |
|
j, j i l 1 |
|
|
Здесь il , il - спектральные составляющие по ошибке и по собственному управлению i -го сепаратного канала соответственно, Kijl - коэффициенты
усиления соответствующих спектральных составляющих. Частными случаями закона управления (13) являются: - многомерный ПИД регулятор
ui (t) Kii1 i (t) Kii 2 i (t)dt Kii 3 i (t) Kij1u j (t) Kij 2u j (t) ,
|
|
|
|
|
|
|
|
j, j i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i 1, 2, ..., ny ; |
|
(14) |
- прогнозирующий регулятор |
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
t пр,ii |
|
|
|
|
ui (t) Kii1 i (t) Kii 2 i (t)dt Kii3 |
|
|
i (t )d |
|
|
||||||||
|
|
|
|
|
|
|
|
|
t |
|
|
, |
(15) |
|
|
|
|
|
t пр,ij |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|||
|
K |
u |
(t) K |
ij 2 |
u |
j |
(t )d |
; |
i 1, 2, ..., n |
. |
|
||
|
|
ij1 j |
|
|
|
|
|
y |
|
|
|||
|
j, j i |
|
|
t |
|
|
|
|
|
|
|
|
При рассмотрении управления в пространстве состояний схема формирования управления для многомерных систем по форме совпадает со схемой формирования управления для одномерных систем (9):
nx |
|
ui (t) Kij x j (t) , |
i 1, 2, ..., nu . |
j 1 |
|
Это связано с тем, что формы модельных представлений одномерных и многомерных динамических систем в пространстве состояний являются идентичными.
Сравнивая схемы формирования управления на основе спектральных составляющих (5), (13) и на основе переменных состояний (9), прежде всего, отметим, что спектральные составляющие отражают результаты анализа внешнего наблюдаемого движения объекта. Поэтому подход на основе спектральных составляющих применим для таких динамических систем, для которых уравнения движения в деталях не известны. Однако это не исключает для подобных объектов требований по наблюдаемости и управляемости. Просто здесь идет речь о том, что указанные характеристики не известны лицу, проводящему соответствующие
342

исследования, хотя объективно они присущи самому объекту исследования.
В противоположность спектральному подходу метод пространства состояний исходит из детального знания уравнений, описывающих динамику объекта управления. Это дает возможность строгого исследования вопросов наблюдаемости и управляемости объекта с обоснованным построением закона управления. Однако, для действительно сложных объектов точное знание уравнений движения, как правило, отсутствует, вследствие необозримой сложности подобных объектов. В этом случае используются усеченные уравнения движения с пониженной размерностью пространства состояний. Соответствующие переменные состояния по физическому смыслу могут быть близки к физическому смыслу спектральных составляющих, что сближает оба подхода к построению управления.
Особо следует отметить построение управления на основе прогноза движения объекта. Прогноз движения объекта может осуществляться как на основе спектральных составляющих траекторий движения объекта, так и на основе переменных состояния. В этом смысле оба способа построения прогнозирующего управления оказываются близки друг к другу.
4.4 Оптимальное управление
4.4.1. Постановка задачи
Рассмотрим постановку задачи оптимального управления.
Пусть задан многомерный объект управления, динамические процессы которого описываются уравнениями
x f (x, u, z, t), |
(1.1) |
|
y g(x, t). |
||
|
Здесь, как и выше, x - вектор переменных состояния, u - вектор управлений, z - вектор входных возмущающих воздействий, y - вектор выходных реакций.
Качество процессов управления в общем случае оценивается интегральным показателем, который может быть представлен как функционал потерь
t |
|
|
IT T 0 |
x(t), u(t), z(t), t dt T x(tT ), u(tT ), z(tT ), tT , |
(1.2) |
t0
где 0 ( ) - функция, оценивающая текущие потери для рассматриваемых процессов, T ( ) - функция, оценивающая потери рассматриваемых
343

процессов в терминальной точке tT . В целом показатель (1.2) состоит из
двух составляющих: первая составляющая оценивает интегральные потери для процессов во временном интервале [t0 , tT ] , вторая составляющая
оценивает потери для процессов в терминальной точке tT .
Ставится задача: найти управление u(t) динамическим объектом (1.1) из условия минимума интегрального функционала потерь (1.2).
Решение указанной задачи можно выполнить на основе двух подходов.
Первый подход основывается на двух этапах решения поставленной задачи. При этом на первом этапе, исходя из инженерного опыта, интуиции, знаний, определяется структура системы управления. На втором этапе осуществляется оптимизация управления в рамках заданной структуры.
Второй подход основывается на аналитической оптимизации самого управления u(t) . В этом случае используется математический аппарат нахождения экстремума функционала (1.2) при наличии ограничений (1.1).
Рассмотрим в начале первый подход к решению задачи оптимизации управления.
Предположим, например, что структура системы управления задана в виде системы с отрицательной обратной связью, представленной на рис.
4.4.1.
|
|
|
|
|
|
z |
|
ур + |
Δy |
|
х |
|
u |
|
|
Фн |
К |
f |
|||||
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
||
|
у |
|
|
|
|
|
x |
|
x |
g |
у |
u |
|
|
||
|
|
|
|
Рис. 4.4.1. Структура системы управления по отклонению с наблюдателем
Здесь Фн – наблюдатель разности желаемого и текущего состояния объекта управления, построенный тем или иным способом. Будем полагать, что наблюдатель является линейной динамической системой. В силу линейности наблюдателя для него будут справедливы соотношения:
х = Фн(у), хр = Фн(ур),
344

где ур, хр – расчетные значения задающего воздействия и состояния объекта управления.
Отсюда следует
х = хр – х.
Управление объектом формулируется обычно как функция переменных состояния объекта, его фазовых координат. В линейном
случае такое управление можно представить в виде |
|
u K(xр x) , |
(1.3) |
где xр - расчетное состояние, K - матрица коэффициентов, в общем случае
нестационарных.
Подставляя (1.3) в (1.1), (1.2), получим соотношения для решения задачи оптимизации:
|
t |
x(t), K(t) xр (t) x(t) , z(t), t |
dt |
|
|
min IT (K), |
IT T 0 |
|
|||
{K } |
t0 |
|
|
|
(1.4) |
|
x(tT ), K(tT ) xр (tT ) x(tT ) , z(tT ), tT ; |
||||
|
+ T |
|
|||
|
x f (x, Kx, z, t), |
|
(1.5) |
||
|
y g(x, t). |
|
|
||
|
|
|
|
||
Одним из подходов к решению задачи (1.4), (1.5) является |
|||||
следующий. |
|
|
|
|
|
Создается |
экспериментальная |
физическая |
модель |
либо |
вычислительная модель системы управления, состоящая из модели объекта управления (1.5), регулятора (1.3) и подсистемы вычисления функционала потерь качества управления (1.4). В итоге функционал потерь будет обычной функцией многих переменных Kij , которые составляют
матрицу коэффициентов K .
Задача (1.4) решается в общем случае итерационными методами. В качестве примера итерационных методов рассмотрим ниже основную идею градиентного метода поисковой оптимизации.
Пусть на (k 1) -ом шаге решения задачи определено некоторое значение матрицы Kk 1 . На основе экспериментов с вычислительной моделью задачи (1.4), (1.5) строится линейная аппроксимация
IT (Kk ) IT (Kk 1 ) Ak 1 Kk , |
Kk |
Kk Kk 1 ; |
(1.6) |
где Ak 1 - матрица коэффициентов аппроксимации. |
|
||
Уточненное значение матрицы K на шаге k |
определяется |
||
соотношением |
|
|
|
Kk Kk 1 Ak 1 , |
|
(1.7) |
|
где - коэффициент релаксации. |
|
|
|
345 |
|
|
|

Коэффициент релаксации определяется из условия
IT (Kk ) IT (Kk 1 |
Ak 1 ) min . |
(1.8) |
|
{ } |
|
Задача (1.8) представляет собой задачу минимизации функции |
IT (Kk ) по |
одному параметру - . Такая задача решается достаточно просто. Для ее решения существуют эффективные алгоритмы, например, упорядоченного перебора вариантов.
В результате решения задачи (1.8) будет получено уточненное значение матрицы Kk и решение может быть итеративно продолжено.
Итерационный процесс решения задачи (1.4), (1.5) сходится при
выполнении условия |
|
|
|
|
|
|
|
|
|
|
|||
lim |
|
Kk Kk 1 |
|
|
|
0. |
(1.9) |
||||||
|
|
|
|||||||||||
k |
|
|
|
|
|
|
|
|
|
|
|
||
Практическим условием сходимости является |
|
||||||||||||
|
|
Kk |
Kk 1 |
|
|
|
, |
(1.10) |
|||||
|
|
|
|
где - достаточно малое положительное число.
В итоге будет получено решение задачи (1.4), (1.5).
_______________________________________________
Второй подход к решению задачи минимизации функционала (1.2) при ограничении (1.1) состоит в аналитическом определении оптимального управления u(t) .
Решение поставленной задачи можно найти математическими методами, так как она представляет собой типовую задачу определения экстремума функционала при наличии ограничений.
Классический подход к нахождению экстремума функционала (1.2) при ограничении (1.1) является сведение задачи на условный экстремум к задаче нахождения безусловного экстремума на основе неопределенных множителей Лагранжа. Соответствующий функционал с множителями Лагранжа для интегральной составляющей функционала потерь:
t |
|
|
|
I λ T 0 |
λ, f x |
dt , |
(1.11) |
t0
здесь λ – вектор неопределенных множителей Лагранжа,
,
- скалярное произведение векторов. Введем обозначение
H λ 0 λ, f x . |
(1.12) |
Из вариационного исчисления5 известно, что необходимые условия минимума функционала (1.12) определяются соотношениями
5 Гельфанд, И.М. Вариационное исчисление / И.М. Гельфанд, С.В. Фомин – М.: Физматгиз, 1961.
346

grad |
|
H |
|
|
d |
grad |
|
H |
|
0 |
, |
(1.13) |
||
x |
λ |
|
x |
λ |
||||||||||
|
|
|
|
|
dt |
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
gradu |
H λ |
0 , |
|
|
|
|
|
(1.14) |
||||||
gradλ |
H λ |
0 . |
|
|
|
|
|
(1.15) |
Уравнения (1.13) - (1.15) представляют собой уравнения Эйлера, определяющие необходимые условия минимума функционала Лагранжа (1.11). Здесь grad( ) ( ) - градиент скалярной функции по векторной
переменной (т. е. вектор частных производных).
Уравнение (1.13) определяет необходимые условия минимума функционала (1.11) при незакрепленных граничных условиях. При задании конечных условий данные уравнения дополняются соотношениями
x(tT ) xT |
|
|
или |
|
|
gradx T [x(t), u(t), z(t), t] t tT |
0 . |
(1.16) |
Уравнения (1.13)-( 1.16) представляют собой исходные уравнения для аналитического решения задач оптимального управления.
При решении задач оптимального управления уравнения Эйлера часто записываются в форме, аналогичной уравнениям Гамильтона в аналитической механике. Это выполняется путем определения
соответствующей функции |
H |
аналогично |
так называемому |
гамильтониану |
|
|
|
H (x, u, z, λ, t) |
λ, f . |
(1.17) |
Здесь вектор λ отличается от вектора множителей Лагранжа в уравнении (12) тем, что имеет нулевую составляющую равную единице: 0 1.
Подобным образом векторное представление f в уравнении (1.17) отличается от соответствующего векторного представления правых частей уравнений динамики объекта тем, что имеет нулевую составляющую, равную подынтегральному выражению 0 [x(t), u(t), z(t), t], функционала
(1.17):
f0 0 [x(t), u(t), z(t), t] .
Таким образом, вектора λ, f теперь являются расширенными на нулевую составляющую и имеют размерность (n 1) .
В связи с изложенным первое необходимое условие оптимальности в случае «незакрепленных» конечных условий для переменных состояния можно записать посредством H в виде
gradx H λ , gradu H 0 , gradλ H x .
347