Теория автоматического управления
..pdfРис. 11.2. Минимаксный критерий оптимальности
применять лишь когда неизвестны статистические характеристики внешних воздействий.
Ограничения на процесс управления. Различают два вида огра ничений: естественные и условные. Естественными ограничени
ями являются |
физические |
законы, в соответствии |
с |
которыми |
|||
функционируют объект управления и управляющее |
устройство. |
||||||
При |
математической постановке |
задачи управления |
эти ограни |
||||
чения |
представляются |
в виде дифференциальных |
и |
алгебраи |
|||
ческих уравнений объекта |
типа |
(11.8) и (11.9). |
К |
естествен |
|||
ным |
относятся |
также |
ограничения значений переменных х (*), |
||||
х в (!) |
и у (t), |
обусловленные |
особенностями |
конструкции |
объекта и управляющего устройства. Например, частота вращения
асинхронного двигателя н е м о ж е т |
быть больше синхронной, |
выходной сигнал усилителя н е м о ж е т |
принять значения, боль |
шие, чем уровень насыщения. Такие ограничения действуют сами по себе, независимо от желания конструктора системы.
Условные ограничения на эти же переменные устанавливает кон структор системы, стремясь не допустить аварийных или какихлибо иных нежелательных режимов работы объекта. Например,
скорость и |
ускорение |
движения |
скипа подъемной установки н е |
Д о л ж н ы |
превысить |
значений, |
допустимых по условиям безо* |
пасности. Выполнение условных ограничений должна обеспечи вать система управления.
При постановке и решении задачи управления необходимо учи тывать естественные и условные ограничения на переменные x(t), *в (t) и у(/), которые в общем случае задаются в виде условий при
z
Рис. 11.3. Обобщенная функциональная схема системы оптимального управ*
ления
В зависимости от вида целевой функции (11.12) и уравнения статики (11.31) задача статической оптимизации может относиться к классу задач нелинейного или линейного программирования. Она является задачей линейного программирования, если линейны целевая функция, уравнение статики и ограничивающие уравне ния (11.27). В частном, но распространенном случае, когда целевая функция (11.12) или статическая зависимость (11.31) имеют экстре мальный характер, задача статической оптимизации становится задачей экстремального регулирования.
Задача управления объектом (11.8— 11.9) или (11.29— 11.30) по критерию типа (11.13) при ограничениях (11.27) называется
задачей динамической оптимизации. Разновидности задач динами ческой оптимизации и методы их решения будут рассмотрены далее.
Сформулированным постановкам задач статической и динами ческой оптимизации соответствует обобщенная функциональная схема системы оптимального управления (рис. 11.3). Кроме обыч ных частей, в системе имеется блок вычисления критерия БВК- Если внешние воздействия на объект и систему управления отсутствуют или заданы в виде конкретных функций, то задача управления называется детерминированной. Если воздействия имеют случайный характер, то задача называется стохастической.
В зависимости от |
полноты априорной |
и текущей |
информации |
о состоянии объекта, |
о возмущении г (t) |
и задании |
х 3 (/), имею |
щейся и поступающей в управляющее устройство, все системы оптимального управления разделяются на системы: с полной (мак симально возможной) информацией; с неполной информацией и пас сивным ее накоплением в процессе управления; с неполной инфор мацией и активным ее накоплением.
Системы с полной информацией работают по «жестким» законам управления с постоянными настроечными параметрами. Системы с пассивным и активным накоплением информации изучают усло вия работы объекта и изменяют законы управления согласно этим условиям, поэтому они называются адаптивными.
Т а б л и ц а |
11.1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Примеры задач оптимального управления |
|
|
|
|
|
|
|
|
|
|||||
Оптимизируемый |
Критерий |
|
Управляющее |
|
Ограничиваемая |
|||||||||
технологический |
оптимальности |
|
воздействие |
|
|
переменная |
|
|||||||
процесс |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Бурение |
взрывной |
Максимум скоро |
Усилие подачи |
|
Усилие подачи |
|
||||||||
скважины |
|
сти проходки |
Скорость боково |
Ток |
и |
температу |
||||||||
Выемка горной мас |
Максимум произ |
|||||||||||||
сы роторным |
эк |
водительности |
го |
перемещения |
ра |
нагрева двига |
||||||||
скаватором |
|
|
|
|
|
|
|
|
теля, вращающе |
|||||
|
|
|
|
|
|
|
|
|
|
го роторное коле |
||||
Погрузка |
горной |
Минимум |
дли |
Момент |
двигате |
со |
двигателя |
|
||||||
Ток |
|
|||||||||||||
массы карьерным |
тельности |
пово |
ля |
поворота |
|
|
|
|
|
|
||||
экскаватором |
|
рота экскаватора |
Момент |
привод |
Момент, скорость, |
|||||||||
Подъем |
груза из |
Минимум |
дли |
|||||||||||
шахты |
|
|
тельности |
одного |
ного двигателя |
|
ускорение |
двига |
||||||
Измельчение |
руды |
цикла |
подъема |
Подача |
руды |
в |
теля |
руды, |
со |
|||||
Максимум произ |
Подача |
|||||||||||||
|
|
|
водительности по |
мельницу |
|
держание |
частиц |
|||||||
|
|
|
готовому продук |
|
|
|
|
заданной |
крупно |
|||||
|
|
|
ту |
|
|
|
|
|
|
сти в готовом про |
||||
Флотационное |
обо |
Максимум |
коэф |
Подача реагентов |
дукте |
|
|
по |
||||||
Содержание |
||||||||||||||
гащение руды |
|
фициента |
извле |
во |
флотомашину |
лезного |
в |
компо |
||||||
|
|
|
чения |
полезного |
|
|
|
|
нента |
концен |
||||
Сушка |
рудного |
компонента |
Подача |
горячего |
трате |
|
|
|
||||||
Максимум |
коли |
Температура в су |
||||||||||||
концентрата |
|
чества удаляемой |
воздуха |
|
|
шильном барабане |
||||||||
Стабилизация |
вы |
влаги |
|
|
Материальные |
и |
Расходы |
материа |
||||||
Минимум диспер |
||||||||||||||
ходных и промежу |
сии |
отклонения |
энергетические |
|
лов |
и энергии |
|
|||||||
точных переменных |
от задания |
потоки |
|
|
|
|
|
|
|
|||||
технологического |
|
|
|
|
|
|
|
|
|
|
|
|
||
процесса |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В системах с активным накоплением информации управляющее воздействие одновременно с выполнением основной своей функции осуществляет такое изменение состояния объекта, при котором на капливается максимум информации об объекте и внешних воз действиях. В связи с двойственным характером управления его в таких адаптивных системах называется дуальным управлением.
Решение любой задачи оптимального управления и последую щая реализация найденного алгоритма в конкретной системе свя заны, как правило, с большими трудностями математического и тех нического характера. Поэтому при создании оптимальных систем стремятся либо предварительно упростить математическое описание объекта, либо реализовать алгоритм приближенно. Такие системы, синтезированные с упрощениями модели объекта или алгоритма управления, называются близкими к оптимальным или квазиоптимальными.
Примеры задач оптимального управления горно-технологиче скими объектами приведены в табл. 11.1.
11.2.Принцип максимума и метод динамического программирования
Втеории управления для оптимизации функционалов вида
(11.20) — (11-21) при наличии ограничений на векторы управления и состояния применяют принцип максимума и метод динамического программирования, разработанные в 1956— 1957 г. советским и аме
риканским математиками Л. С. Понтрягиным и Р. Веллманом на основе классических методов вариационного исчисления (Эйлера,
Лагранжа).
Принцип максимума Понтрягшш. Пусть объект управления описывается следующей системой нелинейных уравнений состо
яния
Xi (t)=fi [X1 (0, |
, Хл (/); Ух (0. |
. У» (01. i = 1; 2; . . . ; я, |
или в векторной форме |
(11.33) |
|
|
||
x ( t ) = f l x ( t ) , |
у (01. |
(11-34) |
Уравнения (11.33) не содержат в явном виде время / и описы вают так называемые стационарные или автономные объекты. Урав нения нестационарных объектов, для которых время t явно входит в функции ft, можно привести к виду (11.33), если вместо перемен
ной t рассматривать условную координату хя+1, заданную диффе
ренциальным уравнением
Я.+1 (0 = /п+г = 1 |
(11.35) |
и удовлетворяющую начальному условию хя+1 (0) = |
0. При этом |
к системе (11.33) добавится еще уравнение (11.35), |
а размерность |
пространства состояний станет равной л + 1. |
|
Положим, что нелинейные функции /| непрерывны по всем аргу ментам и непрерывно дифференцируемы по компонентам вектора состояния х . Исходя из физических соображений, принимаем также, что составляющие вектора управления у являются кусочно-непре рывными функциями времени, которые по модулю не превышают
заданные максимально допустимые значения ур,- |
|
|||
М О К у / * , |
/ = 1 ; 2; |
; т. |
(11.36) |
|
Ограничения (11.36) можно записать и в векторной форме: |
||||
W O K ft, |
или у (0 6 |
у , |
(11.37) |
|
г* Я ( 0 | и |
Ум— векторы-столбцы соответственно модулей |
и мак- |
||
мальных |
значений управляющих воздействий yj (/); У — огра |
ниченное множество в виде m-мерного параллелепипеда со сто ронами 2у,и.
В общем случае допустимые значения положительных и отри цательных управляющих воздействий могут быть различными, и тогда вместо ограничений (11.36) используют неравенства
Hi м^ Hi (0 ^ yfм, |
j — 1» 2; |
ш, |
(11.38) |
где y f > 0 и у г < |
0 — допустимые |
по техническим |
условиям |
значения соответственно положительных и отрицательных управ ляющих воздействий.
Задача оптимального управления заключается в следующем: среди всех допустимых управлений (11.36) или (11.38) необходимо найти такой вектор у (/), который переводит объект (11.34), из за данного начального состояния х (0) = х а в требуемое конечное
состояние х (tK) = |
х к и обеспечивает при этом минимум функцио |
|
нала |
|
|
Q = Qly(t)] = |
S fo[x(y, t), y(t)]dt, |
(11.39) |
|
о |
|
где функция /0 также удовлетворяет условиям гладкости, принятым
для функций |
а момент времени tKможет быть заранее заданным |
||
или свободным. |
|
|
|
Искомый вектор управления и соответствующий ему вектор |
|||
состояния называют оптимальными и обозначают |
у* (t) и х* (i). |
||
Введем в рассмотрение еще одну переменную состояния, опре |
|||
деляемую с помощью интеграла |
|
||
*о (0 = S /о I* |
У (O')] d О, |
(11.40) |
|
о |
|
|
|
где /о — функция |
из критерия (11.40) и 0 < Ф < |
1 < 1к. |
|
Очевидно, |
что |
|
|
х0(0)= 0 |
или |
x0 (tK) = Q. |
(11-41) |
Дифференцируя выражение (11.40) по аргументу O', получим |
|||
уравнение |
|
|
|
*о = Ы * ( 0 . У (01. |
(11-42) |
которое можно присоединить к исходной системе (11.33). Тогда
вместо (11.33) образуется расширенная система уравнений состоя ния
Xi{t) = fi[x{t), y ( t )], i = 0; 1; п. (11.43)
Вводя теперь в рассмотрение (л + 1)-мерный вектор состояния
х (0 = 1*о (*). x i (0 ...........х« (0 1Г» можно систему (11.43) записать в виде следующего векторного уравнения состояния:
i ( 0 = / l * ( Q . * ( 0 Ь |
(11.44) |
где f = [/„, f ) T — вектор правых частей системы (11.43).
Обратим внимание на то, что вектор-функция / не зависит от дополнительной переменной Хц.
Теперь исходную задачу управления можно сформулировать
так: среди всех допустимых управлений |
необходимо найти такое, |
|
которое дает решение х* (/) |
уравнения |
(11.44), удовлетворяющее |
граничным условиям дг(0) = |
*(0) == х в, |
х (tK) = х к и имеющее |
минимальную ординату хь (/*) точки дг* (/„) в расширенном (п + 1)- мерном пространстве состояния.
Для решения этой преобразованной задачи с использованием
принципа максимума |
вводят |
вспомогательную |
вектор-функцию |
||||
ф(/) = Itpo (0» Фж (0» |
•» фп (0 )г. |
|
компоненты |
которой |
ф4(/) |
||
удовлетворяют системе дифференциальных уравнений |
|
||||||
|
dfilxfl), |
у (0 1 |
I |
* = |
0; |
1; |
п, |
|
dxi (t) |
|
|||||
|
\х=х* * |
|
|
|
i=0
(11.45)
в которой частные производные определены вдоль оптимальной траектории х* (/)•
Так как ни одна из функций ft не зависит от переменной х0,
то уравнение |
(11.45) |
для |
вспомогательной |
переменной ф0 |
имеет |
вид ip®= 0, а |
сама |
переменная ф0 = const. |
уп |
||
Ф о р м у л и р о в к а |
п р и н ц и п а |
м а к с и м у м а : |
равляющее воздействие у (/) является оптимальным по критерию (11.39), если в любой момент времени скалярное произведение Н
вектор-функций ф(/) и / |
[х (/), у(/) ], вычисляемое вдоль оптималь |
||||
ной траектории х* (/), достигает максимума, т. е. если |
|
||||
я = я { ф ( 9 , / |
[ х (0, y { t ) \ \ = ^ Tf [ |
x (0, >(<)] = |
|
||
= z |
(0 fi Iх |
(0. |
У (01 = max, |
0< l < t K. |
(11.46) |
|
|
|
y ( 0 £ Y |
|
|
При этом вспомогательная функция ф„ (0 всегда будет пред ставлять собой неположительную константу, которую можно при нимать произвольной, например, ф0 = — 1.
В рассматриваемой задаче с функциями /| и /0, не зависящими явно от времени t, максимальное значение #*, соответствующее