Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Теория автоматического управления

..pdf
Скачиваний:
157
Добавлен:
15.11.2022
Размер:
16.96 Mб
Скачать

где е (0 — /-мерный вектор-столбец, образованный

из

ошибок

gj (/), еа (/),

• , е/ (/);

^ — диагональная неотрицательно опре­

деленная (/ X /)-матрица

весовых коэффициентов qlt

q2,

, qu

оценивающих степень нежелательности отклонений выходных пе­ ременных XtB(/) от своих заданий x t 3 (/).

Во многих задачах управления квадрат управляющего воздейст­ вия у (/) пропорционален мощности, потребляемой управляющим устройством или самим объектом, а интеграл этого квадрата по времени пропорционален, следовательно, энергии, расходуемой на управление. Поэтому часто используют критерий минимума рас­ хода энергии

т *

 

/

 

 

Q" = E M

K//?(Od * =

$ V ( /) r y ( /) d f - > m in ,

(11.18)

i=i

о

о

у (/)

 

где г — диагональная положительно

определенная

(т х т)-мат­

рица весовых коэффициентов r lt г 2,

, гт, соответствующих стои­

мостям энергии отдельных управляющих воздействий.

В некоторых задачах

управляющее воздействие

у (/) есть не

что иное как расход топлива, сырья или катализатора. В таких случаях для многомерного объекта применяют критерий минимума расхода материального ресурса

т

Qn = Е

S

Г(\У( (01 d /- * m in .

(11.19)

i=i

о

у (0

 

Наибольшее распространение в современной теории управле­ ния получил обобщенный квадратичный критерий качества функ­ ционирования

IQn =

<\[гТ (t) qe( t) + y T (t) ry (/)] d/ ->-min,

(11.20)

I

о

У (0

 

соединяющий в себе требование минимума отклонений выходных переменных (критерий максимальной точности (11.17)) и критерий минимума расхода энергии (11.18).

Встречаются задачи управления, в которых, наряду с качеством функционирования системы во время переходного процесса, тре­

буется оценивать точность в

конечном состоянии объекта. Тогда

к обобщенному критерию (11.20) добавляется составляющая

<3п(/к) = 8г (/к)<7к8(/к),

(И.21)

где qK— матрица весовых коэффициентов, оценивающих степень нежелательности отклонений конечного состояния объекта от за­ данного.

При случайном характере внешних воздействий х 3 (/) и г (/) компоненты вектора отклонений е (/) и управлений у (/) также

371

будут случайными сигналами, и критерий оптимальности опреде­ ляют как среднее значение функционала (11.13) на достаточно большом интервале времени:

1 *к

(11.22)

Q= Пш —— \ Q(t) d t.

/к-°° <к о

Иногда в таких случаях среднее значение первичного критерия находят усреднением не по времени, а по множеству. Например, если известна функция w (г) плотности вероятности совместного

распределения компонентов вектора г, то среднее значение Q может быть получено интегрированием по всей области Z изменения

случайных величин

z1( z2,

, z„:

 

0. = М г {Q} = $

Q (г) w (z) dZ (z)

(11.23)

Z( z )

 

 

 

где M z{

} — знак математического ожидания случайной величины;

dZ (г) =

dZidZj

dz„ — бесконечно малый элемент указанной

области n-мерного пространства Z.

Если величина Q в выражениях (11.22) и (11.23) является по­

казателем потерь, то ее математическое ожидание Q называют

средним риском.

В случаях, когда закон распределения w (z) возмущения г за­ ранее не известен, а известны лишь диапазоны изменения компо­

нентов вектора г, можно

применять критерий минимакса

Qn (у , г) min (max)

(11.24)

уг

или критерий максимина

QB(у, z ) m a x (min).

(11.25)

Уz

Оптимизация по критерию (11.24) или (11.25) позволяет выбрать такое управление у*, которое обеспечивает наилучший результат Q’ или Q* при наиболее неблагоприятном сочетании компонентов

вектора возмущений г. Наглядное представление об этих крите­ риях дает зависимость Qn (у, г) в виде гиперболического парабо­ лоида (рис. 11.2), имеющего так называемую седловую точку. Оче­ видно, что в этом примере для показателя потерь Q„ наиболее не­ благоприятное значение г* возмущения всегда соответствует гребню параболоида, а наилучшее значение у* управления — низшей точке этого гребня.

Недостаток минимаксного и максиминного критериев в том, что в более легких условиях они дают худшие результаты, чем, например, критерий среднего риска. Поэтому их целесообразно

372

Рис. 11.2. Минимаксный критерий оптимальности

применять лишь когда неизвестны статистические характеристики внешних воздействий.

Ограничения на процесс управления. Различают два вида огра­ ничений: естественные и условные. Естественными ограничени­

ями являются

физические

законы, в соответствии

с

которыми

функционируют объект управления и управляющее

устройство.

При

математической постановке

задачи управления

эти ограни­

чения

представляются

в виде дифференциальных

и

алгебраи­

ческих уравнений объекта

типа

(11.8) и (11.9).

К

естествен­

ным

относятся

также

ограничения значений переменных х (*),

х в (!)

и у (t),

обусловленные

особенностями

конструкции

объекта и управляющего устройства. Например, частота вращения

асинхронного двигателя н е м о ж е т

быть больше синхронной,

выходной сигнал усилителя н е м о ж е т

принять значения, боль­

шие, чем уровень насыщения. Такие ограничения действуют сами по себе, независимо от желания конструктора системы.

Условные ограничения на эти же переменные устанавливает кон­ структор системы, стремясь не допустить аварийных или какихлибо иных нежелательных режимов работы объекта. Например,

скорость и

ускорение

движения

скипа подъемной установки н е

Д о л ж н ы

превысить

значений,

допустимых по условиям безо*

пасности. Выполнение условных ограничений должна обеспечи­ вать система управления.

При постановке и решении задачи управления необходимо учи­ тывать естественные и условные ограничения на переменные x(t), (t) и у(/), которые в общем случае задаются в виде условий при­

надлежности

векторов х

(/),

х B(t)

и y(t)

к некоторым замкнутым

множествам:

 

 

 

 

 

x ( t ) e X ,

х в (t) 6 Х в,

у (0 6 Y,

 

(11.26)

где X, Х в,

Y — замкнутые

множества,

заданные соответственно

в п-, I- и m-мерных пространствах.

Обычно ограничения (11.26) задаются в виде алгебраических

уравнений или

неравенств:

 

 

f-i (xlt

х2,

 

хп) ^

0;

р/ (XjB, х2в,

Xi в) ^ 0;

Vfc ( У ъ

У ъ

 

У т )

>

0 ,

 

(11.27)

 

 

 

где 0 < i

< п;

0 <

/

<

/;

0 <; k < т.

 

В наиболее простых задачах управления ограничения на ком­

поненты

векторов

х (t),

х в (0 и у (/)

накладываются независимо

друг от друга — в виде ограничений по модулю отдельных компо­ нентов:

|*г|<*<м , |х,-в| < х.в.м, \yi\<y(M,

(11.28)

где хгм, хгв.м, Уы — максимально возможные

или допустимые зна­

чения компонентов.

 

Основными ограничениями в задачах оптимального управления

являются уравнение состояния (11.8) и уравнение выхода (11.9), связывающие между собой все переменные объекта. С целью упро­ щения задачи эти нелинейные уравнения стремятся заменить ли­ нейными в следующей типовой форме (см. 2.9):

x( t) = Ax( t) + By (t) + z(t),

 

 

 

(11.29)

x B(t) = Cx(t) + Dy(t) + g(t).

 

 

(11.30)

Виды задач оптимизации.

Тип задачи управления

зависит от

характера внешних воздействий

и режима

работы объекта.

Если

воздействия

постоянны

или

меняются

медленно,

то

объект

работает в установившемся

режиме, вектор х (t) = 0

и объект

описывается алгебраическим уравнением статики

 

 

Хв = /в{у,

г, ff),

 

 

 

 

(11.31)

которое для линеаризованного объекта (11.29), (11.30) принимает вид

Хв = Куу — Квг + g,

(11.32)

где Ку = D — CA-1B, Кв = СА

Задача управления объектом (11.31) или (11.32) по критерию (11.12) при ограничениях (11.27) называется задачей статической оптимизации.

374

z

Рис. 11.3. Обобщенная функциональная схема системы оптимального управ*

ления

В зависимости от вида целевой функции (11.12) и уравнения статики (11.31) задача статической оптимизации может относиться к классу задач нелинейного или линейного программирования. Она является задачей линейного программирования, если линейны целевая функция, уравнение статики и ограничивающие уравне­ ния (11.27). В частном, но распространенном случае, когда целевая функция (11.12) или статическая зависимость (11.31) имеют экстре­ мальный характер, задача статической оптимизации становится задачей экстремального регулирования.

Задача управления объектом (11.8— 11.9) или (11.29— 11.30) по критерию типа (11.13) при ограничениях (11.27) называется

задачей динамической оптимизации. Разновидности задач динами­ ческой оптимизации и методы их решения будут рассмотрены далее.

Сформулированным постановкам задач статической и динами­ ческой оптимизации соответствует обобщенная функциональная схема системы оптимального управления (рис. 11.3). Кроме обыч­ ных частей, в системе имеется блок вычисления критерия БВК- Если внешние воздействия на объект и систему управления отсутствуют или заданы в виде конкретных функций, то задача управления называется детерминированной. Если воздействия имеют случайный характер, то задача называется стохастической.

В зависимости от

полноты априорной

и текущей

информации

о состоянии объекта,

о возмущении г (t)

и задании

х 3 (/), имею­

щейся и поступающей в управляющее устройство, все системы оптимального управления разделяются на системы: с полной (мак­ симально возможной) информацией; с неполной информацией и пас­ сивным ее накоплением в процессе управления; с неполной инфор­ мацией и активным ее накоплением.

Системы с полной информацией работают по «жестким» законам управления с постоянными настроечными параметрами. Системы с пассивным и активным накоплением информации изучают усло­ вия работы объекта и изменяют законы управления согласно этим условиям, поэтому они называются адаптивными.

Т а б л и ц а

11.1

 

 

 

 

 

 

 

 

 

 

 

 

Примеры задач оптимального управления

 

 

 

 

 

 

 

 

 

Оптимизируемый

Критерий

 

Управляющее

 

Ограничиваемая

технологический

оптимальности

 

воздействие

 

 

переменная

 

процесс

 

 

 

 

 

 

 

 

 

 

 

 

 

Бурение

взрывной

Максимум скоро­

Усилие подачи

 

Усилие подачи

 

скважины

 

сти проходки

Скорость боково­

Ток

и

температу­

Выемка горной мас­

Максимум произ­

сы роторным

эк­

водительности

го

перемещения

ра

нагрева двига­

скаватором

 

 

 

 

 

 

 

 

теля, вращающе­

 

 

 

 

 

 

 

 

 

 

го роторное коле­

Погрузка

горной

Минимум

дли­

Момент

двигате­

со

двигателя

 

Ток

 

массы карьерным

тельности

пово­

ля

поворота

 

 

 

 

 

 

экскаватором

 

рота экскаватора

Момент

привод­

Момент, скорость,

Подъем

груза из

Минимум

дли­

шахты

 

 

тельности

одного

ного двигателя

 

ускорение

двига­

Измельчение

руды

цикла

подъема

Подача

руды

в

теля

руды,

со­

Максимум произ­

Подача

 

 

 

водительности по

мельницу

 

держание

частиц

 

 

 

готовому продук­

 

 

 

 

заданной

крупно­

 

 

 

ту

 

 

 

 

 

 

сти в готовом про­

Флотационное

обо­

Максимум

коэф­

Подача реагентов

дукте

 

 

по­

Содержание

гащение руды

 

фициента

извле­

во

флотомашину

лезного

в

компо­

 

 

 

чения

полезного

 

 

 

 

нента

концен­

Сушка

рудного

компонента

Подача

горячего

трате

 

 

 

Максимум

коли­

Температура в су­

концентрата

 

чества удаляемой

воздуха

 

 

шильном барабане

Стабилизация

вы­

влаги

 

 

Материальные

и

Расходы

материа­

Минимум диспер­

ходных и промежу­

сии

отклонения

энергетические

 

лов

и энергии

 

точных переменных

от задания

потоки

 

 

 

 

 

 

 

технологического

 

 

 

 

 

 

 

 

 

 

 

 

процесса

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В системах с активным накоплением информации управляющее воздействие одновременно с выполнением основной своей функции осуществляет такое изменение состояния объекта, при котором на­ капливается максимум информации об объекте и внешних воз­ действиях. В связи с двойственным характером управления его в таких адаптивных системах называется дуальным управлением.

Решение любой задачи оптимального управления и последую­ щая реализация найденного алгоритма в конкретной системе свя­ заны, как правило, с большими трудностями математического и тех­ нического характера. Поэтому при создании оптимальных систем стремятся либо предварительно упростить математическое описание объекта, либо реализовать алгоритм приближенно. Такие системы, синтезированные с упрощениями модели объекта или алгоритма управления, называются близкими к оптимальным или квазиоптимальными.

Примеры задач оптимального управления горно-технологиче­ скими объектами приведены в табл. 11.1.

11.2.Принцип максимума и метод динамического программирования

Втеории управления для оптимизации функционалов вида

(11.20) — (11-21) при наличии ограничений на векторы управления и состояния применяют принцип максимума и метод динамического программирования, разработанные в 1956— 1957 г. советским и аме­

риканским математиками Л. С. Понтрягиным и Р. Веллманом на основе классических методов вариационного исчисления (Эйлера,

Лагранжа).

Принцип максимума Понтрягшш. Пусть объект управления описывается следующей системой нелинейных уравнений состо­

яния

Xi (t)=fi [X1 (0,

, Хл (/); Ух (0.

. У» (01. i = 1; 2; . . . ; я,

или в векторной форме

(11.33)

 

x ( t ) = f l x ( t ) ,

у (01.

(11-34)

Уравнения (11.33) не содержат в явном виде время / и описы­ вают так называемые стационарные или автономные объекты. Урав­ нения нестационарных объектов, для которых время t явно входит в функции ft, можно привести к виду (11.33), если вместо перемен­

ной t рассматривать условную координату хя+1, заданную диффе­

ренциальным уравнением

Я.+1 (0 = /п+г = 1

(11.35)

и удовлетворяющую начальному условию хя+1 (0) =

0. При этом

к системе (11.33) добавится еще уравнение (11.35),

а размерность

пространства состояний станет равной л + 1.

 

Положим, что нелинейные функции /| непрерывны по всем аргу­ ментам и непрерывно дифференцируемы по компонентам вектора состояния х . Исходя из физических соображений, принимаем также, что составляющие вектора управления у являются кусочно-непре­ рывными функциями времени, которые по модулю не превышают

заданные максимально допустимые значения ур,-

 

М О К у / * ,

/ = 1 ; 2;

; т.

(11.36)

Ограничения (11.36) можно записать и в векторной форме:

W O K ft,

или у (0 6

у ,

(11.37)

г* Я ( 0 | и

Ум— векторы-столбцы соответственно модулей

и мак-

мальных

значений управляющих воздействий yj (/); У — огра­

ниченное множество в виде m-мерного параллелепипеда со сто­ ронами 2у,и.

В общем случае допустимые значения положительных и отри­ цательных управляющих воздействий могут быть различными, и тогда вместо ограничений (11.36) используют неравенства

Hi м^ Hi (0 ^ yfм,

j — 1» 2;

ш,

(11.38)

где y f > 0 и у г <

0 — допустимые

по техническим

условиям

значения соответственно положительных и отрицательных управ­ ляющих воздействий.

Задача оптимального управления заключается в следующем: среди всех допустимых управлений (11.36) или (11.38) необходимо найти такой вектор у (/), который переводит объект (11.34), из за­ данного начального состояния х (0) = х а в требуемое конечное

состояние х (tK) =

х к и обеспечивает при этом минимум функцио­

нала

 

 

Q = Qly(t)] =

S fo[x(y, t), y(t)]dt,

(11.39)

 

о

 

где функция /0 также удовлетворяет условиям гладкости, принятым

для функций

а момент времени tKможет быть заранее заданным

или свободным.

 

 

Искомый вектор управления и соответствующий ему вектор

состояния называют оптимальными и обозначают

у* (t) и х* (i).

Введем в рассмотрение еще одну переменную состояния, опре­

деляемую с помощью интеграла

 

*о (0 = S /о I*

У (O')] d О,

(11.40)

о

 

 

 

где /о — функция

из критерия (11.40) и 0 < Ф <

1 < 1к.

Очевидно,

что

 

 

х0(0)= 0

или

x0 (tK) = Q.

(11-41)

Дифференцируя выражение (11.40) по аргументу O', получим

уравнение

 

 

 

*о = Ы * ( 0 . У (01.

(11-42)

которое можно присоединить к исходной системе (11.33). Тогда

вместо (11.33) образуется расширенная система уравнений состоя­ ния

Xi{t) = fi[x{t), y ( t )], i = 0; 1; п. (11.43)

Вводя теперь в рассмотрение (л + 1)-мерный вектор состояния

х (0 = 1*о (*). x i (0 ...........х« (0 1Г» можно систему (11.43) записать в виде следующего векторного уравнения состояния:

i ( 0 = / l * ( Q . * ( 0 Ь

(11.44)

где f = [/„, f ) T — вектор правых частей системы (11.43).

Обратим внимание на то, что вектор-функция / не зависит от дополнительной переменной Хц.

Теперь исходную задачу управления можно сформулировать

так: среди всех допустимых управлений

необходимо найти такое,

которое дает решение х* (/)

уравнения

(11.44), удовлетворяющее

граничным условиям дг(0) =

*(0) == х в,

х (tK) = х к и имеющее

минимальную ординату хь (/*) точки дг* (/„) в расширенном (п + 1)- мерном пространстве состояния.

Для решения этой преобразованной задачи с использованием

принципа максимума

вводят

вспомогательную

вектор-функцию

ф(/) = Itpo (0» Фж (0»

•» фп (0 )г.

 

компоненты

которой

ф4(/)

удовлетворяют системе дифференциальных уравнений

 

 

dfilxfl),

у (0 1

I

* =

0;

1;

п,

 

dxi (t)

 

 

\х=х* *

 

 

 

i=0

(11.45)

в которой частные производные определены вдоль оптимальной траектории х* (/)•

Так как ни одна из функций ft не зависит от переменной х0,

то уравнение

(11.45)

для

вспомогательной

переменной ф0

имеет

вид ip®= 0, а

сама

переменная ф0 = const.

уп­

Ф о р м у л и р о в к а

п р и н ц и п а

м а к с и м у м а :

равляющее воздействие у (/) является оптимальным по критерию (11.39), если в любой момент времени скалярное произведение Н

вектор-функций ф(/) и /

(/), у(/) ], вычисляемое вдоль оптималь­

ной траектории х* (/), достигает максимума, т. е. если

 

я = я { ф ( 9 , /

[ х (0, y { t ) \ \ = ^ Tf [

x (0, >(<)] =

 

= z

(0 fi Iх

(0.

У (01 = max,

0< l < t K.

(11.46)

 

 

 

y ( 0 £ Y

 

 

При этом вспомогательная функция ф„ (0 всегда будет пред­ ставлять собой неположительную константу, которую можно при­ нимать произвольной, например, ф0 = — 1.

В рассматриваемой задаче с функциями /| и /0, не зависящими явно от времени t, максимальное значение #*, соответствующее

оптимальному

управлению у* (/),

является

константой на всем

интервале 0 <

t <

4, т. е.

 

 

H* = H{q*(t),

x*{t),

у* (^)) =

const,

(11.47)

а в частном случае, когда

конечный момент времени tH не задан,

Н* тождественно равно нулю.

Заметим, что в общем случае для нелинейного объекта (11.33), (11.34) условие (11.46) принципа максимума является необходимым, а для объекта с линейными функциями / г — одновременно и доста­ точным.

Применительно к механическим объектам управления функции fi означают обобщенные скорости движения, функции — обоб­ щенные импульсы (количества движения), а гамильтониан Н вы­ ражает полную механическую энергию, равную сумме кинетиче­ ской и потенциальной энергии. Как известно, полная энергия кон­ сервативной механической системы остается в процессе движения неизменной и равной нулю. Всякое уменьшение полной энергии будет свидетельствовать о диссипативных потерях (на трение и т. д.), и следовательно, о неоптимальности движения. Именно поэтому гамильтониан Н согласно принципу Понтрягина должен быть мак­ симальным.

Принцип максимума позволяет во многих практических слу­ чаях выбрать оптимальный вектор управления у* (/) непосредст­ венно по виду зависимости скалярной величины Н от вектор-функ­ ции у (/), и обойтись тем самым без решения сложной вариационной задачи на условный экстремум. При этом оптимальный закон уп­ равления у* (/) удается выразить через вспомогательные функции

(О- Вспомогательные функции ф* (/) удобно находить из симмет­

ричной системы уравнений

' d x j d t =

dHIcNpi)

 

 

 

(i = 0; 1;

n)

(11.48)

, d % / d / =

дШдъ,

 

 

объединяющей уравнения объекта (11.44) и вспомогательные урав­ нения (11.45) и называемой системой Гамильтона (именно поэтому величину Н называют иногда гамильтонианом).

В том, что система Гамильтона (11.48) действительно объеди­ няет указанные уравнения, нетрудно убедиться, если учесть, что

дн

П

h и (11.49)

ОД

Пример 1. Проиллюстрируем методику решения задач оптимального управления с использованием принципа максимума на сравнительно прос­ том примере. Пусть имеется линейный объект

w о (Р) = (Р)!у (Р) = 0/р 2,

(11.50)

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]