Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Системы экстремального управления

..pdf
Скачиваний:
10
Добавлен:
19.11.2023
Размер:
33.28 Mб
Скачать

миогоэкстремальной, но необходимо, чтоб^1 глобальный экстремум мог быть определен аналитически. Таким обра­ зом, предполагается, что задача

Q (X, 0) —> min

(20.7.35)

xes

 

имеет известное решение X*, полученное либо аналитичеческим, либо поисковым путем. Этим, по сути дела, зада­ ча тоже «сглаживается», но не при помощи сглаживающе­ го оператора, а путем упрощения. Оператор упрощения не имеет формальной записи, как оператор сглаживания, и целиком зависит от характера решаемой задачи. Его действие заключается в выделении из множества всех неоптимизируемых параметров объекта подмножества па­ раметров А, обладающих указанным свойством. При отсут­ ствии формального описания оператора упрощения эту операцию следует производить эвристически при хорошем понимании механизма функционирования и структуры объекта.

Дальнейшие действия опираются на следующие пред­ положения: если вводить параметры А постепенно от 0 до А при одновременной локальной оптимизации из состоя­ ния X *, то при этом определяется глобальный экстремум. Это означает, что решается задача

Q (X, аА) min

(20.7.36)

xes

 

при изменении а от 0 до 1 и начальных условиях (при а =

=0) X = X*. В оправдание сказанного можно привести следующие соображения. Действительно, если при а =

=1 имеем многоэкстремальную задачу, которую можно представить в виде (20.7.1), то быстроизменяющаяся со­ ставляющая, вносящая многоэкстремальность, при а = 0 должна исчезать. Следовательно, исходная функция ка­ чества имеет следующую структуру:

Q (X) = <?, (X) + Ы), (X).

(20.7.37)

Как видно, в этом случае решение задачи (20.7.36) дает возможность определить положение глобального экстре­ мума, так как он расположен вблизи локального экстре-

мума, полученного при решении задачи (20.7.35), т. е.

Х * ~ Х * * .

(20.7.38)

Следует заметить, что указанное предположение имеет эвристический характер и не доказано для всех возможных случаев. Однако многочисленные эксперименты подтверж­ дают это предположение. Для иллюстрации обратимся к уже рассмотренному в этом параграфе примеру (см. стр. 527). Здесь А = а; х* = 0 и х** = 0. Как видпо, ме­ тод упрощения решает поставленную задачу.

Рис. 21.1.1. Блок-схема беспоисковой системы экстремаль­ ного управнения.

Г Л А В А 21

БЕСПОИСКОВЫЕ СИСТЕМЫ ЭКСТРЕМАЛЬНОГО

УПРАВЛЕНИЯ

§ 21.1. Постановка задачи. Примеры

Поиск как метод сбора информации для организации экстремального управления является неприятной необхо­ димостью. Это — плата за информацию, если другим спо­ собом информацию добыть невозможно (например, в слу ­ чае экстремального управления черным ящиком).

Неудобства поиска имеют двоякий характер. Это, прежде всего, временное затраты, связанные с необходи­ мостью делать поисковые ша­ ги и, следовательно, измерять показатель качества в новом состоянии, что значительно снижает быстродействие си­ стемы экстремального управ­

ления.

С другой стороны, реаль­ ные объекты (а не их матема­ тические модели), как пра­ вило, не терпят всякого рода

поисковых сигналов. Действительно, например, трудно представить, что технолога убедят соображения о необходи­ мости изменения технологического режима работающего процесса только ради информации, которая, возможно, будет использована в будущем. Поисковые сигналы всег­ да вносят возмущение в работу объекта, и очень редко эти возмущения улучшают его работу.

Поэтому появляется насущная необходимость изба­ виться от поиска в процессах экстремального управления реальными объектами. Этому способствует то обстоятель­ ство, что всегда об объекте известно нечто большее, чем необходимо при реализации поиска. Ведь поиск предназ­ начен для управления объектами типа «черный ящик», в то время как реальные системы представляют скорее «серый ящик».

Таким образом, задача беспоискового экстремального управления сводится к использованию априорных све­ дений об объекте (т. е. к учету его «серости») с тем, чтобы без поиска получить информацию, достаточную для син­ теза управления, переводящего объект в экстремальное состояние.

Блок-схема беспоисковой системы экстремального уп­ равления показана на рис. 21.1.1. Здесь X (t) — вектор входа — возбуждение объекта (обычно это — случайный процесс с определенными, иногда неизвестными, свой­ ствами):

X (t) =

[ху (t), x h (*)],

(21.1.1)

U — вектор оптимизируемых параметров объекта:

U = (u1?

ип),

(21.1.2)

Y (t) — вектор выхода объекта:

Y (t) = [ух (t),

ут (t)],

(21.1.3)

который связан с векторами X и U оператором F объекта

Y = F ( X , U),

(21.1.4)

структура которого в значительной мере известна. Это означает, что выход объекта может быть точно вычислен, коль скоро будет доопределен оператор F и будут заданы его входы X и параметры U. Знание структуры операто­ ра F и естьтаинформация, которая необходимадля син­ теза управляющего устройства Y Y , реализующего ал­ горитм экстремального управления. Экстремальность при этом заключается в требовании минимизации некоторого функционала Ф, заданного на выходах объекта:

0 = ф(У)_+ min,

(21.1.5)

ues

 

где функционал Ф предполагается заданным вместе с S-об­ ластью допустимых значений оптимизируемых параметров объекта uv ., ип. Обычно в качестве функционала Ф берут интеграл

т

Ф (У )= $ (()]*,

(21.1.6)

О

где функция ф (•) задана.

Для решения поставленной задачи управляющему устройству часто необходимо иметь информацию не толь­ ко о выходе объекта Y (t), но и его входе X (t), что и отра­ жено па рис. 21.1.1.

Как нетрудно заметить, показатель качества объекта в конечном счете зависит только от управляемых парамет­ ров объекта U:

Q = Q (U),

(21.1.7)

но в отличие от поискового метода решепия поставленной задачи следует найти беспоисковый алгоритм определения оптимального вектора Z7*, минимизирующего Q на задан­ ном множестве S :

Q (и *) < Q (и ) для

и , и * е s.

(21.1.8)

Задача, таким образом, заключается в синтезе беспо-

искового алгоритма функционирования

управляющего

 

устройства, которое поддер­

 

живало бы параметры U объ­

 

екта в оптимальном состоя­

 

нии независимо от изменения

 

объекта F и свойств его вхо­

 

да X (t).

случае, когда

 

В частном

Рис. 21.1.2. Блок-схема по­

свойства объекта неизменны,

задача заключается в опреде­

исковой системы экстремаль­

ного управления.

лении его оптимальных пара­

метров (точнее, задача сво­ дится к синтезу алгоритма, дающего возможность опреде­ лить оптимальные параметры без процедуры поиска).

Почему поиск плох при решении поставленной задачи? Для ответа на этот вопрос рассмотрим поисковую систему экстремального управления, решающего задачу (21.1.5).

Эта система показана на рис. 21.1.2. Здесь блок Ф оп­ ределяет критерий оптимизации Q, который минимизи­ руется многоканальным оптимизатором путем воздействия на параметры U объекта. Как видно, для реализации этой схемы не требуется знания вида операторов F и Ф (они могут считаться черными ящиками). Однако это уп­ рощение получено дорогой ценой — значительным уве­ личением времени отыскания оптимального решения U*. Действительно, закрывая глаза на вид операторов F и Ф,

мы действуем вслепую и «добываем» при помощи поиска информацию, которая могла бы быть получена путем вы­ числений. Естественно, что подобное поведение неопти­ мально с точки зрения временных затрат. Более того, при достаточно быстром дрейфе характеристик объекта поиско­ вая оптимизация попросту может не успеть за быстрым из­ менением свойств объекта и возмущения X (f). В этом слу­ чае быстродействие системы оптимизации является опре­ деляющим и поисковый подход неприменим.

Рассмотрим основы беспоисковой оптимизации. Как обычно, при определении положения экстремума U* про­ ще всего использовать градиентный метод, т. е. восполь­ зоваться соотношением (15.1.13)

= — a gràd Q {U)

(21.1.9)

или в дискретном случае

UN+1 = UN- a grad Q(UN).

(21.1.10)

Здесь gFad Q обозначает оценку градиента показателя ка­ чества. При оценке градиента, т. е. при определении

grad Q(U), следует воспользоваться информацией о струк­ туре объекта. Эта информация дает возможность определять оценку градиента без поиска, а путем вычислений. В этом и состоит особенность беспоисковых систем экстремаль­ ного управления. Они используют, как правило, обыч­ ный градиентный метод, но оценка градиента (или како­ го-либо другого целесообразного направления спуска) производится аналитически, т. е. минуя громоздкую про­ цедуру поисковых шагов. Такое несомненно изящное ре­ шение получено ценой усложнения управляющего устрой­ ства, которому следует вычислять оценку градиента пока­ зателя качества вместо реализации простой программы поисковых шагов.

Для иллюстрации задачи беспоискового экстремально­ го управления рассмотрим несколько примеров.

П р и м е р ! О д н о м е р н а я з а д а ч а р е г у ­ л и р о в а н и я по о т к л о н е н и ю . Эта задача в про­ стейшем безынерционном случае формулируется следующим образом. Пусть имеем объект у = F (и), где F — монотон­ ная функция. Необходимо определить такой вход и*,

чтобы выход этого объекта наименьшим образом отличался от заданного у*. Это эквивалентно решению следующей экстремальной задачи: Q (и) = [Z1(и) у*]2 min (го-

U

воря проще, нужно решить уравнение F (и*) у*, когда функция F неизвестна).

Решим эту задачу методом градиента, т. е. пусть ско­ рость изменения и будет пропорциональна градиенту по­

казателя Q (в данном случае производной-^- = — р

а)

б)

Рис. 21.1.3. Пример системы регулирования по отклонению: а) ска­ лярной, б) векторной.

Получаем уравнение

управляющего устройства du/dt =

= —р' LF (и) — у*],

где р' — некоторая постоянная,

знак которой совпадает с наклоном характеристики объекта, т. е. signp' = s ig n ^ . (Заметим, что, строго говоря, величи­

на р/ должна зависеть от и, так как она получается в ре-

dp

зультате дифференцирования невязки: р'=2р -гг- . Однако

Ut

удобно считать р' постоянной. В этом случае оптимизация производится не по градиенту, а в соответствии суравнением

du

U

dQ

сходимости про­

~dT ~

IfF/dt

' "du ’ чт0 не иаРУшает

цесса ввиду монотонности функции F.) Нетрудно показать,

что решение уравнения для и при £—»- оо

стремится к опти­

мальному, т. е. lim и (t) — и*, что и решает поставленную

/—*■ 00

задачу.

Блок-схема устройства, решающего поставленную экст­ ремальную задачу, показана на рис. 21.1.3, а. Как видно, получилась обычная схема регулирования по отклонению.

П р и м е р 2. М н о г о м е р н а я з а д а ч а р е ­ г у л и р о в а н и я по о т к л о н е н и ю б е з ь т н е р - ц и о н н ы х о б ъ е к т о в . Эта задача ставится аналогич­

но, но в векторном виде. Пусть объект Y =

F (U) представ­

ляет

собой

монотонную функцию,

т. е. s

i

g n

= const

(i =

1,

.,

n). Это означает, что

частные

dui

u<=s

производные

сохраняют свой знак во всей области допустимого управ­

ления

S.

 

 

Входом и выходом объекта являются векторы размер­

ности

n :Y =

., j/n), U = (uj,

., un). Необхо­

димо синтезировать

такую систему управления, которая

Рис. 21.1.4. Блок-схема беспоисковой системы экстремального уп­ равления для оптимизации работы регулятора.

бы решала задачу определения входа объекта U, миними­ зирующего уклонение его вида от заданного Y *, что экви­ валентно решению следующей экстремальной задачи:

Q (U)= \F(U) — Y* | 2->-min (проще говоря, необходи­

мее

мо решить векторное уравнение F (U*) = Y *, когда функ­ ция F неизвестна).

Будем решать эту задачу методом градиента. dU/dt = = —р grad Q (U) или после необходимых преобразований

и упрощений

dU/dt — —М' [F (U) — У*], где М' — век-

 

-

.

ЭР

тор-столбец, составляющие которого равны p.j = Vjsign

(i = 1,

., n).

Ui

на

Блок-схема

управляющего устройства показана

рис. 21.1.3, б.

Как видно, получена обычная многомерная система регулирования по отклонению.

П р и м е р З . О п р е д е л е н и е о п т и м а л ь н ы х п а р а м е т р о в р е г у л я т о р а . В процессе управле-

ния объектом с изменяющимися параметрами необходи­ мо соответственно изменять и параметры регулятора, чтобы процесс управления был оптимальным. На рис. 21.1.4 показана блок-схема беспоискового экстремального уп­ равления системой регулирования. Здесь свойства объектаТизменяются во времени под действием фактора Е.

Более того, свойства возмущения у* (t) также могут из­ меняться. Поэтому управляющее устройство УУ должно так изменять параметры U регулятора, чтобы поддержи­ вать в экстремальном состоянии некоторый показатель ра­

боты

контура системы регулирования.

Очевидно, что

алгоритм работы

управляющего

устройства

должен

иметь

беспоисковый

характер, так

как

введение поиска

внесло

бы нежелательные колебания в

контуре

регули­

рования.

 

с м о д е л ь ю .

П р и м е р 4. У п р а в л е н и е

Очень

часто объект и среда, в которой

функционирует

объект, изменяются, в то время как необходимо иметь за­ данные свойства объекта. Для этого, например, в обратную связь объекта вводят регулятор, параметры которого сле­ дует изменять так, чтобы сохранить динамические свойства системы объект—регулятор (рис. 21.1.5, а). Требуемые свойства системы объект — регулятор реализуются в виде модели, выход которой сопоставляется с выходом объ­ екта и результат поступает на управляющее устройство

УУ. Это устройство изменяет параметры регулятора так, чтобы минимизировать рассогласование между выходами объекта и его модели, т. е. минимизировать функцию вида

Q (U) = (t) — рм (i)]2 min для всех значений t. Если

и

располагать только этой информацией, то поставленную задачу может решить только поиск. Однако, имея сведе­

ния о структуре мо­

 

 

дели, объекта и регу­

 

 

лятора и

зная

со­

 

 

стояние

входа

х (t),

 

 

можно построить бес-

 

 

поисковую

систему

 

уш-уш

экстремального • [уп­

 

равления, минимизи­

 

 

рующуюневязку

U)

 

 

при некоторых изме­

 

 

нениях объекта, вно­

Рис. 21.1.6. Блок-схема системы беспо-

симых

неизвестным

исковой идентификации объекта.

фактором

Е.

(Заме­

может быть введен не в обратную

тим, что

регулятор

связь объекта, как показано на

рис. 21.1.5, а, а постав­

лен последовательно с объектом

(рис. 21.1.5, б).)

П р и м е р 5. Б е с п о и с н о в а я и д е н т и ф и ­

к а ц и я

о б ъ е к т о в . Эта задача возникает в случае,

когда необходимо иметь непрерывно подстраиваемую мо­ дель изменяющегося объекта. Блок-схема системы беспоисковой идентификации показана на рис. 21.1.6. Здесь на объект и его модель, структура которой задана, подает­

ся входное

воздействие

X (t). Вектор невязки выходов

объекта и

его модели

Y (t) — FM{t) и вход X (t)

являются исходной

информацией управляющего устрой­

ства УУ,

которое,

располагая данными о

структуре

объекта (они заложены в модель), определяет

парамет­

ры модели

U, минимизирующие компоненты вектора не­

вязки.

 

 

 

Таким образом, задача оптимизации сводится к отыска­ нию беспоискового метода решения экстремальной задачи

Л

min.

и