
vostrikov
.pdf

402 |
Глава 12. СИСТЕМЫ АВТОМАТИЧЕСКОГО ПОИСКА ЭКСТРЕМУМА |
12.4. УСЛОВИЕ ЭКСТРЕМУМА
Рассмотрим экстремальную характеристику произвольного вида
Y Y ( y), Y R1, y Rn , |
(12.5) |
полагая для простоты, что отсутствует дрейф экстремума.
Как известно, необходимым условием экстремума является равенство нулю градиента, полученного для этой характеристики [37], т. е. выполнение условия
|
|
G 0 , |
(12.6) |
|
Y |
|
|
|
|
|
|
|
y1 |
|
|
где G |
|
– градиент (вектор частных производных) |
выходной |
|
Y |
|
|
ym
переменной объекта.
Для того чтобы определить тип экстремума характеристики (12.5), можно задать небольшие приращения по переменным y относительно
значения y0 в виде y0 |
y и исследовать полученные значения выхо- |
|||
да Y. В случае, когда справедливы соотношения |
|
|||
|
Y ( y0 |
y) |
Y0 ( y)0 , |
(12.7) |
|
Y ( y0 |
y) |
Y0 ( y0 ), |
|
|
|
Y0 представляет собой точку минимума.
Если значения выхода Y при небольших отклонениях от Y0 удовлетворяют условиям
Y ( y0 |
y) |
Y0 |
( y0 ), |
(12.8) |
|
Y ( y0 |
y) |
Y0 ( y0 ), |
|||
|
то Y0 соответствует точке максимума характеристики (12.5).

12.5. Постановка задачи синтеза экстремальных систем |
403 |
12.5. ПОСТАНОВКА ЗАДАЧИ СИНТЕЗА ЭКСТРЕМАЛЬНЫХ СИСТЕМ
Цель экстремального управления состоит в обеспечении минимума или максимума заданной функции качества Y(t,y) при недостаточной априорной информации об объекте.
Задача синтеза экстремальной системы заключается в отыскании для объекта типа (12.1) такого управляющего воздействия u( ), которое позволяло бы автоматически определить положение экстремума и удерживать в нем систему. Формально это означает выполнение условия
extr Y (t, y) Y0 , |
(12.9) |
y |
|
где Y0 – экстремальное значение выходной характеристики. Поскольку экстремальному значению Y0 соответствует определен-
ное значение y0 , задачу синтеза можно переформулировать. Для экстремального объекта (12.1) необходимо определить управляющее воздействие u( ), которое обеспечит выполнение свойства
lim y(t) y0 . |
(12.10) |
t |
|
Как видим, задача синтеза экстремальной системы сводится к задаче стабилизации в точке экстремума y0 , а для контроля за достижени-
ем этой точки следует использовать условия (12.6) – (12.8).
Таким образом, при синтезе экстремальных систем от алгоритма управления требуются организация движения в точку экстремума, если градиент выходной характеристики G не равен нулю, и удержание объекта в точке экстремума, если он равен нулю.
Анализ задачи синтеза экстремальных систем управления показывает, что в ней можно выделить три относительно самостоятельные подзадачи:
•задача оценки градиента;
•организация движения системы к точке экстремума в соответст-
вии с условием G 0 ;
• стабилизация системы в точке экстремума.

404 |
Глава 12. СИСТЕМЫ АВТОМАТИЧЕСКОГО ПОИСКА ЭКСТРЕМУМА |
12.6. СПОСОБЫ ОЦЕНКИ ГРАДИЕНТА
Задача непрерывной оценки градиента представляет собой самостоятельную и очень непростую техническую проблему. К настоящему времени разработаны различные способы оценки градиента [1, 6, 19, 32, 37, 40, 44]. Обсудим некоторые из них.
12.6.1. СПОСОБ ДЕЛЕНИЯ ПРОИЗВОДНЫХ
Рассмотрим суть данного способа на примере одноканальных объектов со статической экстремальной характеристикой
Y Y ( y,t), y R1 . |
(12.11) |
Определим полную производную выходной переменной по
времени |
|
|
|
|
|
Y |
Y |
y |
Y |
. |
(12.12) |
|
|
||||
|
y |
|
t |
|
Второе слагаемое в выражении (12.12) обусловлено наличием дрейфа. При медленном дрейфе экстремальной характеристики им можно пренебречь, так как Y t 0 . В этом случае из выражения (12.12) можно
определить величину градиента как отношение двух полных производных по времени:
|
Y |
|
Y |
|
|
G |
|
|
|
. |
(12.13) |
y |
y |
Структурная схема устройства, реализующего оценку градиента способом деления производных, представлена на рис. 12.6.
Поскольку операция дифференцирования на практике очень критична к помехам, для оценки производных следует использовать дифференцирующие фильтры ДФ (на рис. 12.6 они показаны пунктиром).
Достоинством данного способа является простота технической реализации.

12.6. Способы оценки градиента |
|
405 |
||
|
y |
Y |
|
|
ДФ |
d |
d |
ДФ |
|
dt |
dt |
|||
|
|
|||
|
y |
Y |
|
G
Рис. 12.6. Структурная схема устройства оценки градиента способом деления производных
Недостатки – сложность оценки градиента при малых значениях y (как следует из выражения (12.13)) и соответственно слабая помехо-
защищенность. Для уменьшения влияния помехи рекомендуется использовать дифференцирующие фильтры выше первого порядка (см. главу 11).
12.6.2. СПОСОБ КОНЕЧНЫХ РАЗНОСТЕЙ
Данный способ оценки градиента рассмотрим также для одноканальных объектов со статической экстремальной характеристикой (12.11). При этом в отличие от предыдущего способа производные Y и y приближенно заменяются конечными разностями
y |
dy |
|
|
y y(k ) |
y(k 1) |
, |
|
|||||
dt |
|
|
t |
|
|
T |
|
|||||
|
|
|
|
|||||||||
|
dY |
|
|
Y Y (k) Y (k 1) |
|
|||||||
Y |
dt |
|
|
t |
|
|
T |
|
, |
|||
|
|
|
|
где k – дискретный момент времени; T – шаг квантования (дискретизации) по времени.


12.6. Способы оценки градиента |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
407 |
|
или после несложных преобразований |
|
|
|
|
|
|
|
|||||||||
|
|
Y |
|
|
|
Y |
Y |
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
Y |
|
sgn |
Y |
|
|
|
sgn G |
|
y |
|
|
|
y |
|
. |
(12.16) |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
Y |
|
|
y sgn |
|
|||||||
|
|
Y |
|
|
|
|
|
y |
|
|||||||
|
|
|
|
|
|
|
|
|
|
y |
|
|
|
|
|
|
|
|
y |
|
|
|
y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Предполагая, что шаг квантования Т достаточно мал, заменим в выражении (12.16) дифференциалы конечными разностями
Y Y Y (k) Y (k 1),
y |
y y k |
y(k 1). |
Это позволяет представить соотношение (12.16) в виде
sgn G |
sgn |
Y |
sgn Y sgn y , |
(12.17) |
|
|
|
||||
sgn |
y |
||||
|
|
|
которое и используется для оценки знака градиента как аппаратным, так и программным способом.
12.6.4. СПОСОБ СИНХРОННОГО ДЕТЕКТИРОВАНИЯ
В основе этого способа лежит идея синхронного детектора, который используется в радиотехнике для выделения на фоне основного сигнала дополнительной составляющей [22].
Способ синхронного детектирования (рис. 12.8) предполагает добавление к основному сигналу на входе экстремальной характеристики y дополнительного поискового синусоидального сигнала малой амплитуды и высокой частоты y Asin t с последующим выделением со-
ответствующей составляющей из выходного сигнала Y.
На рис. 12.8 ГСК – генератор синусоидальных колебаний; ФЧУ – фазочувствительное устройство; Ф – усредняющий фильтр.
Сравнение фаз входного и выходного периодических сигналов позволяет сделать вывод о том, движется ли система к экстремуму или удаляется от него, т. е. получить оценку знака градиента. Введение в систему специального усредняющего фильтра дает возможность оценить и его значения.



410 |
Глава 12. СИСТЕМЫ АВТОМАТИЧЕСКОГО ПОИСКА ЭКСТРЕМУМА |
|
|
Y Y k( y y ) , |
(12.18) |
где k – тангенс угла наклона касательной, который определяется соотношением
k |
Y |
. |
(12.19) |
|
|||
|
y |
|
Таким образом, k = G. В дальнейшем используем это обозначение. Сигнал на входе экстремального объекта представляет собой сумму
y y Asin t . |
(12.20) |
Для простоты будем полагать, что y = 0 (преобразования не изме-
нятся и в общем случае, но станут более громоздкими). Выражение
(12.18) с учетом (12.19) и (12.20) принимает вид
Y Y |
GA sin t . |
(12.21) |
Запишем теперь выражение для сигнала на выходе ФЧУ: |
|
|
|
YA sin t |
(12.22) |
или с учетом (12.21) |
|
|
Y A sin |
t GA2 sin2 t . |
(12.23) |
Так как усредняющий фильтр усредняет сигналы на периоде, то на его выходе получим
2 |
|
2 |
|
z |
t d t |
Y Asin t GA2 sin2 t d t . |
(12.24) |
0 |
|
0 |
|
Представив в (12.24) интеграл суммы в виде суммы интегралов, запишем
2 |
2 |
|
z Y A sin td t GA2 |
sin2 td t . |
(12.25) |
0 |
0 |
|
Первый интеграл в выражении (12.25) на периоде будет равен нулю, а во втором sin2 t выразим через косинус двойного угла: