
vostrikov
.pdf
12.6. Способы оценки градиента |
411 |
|
z |
GA2 |
2 1 |
cos 2 t |
d |
t . |
|
||||
|
0 |
|
|
|
|
||||||
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Полученное выражение преобразуем к виду |
|
|
|||||||||
|
2 2 |
|
|
|
2 2 |
|
|
|
|
||
z |
GA |
d |
t |
GA |
cos 2 |
td t . |
(12.26) |
||||
2 |
2 |
|
|
||||||||
|
0 |
|
|
0 |
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|||
Поскольку интеграл cos 2 |
t на периоде равен нулю, на выходе фильт- |
||||||||||
ра получим сигнал, пропорциональный градиенту |
|
||||||||||
|
|
|
z |
A2G . |
|
|
|
(12.27) |
Метод синхронного детектирования работает устойчиво, хорошо защищен от помех и часто применяется в реальных системах поиска экстремума.
Аналогичный подход можно использовать и для оценки градиента в многоканальных системах. С этой целью к каждому значению выход-
|
|
|
|
|
|
ной переменной динамической части объекта |
yi (i 1, m) |
добавляет- |
|||
ся |
свой поисковый сигнал определенной |
частоты и |
амплитуды |
||
( |
i , Ai ). В систему необходимо добавить соответствующее число по- |
лосовых фильтров, каждый из которых будет выделять свою составляющую выходного сигнала Y . Наличие m усредняющих фильтров позволяет получить отдельные компоненты вектора G .
12.6.5.ОЦЕНКА ГРАДИЕНТА
СПОМОЩЬЮ СПЕЦИАЛЬНОГО ФИЛЬТРА
Оригинальный способ оценки градиента разработан на кафедре автоматики НГТУ (рис. 12.12).
Покажем, что данное устройство действительно позволяет оценивать частную производную. С этой целью для промежуточной переменной z запишем соотношение
|
|
|
1 |
|
ˆ |
|
|
|
|
z |
|
T |
(Y |
Y ) , |
(12.28) |
где |
ˆ |
– оценка выходной |
переменной |
экстремального объекта; |
|||
Y |
T – постоянная времени фильтра.

412 |
Глава 12. СИСТЕМЫ АВТОМАТИЧЕСКОГО ПОИСКА ЭКСТРЕМУМА |
||||
y |
|
Y |
|
|
|
|
|
|
|
|
|
|
|
1 |
z |
ˆ |
1 |
p |
ДФ |
|
|||
|
|
|
p |
||
|
|
T |
|
|
|
|
|
|
|
|
|
y |
|
|
G |
|
|
Рис. 12.12. Структурная схема фильтра оценки градиента
Дифференцируя по времени соотношение (12.28), получим уравнение динамики фильтра оценки градиента относительно переменной z:
|
1 |
|
|
|
|
||
z |
|
|
|
|
ˆ |
|
|
|
T |
Y |
Y . |
(12.29) |
|||
|
|
|
|
|
|
|
|
ˆ |
|
|
|
|
|
|
|
Учитывая, что Y zy , представим (12.29) в виде |
|
||||||
Tz |
Y |
zy . |
(12.30) |
||||
При достаточно малом значении постоянной времени ( T |
0 ) уравне- |
||||||
ние (12.30) вырождается в соотношение |
|
||||||
|
Y |
|
zy, |
(12.31) |
|||
из которого следует |
|
|
|
|
|
|
|
z |
Y |
|
|
Y |
G . |
(12.32) |
|
y |
|
y |
Таким образом, предложенное устройство действительно позволяет оценивать частную производную, причем точность оценки будет тем выше, чем меньше параметр T.
На практике необходимую для оценки градиента производную y
рекомендуется определять с помощью дифференцирующего фильтра (на рис. 12.12 показан пунктиром), имеющего малую постоянную времени.

12.7. Организация движения к экстремуму |
413 |
12.7.ОРГАНИЗАЦИЯ ДВИЖЕНИЯ
КЭКСТРЕМУМУ
Организация движения к экстремуму в автоматической системе основана на контроле градиента и использовании его в законе управления. Такие системы называются градиентными экстремальными системами (рис. 12.13). Существующие способы их построения используют как оценку значения градиента (системы с управлением по градиенту) [32, 37], так и оценку знака компонент градиента (системы с запоминанием экстремума, отдельные типы шаговых систем).
G |
u |
Динамическая |
y |
Y |
|
Регулятор |
|
|
|
|
часть |
|
|
|
|
|
|
|
Блок оценки градиента
Рис. 12.13. Обобщенная функциональная схема градиентной экстремальной системы
12.7.1. ГРАДИЕНТНЫЕ СИСТЕМЫ ПЕРВОГО ПОРЯДКА
Рассмотрим организацию движения к экстремуму на примере простейшего объекта управления, который описывается следующей системой уравнений:
x |
u, |
|
y |
x, |
(12.33) |
Y |
Y ( y). |
|
Сформируем пропорциональный градиенту закон управления в
виде |
|
u kG( y,t) . |
(12.34) |
Подставив (12.34) в уравнение объекта (12.33), получим уравнение замкнутой системы

414 |
Глава 12. СИСТЕМЫ АВТОМАТИЧЕСКОГО ПОИСКА ЭКСТРЕМУМА |
|
|
y kG( y,t) , |
(12.35) |
которое представляет собой нелинейное дифференциальное уравнение
относительно переменной y. Полагая y |
0 , запишем уравнение статики |
|
kG( y, t) 0 , |
(12.36) |
|
где зависимость G от t параметрическая. Поскольку k |
0 , из выраже- |
|
ния (12.36) следует |
|
|
G( y, t) |
0 . |
(12.37) |
Таким образом, в случае устойчивости замкнутой системы процессы в ней будут сходиться к точке равновесия, которая является точкой экстремума. Устойчивость движения в замкнутой системе можно обеспечить соответствующим выбором коэффициента усиления k , при этом выход на экстремум происходит автоматически. В некоторых случаях с помощью коэффициента k кроме устойчивости можно обеспечить определенную длительность переходного процесса в замкнутой системе, т. е. заданное время выхода на экстремум.
ПРИМЕР 12.1
Для объекта, математическая модель которого имеет вид y 2u,
Y y2 ,
необходимо обеспечить выход на экстремум за заданное время tn 3 с. В соответствии с (12.34) сформируем управление
u kG( y) .
Так как известна модель статической экстремальной характеристики, градиент можно определить аналитически, т. е.
Y
G 2 y , y
и организовать алгоритм управления
u2ky .
Вэтом случае получим уравнение замкнутой системы
y 4ky .

12.7. Организация движения к экстремуму |
|
|
|
|
|
|
|
|
415 |
||||||||||||
Как видим, она имеет первый порядок, и для ее устойчивости корень |
|||||||||||||||||||||
характеристического |
уравнения p1 |
4k |
|
должен быть |
отрицательным. |
||||||||||||||||
Следовательно, необходимо выбирать коэффициент |
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
k |
0 . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Численное значение k определим, используя корневые оценки переходного |
|||||||||||||||||||||
|
|
|
|
|
|
|
|
k |
|
0, 25 . Если выбрать |
|
k |
|
0, 3 , |
|||||||
процесса. Так как |
3 tn , то получим |
|
|
|
|||||||||||||||||
то алгоритм управления, обеспечивающий выполнение заданных требова- |
|||||||||||||||||||||
ний, примет вид |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
u |
0,3G . |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
u |
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
G |
k |
|
b |
|
1 |
|
|
y |
|
|
|
Y |
||||||||
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
p |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Блок оценки |
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
градиента |
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Рис. 12.14. Структурная схема системы для примера 12.1
Структурная схема системы с рассчитанным законом управления представлена на рис. 12.14.
12.7.2. МЕТОД «ТЯЖЕЛОГО ШАРИКА»
Рассмотренный в разд. 12.7.1 метод позволяет автоматически найти экстремум, в окрестности которого заданы начальные условия. Если экстремальная характеристика помимо глобального имеет также и несколько локальных экстремумов, то система может «остановиться» в любом из них.
По аналогии с тяжелым шариком, который скатывается в овраг, проскакивая локальные экстремумы, данный метод предполагает введение в систему дополнительной инерционности для придания процессам свойства «проскакивать» точки локальных экстремумов.
Будем рассматривать объект, поведение которого описывают уравнения (12.33). Чтобы обеспечить колебательные переходные процессы в системе, добавим в обратную связь апериодическое звено с постоянной времени T, которую и определим в результате синтеза
(рис. 12.15).

416 |
Глава 12. СИСТЕМЫ АВТОМАТИЧЕСКОГО ПОИСКА ЭКСТРЕМУМА |
||||
|
u |
|
1 |
y |
Y |
|
k |
b |
p |
|
|
|
|
|
|
|
Блок оценки
градиента
1 G Tp 1
Рис. 12.15. Структурная схема системы с дополнительной инерционностью
Запишем операторное уравнение замкнутой системы, предполагая, что с помощью соответствующего блока градиент можно оценить точно, т. е.
|
bk |
|
y |
p(Tp 1) G , |
(12.38) |
где G Y y 2y, так как экстремальная характеристика описывает-
ся уравнением Y y2 . Преобразуем уравнение (12.38) :
p(Tp 1) y 2bky ,
которое затем представим в стандартной форме:
(Tp2 |
p 2bky) |
0 . |
(12.39) |
|
Отсюда следует, что, выбирая ( bk) |
0, |
можно обеспечить устойчи- |
||
вость системы (12.39), уравнение статики которой имеет вид |
||||
|
2bky0 |
0 . |
|
(12.40) |
Таким образом, точка равновесия |
y0 |
0 |
эквивалентна точке экс- |
|
тремума, так как при этом G |
0 . |
|
|
|
Характер движения системы к точке экстремума определяется ха-
рактеристическим уравнением |
|
Tp2 p 2bk 0 . |
(12.41) |

12.7. Организация движения к экстремуму |
417 |
Выбирая распределение корней из условия обеспечения требуемых показателей качества процесса выхода на экстремум ( tn* и * ), сфор-
мируем желаемое характеристическое уравнение второго порядка. Приравнивая коэффициенты при соответствующих степенях оператора p этих двух уравнений (согласно методике модального метода синтеза), можно определить требуемые численные значения k и T.
12.7.3. ОДНОКАНАЛЬНЫЕ СИСТЕМЫ ОБЩЕГО ВИДА
Обсудим теперь задачу синтеза для объектов управления произвольного порядка, которые описываются нелинейным нестационарным дифференциальным уравнением
y n f t, y, , y n 1 |
b t, y, , y n 1 u; Y Y (t, y). (12.42) |
Предполагается, что дрейф экстремума медленный, т. е. dYdt 0 . В этом случае градиент определяется соотношением
G |
Y |
G( y) . |
|
|
|||
y |
|||
|
|
Сформируем снова пропорциональный градиенту закон управления
u kG( y) |
(12.43) |
и исследуем поведение замкнутой системы
y(n) f t, y, , y(n 1) |
b t, y, , y n 1 kG( y) . (12.44) |
Обеспечить устойчивость замкнутой системы можно соответствующим выбором коэффициента усиления k . Так как система (12.44) нелинейная, то для анализа устойчивости можно использовать второй метод Ляпунова, на основе которого определяется коэффициент k . Поскольку второй метод Ляпунова дает лишь достаточное условие устойчивости, выбранная функция Ляпунова может оказаться неудачной, поэтому регулярную процедуру расчета регулятора здесь предложить нельзя.

418 |
Глава 12. СИСТЕМЫ АВТОМАТИЧЕСКОГО ПОИСКА ЭКСТРЕМУМА |
12.7.4. ЭКСТРЕМАЛЬНЫЕ СИСТЕМЫ, ОСНОВАННЫЕ НА МЕТОДЕ ЛОКАЛИЗАЦИИ
Данный способ синтеза экстремальной системы предполагает использование в законе управления действительной и желаемой старшей производных выходной переменной динамической части системы аналогично способу управления нелинейными нестационарными объектами (см. главу 10).
Рассмотрим возможности метода применительно к объекту управления (12.42), описание которого представим в переменных состояния:
x |
f x,t B x,t u, |
x Rn , u R1, |
|
y |
g(x), |
y R1, Y R1, |
(12.45) |
Y |
Y ( y,t). |
|
|
Здесь предполагаем, что функция g(x) допускает многократное диф-
ференцирование, а дрейф экстремума достаточно медленный.
Цель управления заключается в определении такого управляющего воздействия u = u( ), которое обеспечивает выполнение усло-
вия (12.10)
lim y(t) y0
t
с заданной точностью | 0| |
*0 . |
Наряду с условием статики предъявляются требования и к динамике, т. е. к характеру переходных процессов, в виде оценок
tn tn* и |
* . |
Для формирования алгоритма управления необходимо предварительно определить производную выходных переменных динамической части объекта, которая непосредственно зависит от управления. При
этом обозначим через C вектор-строку производных C |
g xT . |
Исследуем ситуацию, когда |
|
CB( ) 0 . |
(12.46) |
В этом случае от управляющего воздействия будет явно зависеть первая производная выходных переменных динамической части объекта

12.7. Организация движения к экстремуму |
419 |
|
y |
Cx Cf (t, x) CB(t, x)u , |
(12.47) |
поэтому требования к поведению замкнутой системы следует формировать относительно нее в виде желаемого дифференциального уравнения [8]
y F (G) G( y) , |
(12.48) |
где – коэффициент, который выбирается из условия требуемого времени выхода на экстремум. Причем для большого класса объектов типа (12.45) желаемое дифференциальное уравнение можно конструировать в классе линейных уравнений, формируя распределение корней аналогично модальному методу синтеза.
В статике желаемое уравнение (12.48) вырождается в условие
G( y) 0 ,
что соответствует точке экстремума.
Зададим закон управления на основе метода локализации в виде
u k(F y) , |
(12.49) |
где k – коэффициент усиления регулятора.
Использование y в алгоритме управления (12.49) позволяет пода-
вать влияние динамической части объекта и действующих на него возмущений, а наличие градиента – организовать движение к точке экстремума, соответствующей точке равновесия замкнутой системы.
Подставив (12.49) в (12.47), получим уравнение динамики для выходной переменной ДЧ
|
y Cf (t, x) CB(t, x)k(F |
y) , |
(12.50) |
||
которое преобразуется к виду |
|
|
|
|
|
|
(1 CBk) y |
Cf |
CBkF . |
|
|
При условии, что (1 |
CBk) 0 , получим уравнение замкнутой системы |
||||
y |
(1 CBk) 1Cf |
(1 |
CBk) 1CBkF . |
(12.51) |
Начиная с некоторых значений коэффициента k выполняется условие
CBk 1 , и уравнение (12.51) при условии, что (CBk) |
0 , вырождает- |
ся в следующее: |
|
y (CBk) 1Cf (CBk) 1CBkF . |
(12.52) |

420 |
Глава 12. СИСТЕМЫ АВТОМАТИЧЕСКОГО ПОИСКА ЭКСТРЕМУМА |
||
Пренебрегая первым слагаемым в уравнении (12.52) при k |
, за- |
||
пишем его в виде |
|
|
|
|
y F (G) |
G( y) . |
|
Таким образом, соответствующий выбор коэффициента усиления регулятора позволяет с заданной точностью обеспечить в замкнутой системе желаемую динамику выхода на экстремум. Параметры регулятора выбираются из соотношения
CBk 20...100 . |
(12.53) |
В этом случае ошибка поддержания в системе желаемого уравнения не будет превышать (1…5) %. Структурная схема системы приведена на рис. 12.16.
|
u |
x = f + Bu, y |
Y |
–α |
KК |
y = g(x)) |
ЭХ |
|
y |
|
Блок |
|
d |
оценки |
|
|
|
градиБОГ- |
|
|
|
dt |
|
G |
|
ента |
Рис. 12.16. Расчетная схема системы со старшей производной
вуправлении
Вреальной системе для оценки полной производной по времени используется дифференцирующий фильтр, поэтому оценивать градиент удобно с помощью специального фильтра, который будем назы-
вать фильтром оценки частной производной.
Следует отметить, что использование в системе фильтров с малыми инерционностями может приводить к возникновению в ней разнотемповых процессов, для исследования свойств которых необходимо применять метод разделения движений (см. разд. 10.5).
ПРИМЕР 12.2
Рассчитать систему поиска экстремума для объекта управления, поведение которого описывают уравнения
T0 y y k0 (t)u, Y ay2 ,