Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Власов_Методы оптимизации и оптимального управления_2013

.pdf
Скачиваний:
127
Добавлен:
27.03.2016
Размер:
710.95 Кб
Скачать

величины. Если ненаблюдаемая часть движения системы стремится к нулю, то систему называют обнаруживаемой.

Упражнение. Показать, что две различные системы, описывае-

мые уравнениямиx = A1 x + B1u

и x = A2 x + B2u , где

A1

0;1

 

,

=

 

 

 

 

1;

2

 

B1

 

0

 

,

A2

 

2;1

и

B2

1

, в первой системе наблюдаемый

=

 

 

=

1;0

 

=

 

1

 

 

 

 

 

 

 

1

 

выходной сигнал y1 = x1 + x2 , а во второй – y2 = x1 , имеют одинако-

вые передаточные функции, но одна из них неуправляемая, другая – ненаблюдаемая.

Построить структурные схемы систем и убедиться в их различии.

3.4. Понятие фильтра и общая задача регулирования

Самым простейшим примером фильтра является колебательный контур в радиоприемниках. Настройка такого фильтра на определенную частоту отсекает другие несущие частоты и позволяет выбрать сигнал единственной радиостанции. Поэтому первое понятие фильтра связано с его частотными характеристиками.

Построение систем автоматического регулирования с требуемыми показателями качества требует введения корректирующих устройств. Эти корректирующие устройства являются динамическими звеньями и описываются дифференциальными уравнениями. Поэтому корректирующие устройства также могут описываться частотными характеристиками, т.е. они также являются фильтрами.

Остановимся на понятии фильтра Винера, который предназначен для выделения полезного случайного сигнала на фоне помех. Построение линейного алгоритма обработки искаженного случайными помехами наблюдаемого сигнала сводится в итоге к поиску оптимальной линейной динамической системы. Таким образом, фильтр Винера может быть реализован с помощью линейных динамических звеньев и естественно обладает частотной характеристикой.

41

Далее, метод гармонической линеаризации основан на предположении, заключающемся в том, что линейная часть рассматриваемой нелинейной динамической системы не пропускает (отфильтровывает) высшие гармоники.

Понятно, что с появлением цифровых систем управления стало необходимым вводить с помощью программных средств цифровые корректирующие звенья, где присутствовали операции интегрирования и дифференцирования.

Из анализа приведенных примеров следует, что фактически речь идет о математическом преобразовании сигналов с помощью технических средств, т.е. входному сигналу x(t) ставится в соответст-

вие выходной сигнал y(t) , что символически можно описать оператором L преобразования y(t) = L[x(t)] . Например, если система описывается дифференциальным уравнением

a

 

d n

x(t) + a

 

d n1

x(t) +... + a x(t) =b

d m

u(t) +... +b u(t) ,

n dtn

n1 dtn1

 

 

 

0

m dtm

0

то управляющему воздействию u(t) соответствует решение x(t) .

Это означает, что любой динамический объект является фильтром. Поэтому любое преобразование y(t) = L[x(t)] сигнала следует

называть фильтром.

Общая задача регулирования заключается в построении подходящего фильтра.

Контрольные вопросы

1.Какие способы описания динамических систем являются полными?

2.Каковы недостатки способа описания с помощью передаточных функций?

3.Какими свойствами обладает ненаблюдаемая система?

4.Какими свойствами обладает неуправляемая система?

5.Какими средствами можно добиться свойства управляемости системы?

42

ГЛАВА 4. ПРИМЕНЕНИЕ ВАРИАЦИОННЫХ МЕТОДОВ ДЛЯ ПОИСКА ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ

4.1. Понятие линейного пространства

Множество M элементов m называется линейным пространством [10], если:

для любых двух элементов m1 , m2 определена сумма m1 + m2 , принадлежащая M.

для любого элемента m определена операция умножения на вещественное число λ (результат умножения

принадлежит M).

Причем выполняются следующие условия: для любых двух элементов m1 , m2 справедливо соотношение m1 + m2 = m2 + m1 ;

для любых трех элементов m1 , m2 , m3 справедливо равен-

ство (m1 + m2 ) + m3 = m1 + (m2 + m3 ) ;

существует нулевой элемент 0, обладающий свойством m +0 = m для любого m ;

для любых двух элементов m1 , m2 уравнение m1 + m2 = 0 разрешимо относительно m1 и элемент m2 называется противоположным элементу m1 ;

существует единичный элемент 1, обладающий свойством 1m = m для любого m ;

для любых двух λ,μ чисел и любого m выполняется соотношение λ(μm)=(λμ)m ;

для

любых

λ, m1 , m2

справедливо

равенство

 

λ(m1 + m2 ) = λm1 + λm2 ;

 

 

для

любых

λ,μ, m2

справедливо

равенство

+μ)m = λm +μm .

Примерами линейных пространств могут служить:

множество всех вещественных чисел;

множество всех векторов определенной размерности;

43

множество всех квадратных матриц определенной размерности.

Введем понятие расстояния ρ(m1 , m2 ) между элементами m1 , m2 множества M – это функция двух аргументов m1 , m2 , удовлетворяющая условиям:

для любых двух элементов m1 , m2 справедливо равенство

ρ(m1 , m2 ) = ρ(m2 , m1 ) ;

для любых его двух различных элементов m1 , m2 имеет место неравенство ρ(m1 , m2 ) > 0 ;

если m1 = m2 , то ρ(m1 , m2 ) = 0 , и обратно – при ρ(m1 , m2 ) = 0 обязательно m1 = m2 ;

для любых трех элементов m1 , m2 , m3 выполняется нера-

венство треугольника ρ(m1 , m2 ) ρ(m1 , m3 ) + ρ(m2 , m3 ) . Если удается ввести понятие расстояния, то множество M на-

зывают метрическим пространством.

Линейное пространство называется нормированным, если для его любых двух элементов m1 , m2 существует расстояние

ρ(m1 , m2 ) , удовлетворяющее дополнительным условиям:

для любых трех элементов m1 , m2 , m3 справедливо равен-

ство ρ(m1 + m3 , m2 + m3 ) = ρ(m1 , m2 ) ;

для любых λ,m выполняется равенство

ρ(λm,0) =| λ| ρ(m,0) .

Величина ρ(m,0) называется нормой элемента m и обозначается символом m .

Примером линейного нормированного пространства может служить множество функций y = f (x) вещественного аргумента,

определенных на отрезке [a,b] , которые имеют производные порядка k. Расстояние можно, например, ввести согласно формуле [6]:

ρ{ f1 (x), f2 (x)} = max{| f1 (x) f2 (x) |,| f1(x) | f2(x) |,...

...,| f1(k ) (x) f2(k ) (x) |}, x [a,b].

44

Следует заметить, расстояние может быть определено не единственным способом, поскольку требуется лишь определить функцию от элементов, обладающую перечисленными выше способами.

4.2. Функционал и его вариация

Функционалом называют отображение, аргументом в котором является функция (может быть и векторная) вещественной переменной, причем каждой функции ставится в соответствие вещественное число. Функционал обозначим символом J[ f (x)] .

В теории управления вещественной переменной обычно является время t . Задача оптимального управления заключается в выборе самого хорошего управляющего воздействия u(t) . Качество управ-

ляющего воздействия характеризуется значением некоторого функционала, и ищут такое управляющее воздействие, при котором достигается экстремум функционала. Функционал определяется на выбранном линейном нормированном пространстве. Таким образом, для поиска оптимального управления необходимо искать экстремумы функционалов.

Необходимое условие экстремума функционала получают с помощью выделения главной линейной части приращения функционала (называемой вариацией функционала и обозначаемой как δJ ) в выбранной «точке» f (x) , когда аргумент f (x) получает прира-

щение η(x) . Приращение также η(x) принадлежит выбранному

линейному нормированному пространству, и его называют вариацией аргумента. Необходимое условие экстремума заключается в неизменности знака приращения функционала при произвольной, но достаточно малой вариации аргумента. Поскольку знак приращения функционала в этих условиях определяется знаком его вариации, то необходимым условием экстремума функционала является равенство нулю вариации функционала.

Введем понятие линейного функционала. Функционал L[ f (x)]

называется линейным, если он удовлетворяет принципу суперпозиции:

L1 f1 (x) + λ2 f2 (x)] = λ1L[ f1 (x)] + λ2 L[ f2 (x)] .

(4.2.1)

45

Определения (4.2.1) достаточно, чтобы найти правило вычисления вариации функционала.

При поиске экстремумов функционалов дополнительно используется основная лемма вариационного исчисления:

если интеграл

x2

f (x)g(x)dx равен нулю при любой g(x) , то

 

x1

 

f (x) тождественно равна нулю (рассматриваются непрерывные функции).

4.3. Вычисление вариации функционала

Согласно свойству линейности вариации запишем соотношение

J[ f (x)) + λη(x)] J[ f (x)] = L[ f (x), λη(x)] + 0[λη(x)] ,

где L[ f (x), λη(x)] – линейный функционал относительно второго аргумента, 0[λη(x)] – бесконечно малая величина достаточно вы-

сокого порядка. Учитывая

свойство линейности функционала

L[ f (x), λη(x)] , можно записать:

 

 

 

J[ f (x)) + λη(x)] J[ f (x)]

1

 

= L[ f (x),η(x)] +

0[| λη(x) |]

.

(4.3.2)

λ

 

 

 

λ

 

Переход к пределу в последнем равенстве при λ 0 приводит к результату δJ = λ J[ f (x) + λη(x)] при λ =0 .

Следует заметить, что равенство нулю предела второго слагаемого в правой части равенства (4.3.2) определяет существование вариации функционала (функционал в этом случае называется дифференцируемым).

4.4. Задача Эйлера

 

 

x2

 

Рассматривается функционал вида

J =

F(x, y, y )dx . Требуется

 

 

x1

 

провести через две

заданные точки с координатами (x1 , y1 ) и

(x2 , y2 ) такую кривую

y(x) , которая доставила бы экстремум рас-

сматриваемому функционалу.

 

 

46

Вычислим вариацию рассматриваемого функционала [10,11]

x2

F

η+

F

δJ = [

y

y

η ]dx ,

x1

 

 

где η(x) – вариация аргумента,

удовлетворяющая условиям:

η(x1 ) = 0, η(x2 ) = 0 ; Fy = Fy , Fy= Fy– частные производные.

Вариацию преобразуем путем интегрирования по частям второго слагаемого к виду

δJ = η(x2 )Fy[x2 , y(x2 ), y(x2 )] (x1 )Fy[x1 , y(x1 ), y(x1 )] +

x2

d

(4.4.1)

+

[Fy

Fy]η(x)dx.

dx

x1

 

 

С учетом ограничений на вариацию аргумента получим условие экстремума

x2[Fy

d

Fy]η(x)dx = 0 .

dx

x1

 

Основная лемма вариационного исчисления позволяет условие экстремума записать в виде дифференциального уравнения для искомой кривой:

F

d

F

= 0 .

(4.4.2)

dx

y

 

y

 

 

Уравнение (4.4.2) называется уравнением Эйлера.

Уравнение Эйлера может иметь упрощенный вид, если функция F(x, y, y) не зависит от некоторых из аргументов x, y, y. Напри-

мер, если отсутствует зависимость от x, y , то легко получить об-

щее решение уравнения Эйлера в виде совокупности всех линейных зависимостей y(x) .

Пример 4.4.1. Длина L кривой, проходящей через две точки,

x2

 

 

 

может быть вычислена по формуле L =

2

dx .

1+ ( y )

 

x1

 

 

 

47

Вид функции F (x, y, y) = 1 + ( y)2 показывает, что имеется зависимость только от одного аргумента. Поэтому уравнение Эйлера

получается простым

d

F 1 =

d

 

 

 

y

 

= 0 .

 

 

 

 

 

 

 

dx

dx

 

 

 

 

 

 

 

 

 

 

 

 

y

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

+( y )

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 зависит только от

y

,

Учитывая, что функция Φ( y )

 

 

 

 

 

 

 

 

 

 

1+( y )

 

 

 

 

 

 

 

получим следующий

вид

уравнения

 

Эйлера

′′

= 0

,

где

 

ψ( y ) y

 

ψ( y) = dyd Φ( y) . Поэтому уравнение Эйлера распадается на два

дифференциальных уравнения, и его общее решение представляет собой совокупность прямых линий. Функционал L достигает минимального значения, если y(x) = ax +b . Неизвестные коэффици-

енты a,b находятся из условий закрепления функции y(x) на концах траектории.

Понятно, что если функция F(x, y, y) зависит только от y, то

общее решение Уравнения Эйлера всегда представляет собой совокупность прямых линий.

4.5. Применение уравнения Эйлера для поиска оптимального закона управления

Пусть имеется динамический объект, который описывается дифференциальным уравнением

dxdt + x =u(t) ,

где u(t) – управляющее воздействие.

Требуется перевести объект за время T из состояния x1 в со-

стояние x2 так, чтобы функционал J = T(x 2 +u2 )dt имел мини-

0

мальное значение.

48

Решение. С учетом вида дифференциального уравнения пред-

ставим функционал в виде J = T[x2 + (x′+ x)2 ]dt . Дифференциаль-

0

ное уравнение Эйлера для этого случая является линейным, имеющим второй порядок x′′−2x =0 . Решая это уравнение и используя

граничные условия x(0) = x1 , x(T ) = x2 ,

получим

оптимальную

траекторию x 0 (t)

движения. После этого оптимальное управление

u 0 (t) может

быть найдено с

помощью

соотношения

u0 (t) = x0 (t) + x0 (t) .

В данном примере удалось временно исключить из рассмотрения функцию u(t) . В других случаях этого сделать не удается. По-

этому для поиска оптимального управления применяются более общие подходы.

4.6. Уравнение Эйлера – Пуассона и его применение

Это уравнение связано с функционалами, зависящими от старших производных:

J = x2 F(x, y, y,..., y(n) )dx .

x1

На функцию y(x) наложены граничные условия:

y(x1 ) = y1, y(x1 ) = y1,..., y(n1) (x1 ) = y1(n1) ,

y(x2 ) = y2 , y(x2 ) = y2,..., y(n1) (x2 ) = y2(n1) .

Рассуждения, которые привели к уравнению Эйлера, когда понижался порядок производной вариации аргумента, подобным образом могут быть использованы и в данной задаче. Итогом оказывается уравнение Эйлера – Пуассона, которому должна удовлетворять оптимальная траектория. Уравнение имеет вид

F

d

F

+

d 2

F

+... + (1)n

d n

F

( n ) = 0 .

dx

dx2

dxn

y

 

y

 

y′′

 

y

 

49

Пример 4.6.1. Динамическая система описывается дифференци-

альным уравнением

d 2 x

= u(t) . Требуется перевести систему за

dt2

 

 

 

 

 

 

время T из одного состояния в другое так,

чтобы функционал

J = T[x′′(t)]2dt принял минимальное значение.

 

 

 

0

 

 

 

 

 

 

Уравнение Эйлера – Пуассона имеет вид

d

4 x

= 0 , общее реше-

dt4

 

 

 

 

 

ние которого является полиномом x(t) =c +c t +c t2

+c t3 . Коэф-

фициенты c0 , c1 ,c2 , c3

 

0

 

1

2

3

находятся с использованием заданных значе-

ний функции и ее производных при t = 0 и t =T . После этого с

помощью уравнения

d 2 x

= u(t) находится оптимальное управле-

dt

2

ние.

 

 

 

 

 

 

4.7. Функционалы, зависящие от векторного аргумента

Рассматриваются функционалы вида:

J = x2

F[x, y1 (x),..., yn (x), y1(x),..., yn(x)]dx .

x1

 

 

 

 

Каждая из функций проходит через заданные для нее две точки. Вариация функционала равна

x2

n

yF

n

yFηi (x)]dx .

δJ =

[i=1

ηi (x) + i1

x1

 

i

 

i

Необходимое

условие

экстремума функционала имеет вид

δJ =0 . Выберем вариацию аргумента такую, что ηi (x) = 0 при i 1

и η1 (x)

является произвольной. В этих условиях можно записать

x2

 

F

 

F

 

δJ = x1

[

y1

η1 (x) +

y1

η1(x)]dx . Приравнивая нулю это выражение и

повторяя рассуждения, которые привели к уравнению Эйлера, по-

50