Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Управление и оптимизация / Babenishev - Metodi optimizatsii 2017

.pdf
Скачиваний:
64
Добавлен:
02.09.2019
Размер:
4.49 Mб
Скачать

21

Рис. 9.

2. Вычислим обобщенную силу Qx, соответствующей (единственной) обобщенной координате q = x. Для этого придадим обобщенной координате бесконечно малое приращение dx. Сумма элементарных работ всех активных сил, действующих на систему, при этом перемещении равна:

 

 

 

dA Q dx (P P )dx .

 

 

 

x

1 3

Следовательно, обобщенная сила равна:

 

 

 

Q P P 1000 2000 1000 н .

 

 

 

x 1 3

 

3. Определим кинетическую энергию T системы:

 

 

 

T T1 T2 T3 ,

где T

P x2

 

 

 

1

– кинетическая энергия противовеса, движущегося плоскопарал-

 

1

2g

 

 

 

 

 

 

 

лельно ( P M

g 1000 н – вес противовеса);

 

1

1

 

 

 

 

 

 

 

 

 

 

 

22

 

I

c

2

 

 

 

 

 

T

 

 

– кинетическая энергия вращающегося блока ( x / R – уг-

 

 

 

2

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ловая скорость блока, поскольку x R ,

Ic

M

2

R2

– момент инерции

 

2

 

 

 

 

 

 

 

 

блока относительно его геометрической оси);

T3 P3 x2 – кинетическая энергия кабины.

2g

Окончательно, кинетическая энергия системы равна

 

 

 

 

 

 

P x2

P R2

x2

 

 

 

P x2

 

1

 

 

 

 

 

 

 

T

1

 

 

2

 

 

 

 

 

 

 

3

 

 

 

 

(2P P 2P ) x2 162,5 x2 .

 

 

2g 2R2

 

 

 

 

 

 

 

2g

 

 

 

 

 

2g

 

4g

1

 

2

3

 

 

 

Находим производные:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T

325x ;

 

d

T

 

 

d

325x

325

d

x 325x ;

 

T

0 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

dt

x

 

 

dt

 

 

 

 

 

dt

 

 

 

x

 

и подставим в (4):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

d

T

T

 

 

 

 

 

 

 

 

 

 

 

 

 

40

 

 

 

 

 

 

 

 

 

 

 

1000

 

 

325x 1000

x

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dt

x

x

 

 

 

 

 

 

 

 

 

 

 

 

 

13

 

 

Интегрируя это уравнение дважды, получим:

x(t) 1340 t C1 , x(t) 1320 t2 C1t C2 .

Из начального условия t = 0, x(0) = 0, x(0) 0 , получаем C1 C2 0 , т.е. уравнение движения системы имеет вид

x(t) 1320 t2 .

Время tсп за которое кабина опустится с высоты h 10 м до земли, найдем из соотношения:

 

 

 

20

 

 

 

t

 

 

 

130

 

 

 

 

x(t

 

)

t

2

10

 

 

 

 

 

6,5 2,55 сек;

сп

 

сп

сп

20

 

13

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

скорость касания земли равна

vсп x(tсп ) 1403 6,5 7,84 м/c.

Уравнение движения кабины при свободном спуске и время tсв свободного спуска рассчитывается по обычным формулам из физики.

23

Тема 2. Оптимальное управление

Вопрос 1. Постановка задачи оптимального управления

Если уравнения состояния некоторой системы (физической, химической, механической, экономической и др.), наряду с фазовыми переменными, описывающими состояние системы, учитывают также управляющие воздействия, то можно рассматривать задачу оптимального управления этой системой, при условии, что задан некоторый целевой функционал – критерий качества (оп-

тимальности) управления.

Смысл вводимых понятий проиллюстрируем на упрощенном примере.

Пример. Роботизированная коробка передач.

Фазовые переменные – скорость оборотов двигателя и крутящий момент (описываются функциями класса C[0, t]).

Управляющее воздействие – номер передачи (по сути передаточное число

– задается функцией класса KC[0, t]).

Критерий качества (оптимальности) управления – могут быть разными,

например, минимизация расхода топлива или максимизация разгона (ре-

жимы экономный и агрессивное вождение).

Ограничения на фазовые переменные – обусловлены мощностью и физи-

ческими ограничениями двигателя: от 0 до максимально допустимого значения.

Ограничения на управляющее воздействие – обусловлены конструкцией коробки передач (количество передач и соответствующие передаточные числа).

Рассмотрим математическую формализацию общей задачи оптимального управления нестационарной динамической системой.

Уравнения движения – система обыкновенных дифференциальных уравнений (ОДУ):

 

.

 

 

 

 

 

 

 

 

 

x (t) f (t, x (t), , x (t),u (t), ,u

m

(t))

 

1

1

1

n

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

x (t) f

n

(t, x (t), , x (t),u (t), ,u

m

(t))

 

n

 

1

n

1

 

 

Замечание. Для нестационарной динамической системы, уравнения движения зависят от времени t. Однако, в большинстве чисто физических приложений, уравнения движения не зависят от времени t, поскольку выражают физические законы, которые не меняются со временем. В этом случае постановка и сама задача оптимального управления упрощается.

24

Критерий качества управления:

J (x,u ) tT0 f0 (t, x (t),u (t)) dt inf

Ограничения на фазовые переменные и управление:

xi (t) DX C[t0 ,T ], i 1, , n ,

u j (t) U DU KC[t0 ,T ], j 1, ,m,

где DX и U – заранее заданные классы функций, которым должны принадлежать функции, задающие фазовые траектории и управляющие воздействия, соответственно.

Замечания.

1.Далее, для краткости, будем записывать систему ОДУ в векторном виде

x(t) f (t, x(t),u (t)) .

2.Наряду с интегральной формой возможны и другие формы функционалов качества управления, например,

1) сингулярная форма, когда для некоторого t [t0 ,T ]

J (x,u ) f0 (t , x(t ),u (t )) ;

2)J (x,u ) maxt [t0 ,T ] f0 (t, x(t),u (t)) ;

3)интегрально-терминальная форма:

J (x,u ) tT0 f0 (t, x (t),u (t)) dt (x(T ),T ) .

Рис. 1. Иллюстрация ограничений на фазовые переменные.

25

Рис 2. Пример ограничений на управляющие воздействия.

Рассмотрим пример задачи оптимального управления.

Простейшая задача оптимального быстродействия

Простейшая задача оптимального быстродействия – это задача о быстрейшем попадании рассматриваемой точки в начало координат (0,0) из заданного

начального состояния x 0 (x10 , x20 ) . Другими словами, задача перевода за крат-

чайшее время материальной точки, имеющей начальное положение x10 и

начальную скорость x20 , в начало координат с нулевой скоростью (чтобы точка перешла в начало координат и остановилась там).

Пример. Пусть материальная точка массой m = 1, движется без трения по горизонтальной прямой (рис. 3). Пусть эта точка снабжена двигателем, разви-

вающим силу тяги u(t) такую, что | u(t) | 1. Введем обозначения

x1(t) x(t) , x2 (t) x(t) v(t) .

Таким образом, для рассматриваемой динамической системы размерность вектора фазовых переменных равна n = 2, и этот вектор можно записать как

x(t) (x1(t), x2 (t)) .

Рис. 3. Движение материальной точки вдоль прямой.

26

Формальное описание системы:

.

 

 

0

x1 (t) x2 (t),

x1 (0) x1 ,

.

 

 

x (t) u(t),

x (0) x0 .

 

2

2

2

Постановка задачи:

 

 

 

J (x (t), x (t),u(t))

T dt T inf ,

1

2

0

 

 

 

| u(t) | 1 , x1(T ) 0,

x2 (T ) 0 .

Решение этой задачи будет в дальнейшем рассмотрено на примере.

Определения.

1. Если оптимальное управление задается как функция фазовых координат управляемого объекта

u u(t, x) ,

то такая функция называется синтезирующей функцией управления.

2. Управление, заданное как функция времени при некоторых начальных

значениях x0

ux 0 u (t) ,

называется программным управлением.

Синтез оптимального управления, то есть нахождение синтезирующей функции, более предпочтителен чем просто нахождение программного управ-

ления. В частности если имеется синтезирующая функция u u(t, x) , то программное управления для заданных начальных значений получается по формуле.

,

Кроме того, при управлении системой возможны следующие источники погрешностей:

1.Параметры управляемой системы измеряются с погрешностями.

2.Управление вычисляется и осуществляется с погрешностями.

3.На движение управляемого объекта могут оказывать влияние факторы, неучтенные в модели движения.

При этих условиях, знание синтезирующей функции позволяет осуществ-

лять оптимальную коррекцию траектории.

27

Найти полную синтезирующую функцию удается только в редких случаях, однако в простейшей задаче оптимального быстродействия это возможно сделать (рис. 4).

Рис. 4. Иллюстрация к синтезу оптимального управления в простейшей задаче оптимального быстродействия.

На рис. 4 показано семейство фазовых траекторий при оптимальном управлении, которое может быть экстраполировано на все возможные начальные условия. Верхняя правая часть полуплоскости фазовой плоскости соответствует начальным условиям, для которых при оптимальном управлении сначала давать максимальную располагаемую тягу вдоль отрицательного направления оси x; нижняя левая – начальным условиям, для которых оптимально сначала давать максимальную располагаемую тягу вдоль положительного направления оси x. Точки переключения расположены на двух нарисованных полупараболах, проходящих через начало координат.

Вопросы для самоконтроля:

1.Расшифруйте сокращение ОДУ. Что оно обозначает?

2.Чем отличаются стационарные и нестационарные динамические си-

стемы?

3.Что такое фазовые переменные системы, фазовое пространство, фазовые траектории? Приведите примеры.

4.Что такое управляющие воздействия? Приведите пример.

5.Имеется ли связь между размерностями вектора управляющих воздействий и размерностью вектора фазовых переменных?

6.Чем отличается синтезирующая функция от программного управления? Как можно получить одно из другого?

28

Вопрос 2. Принцип оптимальности и принцип максимума Понтрягина

Решение задачи оптимального управления – поиск оптимального управления обычно осуществляется на основе одного из двух принципов: принципа оптимальности Беллмана или принципа максимума Понтрягина.

Принцип оптимальности Беллмана. Начиная с любого момента вре-

мени t [t0, T], оптимальное управление должно оставаться оптимальным на оставшемся промежутке [t, T].

Замечание. Принцип оптимальности в несколько другой формулировке будет использован для решения задач в теме 3. Для решения простейшей задачи оптимального быстродействия будет использоваться принцип максимума Понтрягина.

Принцип максимума Понтрягина

Сформулируем принцип максимума Понтрягина для стационарных динамических систем с интегральным критерием качества управления.

Для простоты записи полагаем t0 = 0:

x (t) f (x (t),

 

(t)), t [0,T ]

u

 

x (0) x 0 ,

x (T ) xT ,

 

 

 

 

 

 

 

 

 

 

 

 

u (t) U ,

 

 

 

Требуется найти управление u (t) , которое переводит эту систему из со-

стояния x 0 в состояние xT , удовлетворяя уравнениям движения, и минимизи-

рует критерий оптимальности управления – функционал

J (x,u ) 0T f0 (t, x (t),u (t))dt .

Рассмотрим гамильтониан системы – функцию:

n

H ( (t), x (t),u (t)) i (t) fi (x (t),u (t)) .

i 0

Введем дополнительную константу ψ0 и вспомогательные функции

(t) ( 1(t), , n (t)) , t [0,T ],

являющиеся решением сопряженной системы ОДУ по переменной t:

 

d i

 

 

 

 

 

(t), x (t),

 

(t))

 

 

 

H (

u

, i 1, , n

 

 

 

 

 

 

x

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

или в векторной форме

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( (t), x(t),u (t)) .

 

 

H X

29

Теорема. (Принцип максимума Понтрягина)

Пусть uˆ(t) – допустимое управление, переводящее стационарную динамическую систему из точки x0 в точку xT , а xˆ(t) – соответствующая фазовая траектория. Для оптимальности процесса (uˆ(t), xˆ(t)), t [0,T ] необходимо существование такой константы 0 0 и такого решения

(t) ( 1(t), , n (t)), t [0,T ]

сопряженной системы, что вектор-функция ( 0 (t), 1(t), , n (t)) не тривиальна и для любого момента времени t [0,T ] выполняется условие максимума

maxu U H ( (t), x(t),u (t)) H ( (t), xˆ(t),uˆ(t)) .

Нетривиальность вектор-функции ( 0 (t), 1(t), , n (t)) означает, что среди величин 0 (t), 1(t), , n (t) имеется хотя бы одна тождественно не равная нулю.

Замечания.

1.Отметим, что начальные условия для сопряженной системы не заданы, то есть можно получить только общее решение этой системы.

2.Принцип максимума определяет лишь необходимое условие оптимальности, т.е. дает траектории лишь «подозрительные» на оптимальность. Для определения из их числа оптимальной траектории необходима дополнительная проверка.

Рассмотрим реализацию принципа максимума для простейшей задачи оптимального быстродействия, сформулированной выше.

Критерий качества управления:

J (x1, x2 ,u) T , то есть f0 = 1.

Гамильтониан системы:

n

H ( 0 , 1, 2 , x1, x2 ,u) i fi (x1, x2 ,u) 0 1 x2 2 u.

i 0

Сопряженная система ОДУ:

 

 

 

 

 

 

, x,u)

 

 

H (

 

1

 

 

 

 

 

 

 

x1

 

 

 

 

 

 

 

 

 

 

 

 

 

H ( , x,u)

 

 

 

 

 

 

 

 

 

 

 

2

 

x2

 

 

 

0,

1.

30

Известно множество обобщений принципа максимума Понтрягина, например, для следующих условий и задач.

Задача с подвижными концами. Здесь векторы x0 , xT не фиксированы, а

должны лишь попасть на некоторые гладкие поверхности M 0 и MT , размерность которых меньше n и такие, что x0 M0 , xT MT .

Дополнительные ограничения на вектор управления. Кроме требова-

ния минимизации критерия оптимальности заданы дополнительные ограничения на управление вида

Ji (u (t)) 0, i 1, ,k ,

где Ji (u (t)) – некоторые функционалы.

Обобщение для нестационарных динамических систем.

Обобщение для динамических систем с параметрами.

Поскольку аналитическое решение задачи оптимального управления связано с решением системы обыкновенных дифференциальных уравнений – сопряженной системы, точное решение, за исключением простейших и специальных случаев. Одним из подходов к решению этой проблемы является приближение участвующих функций с помощью формулы Тейлора, и последующая работа с упрощенной приближенной моделью системы.

Другой подход связан с тем, что алгоритмы и решения задач оптимального управления, в силу их непрерывности, можно впрямую реализовать посредством аналоговых схем, как это и делалось до появления быстродействующих цифровых компьютеров. Однако современные компьютеры, как правило цифровые и работают в дискретном времени. Решением задач оптимального управления для систем дискретного времени занимается динамическое программирование, с основами которого мы познакомимся в следующей теме.

Динамическое программирование основывается на ряде принципов общих с теорией оптимального управления, но часто позволяет более просто получать программное управление и даже синтезирующую функцию.

Вопросы для самоконтроля:

1.Как формулируется принцип оптимальности Беллмана?

2.Запишите принцип максимума Понтрягина для стационарной динамической системы.

3.Как записывается гамильтониан стационарной динамической системы?

4.Что такое сопряженная система ОДУ?

5.В чем отличие задачи с подвижными концами?