Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

VbIshka / Специальные главы математики

.pdf
Скачиваний:
62
Добавлен:
16.03.2016
Размер:
1.16 Mб
Скачать

61

с импульсом системы L mx p . А из уравнения Лагранжа следует, что

L

 

d

L

x

 

p . Пусть функция Лагранжа явно не зависит от времени. То-

 

 

 

 

 

x

 

 

 

dt

x

 

гда полную производную по времени записываем следующим образом:

dL L x L x dt x x

d px L 0 . dt

d

L

L

 

 

 

 

x

 

x

 

 

x

dt

x

 

d

L

 

x

 

 

 

 

dt

x

Из последнего уравнения следует, что при движении по экстремали сохраняется постоянной величина ( x p L ). Эта величина является полной энергией системы и ее называют гамильтонианом системы H (x, p) .

H (x, p) x p L(x, x )

Запишем выражение для полного дифференциала этой функции:

dH x dp pdx L dx L dx x dp pdx p dx pdx p dx x dp .

x x

Сопоставляя полученное выражение с общим выражением для полного дифференциала

dH

H

dx

H

dp , получаем уравнения, которые в механике называют

 

 

 

x

p

уравнениями Гамильтона

H p

x

.

H xp

Эти уравнения являются наиболее общей формой записи уравнений движения. Таким образом, если движение подчиняется уравнениям Гамильтона, то вдоль всей траектории энергия системы сохраняется.

62

Принцип максимума Л.С. Понтрягина в оптимальном управлении

Пусть движение объекта задается системой дифференциальных уравнений

 

 

 

 

 

dxi

 

 

 

 

 

 

 

 

 

 

 

 

 

f ( X (t),U (t)) ,

i 1 ,2,3 n

 

 

 

 

 

 

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

x2

 

- вектор фазовых координат, а

U (u u

 

 

u

 

) - вектор

Здесь X

2

 

r

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xn

 

 

 

 

 

 

 

 

 

 

 

управления. Важным является то, что вектор управления не может быть произвольным. Он ограничен физическими и конструкционными особенностями зада-

чи: U min U U max .

Задача. Требуется найти такую функцию управления U (t) , которая обеспечила бы минимум функционала

f0 ( X (t),U (t))dt .

t0

Этот функционал может иметь различный смысл, например, может быть временем перехода системы из одного состояния в другое, временем затухания переходного процесса и т.д.

Рассмотрим линейную задачу на быстродействие. В этой задаче функционал имеет смысл времени перехода

T

dt T t0

t0

 

системы из состояния X (t0 ) X 0 в

состояние X (T ) X1 .

Оптимальным называют управление

U (t) , которое обеспечит перевод системы

из одного состояния в другое за наименьшее время.

Однако ограниченность управления не позволяет применить для решения задачи классическое вариационное исчисление. Задачу решил Л.С. Понтрягин следующим образом.

Кроме фазовой координаты в рассмотрение вводится также и фазовый импульс. Обозначим вектор фазового импульса как ( 1, 2 , , n ) .

По аналогии с классической теоретической механикой рассматривается функция

H 1 f1 ( X ,U ) 2 f2 ( X ,U ) n fn ( X ,U ) ,

63

которая называется гамильтонианом и по смыслу является полной энергией системы. Эта функция связана с векторами фазовых координат и импульсов уравнениями, аналогичными уравнениям Гамильтона в механике

 

 

Н

 

dx

i

 

 

 

 

 

 

i

dt

 

 

 

 

 

H

 

d

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

 

 

dt

 

 

 

 

 

 

 

xi

i

Для оптимального управления вектор управления должен быть таким, чтобы при любых фазовых координатах и импульсах обеспечивался максимум гамильтониана как функции управления H (U ) .

При этом необходимые условия существования экстремума имеют вид

H H H 0 .U1 U 2 U r

Запись линейной системы в матричной форме имеет вид

 

 

 

dX

 

 

 

 

 

 

 

 

 

AX U

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

d

 

 

.

 

 

 

 

 

 

 

A

 

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

H ( X

, ,U ) AX

( ,U )

Из последнего выражения гамильтониана следует, что он принимает наиболь-

шее значение в случае, когда скалярное произведение ( ,U ) максимально. Другими словами векторы фазового импульса и управления должны быть сонаправлены.

Рассмотрим конкретную задачу: точка массы m 1 движется по инерции. Как за наименьшее время остановить ее в начале координат под действием ограниченной силы?

Уравнение движения в данном случае имеет вид mx U ,

U

1.

Шаг 1. Переписываем дифференциальное уравнение в равносильную систему, вводя новые переменные x x1, x x2 x1

64

x

x

 

f

0

1

1

 

2

1 .

A

0

0

 

 

U f2

 

 

x2

 

 

 

 

Записываем гамильтониан системы

 

H 1 f1

2 f2 1x2

2U

Шаг 2. Записываем уравнения Гамильтона (второе уравнение из системы) и получаем систему уравнений для нахождения фазовых импульсов:

 

 

H

 

0

d

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dt

 

 

 

 

 

x1

 

 

 

.

 

H

 

 

 

 

d

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

`1

 

 

 

 

x2

 

 

 

 

 

 

 

 

dt

 

 

Решение системы имеет вид

1

C1

.

C1t C2

2

 

Шаг 3. Найденные выражения для импульсов подставляем в гамильтониан системы

H (U ) C1x2 (C2 C1t)U .

Записываем необходимые условия существования экстремума:

H C2 C1t 0 .U

Из этого выражения видно, что производная имеет только один нуль. Функция C2 C1t является строго монотонной и изменяет знак один раз.

Максимум гамильтониана как функции управления обеспечивается при условии: управление принимает максимальное по абсолютной величине значение. Поэто-

U 1,

C2 C1t 0

му возможными значениями управления являются

C2 C1t 0

U 1,

Шаг 4. Находим фазовые траектории при различных возможных значениях управления.

Так

 

для значения управления U 1 исходная система уравнений имеет вид

 

dx1

 

x2

 

 

 

dt

 

 

.

dx

2

 

 

 

 

1

 

 

 

 

 

 

dt

 

 

 

65

Исключая время, получаем уравнение для нахождения фазовой траектории

dx2 1 . Решая уравнение, находим, что фазовыми траекториями являются па- dx1 x2

раболы

x22

x

C , ветви которых в системе координат ( x , x

2

) направлены

 

 

2

1

1

1

 

 

 

 

 

 

 

вправо. Обе компоненты скорости положительны. Поэтому движение вдоль фазовых траекторий происходит по часовой стрелке (сплошные линии).

 

 

 

 

 

dx

 

 

 

 

 

 

 

 

 

1

 

x2

Для значения управления U 1

 

 

 

 

 

 

исходная система имеет вид dt

,

 

 

 

 

 

 

 

dx

2

 

1

 

 

 

 

 

 

 

 

 

 

 

dx2

 

1

dt

 

 

а уравнение для фазовых траекторий

 

имеет своим решением семей-

dx1

x2

 

 

 

 

 

 

 

 

 

ство парабол, ветви которых направлены влево. При этом обход фазовых траекторий происходит также по часовой стрелке (пунктирные линии).

x2

x1

Анализ обхода траекторий показывает, что система, находящаяся в состоянии, характеризуемом произвольной точкой фазовой плоскости, может попасть в начало координат только при условии перехода (переключения) с фазовой траектории одного типа на фазовую траекторию другого типа, проходящую через начало координат.

66

Шаг 5. Рассмотрим задачу с конкретными начальными условиями. Пусть в на-

чальный момент система находилась в состоянии

x

(0) a

0

 

1

 

. В момент вре-

 

 

x2 (0) 0

 

x1(T ) 0 мени T система находится в начале координат .

x2 (T ) 0

При выбранных начальных условиях движение должно начаться по траектории, соответствующей значению управления U 1 (парабола с ветвями, направленными влево), и продолжиться по траектории, соответствующей управлению U 1, проходящей через начало координат.

x2

t1

x 1

 

a

Для нахождения момента переключения t1 с одной траектории на другую находим конкретные уравнения траекторий.

dx

 

 

 

1

x

2

 

 

dt

 

Решаем систему

 

, x1(0) a,

dx2

1

 

dt

 

 

 

Решаем систему операторным способом:

x2 (0) 0

 

 

pX

1

( p) a X

2

( p)

 

 

 

 

 

pX 2 ( p)

 

1 .

 

 

p

 

 

 

 

 

 

Имеем

 

X 2

( p)

1

t ,

X1

( p)

a

 

X 2 ( p)

 

a

 

1

a

t 2

.

 

p2

p

p

p

p3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

x

 

 

 

 

 

t 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

a

2

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

67

dx

 

 

 

 

1

 

x2

 

 

 

 

x1(T ) x2 (T ) 0 . Для того, чтобы применить

Решаем систему dt

,

 

dx2

 

1

 

dt

 

 

 

 

 

 

 

операторный метод, вводим новую переменную таким образом, чтобы начальные условия соответствовали моменту 0 : t T . Тогда система записы-

dx

 

 

 

1

x2 ( )

 

 

вается следующим образом d

 

, x1(0) x2 (0) 0

 

dx2 ( )

1

 

d

pX

1

( p) X

2

( p)

 

 

 

 

 

 

 

 

pX

2

( p)

1

,

 

 

 

 

 

 

 

 

p

 

 

 

 

 

 

 

 

X

 

( p)

1

 

 

1

2

2

 

 

X1

( p)

 

 

 

 

p

2

p

3

 

 

 

 

 

 

 

2

 

 

 

 

 

(t T )

2

 

x

 

 

 

Возвращаясь к исходной переменной, получаем решение:

 

1

 

 

 

2

 

.

 

 

 

 

 

 

 

 

x

2

 

 

 

t T

 

 

 

 

 

 

 

x1 (t1 ) x1 (t1 ) Находим точку пересечения, решая систему ,

x2 (t1 ) x2 (t1 )

 

t 2

 

t 2

 

T 2

 

 

 

 

 

1

a

1

Tt1

 

 

 

 

 

 

 

получаем t1

a, T 2 a

2

 

 

 

2

 

2

 

 

t1 t1 T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, материальная точка будет остановлена в начале координат за наименьшее время T , если в момент времени t1 переключить управление на противоположное.

ВАРИАНТЫ

1. Объект управления задается уравнением x U . Определите алгоритм

k

оптимального управления, который обеспечит перевод объекта из началь-

ного

состояния

x(0) 0,

 

в

конечное

состояние

x (0) 0

x(T ) 1,

 

за минимальное время T . Определите число и момен-

x (T ) 0

ты переключений. Постройте кривую управления, кривые x(t),

x (t) , фа-

зовые траектории. Заданы параметры

 

U

 

0,5

k 2.

 

 

 

 

68

1. Объект управления задается уравнением

T1 x x kU .

Определить алгоритм оптимального управления, который обеспечит пере-

 

 

 

 

 

 

 

конечное со-

вод объекта из начального состояния x(0) 0, x

(0) 0 в

стояние

x(T ) 1,

 

 

при условии

x (T ) 0 за минимальное время T

 

U

 

10,

k 1,

T1 0,1 c . Определите число и моменты переключений. По-

 

 

стройте

фазовый портрет и графики функций x(t),

 

 

x (t)

 

Ответ : (T 0,59c)

Вопросы к зачету

1.Основные характеристики динамических звеньев (передаточная функция, амплитудно-частотная характеристика, фазово-частотная характеристика, амплитудно-фазовая характеристика).

2.Понятие решетчатой функции. Z преобразования. Определение. Восстановление оригинала. Применение к решению разностных уравнений.

3.Случайные функции (процессы). Сечение случайного процесса. Основные характеристики случайного процесса (математическое ожидание, дисперсия, автоковариационная функция, автокорреляционная функция). Понятие эффективного времени корреляции.

4.Характеристики стационарных случайных функций (процессов). Оценка эффективного времени корреляции.

5.Спектральное разложение стационарных случайных функций. Понятие спектральной плотности. Теорема ВинераХинчина. Оценка эффективной ширины спектральной плотности.

6.Дисперсия стационарного случайного процесса с непрерывным спектром. Вычисление. Связь со средним квадратом случайного процесса (мощностью).

7.Преобразование стационарных случайных функций линейными динамическими системами.

8.Эргодическое свойство стационарного случайного процесса. Способы определения автокорреляционной функции по опытным данным (усреднение по реализациям, усреднение по времени).

9.Динамическая интерпретация автономных линейных дифференциальных уравнений первого порядка. Понятие фазовой траектории, фазового портрета, качественной эквивалентности.

10.Равносильность линейного дифференциального уравнения второго порядка и системы двух линейных уравнений первого порядка. Фазовая плоскость. Понятие фазовых координат. Фазовая траектория. Фазовый портрет.

11.Матричная запись системы линейных дифференциальных уравнений первого порядка. Характеристики матрицы системы: собственные векторы и собст-

69

венные значения матрицы. Характеристическое уравнение. Подобие матриц. Жорданова форма матрицы. Понятие качественной эквивалентности.

12.Анализ качественно различных систем второго порядка : случай действительных и различных собственных значений. Фазовые портреты.

13.Анализ качественно различных систем второго порядка: случай действительных одинаковых собственных значений . Фазовые портреты .

14.Анализ качественно различных систем второго порядка: случай комплексных собственных значений. Фазовые портреты .

15.Запись линейного дифференциального уравнения порядка n 2 в матричной форме. Построение жордановой формы матрицы системы.

16.Алгоритм решения однородной системы линейных дифференциальных уравнений с использованием матричной экспоненты. Матричная функция отклика.

17.Алгоритм решения неоднородной системы линейных дифференциальных уравнений с использованием матричной экспоненты.

18.Понятие устойчивости линейных систем. Критерий Гурвица.

19.Логарифмический вычет и принцип аргумента для функции комплексного переменного.

20.Применение принципа аргумента к исследованию на устойчивость линейных систем на примере критерия устойчивости Михайлова.

21.Нелинейные системы. Устойчивость по первому приближению. Теорема о линеаризации.

22.Понятие функционала. Основная задача вариационного исчисления. Уравнение Эйлера. Понятие экстремали.

23.Задача о брахистохроне.

24.Задача с подвижными границами. Условия трансверсальности.

25.Принцип наименьшего действия в механике. Уравнения Лагранжа и Гамильтона.

26.Принцип максимума Л.С. Понтрягина в оптимальном управлении.