Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Матика 2 курс / Специальные главы математики 140410(ЭАб)

.pdf
Скачиваний:
38
Добавлен:
10.05.2015
Размер:
1.59 Mб
Скачать

61

Сучетом условий трансверсальности:

Сучетом граничного условия получаем

Искомая кривая

ВАРИАНТЫ:

 

 

 

 

 

 

 

 

x1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1) I ( y)

1

 

 

 

2

 

 

 

 

2

2,

y(x1) x1

( y )

dx, y(x0 ) x0

 

 

 

 

 

 

 

 

x0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( y x

11

,

 

x

 

 

 

1

 

, x

11

)

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

2

 

 

1

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1/ 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2) I ( y) ( y

 

2

 

)dx,

 

y(0) 0

 

 

 

( y )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( y

1

 

x(1 x) )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x1

 

 

 

 

 

 

2

 

 

 

 

 

 

 

1

 

3) I ( y)

1 ( y )

 

 

 

 

y(0) 0,

y(x1 )

 

 

 

 

 

dx,

 

 

 

 

x2

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( y

 

,

x

 

6

2

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

РГР 11. Принцип максимума Л.С. Понтрягина

Литература

62

Гюнтер Н.М. Курс вариационного исчисления [электронный ресурс] / Н. М.

Гюнтер. – СПб.: Лань, 2009. – 320 с.

Принцип наименьшего действия в механике.

Наиболее общей формой закона движения в механике является принцип наименьшего действия. Согласно этому принципу механическая система полностью задается координатами и скоростями (импульсами ) элементов системы при помощи функции Лагранжа L L(x, x ,t) Eкин Eпот , которая является разностью между кинетической и потенциальной энергиями

системы. Движение между двумя

точками x(t1) x1 и

x(t2 ) x2 всегда

происходит

таким

образом,

чтобы

функционал

действия

S(x(t))

t2

 

 

 

 

 

 

 

 

 

 

принимал наименьшее возможное значение.

Другими

L(x, x ,t)dt

 

t1

 

 

 

 

 

 

 

 

словами

 

траектория

 

движения

x(t) должна

быть

экстремалью и

удовлетворять уравнению Эйлера, которое в механике называют уравнением

 

L

 

d

L

 

 

 

 

 

 

 

 

Лагранжа:

x

 

 

 

 

 

 

 

0 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dt

x

 

 

 

 

 

 

 

 

Используя

выражение для кинетической энергии,

представляем функцию

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

Лагранжа

в

 

виде

 

L

m(x )

 

Eпот . Тогда частная

производная по x

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

L

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

совпадает с

импульсом системы x mx

p . А

из

уравнения Лагранжа

 

 

 

L

 

 

d

L

 

 

 

 

 

 

 

 

следует, что

x

 

 

 

 

 

 

 

 

p

. Пусть функция Лагранжа явно не зависит от

 

 

 

 

 

 

 

 

 

dt

x

 

 

 

 

 

 

 

 

времени. Тогда полную производную по времени записываем следующим образом:

 

dL

 

L

 

L

 

d

L

 

L

 

 

d

L

 

 

 

 

 

 

 

x

 

 

x

 

 

 

x

 

x

 

 

x

 

 

 

 

 

x

x

 

 

x

 

 

 

dt

 

 

 

dt

x

 

 

 

dt

x

 

d

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dt px

L 0 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из

последнего

уравнения

следует,

 

что

при движении по экстремали

сохраняется постоянной величина

 

 

 

 

( x p L ). Эта величина является полной

энергией системы и ее называют гамильтонианом системы H (x, p) .

63

H (x, p) x p L(x, x )

Запишем выражение для полного дифференциала этой функции:

dH x dp pdx L dx L dx x dp pdx p dx pdx p dx x dp .

x x

Сопоставляя полученное выражение с общим выражением для полного дифференциала

dH

H dx

H dp , получаем уравнения, которые в механике называют

 

x

 

 

p

уравнениями Гамильтона

H

p

 

 

x

 

.

 

H

 

 

 

x

 

 

 

p

 

 

 

 

 

Эти уравнения являются наиболее общей формой записи уравнений движения. Таким образом, если движение подчиняется уравнениям Гамильтона, то вдоль всей траектории энергия системы сохраняется.

1.Принцип максимума Л.С. Понтрягина в оптимальном управлении.

Пусть движение объекта задается системой дифференциальных уравнений

 

 

 

 

 

 

 

dxi f ( X (t),U (t)),

 

i 1,2,3 n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x2

 

 

- вектор фазовых координат,

а

u

 

 

u

 

) - вектор

Здесь X

 

 

 

 

U (u

2

r

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xn

 

 

 

 

 

 

 

 

 

 

 

 

 

 

управления.

 

Важным является то,

что вектор управления не может быть

произвольным. Он ограничен физическими и конструкционными особенностями задачи : Umin U Umax .

64

Задача. Требуется найти такую функцию управления U (t) , которая обеспечила бы минимум функционала

t

 

 

f0 ( X (t),U (t))dt .

t0

 

Этот функционал может иметь различный смысл, например, может быть временем перехода системы из одного состояния в другое, временем затухания переходного процесса и т.д.

Рассмотрим линейную задачу на быстродействие. В этой задаче функционал имеет смысл времени перехода

T

 

 

 

 

 

dt T t0

 

 

 

t0

 

 

 

 

 

 

 

 

 

 

 

системы из состояния

X (t0 ) X 0

в состояние

X (T ) X1 .

Оптимальным называют

управление U (t) ,

которое

обеспечит перевод

системы из одного состояния в другое за наименьшее время.

Однако, ограниченность управления не позволяет применить для решения задачи классическое вариационное исчисление. Задачу решил Л.С. Понтрягин следующим образом.

Кроме фазовой координаты в рассмотрение вводится также и фазовый

импульс. Обозначим вектор фазового импульса как ( 1, 2 , , n ) .

По аналогии с классической теоретической механикой рассматривается

функция

 

 

 

 

 

 

 

H 1 f1(X ,U ) 2 f2

( X ,U ) n fn (X ,U ),

которая называется гамильтонианом и по смыслу является полной энергией системы. Эта функция связана с векторами фазовых координат и импульсов уравнениями, аналогичными уравнениям Гамильтона в механике

 

 

Н

 

 

dx

 

 

 

 

 

 

i

xi

 

i

 

 

 

 

 

 

 

dt

 

H

 

 

d

i

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

xi

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

Для оптимального управления вектор управления должен быть таким, чтобы при любых фазовых координатах и импульсах обеспечивался максимум гамильтониана как функции управления H (U ) .

При этом необходимые условия существования экстремума имеют вид

65

 

 

 

 

H

 

 

H

 

 

H

0 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

U1

 

 

U 2

 

 

U r

Запись линейной системы в матричной форме имеет вид

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dX

 

 

 

 

 

 

 

 

 

 

 

 

AX

U

 

 

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

d

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A

 

 

 

.

 

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H ( X ,

,U ) AX

(

,U )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из последнего выражения гамильтониана следует,

что он принимает

наибольшее значение в случае, когда скалярное

произведение

 

 

(

,U )

максимально. Другими словами векторы фазового импульса и управления должны быть сонаправлены.

Рассмотрим конкретную задачу: точка массы m 1 движется по инерции. Как за наименьшее время остановить ее в начале координат под действием ограниченной силы?

Уравнение движения в данном случае имеет вид mx U ,

 

U

 

1.

 

 

 

 

 

 

 

Шаг1. Переписываем дифференциальное уравнение в равносильную систему,

вводя новые переменные x x1, x

 

 

 

x2 x1

 

x2 f1 .

x1

 

U f2

x2

0 1 A 0 0

Записываем гамильтониан системы H 1 f1 2 f2 1x2 2U

Шаг 2. Записываем уравнения Гамильтона (второе уравнение из системы) и получаем систему уравнений для нахождения фазовых импульсов:

 

H

 

0

 

d

1

 

 

 

x1

 

 

 

 

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

H

`

 

 

d .

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

x2

 

1

 

 

dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

66

Решение системы имеет вид

 

1 C1

.

 

C t C

 

2

1

2

Шаг 3. Найденные выражения для импульсов подставляем в гамильтониан системы

H (U ) C1x2 (C2 C1t)U .

Записываем необходимые условия существования экстремума:

H C2 C1t 0.U

Из этого выражения видно, что производная имеет только один нуль. Функция C2 C1t является строго монотонной и изменяет знак один раз.

Максимум гамильтониана как функции управления обеспечивается при условии: управление принимает максимальное по абсолютной величине значение. Поэтому возможными значениями управления являются

U 1, C2 C1t 0 U 1, C2 C1t 0

Шаг 4. Находим фазовые траектории при различных возможных значениях управления.

Так

для значения управления U 1 исходная система уравнений имеет вид

dx

 

x2

 

1

 

 

 

 

dt

 

.

dx2

 

1

 

 

dt

 

 

Исключая время, получаем уравнение для нахождения фазовой траектории

dx2 1 . Решая уравнение, находим, что фазовыми траекториями являются dx1 x2

параболы

x22

x

C

, ветви которых в системе координат ( x , x

2

) направлены

 

 

2

1

1

1

 

 

 

 

 

 

 

вправо. Обе компоненты скорости положительны. Поэтому движение вдоль фазовых траекторий происходит по часовой стрелке (сплошные линии).

 

dx

x2

 

 

1

Для значения управления U 1

dt

исходная система имеет вид

,

 

dx2

1

 

 

 

 

dt

 

67

 

 

 

 

а уравнение для фазовых траекторий

 

dx2

 

1

имеет своим решением

 

dx1

x2

 

 

 

 

семейство парабол, ветви которых направлены влево. При этом обход фазовых траекторий происходит также по часовой стрелке (пунктирные линии).

x2

x1

Анализ обхода траекторий показывает, что система, находящаяся в состоянии, характеризуемом произвольной точкой фазовой плоскости, может попасть в начало координат только при условии перехода (переключения) с фазовой траектории одного типа на фазовую траекторию другого типа, проходящую через начало координат.

Шаг 5. Рассмотрим задачу с конкретными начальными условиями. Пусть в

 

x

(0) a

0

 

начальный момент система находилась в состоянии

 

1

 

 

. В момент

 

 

x2 (0) 0

 

 

 

x

(T ) 0

 

времени T система находится в начале координат

1

 

.

 

x2 (T ) 0

 

При выбранных начальных условиях движение должно начаться по траектории, соответствующей значению управления U 1 (парабола с ветвями, направленными влево), и продолжиться по траектории, соответствующей управлению U 1, проходящей через начало координат.

68

x2

t1

 

x1

 

a

Для нахождения момента переключения t1 с одной траектории на другую находим конкретные уравнения траекторий.

dx

 

x2

 

 

 

1

 

 

 

dt

,

x1(0) a,

Решаем систему

 

 

dx2

 

1

 

 

 

 

 

 

 

 

dt

 

 

 

 

Решаем систему операторным способом:

x2 (0) 0

pX1( p) a X 2 ( p)

 

 

 

1 .

 

pX 2

( p)

 

p

 

 

 

 

 

 

 

 

 

 

X 2

( p)

1

t ,

X1( p)

a

 

X 2

( p)

 

a

 

1

a

t 2

Имеем

 

 

 

 

 

 

 

 

.

 

p2

p

p

p

p3

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

t 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

a

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x2

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dx

x2

 

 

 

 

1

 

 

 

 

 

 

 

x1(T ) x2 (T ) 0 .

Для того, чтобы применить

Решаем систему dt

,

dx2

 

1

 

 

 

 

 

dt

 

 

 

 

операторный метод,

 

вводим

новую переменную

таким

образом, чтобы

начальные условия соответствовали моменту 0 :

t T .

Тогда система

dx

 

 

x2 ( )

 

 

1

 

 

 

 

 

 

, x1(0) x2 (0) 0

записывается следующим образом d

 

 

 

 

 

 

dx ( )

1

 

 

 

2

 

 

 

 

 

 

 

 

 

 

d

 

 

69

pX1( p) X

2 ( p)

 

 

 

 

1 ,

 

pX 2

( p)

 

 

p

 

 

 

 

 

 

 

 

X

 

( p)

1

 

X

 

( p)

1

 

2

2

p2

1

p3

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Возвращаясь к исходной переменной, получаем решение: x1

x2

(t T )2

 

2

.

 

t T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(t1)

 

Находим

 

точку

 

 

пересечения,

решая

систему

x1(t1) x1

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x2

(t1) x2

(t1)

 

 

2

 

2

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

t1

a

t1

Tt1

 

T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

получаем

t a,

T 2 a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

2

 

2

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

t1

t1 T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, материальная точка будет остановлена в начале координат за наименьшее время T , если в момент времени t1 переключить управление на противоположное.

ВАРИАНТЫ

 

 

 

 

 

 

 

 

 

U

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1. Объект управления задается уравнением x

k .

Определите алгоритм

 

оптимального управления, который

обеспечит

перевод

объекта

из

начального

состояния

x(0) 0,

 

 

 

 

в

конечное

 

состояние

x (0) 0

 

 

x(T ) 1,

 

 

за

минимальное время

T .

Определите число

и

x (T ) 0

моменты

переключений.

Постройте

кривую управления,

кривые

 

 

 

 

 

 

 

 

 

 

 

 

U

 

0,5

k 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x(t), x (t), фазовые траектории. Заданы параметры

 

 

 

2. Объект управления задается уравнением

 

 

 

 

 

 

 

 

 

 

 

 

T1 x x kU .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Определить

алгоритм оптимального

управления,

 

который

обеспечит

перевод объекта из начального состояния x(0) 0,

 

 

0 в

конечное

x (0)

состояние

 

x(T ) 1,

 

 

 

 

 

 

 

 

 

 

 

 

T

при условии

 

x (T ) 0 за минимальное время

 

 

 

 

 

70

 

U

 

10,

k 1,

T1 0,1 c . Определите число и моменты переключений.

 

 

 

 

 

 

 

 

Постройте фазовый портрет и графики функций x(t), x (t)

Ответ : (T 0,59c)

Вопросы к зачету.

1.Основные характеристики динамических звеньев ( передаточная функция, амплитудночастотная характеристика, фазово-частотная характеристика, амплитудно-фазовая характеристика).

2.Понятие решетчатой функции. Z преобразования. Определение. Восстановление оригинала. Применение к решению разностных уравнений.

3.Случайные функции (процессы). Сечение случайного процесса. Основные характеристики случайного процесса (математическое ожидание, дисперсия, автоковариационная функция, автокорреляционная функция). Понятие эффективного времени корреляции.

4.Характеристики стационарных случайных функций (процессов). Оценка эффективного времени корреляции.

5.Спектральное разложение стационарных случайных функций. Понятие спектральной плотности. Теорема ВинераХинчина. Оценка эффективной ширины спектральной плотности.

6.Дисперсия стационарного случайного процесса с непрерывным спектром. Вычисление. Связь со средним квадратом случайного процесса (мощностью).

7.Преобразование стационарных случайных функций линейными динамическими системами.

8.Эргодическое свойство стационарного случайного процесса. Способы определения автокорреляционной функции по опытным данным (усреднение по реализациям, усреднение по времени).

9.Динамическая интерпретация автономных линейных дифференциальных уравнений первого порядка. Понятие фазовой траектории, фазового портрета, качественной эквивалентности.

10.Равносильность линейного дифференциального уравнения второго порядка и системы двух линейных уравнений первого порядка. Фазовая плоскость. Понятие фазовых координат. Фазовая траектория. Фазовый портрет.

11.Матричная запись системы линейных дифференциальных уравнений первого порядка. Характеристики матрицы системы: собственные векторы и собственные значения