Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Оптимальные и адаптивные системы.doc
Скачиваний:
44
Добавлен:
02.05.2014
Размер:
1.7 Mб
Скачать

2. Принцип максимума Понтрягина.

1. Теорема (см. ниже) будет справедлива для линейных уравнений. Система описывается линейными дифференциальными уравнениями.

(1)

- фазовые координаты,

- управляющее воздействие.

Ставиться задача отыскать такое управление U(t), чтобы доставить экстремум функционалуIпри определённых краевых условиях.

U(t) - ?

(2)

ограничение на управление :(3)

U(t) Ω

краевые условия : (4)

Можно ввести специальные функции

- в (1).

Геометрической интерпретацией является переход от n-мерного пространства к (n+1)-мерному пространству.

  1. Вводится понятие Гамильтониана.

(5)

- неизвестная функция времени, для её определения имеется канонически сопряженная система уравнений вида :

Гамильтонова система уравнений (6)

Теорема принципа максимума Понтрягина

Для оптимальности управления U(t) и соответствующее ему в силу уравнений (1) траектория y(t), необходимо существование такой ненулевой непрерывной функции ψ(t) с координатами ψ1,…ψn , соответствующее U(t) и y(t) в силу уравнений (6), что при любом t в пределах t0 ≤ t ≤ T функция параметра U принимает при максимальное значение.

Для доказательства теоремы принципа максимума Понтрягина используем вариационное исчисление.

Вычесть значение функционала неприварьированного и из значния функционала приварьированного и приравнять к нулю.

В вариационном исчислении вариации – это непрерывные гладкие функции.

В принципе максимума Понтрягина – скачкообразное изменение управления, которое с самого начала включено в класс отыскиваемых экстремалей. Кусочно-непрерывные функции являются во многих экстремальных задачах оптимальным управлением.

Алгоритм принципа максимума.

  1. Формируется система уравнений объекта

  1. Формируется гамильтониан Н

  1. Определяется U, максимизирующее H из системы уравнений

(7)

Возможно, что max Н достигается на границе допустимой области управления (Ω), тогда для некоторых j равенство (7) может не выполняться для ненулевой, непрерывеой функции (как следовало из теоремы принципа max).

Для некоторых j max Н достигается на границе U.

Неизвестны :

-----------------------------

(2n+2+r) – штук

(8)

В последующих примерах решения совместной системы (8) избежим благодаря низкому порядку n и физическому смыслу задачи.

особенность принципа максимума – вариационная задача нахождения функции , экстремизирующей i, заменяется более простой задачей нахождения параметра U, максимизирующей H.

Пример : 1. нахождение с помощью принципа максимума оптимального управления двигателем постоянного тока с независимым возбуждением.

1)

  1. (9)

?

Принцип максимума Понтрягина требует существования ненулевой функции. Значит U, максимизирующее H следует брать на границе : либо +1, либо –1. Очевидно, что при надо брать U = +1, а при надо брать U = –1.

Этот закон можно записать в виде выражения (9) :

; ;

Пример : 2 задача о безударной стыковке (оптимальная встреча 2-ух объектов)

(1)

(мишень)

ya

-a

а yb

(объект) -b

τ

Ставится задача так изменить U(t), чтобы за минимальное время положение и скорости объектов A и B в пространстве совпали.

2.

В задачах о максимальном быстродействии можно опустить в гамильтониане Н первое слагаемое, равное .

,

U максимизирующее Н :

меняет знак не более одного раза, следовательно оптимальное управление меняет знак не более одного раза или имеет не более двух интервалов постоянства.

U

+1 b

t1=τ1 τ2=t2 t

-1

Из физического смысла задачи ясно, что в начальный момент управление должно обеспечивать разгон объекта B, а затем его торможение (см. рис.). В момент перехода с тяги не торможение – t1; в момент сближения – τ2=t2, после которого движение должно проходить одинаково и при этом U=b.

Введём относительное время регулирования

конечн. усл.

а) [0 ; τ1]

(2)

(3)

(4)

н.у. (6)

б)

(5)

интегрируя (5) с учётом н.у. (6) получим :

(7)

(8)

По условию задачи в момент окончания процесса . Если в (7) и (8) подставитьи приравнять к нулю, то получим сложные функции, содержащиеи.

(9)

(10)

Эти выражения решаются графически :

из (9) :

из (10) :

Теорема об n интервалах (Фельдбаум А.А.)

Для линейной системы n-го порядка, у которой все корни характеристического уравнения действительны, а на управление наложено ограничение оптимальное управление, доставляющее экстремум линейному функционалу, представляющему собой кусочно-постоянную функцию, принимающую граничные значенияи имеющую не более n интервалов постоянства. (1949г. Фельдбаум А.А.)

Пример 3 : Оптимальное управление консервативным объектом

1.

(1)

- консервативный объект

корни : p = ±j

2.

(2)

(3)

U

+1

t0 t1 t2 t3 t

-1

Для изучения кусков траекторий соответствующих отрезкам времени, на которых либо +1 U, либо –1 U, рассмотрим вспомогательную систему :

(4) ,

отличающуюся от (1) тем, что U=0.

Если построить фазовые траектории для системы (4), то получим :

x2

x1

R

Движение по физической траектории по часовой стрелке, движение осуществляется равномерно, с линейной скоростью 2πR (один оборот за время 2π, половина за π).

x2 x2

0+1 x1 0-1 x1

Зададимся каким-то видом управления :

U0 β<π

t0 t1 t

π+α 2π+α

α<π

рис.1

Заключим отрезки оптимальной траектории соответствующего угла ОА при U=+1 и действующем при отрезке β<π.

В т.А фазовая точка, двигаясь в течение отрезка π, попала под действие управления U=–1, т.е. предыдущим для дуги АО является дуга АВ, являющаяся полуокружностью АВ с центром в (0-1) или т.В располагается симметрично точке А на полуокружности N1N2 c центром симметрии (0-1).

Дуге ВА предшествует дуга СВ, соответствующая отрезку времени π, на котором U=+1, т.е. точка С располагается симметрично точке В с центром симметрии на полуокружности М2М3.

Линии переключения: полуокружности радиуса 1

…N4N3N2N1M1M2M3

Возьмём другое управление:

U α<π

α

t0 π+α 2π+α t1 t

β<π

рис. 2

Объединяя рис.1 и рис.2 получим общий портрет:

Задача с ограничением на фазовые координаты

U

a

x2m

t

t0 I tA II tB III t1

t0 - tA – разгон (тяга), скорость нарастает и достигает x2m в момент tA

tA- tB – управление = 0, режим выбега

tB- t1 – торможение с замедлением -а

II-го участка может не быть