Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

vostrikov

.pdf
Скачиваний:
136
Добавлен:
23.01.2019
Размер:
12.99 Mб
Скачать

13.3. Метод динамического программирования

 

 

 

441

и дополним его уравнением в частных производных (13.26)

2u0

 

V

0 .

 

 

 

 

 

 

xT

 

 

 

 

 

 

 

Выразим из второго уравнения

 

V

 

x и подставим в первое, в резуль-

тате получим

 

 

 

 

 

 

 

5x2

u2

4xu2

2u2

0

 

0

 

 

0

 

0

 

или после приведения подобных

 

 

 

 

 

 

u2

4xu

5x2

0 .

 

0

 

0

 

 

 

 

Решение квадратного уравнения относительно управления дает два

значения:

 

 

 

 

 

 

 

u0 1

5x,

u0 2

 

x.

Поскольку для одной системы двух оптимальных законов управления быть не может, одно из найденных значений не является оптимальным. Для определения оптимального управления проверим устойчивость замкнутой системы.

В уравнение объекта подставим значение u0 1 и получим уравнение замкнутой системы

x 3x .

Как видим, система неустойчива, а значит, первое управляющее воздействие не является оптимальным.

В уравнение объекта подставим значение u0 2 , при этом уравнение замкнутой системы примет вид

x 3x

и она будет устойчивой.

Таким образом, оптимальный закон управления имеет вид u0 Kx , где

K 1 .

442

Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ

13.4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА

13.4.1. ОСНОВНОЕ СООТНОШЕНИЕ ПРИНЦИПА МАКСИМУМА

Принцип максимума Понтрягина представляет собой метод расчета оптимального управления. Он был сформулирован независимо [1, 3, 31] и почти в то же время, что и метод динамического программирования. Впоследствии оказалось, что уравнения одного метода можно получить из другого и наоборот. Запишем основные соотношения принципа максимума на основе уравнений метода динамического программирования.

Рассмотрим основное соотношение (13.24)

min f0 (x, u)

V

f (x, u) 0 .

xT

u u

 

Поскольку минимум функции равен максимуму этой же функции с противоположным знаком, то справедливо:

max f0 (x, u)

V

f (x, u) 0 .

(13.27)

xT

u u

 

 

Преобразуем уравнение (13.27), предварительно введя ряд обозначений.

1. Введем расширенный вектор состояния z Rn 1 , дополнив его компонентой x0:

 

 

T

 

 

 

x0

f0 (x, u)d

 

 

 

x1

0

 

 

z

x1

.

(13.28)

 

 

 

 

xn

 

xn

 

13.4. Принцип максимума Понтрягина

443

2. Введем соответствующий расширенный вектор правых частей

Rn 1 :

 

 

f0 (x, u)

 

 

 

 

 

 

(x, u)

f1

(x, u)

.

 

 

 

(13.29)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

fn (x, u)

 

 

 

 

 

3. Вектор сопряженных координат

Rn 1 :

 

 

 

(z)

1,

V

,

,

 

 

V

.

(13.30)

 

 

 

 

 

 

x1

 

 

 

xn

 

Определим скалярное произведение вектора сопряженных координат и расширенного вектора правых частей, которое называется функцией

Понтрягина (гамильтониан):

H

(z) (x,u) .

(13.31)

Если вместо вектора сопряженных координат и расширенного вектора правых частей подставить их значения согласно (13.30) и (13.29) в выражение (13.31), то последнее можно представить следующим образом:

 

 

 

 

 

f0

(x,u)

 

H

1,

V

, ...,

V f1

(x,u)

,

x

x

 

 

 

 

 

 

 

 

1

 

n

 

 

fn (x,u)

или окончательно

H f0 (x, u)

V

f (x, u) .

xT

 

 

С учетом (13.32) уравнение (13.27) можно записать в виде

max H (z,u) 0 ,

u u

(13.32)

(13.33)

которое и представляет собой основное соотношение принципа максимума.

444

Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ

При этом сопряженные координаты определяются системой дифференциальных уравнений

 

H

.

(13.34)

 

 

zT

 

Формулировка принципа максимума. Оптимальным является управ-

ление из области допустимых значений, которое обеспечивает максимум выражения (13.33).

В случае, когда ресурс управления объекта не ограничен, для нахождения максимума гамильтониана можно воспользоваться необходимым условием экстремума

H

uT

0 . ( 13.35)

При ограниченном ресурсе (например, u U ) вычисленное с по-

мощью (13.35) оптимальное управляющее воздействие может находиться вне области допустимых значений, поэтому для отыскания максимума гамильтониана необходимо использовать максимальное значе-

ние управления U .

13.4.2. ПРОЦЕДУРА ОПРЕДЕЛЕНИЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

На основе рассмотренных соотношений принципа максимума Понтрягина можно предложить следующую процедуру расчета регулятора.

1. Описание объекта следует привести к стандартному для теории оптимального управления виду (13.1):

x f (x, u),

 

 

 

 

u

U .

 

 

 

 

 

Записывается критерий оптимальности (13.4) в форме

T

J 0 min f0 (x, u)dt .

u

u 0

 

13.4. Принцип максимума Понтрягина

445

2. Формируется расширенный вектор состояния

z и правых час-

тей (z,u); в общем виде записывается вектор сопряженных координат

0 , 1,..., n .

3. В форме скалярного произведения векторов ( ) и ( ) записывается выражение

H(z) (z, u) .

4.Из условия максимума определяется оптимальное управление как функция сопряженных координат

max H : u0 u0 ( ) .

uu

5.Формируется система дифференциальных уравнений для нахождения сопряженных координат

H . zT

6.Вычисляется оптимальное управление в виде функции времени (программное управление)

u0 u0 (t) .

7. По возможности осуществляется переход к оптимальному управлению в виде обратной связи

u0 u0 (x) ,

т. е. решается задача синтеза регулятора.

Рассмотрим вычисление оптимального управления с помощью описанной процедуры на примере.

446

Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ

ПРИМЕР 13.3

Определить оптимальное управление для объекта, поведение которого описывают уравнения

x1 x2 , x2 u.

Требуется обеспечить переход из начальной точки в конечную

x1

0

0

x1

T

1

x2

0

0

x2

T

0

за заданное время T 1 с при минимуме затрат энергии, т. е.

T

J min u2d .

u

u 0

 

Поскольку известно описание объекта в переменных состояния, переходим к формированию расширенного вектора состояния и правых частей, а также запишем вектор сопряженных координат

 

 

 

T

 

 

 

 

z1

x0

u2d

 

f0

u2

z

z2

x1

0

,

f1

x2 ,

x1

 

z3

x2

 

f2

u

 

x2

 

 

 

 

 

 

 

 

 

 

0,

1,

2 .

 

Сформируем теперь гамильтониан

H

0

u2

x

2

u

 

1

2

 

и определим его максимум по u

max H :

H

2

0u

2 0 .

 

u

u

u

 

 

 

 

 

 

 

 

Из этого уравнения определим оптимальное управление в виде функции сопряженных координат

u0

 

2

.

 

 

2

0

 

13.4. Принцип максимума Понтрягина

447

Для сопряженных координат запишем систему дифференциальных уравнений

0

 

 

H

 

 

H

 

 

 

 

 

 

 

 

 

 

 

 

 

z1

 

 

x0

 

 

 

 

 

 

1

 

 

 

H

 

 

H

 

 

 

 

 

 

 

 

 

 

 

 

 

z2

 

 

x1

 

 

 

 

 

 

2

 

H

 

 

H

 

 

 

 

 

 

 

 

 

 

 

z3

 

 

x2

 

 

 

 

 

 

из которой получим

 

 

 

 

 

 

 

 

 

0

c1

const,

1

c2

const,

2

 

 

c2t

 

 

c3.

0,

0,

1,

В результате оптимальное управление примет вид

u0

 

 

 

c2t c3

b t b .

 

 

 

 

 

1

2

 

 

 

 

2c1

 

Коэффициенты bi (i

1, 2) определим,

решая краевую задачу. С этой

целью запишем уравнения замкнутой системы

x1 x2 ,

x2 b1t b2.

Найдем решение для переменных состояния:

 

 

T

 

 

 

 

 

 

1

 

 

 

 

 

 

x t

x 0

 

b t b d

 

b t2

 

b t,

 

 

2

 

 

2

2

0

1

 

 

2

1

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x t

x 0

T

1

b

2

b

d

 

1

b t3

1

b t 2.

 

 

 

 

1

1

0

2

 

1

2

 

 

6

1

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Учтем теперь заданные начальные и конечные условия и T = 1 с.

x

T

1

1

b

1

b ,

 

 

 

1

 

 

6

 

1

2

2

x

T

0

 

1

b

b .

 

 

2

 

 

2

1

 

2

448

Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ

 

Решая полученную систему уравнений, определим неизвестные коэф-

 

 

фициенты: b1 12, b2

6 . В результате оптимальный программный за-

 

кон управления будет

 

 

 

u0 12t 6 .

13.4.3. ЗАДАЧА ОПТИМАЛЬНОГО БЫСТРОДЕЙСТВИЯ

Задача оптимального быстродействия имеет некоторые особенности, которые упрощают ее решение на основе принципа максимума Понтрягина [1, 3].

Гамильтониан быстродействия. Рассмотрим общий класс объек-

тов управления (13.1)

x f (x,u), x Rn , u Rm , m n

с ограниченным управлением u U и критерием оптимальности в виде (13.6), т. е. критерием быстродействия

T

J min d .

u

u 0

 

Согласно процедуре синтеза на основе принципа максимума запишем расширенный вектор правых частей и вектор сопряженных координат

1

 

 

 

 

f1( )

,

1,

1, ,

n ,

 

 

 

 

 

fn ( )

азатем сформируем гамильтониан в виде

H

( ) 1 1 f1( ) n fn ( ) .

(13.36)

В соответствии с (13.33) максимум гамильтониана равен нулю. Поскольку первое слагаемое в данном выражении не зависит от управления, можно вместо (13.36) рассматривать усеченный гамильтониан,

который называется гамильтонианом быстродействия

13.4. Принцип максимума Понтрягина

449

Hб f ( )

 

1 f1( )

 

n fn ( ) .

(13.37)

В этом случае уравнение принципа максимума принимает вид

 

 

max Hб

1.

 

(13.38)

 

u

u

 

 

 

 

 

 

 

 

Таким образом, при решении задачи оптимального быстродействия нет необходимости переходить к расширенному вектору состояния и расширенному вектору правых частей. Можно сформировать гамильтониан быстродействия и определить управление, обеспечивающее его максимум в соответствии с (13.38).

Разрывное (релейное) управление. Для объектов с аддитивным управлением вида (13.2)

x f (x) B(x)u,

x Rn , u Rm ,

 

 

 

 

 

ограниченным ресурсом управления

u

U и требованием в виде кри-

 

 

 

 

 

терия быстродействия управляющее воздействие имеет разрывный характер.

Сформируем гамильтониан быстродействия (13.37)

 

Hб

1 f1( ) 1B1( )u

 

n fn ( )

nBn ( )u ,

(13.39)

где fi ( ) – i-й элемент вектора

f (x) ,

а Bi ( )

i-я строка матрицы

B(x) , i = 1, 2, …, n.

 

 

 

 

Управление, обеспечивающее максимум гамильтониана (13.39) с учетом ограничений, имеет вид

 

 

 

 

u0 U

sgn B(x) .

(13.40)

Следовательно, для объектов класса (13.2) оптимальное управление всегда носит релейный характер.

Теорема о числе переключений. Данная теорема связывает число переключений оптимального управления со свойствами объекта. Она справедлива для линейных объектов (13.3)

x Ax Bu , x Rn , u Rm , m n

с ограничением типа u U и критерием быстродействия. При этом оптимальное управление имеет вид (13.40).

450

Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ

Поскольку объект управления линейный, для него можно определить корни характеристического уравнения

det( pI A) 0

(13.41)

в виде совокупности

1,..., n .

Рассмотрим без доказательства формулировку теоремы.

Теорема. Если корни характеристического уравнения (13.41) вещественные, то число переключений управляющего воздействия не превышает (n – 1), где n – порядок объекта.

С л е д с т в и е. Число интервалов постоянства управляющего воздействия не превышает n.

Варианты изменения оптимального управления в линейной системе третьего порядка с вещественными корнями приведены на рис.13.8.

+U

+U

+U

t

t

t

-UU

U-U

U-U

а)

б)

в)

а

б

в

Рис. 13.8. Иллюстрация изменения оптимального управления:

а – нет переключений; б – с одним, в – с двумя переключениями

В случае, когда среди совокупности корней характеристического уравнения (13.41) есть комплексно-сопряженные, число переключений теоретически не ограничено. В реальных системах невысокого порядка число переключений, как правило, невелико.

ПРИМЕР 13.4

Рассмотрим задачу синтеза оптимальной по быстродействию системы для объекта

x1 x2 ,

x2

 

 

 

 

 

x1 2dx2 u,

u

U.

Соседние файлы в предмете Основы Теории Управления