Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

vostrikov

.pdf
Скачиваний:
182
Добавлен:
23.01.2019
Размер:
12.99 Mб
Скачать

13.4. Принцип максимума Понтрягина

 

 

 

 

 

 

 

 

 

451

Запишем гамильтониан быстродействия

 

 

 

 

 

Hб

1x2

 

 

 

2 ( x1

2dx2

u)

и определим оптимальное управление

 

 

 

 

 

 

 

u0

 

 

 

 

 

 

 

 

 

 

U sgn

2 .

 

Система дифференциальных уравнений для сопряженных координат

имеет вид

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

H

,

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x1

 

 

 

 

 

2

 

 

 

 

H

 

2d

2 .

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

x2

 

 

 

 

 

 

 

 

 

 

Ее можно представить в виде одного дифференциального уравнения

 

 

1

 

2d 1

1

0 ,

 

которому соответствует характеристическое уравнение

 

 

 

 

p2

2dp 1 0 .

 

При d 1 его корни 1 и

2

будут вещественными и положительными,

следовательно, оптимальное управление принимает вид

 

 

u0

 

 

 

 

c e 1t

 

c e 2t

 

U sgn

 

 

,

 

 

 

 

 

 

 

 

1

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где ci const, i 1, 2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

e 1t

 

 

 

 

 

 

 

1t

 

 

 

 

с

 

2t

t

e

2t

e

 

 

 

 

 

 

 

t

а

 

 

б

 

Рис. 13.9. Иллюстрация теоремы о числе переключений:

а – одно переключение; б – без переключений; штриховая линия – сумма экспонент

452

Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ

Сумма двух экспонент может только один раз изменить знак, что соответствует однократному переключению управляющего воздействия (рис. 13.9, а), либо не изменит знака совсем. В последнем случае не будет переключений управляющего воздействия (рис. 13.9, б).

13.5. МЕТОД ПОВЕРХНОСТИ ПЕРЕКЛЮЧЕНИЯ

13.5.1. ОСНОВНЫЕ ПОНЯТИЯ

Этот метод применяется для формирования оптимального управления в виде обратной связи в случае, когда управление носит разрывный (релейный) характер.

Рассматривается общая задача синтеза оптимальной системы для объекта (13.1)

 

f (x,u),

x

R

n

,

u R

m

, m n

x

 

 

и переход из произвольных начальных состояний x(0) в заданные конечные x(T ) в соответствии с некоторым критерием оптимальности

 

 

 

 

T

 

 

 

 

J min f0 x, u

d .

(13.42)

 

 

u

u 0

 

 

 

 

 

 

 

Оптимальный закон управления в этом случае имеет вид

 

 

 

 

 

sgnS x

 

 

 

 

u0 U

,

(13.43)

 

 

Rm – вектор максимальных значений управления, S

Rm

где U

вектор функций, определяющих в пространстве состояний некоторую поверхность, которая называется поверхностью переключения [42]

S x 0 .

(13.44)

Для определения этой поверхности предварительно конечная точка «приводится» к началу координат с помощью замены переменных

x x x(T ) . (13.45)

13.5. Метод поверхности переключения

453

Затем в пространстве состояний исследуются траектории перехода из произвольных начальных состояний x(0) в конечную точку x(T ) 0 .

На траекториях перехода выделяются точки, где происходит смена знака управления, которые объединяются в поверхность переключения

S(x) 0 .

(13.46)

Однако чтобы получить траекторию перехода из начальной точки x1(0) в начало координат пространства состояний, необходимо также

задавать в соответствии с принципом максимума и начальные условия для сопряженных координат (0) . Если эти начальные условия вы-

браны неудачно, то получим траекторию перехода не в x(T ) 0 , а

в произвольную точку пространства состояний. В этом случае следует задать новые начальные условия для сопряженных координат (0) и вновь попытаться

отыскать траекторию перехода в начало координат (рис.13.10).

Для новой начальной точки x2 (0) траектория перехода в на-

xn

x1(0)

x(Т) x1

x2(0)

Рис. 13.10. Иллюстрация построения траекторий перехода в начало координат

чало координат также может быть получена в результате перебора начальных условий для сопряженных координат (рис.13.10).

Объединяя точки переключения управления на всех траекториях перехода из произвольных состояний в начало координат, можно получить поверхность переключения в виде (13.46) или, разрешив уравнение (13.46) относительно xn , в следующей форме:

xn F x1 ,

(13.47)

где x1 – «усеченный» вектор состояния (без последней компоненты). С учетом (13.47) оптимальный закон управления (13.43) можно за-

писать в виде

 

u0 U sgn xn F x1 .

(13.48)

454 Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ

Таким образом, метод поверхности переключения позволяет получить оптимальный закон управления в виде обратной связи. Однако при этом приходится рассматривать две совокупности начальных условий: для переменных состояния x(0) и сопряженных координат (0) , что

существенно затрудняет определение управляющего воздействия.

13.5.2.МЕТОД ОБРАТНОГО ВРЕМЕНИ

Сцелью упрощения задачи определения поверхности переключе-

ния

предлагается поменять местами начальную x(0) и конечную

x(T )

0 точки, что в пространстве состояний соответствует движению

в обратную сторону. Для динамической системы это означает замену времени t на –t. При этом вместо двух совокупностей начальных усло-

вий

x(0); (0) нужно рассматривать только одну – (0) , так как

x(0)

0 .

Постановка задачи синтеза оптимальной системы в обратном времени формулируется следующим образом. Для объекта

x f (x,u)

с ограниченным ресурсом управления необходимо определить оптимальное управление в виде обратной связи, которое обеспечивает переход из начальной точки x(0) 0 в конечную x(T ) в соответствии с

критерием оптимальности (13.4). При этом заранее известно, что оптимальное управление имеет релейный характер.

Отметим, что в этом случае необходимо перебирать только одну совокупность начальных условий (0) . Причем каждому конкретному значению i (0) соответствует оптимальная траектория перехода из заданной начальной точки x(0) 0 в некоторую конечную xi (T ) .

В соответствии с методом поверхности переключений в пространстве состояний на траекториях перехода выделяются точки, где происходит смена знака управления и объединяются в поверхность

S(x) xn F(x1) .

13.5. Метод поверхности переключения

455

В обычном времени следует изменить направление движения на противоположное. В результате находится оптимальное управление в виде (13.43)

u0 U sgn S x

или в форме (13.48).

ПРИМЕР 13.5

Рассмотрим процедуру определения оптимального управления методом обратного времени для объекта

y

1

u

p2

 

 

с ограничением на управление u A . Необходимо перейти из начальной

точки x 0 в конечную x T 0 с критерием оптимальности

t

J min d .

u

u 0

 

Запишем уравнения объекта в переменных состояния

x1 x2 , x2 u,

где x1 y, x2 y .

Поскольку рассматривается задача оптимального быстродействия, оптимальное управление носит релейный характер

u0 A sgn 2 .

Для определения u0 в виде функции переменных состояния используем метод поверхностей переключения. Предварительно запишем уравнения объекта в обратном времени

x1 x2 , x2 u.

456

Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ

 

Будем решать следующую задачу перехода: x(0) 0 x (T) . Для получе-

ния фазовых траекторий в пространстве состояний воспользуемся методом непосредственного интегрирования и рассмотрим последовательно два значения оптимального управления.

1. Случай, когда u0

A . Уравнения замкнутой системы имеют вид

 

 

x1

 

x2 ,

 

 

x2

 

 

A.

Интегрируя последовательно второе, а затем первое уравнения, получим

 

x2 (t)

x2

0

 

At,

 

x (t)

x

0

 

1

At2

 

 

 

 

1

1

 

 

2

 

 

 

 

 

 

 

или при нулевых начальных условиях

 

 

 

 

 

 

x2 (t)

 

 

At,

 

x (t)

 

1

At2.

 

 

 

 

1

 

2

 

 

 

 

 

 

 

 

 

Теперь исключим время

t

x2 A , и запишем уравнение фазовой тра-

ектории, выходящей из начала координат при положительном управлении,

 

 

 

 

 

 

 

 

 

 

x2

 

 

2 Ax1 .

2. Случай, когда u0

A . При этом уравнения замкнутой системы

следующие:

 

 

 

 

 

 

 

 

 

 

x1

 

 

x2 ,

 

 

x2

 

 

A.

 

 

После интегрирования имеем

 

 

 

 

 

 

 

 

x2 (t)

x2 (0)

At,

 

x (t)

x (0)

1

At2

 

 

 

1

 

1

 

 

 

2

 

 

 

 

 

 

 

 

 

или

 

 

 

 

 

 

 

 

 

x2 (t)

 

 

At,

 

x (t)

 

 

1

At2.

 

 

 

 

 

1

 

2

 

 

 

 

 

 

 

 

 

13.5. Метод поверхности переключения

 

 

 

457

Исключая время, t x2 A , получаем

 

 

 

1

 

x2

2

x1

A

.

2

A

 

 

 

В этом случае уравнение фазовой траектории, выходящей из начала координат при отрицательном управлении, принимает вид

x2 2A x1 .

Для каждой фазовой траектории (рис. 13.11) определим направление движения и оставим ту половину параболы, которая соответствует движению из начала координат. Затем объединим эти две полутраектории в одну и получим уравнение линии переключения

x2

2 A

x1

sgn x1 .

 

xn

u = А

x1

u = +А

Рис. 13.11. Определение линии переключений к примеру 13.5

Оптимальный закон управления следующий:

u0 A sgn x

 

 

 

2A

x

 

sgn x .

2

 

1

1

Теперь изменим направление движений на противоположное, т. е. вернемся к обычному времени (рис. 13.12).

458

 

 

 

Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ

 

u = А

 

x2

 

 

 

 

 

 

 

 

 

X3(0)

X1(0)

 

 

 

 

 

 

 

 

X2(0)

 

 

 

 

 

 

 

 

 

x1

X4(0)

u = +А

Рис. 13.12. Оптимальные траектории движения из различных начальных условий

Оптимальные траектории движения системы представляют собой участки парабол (рис. 13.12). Если начальная точка не принадлежит линии переключений, то в системе может быть только одно переключение управления (точки X1(0), X2(0) и X4(0)). Переключений не будет совсем, если начальная точка находится на линии переключений (начальные условия

X3(0)).

13.6. СУБОПТИМАЛЬНЫЕ СИСТЕМЫ

Субоптимальными будем называть системы, которые близки по свойствам к оптимальным с заданной точностью. Точность приближения к оптимальной системе определяется соотношением

J J 0

100 % ,

(13.49)

J 0

 

 

где J – критерий, соответствующий субоптимальной системе.

Такую систему получают в результате либо аппроксимации оптимального закона управления, либо искусственного ограничения рабочей области пространства состояний.

Рассмотрим релейный оптимальный закон управления u0 U sgn S (x) .

13.6. Субоптимальные системы

459

Поверхность переключения сложной конфигурации можно аппроксимировать, например, следующим образом:

S(x) c1x1 cn xn ,

(13.50)

представить в виде совокупности функций

S(x) f1(x) fn (x)

(13.51)

или аппроксимировать каким-либо другим способом. При этом будут получаться субоптимальные системы, с различной степенью точности близкие к оптимальным.

Обсудим особенности субоптимальных систем на примере.

ПРИМЕР 13.6

Рассмотрим оптимальную по быстродействию систему (см. пример 13.5) и аппроксимируем линию переключения прямой (рис. 13.13).

Уравнение реальной линии переключения имеет вид

Sp (x) x2 Kx1 . x2

 

X1(0)

 

 

 

 

 

 

2

 

3

 

 

 

X1(0)

 

X2(0(0)

 

XX3(0)

 

 

 

 

 

 

 

 

x

Идеальнаядеалинияь ая л ния

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x1

 

 

 

 

1

переключениячения

Реальная линия

Реальная линия

переклю чения

переключения

Рис. 13.13. Фазовый портрет субоптимальной системы к примеру 13.6

Процессы в субоптимальной системе будут существенно зависеть от начальных условий. Так, при движении из X 1(0) изображающая точка сис-

темы попадает на реальную линию переключений Sp (x) , а затем движется вдоль нее в скользящем режиме.

460

Глава 13. ОПТИМАЛЬНЫЕ СИСТЕМЫ

Из начальных условий X 2(0) изображающая точка системы будет попадать в точку пересечения идеальной и реальной линий переключения и к началу координат будет двигаться по соответствующему участку идеальной линии переключений, т. е. по оптимальной траектории.

При движении из X 3(0) изображающая точка системы будет доходить до Sp (x) , переключаться на траекторию, соответствующую другому знаку

управления, вновь попадать на реальную линию переключений и двигаться вдоль нее в скользящем режиме.

Таким образом, в субоптимальной системе могут быть строго оптимальные процессы, только если из начальных условий изображающая точка системы по фазовой траектории попадает в точку пересечения идеальной и реальной линий переключения.

ЗАКЛЮЧЕНИЕ

С появлением рассмотренных методов оптимизации переходных процессов в теории автоматического управления возник ряд инженерных методов проектирования. Особенно распространенными стали релейные системы оптимизации по быстродействию. В начале главы рассмотрен случай системы первого порядка, когда алгоритм оптимального управления практически не зависит от параметров объекта и возмущения. К сожалению, этот случай крайне редкий; в подавляющем большинстве система автоматики должна подавлять действие возмущений, и вид оптимальных процессов, а следовательно, и алгоритм управления зависят от возмущений. При этом характер изменения самих возмущений во времени неизвестен. Это обстоятельство резко снизило интерес инженеров к математическим методам оптимального управления.

Есть, однако, несколько конкретных технических ситуаций, когда возможности математической теории оптимального управления могут использоваться в полной мере. Показательным примером может служить задача автоматического управления лифтами и подъемниками. При этом параметры объекта (масса груза) меняются от процесса к процессу, а ограниченным является только значение старшей производной от положения (выходной величины). Старшей производной является ускорение кабины лифта или какая-либо его производная. В пассажирских подъемниках они должны быть ограничены условиями комфорта пассажиров, а в грузовых – условиями прочности конструкции (ограничен должен быть рывок).

Соседние файлы в предмете Основы Теории Управления