Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математические основы теории систем / Лекции / Павлова А.В. Математические основа теории систем. Лекции Часть 2.pdf
Скачиваний:
154
Добавлен:
02.06.2015
Размер:
1.3 Mб
Скачать

Непрерывное ДП позволяет получать оптимальный закон управления объектом в функции переменных состояния, т.е. проводить синтез системы. Недостаток метода – необходимость решать нелинейные дифференциальные уравнения в частных производных. Функция S (x) должна иметь частные производные по всем переменным.

7.3.Принцип максимума Понтрягина

7.3.1.Постановка задачи. Формулировка принципа максимума. Принцип максимума – это метод оптимизации, разработанный специально для задач оптимального управления, в которых управляющие воздействия ограничены и описываются кусочно-непрерывными функциями. Принцип максимума разработан группой учёных под руководством академика Понтрягина Л.С. в 1956 г. Этот метод обоснован как необходимое условие оптимальности для нелинейных систем и как необходимое и достаточное условие для линейных. Задача формулируется следующим образом.

Пусть ОУ описывается системой уравнений

x&i = fi (x1 , x2 ,..., xn ,u1 ,u2 ,...,ur ) ,

(7.45)

или, в векторной форме x& = f (x,u),

где xT = [x ,..., x

n

] – вектор переменных со-

стояния системы, uT = [u ,...,u

 

 

1

 

 

r

] – вектор управляющих воздействий.

 

1

 

 

 

 

 

Управление u(t) принадлежит

ограниченной

замкнутой областиU

r-мер-

ного пространства управлений, а координаты x(t) принадлежат хотя и ограни-

ченной, но открытой областиX n-мерного пространства состояний, т.е. u(t) ÎU , x(t) Î X .

Требуется из класса кусочно-непрерывных управлений, принадлежащих области U (допустимые управления), выбрать такое управление, которое переводит

объект управления из заданного

начального состоянияxi (t0 )

в конечное xi (t1)

(i = 1,..., n) и минимизирует функционал

 

 

t1

 

 

J (x,u) = ò f0 (x,u)dt .

(7.46)

 

t0

 

Будем полагать, что функции

fi (x,u) определены и непрерывны по совокуп-

ности переменных x, u вместе со своими частными производными fi . Для удоб-

xi

ства решения задачи вводится дополнительная переменная x0 такая, что

129

x&0 = f0 (x,u) и x0 (t0 ) = 0 .

(7.47)

Здесь f0(x,u) – подынтегральная функция функционала (7.46). Присоединив (7.47) к исходной системе уравнений (7.45), получим систему из n+1 уравнений

x&i = fi (x1, x2 ,..., xn ; u1, u2 ,...,un ) , i = 0,1,2,…, n,

(7.48)

правые части которой не зависят от x0 .

С учётом (7.47) функционал J можно рассматривать как конечное значение переменной x0 :

t1

 

J (x, u) = ò x&0dt =x0 (t1) ,

(7.49)

t0

 

и сформулированная выше задача сводится к задаче о достижении экстремума конечного значения координаты x0 .

Прежде чем перейти к формулировке принципа максимума, введём понятие о вспомогательных переменных Y0 (t), Y1 (t),...,Yn (t), которые определяются систе-

мой линейных однородных уравнений:

&

n

f j

(x,u)

 

Yi

(t) = - å

 

 

Yj (t) , i = 0,1,..., n.

(7.50)

 

j =0

xi

 

Системы уравнений (7.48) и (7.50) можно объединить одной формой записи, вводя в рассмотрение вспомогательную функцию

 

 

 

 

 

 

 

n

 

 

H (Y, x,u) = åYi (t) fi (x,u) .

(7.51)

 

 

 

 

 

 

 

i =0

 

Определив частные производные

 

функции H по Yi и xi

с учётом (7.48),

(7.50) и (7.51) найдём, что

 

 

 

 

 

 

 

dxi

=

H

 

,

i = 0,1,..., n.

(7.52)

 

 

¶Y

 

 

dt

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

dYi

 

= -

H , i = 0,1,..., n.

(7.53)

 

 

 

 

 

 

 

 

dt

 

 

xi

 

Векторные функции x(t) и Y(t) непрерывны и имеют непрерывные производные, и при фиксированных значениях x(t) и Y(t) функция H становится функци-

130

ей только управления u. Уравнения вида (7.52) и (7.53) носят название канонически сопряжённых и совпадают по форме с каноническими уравнения Гамильтона, известными из теоретической механики. В связи с этим функциюH называют

функцией Гамильтона, или гамильтонианом.

Принцип максимума гласит, что для оптимальности системы, т.е. для получения минимума функционала J (7.46), необходимо существование таких ненулевых непрерывных функций Y0 (t), Y1 (t),...,Yn (t), что при любом t Î[t0 ,t1 ] , функция H как функция переменных u1, u2 ,...,ur в заданной области их допустимых значе-

ний достигает максимума, т.е. H (Y, x,u) = max H , а Y0 (t)

и max H постоянны

 

uÎU

uÎU

во времени и Y0

(t) £ 0, max H = 0 .

 

 

uÎU

 

Таким образом, для получения оптимального процесса нужно в любой -мо мент времени t Î[t0 ,t1] выбирать такое управление, чтобы величина H была мак-

симальной, причём в течение всего времени оптимального управления max H = 0 ,

ueU

а переменная Y0 (t) постоянна по величине и неположительна.

Особенностью принципа максимума является ,точто вариационная задача определения управления u(t) , минимизирующего функционал J, заменяется задачей математического анализа определения параметра u, доставляющего максимум вспомогательной функции H (u) . Отсюда происходит и название метода– принцип максимума.

7.3.2. Алгоритм расчёта оптимального управления с помощью принципа максимума.

1-й шаг. Уравнения объекта представляются в виде системы дифференциальных уравнений первого порядка(7.45) с учётом уравнения(7.47) для дополнительной координаты

x&i = fi (x, u), i = 0,1,...,n .

2-й шаг. Составляется функция H:

n

H= åYi (t) fi (x,u).

i=0

3-й шаг. Определяется значение u , максимизирующее функцию H , из системы уравнений

H

= 0, j =1,2,...,r .

(7.54)

 

u j

 

В некоторых случаях это равенство не выполняется при ненулевой функции Y(t) , тогда максимум H достигается на границе допустимой области управления.

131

4-й шаг. Составляются уравнения для определения Yi (t) :

 

dYi

= - H , i = 0,1,..., n .

 

 

 

dt

xi

При решении задачи нужно найти n +1 функций xi (t) , n +1 функций Yi (t) и

r функции u j (t) , всего 2n + 2 + r

неизвестных. Для их определения имеетсяr

уравнений (7.54), n +1 уравнений исходной системы и n +1 уравнений для функции Yi (t) . Из совместного решения перечисленных 2n + 2 + r уравнений находит-

ся оптимальное управление.

Пример 7.5. Объект управления описывается уравнениемx& = 1 (ku - x) .

T

t1

Определить алгоритм управления, который минимизирует функционал J = ò xdt ,

0

если известны начальные и конечные состояния объекта, а управляющее воздействие u ограничено, т. е. u £U max .

1-й шаг. Система уравнений, включающая дополнительную переменную имеет вид

ìx&

o

= x,

 

 

 

ï

 

 

 

 

 

 

í

 

 

1

(ku - x).

ïx&

=

 

î

 

T

 

 

 

2-й шаг. Составим функцию H = Y x + Y

1

(ku - x) .

 

 

 

0

1 T

3-й шаг. Определить управление u, минимизирующее H. Для этого приравняем нулю частную производную

H k

u = T Y1(t) = 0 .

Это условие удовлетворяется только приY1 (t) = 0 . Однако в формулировке принципа максимума требуется существование ненулевой функции Y1 (t) . Отсюда

следует, что значение u, максимизирующие H, следует брать на границах, т.е. u = +U max или u = -U max . Очевидно, что при Y1 (t) > 0 следует брать u = +U max , а при Y1 (t) < 0 необходимо u = -U max . Этот закон управления можно записать сле-

дующим образом:

u* =U max ×SignY1 (t) .

132

Символ Sign означает операцию смены знаков, т.е. переключение релейного

типа

ì+1, при Y > 0, SignY = í

î-1, при Y < 0.

dY1

dt

4-й шаг. Определим функции Y0

H = xi :

ìd Y0 = 0, ïí dt

ïd Y1 = -Y0

î dt

и Y1 , составив систему

1

+ Y1 T .

Из первого уравнения следует, что

Y0 = const = -C1

. Тогда

dY1

dt

 

dY1

 

dt

 

 

или, разделяя переменные,

=

. Отсюда

 

 

Y1 + C1T

T

 

 

 

 

 

 

 

уравнений

= C1 + Y1 ,

T

 

 

 

 

t

 

 

 

t

ec = C

 

 

t

 

 

 

 

 

t

ln(Y + C T ) =

+ C ;

Y + C T = e

T

2

e

T

;

Y = -C T + C

e

T

 

 

 

1

1

 

T

1

1

 

 

 

 

 

 

1

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Так

как

функция Y1(t) может

Y1(t)

 

 

 

 

 

 

 

менять знак не более одного раза, то

 

 

 

 

 

 

 

оптимальное

управление

представ-

 

 

 

 

 

 

 

 

 

 

 

 

 

ляет

собой

 

кусочно-постоянную

C

 

 

 

 

 

 

Y1(t)

 

 

 

 

функцию, принимающую

предель-

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

ные значения - U max или + U max

и

 

 

 

 

 

 

 

 

 

t

 

 

 

имеющую не более двух интервалов

 

 

 

 

 

 

 

 

 

 

 

 

 

постоянства (рис. 7.10).

 

 

 

-C1T

 

 

 

 

 

 

 

 

 

 

 

Для

определения

постоянных

 

 

 

 

 

 

 

 

 

 

 

интегрирования C1 и C2 необходимо

u*(t)

 

 

 

 

 

 

 

 

 

 

 

задать начальные условия для функ-

+Umax

 

 

 

 

 

 

 

ции Y(t) . Однако они не могут зада-

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ваться независимо, так как их выбор

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t1

 

 

 

 

 

 

 

 

 

 

 

 

однозначно определил бы какой-то

-Umax

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

процесс x(t) из всей совокупности и

 

 

 

 

 

 

 

 

 

 

 

 

 

при этом не были бы уточнены гра-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ничные условия, которым этом про- Рис. 7.10. Вид функций Ψ1(t) и u*(t)

к примеру 7.5

цесс должен удовлетворять.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

133

Задача может быть решена до конца следующим образом. Считая управляющее воздействием известным, интегрируют уравнение объекта управления. Затем, используя граничные условия для координат, получают систему алгебраических уравнений и неравенств, которая однозначно определяет параметры оптимального

процесса.

 

На основании рассмотренного примера можно заметить, что

функцию

x&0 = f0 , а следовательно, и Y0 (t) можно не включать в выражение

дляH, если

функционал не содержит в явном виде управленияu, так как в этом случае слагаемое Y0 f0 не влияет на максимизацию H.

7.3.3. Принцип максимума в задачах о максимальном быстродействии. В

задачах о максимальном быстродействии минимизируемый функционал характе-

ризует время перехода системы из состояния x(t0 ) в состояние x(t1 )

и имеет вид

 

 

t1

 

 

 

J (x, u) = ò dt = t1 - t0 ,

 

 

(7.55)

а функция f0 (x,u) º1.

t0

 

 

 

 

 

 

 

С учётом (7.55) составим функцию H1 , равную

 

 

 

 

 

n

 

 

 

H1 = Y0 + åYi fi (x,u) .

 

 

(7.56)

 

 

i =1

 

 

 

Так как на основании (7.50)

dY0

= 0 и Y = Const , максимум H

1

реализу-

 

 

dt

0

 

 

 

n

 

 

 

 

 

 

 

 

ется одновременно с максимумом

функцииH = åYi fi (x,u) , а

из

требования

 

 

i =1

 

 

 

Y0

£ 0 и max H1 = 0 вытекает, что max H ³ 0 .

 

u (t )ÎU

 

С учётом сказанного, принцип максимума для систем, оптимальных по

быстродействию формулируется следующим образом.

 

Для оптимальности системы по быстродействию необходимо существова-

ние

таких ненулевых непрерывных функцийY1(t), Y2 (t),...,Yn (t) , что для всех

t Î[t0 , t1] функция H переменных u1, u2 ,...,ur в заданной области их допустимых

значений достигает максимума, т.е. H (Y, x,u) = max H , причём величина max H

uÎU uÎU

постоянна во времени и max H ³ 0 .

uÎU

Согласно приведенным формулировкам принцип максимума даёт только необходимые условия оптимальности. Вопрос о достаточности условий сложен, поэтому в практических приложениях заранее интуитивно предполагают достаточность по физическому смыслу исследуемой системы.

134

Пример 7.6. ОУ описывается системой уравненийx&1 = x2 , x&2 = u . Найти управляющее воздействие, которое за минимальное время переведёт объект из произвольного начального состояния в равновесное x1 = 0 ; x2 = 0 , при этом u £1.

Составим функцию H (Y, x, u) = Y1x2 + Y2u и определим максимум H по пе-

ременной u: dH = Y2 = 0 . Это равенство может выполняться только при нулевой du

функции Y2 (t) , поэтому максимум H достигается на границе области допустимых

управлений

u

=1. Для

нахождения

Y2 (t)

 

воспользуемся

уравнениями

 

dYi

= -

H

:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dt

xi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dY1

= -

H

= 0 ,

dY2

= -

H

= -Y ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

dt

 

x1

dt

 

 

x2

1

 

 

 

 

 

 

 

 

 

 

 

 

 

откуда Y1 = Const = C1 , Y2 = C2 - C1t .

 

 

 

 

 

 

 

 

 

Оптимальное управление u* = SignY

= Sign (C

2

- C t) .

 

 

 

 

 

 

 

 

 

2

 

 

 

1

 

 

Поскольку

линейная

функ-

ция Y2 (t) = C2

- C1t

не более од-

ного раза меняет знак, то один

раз

произойдёт

переключение с

u = +1 на u = -1 (рис. 7.11).

 

 

Следовательно оптимальная

по быстродействию система бу-

дет

релейной

со

специальным

законом переключения по

знаку

вспомогательной

 

 

функции

Y2 = C2 -C1t .

Момент окончания

управления

tk

определится до-

стижением заданных x1 = x2 = 0 .

Y2 (t)

C2

-C1t

u

+Umax

0

-Umax

t

Y2 (t)

tk

t

 

Рис. 7.11. Вид функции Ψ2(t) и u*(t) к примеру 7.6

7.4. Оптимальное по быстродействию управление линейными объектами

Предположим, что объект управления описывается дифференциальным уравнением n-го порядка с постоянными коэффициентами, которое можно представить в виде системы из n уравнений первого порядка:

135

x&

=

k1u - x1

,

 

 

 

ü

 

 

 

 

 

ï

 

1

 

 

 

 

T1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ï

 

x&2

=

k2 x1 - x2

,

 

ï

 

 

ï

 

 

(7.57)

 

 

 

 

 

T2

 

 

 

 

 

ý

............................

ï

 

 

 

 

 

 

 

 

 

 

 

 

 

ï

 

x&n

 

 

k

n

x

n-1

- x

n

 

ï

 

=

 

 

 

 

 

 

.ï

 

 

 

 

 

Tn

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

þ

 

Требуется определить закон управления u(t) , при котором время перехода

объекта из положения x(t0 )

 

в x(tn )

 

 

будет

минимальным, если на управление

наложено ограничение

 

u

 

 

£ Umax .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Функция Гамильтона H имеет вид

 

 

 

 

 

 

 

 

 

 

H =

k1u - x1

Y (t) +

k2 x1 - x2

Y (t) + ... +

kn xn -1 - xn

Y

 

(t).

(7.58)

 

 

 

 

 

 

 

1

 

 

 

T2

 

 

 

 

2

 

 

n

 

 

 

T1

 

 

 

 

 

 

 

 

 

Tn

 

 

 

Управление u , максимизирующее H, определим из равенства

 

 

 

 

 

 

 

 

 

 

 

 

 

H

=

K1

Y (t) = 0.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u

T1

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Равенство (7.59) возможно только при Y1 (t) = 0 , в соответствии с этим для

максимума H необходимо,

чтобы

u =U max

при Y1 (t) > 0

и u = -U max

при

Y1 (t) < 0 , т.е.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u* (t) = U

max

SignY (t) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

В общем случае

H

 

может зависеть от

нескольких или

 

от суммы

всехсо

u

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ставляющих вектора Y(t) .

Для определения характера управляющего воздействия нужно знать, сколько раз функция Y1(t) меняет знак или, иначе говоря, сколько корней имеет функция

Y1(t) . При прохождении функции Y1 (t) через нуль каждый раз будет происходить

смена знака управляющего воздействия. Моменты смены знака управляющего воздействия называются моментами переключения.

А. А. Фельдбаум в 1953 г. доказал теорему об n-интервалах, которая позволяет определить вид оптимального управления, не анализируя функции Y1 (t) : ес-

ли ОУ описывается линейным дифференциальным уравнениемn-го порядка с по-

136

стоянными коэффициентами и корни его характеристического уравнения вещественные отрицательные или нулевые, то для оптимального управления необходимо и достаточноn-интервалов максимального значения управленияU max , а

знаки на интервалах должны чередоваться (n -1) раз.

В соответствии с теоремой обn-интервалах оптимальное управление для рассматриваемого ОУ (7.57) имеет вид, показанный на рис. 7.12.

Следует отметить, что теорема об n-интервалах указывает только форму оптимального процесса, но не даёт закона определения продолжительности интервалов постоянства и моментов переключения.

u(t)

+Umax

 

 

t1

t2

 

 

 

t3

tn-1

 

tn

0

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

-Umax

Рис. 7.12. Вид оптимального управляющего воздействия

Выбор знака первого интервалауправляющего воздействия определяется начальными и конечными условиями задачи. Если начальные условия нулевые, то знак первого интервала определяется знаком конечного значения выходной координаты. Иначе говоря, если задана координата x(tn ) > 0 , то управление следует

начинать с положительного интервала, если задана координата x(tn ) < 0 , то с от-

рицательного интервала.

Если начальные условия ненулевые, то знак первого интервала выбирается из следующих соотношений:

при x(tn ) - x(t0 ) > 0 первый интервал положительный, при x(tn ) - x(t0 ) < 0 первый интервал отрицательный.

Данные соотношения справедливы только при равенстве нулю всех производных функции x(t) в начальный и конечный моменты времени.

Если эти условия не выполняются, то может оказаться, что для перевода изображающей точки из начального положения в конечное можно использовать как тот, так и другой знак управления на первом интервале. В этом случае следует рассчитать алгоритм оптимального управления для положительного и отрицательного первого интервала. Оптимальным будет тот алгоритм, который даёт меньшее время.

137

7.4.1. Определение моментов переключения. Для определения моментов переключения на практике часто используют метод стыкования решений дифференциальных уравнений со знакопеременной правой частью.

Пусть ОУ описывается линейным дифференциальным уравнением с постоянными коэффициентами

 

x(n) (t) + b

x(n -1) (t) + ... + b x&(t) + b x(t) = kU

max

,

 

(7.60)

 

n -1

1

0

 

 

 

 

 

а начальные и

конечные

условия заданы

T

 

= [x0

, x&

n -1

] ,

векторамиx (t0 )

0 ,..., x0

 

xT (tn ) = [xn , x&n ,..., xnn -1] .

 

состоит из n интервалов,

 

 

Управление,

оптимальное по быстродействию,

где

u = U max (рис. 7.12). Следовательно, нужно определить n моментов переключения, включая время окончания управления tn .

Рассмотрим алгоритм расчёта моментов переключения. 1-й шаг. Находится решение уравнения (7.60):

 

 

 

 

 

 

 

x(t) = C

0

+ C e- p1t

+ C

e- p2t + ... + C

n

e- pnt ,

(7.61)

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

где

-p1, -p2,…,-pn

вещественные и неположительные корни характеристическо-

го уравнения,

а C0 = ±kUmax – вынужденное решение дифференциального урав-

нения с правой частью.

 

 

 

 

 

 

 

 

 

 

 

 

2-й шаг.

Записывается решение на конце последнего интервала управления

при

t = tn и определяются все составляющие вектора x

 

 

 

 

 

 

x

n

= x(t

n

) = ±kU

max

+ C ne- p1tn

+ Cne- p2tn

+ ... + C ne- pntn .

(7.62)

 

 

 

 

 

 

 

1

2

 

 

n

 

Здесь Cin – постоянные интегрирования на последнем интервале.

Верхний индекс в постоянных интегрирования Cij обозначает номер интер-

вала ( j =1,...,n) . Дополним (7.62)

уравнениями

 

для составляющих

вектораxn ,

дифференцируя его (n-1) раз:

 

 

 

 

 

n

 

 

 

 

 

 

ü

 

xn

 

 

 

 

 

 

 

n

- p t

 

 

= ±kU max + åCi e

 

i

n

ï

 

 

 

n

 

 

i=1

 

 

 

 

 

ï

 

 

 

 

n

 

- pitn

 

 

 

ï

 

x&n = å

 

e

 

 

 

 

- piCi

 

 

 

 

 

 

 

 

ï

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

ï .

(7.63)

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

n

 

- pitn

 

 

ý

 

&&xn = å

(- pi )

 

 

e

 

 

ï

 

 

Ci

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

ï

 

LLLLLLLLLLL

ï

 

(n-1)

 

n

 

 

 

n-1

n

 

- pitn ï

 

= å(- pi )

e

 

xn

 

 

 

 

Ci

 

 

ï

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

þ

 

138

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из системы (7.63) определяются постоянные интегрирования Cin на послед-

нем интервале управления.

3-й шаг. Производится стыкование решений на границе последнего и предпоследнего интервалов. Для этого записывается решение дифференциального уравнения (7.61) при подходе к точке tn -1 справа

n

 

- pi tn-1

 

n

e

(7.64)

xn -1 = ±kUmax + åCi

 

i =1

 

 

 

и слева

 

 

 

n

 

 

 

xn -1 = mkU max + åCin -1e- pi tn-1 .

(7.65)

i =1

Решение отличается постоянными интегрирования, которые соответствуют при подходе справа последнему, а при подходе слева– предпоследнему интервалам, и знаком при слагаемом kU max .

Дополним (7.64) и (7.65) уравнениями для составляющих вектора xn-1 , диф-

ференцируя их (n-1) раз, и вычтем из одной системы соответствующие уравнения другой системы (стыкуем решения). Считая, что x(t) – гладкая функция, т.е. она и ее производная не претерпевают разрывов, получим

n

 

 

 

 

 

 

 

 

ü

 

å (Cin -1 - Cin )e- pitn-1

 

= ±2kU max ï

 

i =1

 

 

 

 

 

 

 

 

ï

 

n

 

n -1

 

n

- p t

 

ï

 

å

 

 

n-1 = 0

(7.66)

(- pi )(Ci

 

- Ci )e

 

i

ýï .

i =1

 

 

 

 

 

 

 

 

 

 

LLLLLLLLLLLLLLï

 

n

 

n -1

n -1

 

n

 

- pitn-1

ï

 

å

(- pi )

 

)e

ï

 

 

(Ci

 

- Ci

 

= 0ï

 

i =1

 

 

 

 

 

 

 

 

þ

 

Система (7.66) решается относительно (Cin -1 - Cin ), i = 1,2,..., n.

4-й шаг. Определяются постоянные интегрирования Cin -1 путем подстановки значений Cin , i = 1,2,..., n.

5-й шаг. Стыкуются решения на границах последующих интервалов, вплоть до первого и определяются постоянные интегрирования.

6 шаг. Определяются постоянные интегрирования на первом интервале из начальных условий при t0 = 0 путем решения следующей системы уравнений

139

x0

 

 

n

 

ü

 

= ±kU max + åCi1

ï

 

 

 

n

i =1

 

ï

 

 

 

1

 

 

ï

 

x&0

= å(- pi )Ci

 

 

ï

(7.67)

 

 

ý.

 

i =1

 

 

 

ï

 

LLLLLLLLL

 

(n-1)

n

 

n -1

1

ï

 

= å

(- pi )

ï

 

x0

 

 

Ci

ï

 

 

 

i =1

 

 

 

þ

 

В результате произведенных расчетов постоянные интегрирования исключаются и остается система из n уравнений с неизвестными t1, t2 , ..., tn .

7-й шаг. Рассчитываются моменты переключения.

Таким образом, при стыковании решений составляется (n+1) система уравнений: (n-1) уравнений для моментов смены знака и два уравнения для моментов начала и конца управления. Каждая система содержит n уравнений, т.е. общее ко-

личество уравнений

равно n(n +1) = n2 + n . Неизвестными являются n моментов

переключения и n2

постоянных интегрирования Cin , i = 1,2,..., n, j = 1,2,..., n. Все

неизвестные могут быть найдены.

 

Пример 7.7. ОУ описывается дифференциальным уравнением

 

 

T1T2 &x& + (T1 + T2 )x& + x = kU .

(7.68)

Определить управляющее воздействие, переводящее объект из начального

положения x(t0 ) = x&(t0 ) = 0 при t0 = 0 в положение x(tk ) = x2 , x&(tk ) = 0

за мини-

мальное время, если u £ U max .

По теореме об n-интервалах оптимальное управление должно иметь два интервала максимального значения управления ± U max и одну смену знака. Так как

начальные условия нулевые и в конечный момент времени tk x2 > 0 , знак первого интервала будет положительным.

1-й шаг. Для нахождения решения уравнения(7.68) составим характеристическое уравнение ОУ T1T2 p2 + (T1 + T2 ) p +1 = 0 . Корни его находятся в результате

решения квадратного уравнения и равны - p1 =- 1 ; - p2 =- 1 .

T1 T2

2-й шаг. Запишем решение на конце второго интервала управления, учитывая, что второй интервал – отрицательный

140

x2

2

 

- p1t2

2

- p

2t

2

ü

= -kU max + C1 e

 

 

+ C2 e

 

 

 

ï

x&

 

= - p C 2e- p1t2

- p

C 2e- p2 t2

 

 

ý .

2

 

 

ï

 

1 1

 

2

 

2

 

 

 

þ

Определим из (7.69) постоянные интегрирования

 

2

 

(x2

+ kU max )

p t

 

C

2

 

(x2

+ kU max )

p t

C

 

= -

 

 

e

1 2

;

2

= -

 

 

e

2 2 .

 

 

 

 

 

1

 

( p1 - p2 )

 

 

 

 

( p1 - p2 )

 

 

 

 

 

 

 

 

 

 

3-й шаг. Стыкуем решения в момент переключения t1

1

2

)e

- p1t1

1

 

 

2

- p2t1

 

ü

(C1

- C1

 

 

+ (C2

- C2 )e

 

= -2kU max ï

- p

(C1

- C 2 )e- p1t1 - p

 

(C1

- C 2 )e- p2t1

ý.

2

= 0 ï

1

1

 

 

1

 

 

2

2

 

þ

Находим разности постоянных интегрирования из систем (7.71):

(7.69)

(7.70)

(7.71)

(C1

- C 2 ) = -

2 p2 kUmax

e p1t1 ; (C1

- C 2 ) = -

2 p1kUmax

e p2t1 .

(7.72)

 

 

 

 

1

1

 

( p1

- p2 )

 

 

2

 

2

 

( p1

- p2 )

 

 

 

 

 

 

 

 

 

 

 

4-й шаг. Запишем решение на начало первого интервала приt = 0 с учетом

начальных условий:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x0 = kUmax

1

 

1

=

ü

 

 

 

 

 

 

+ C1

 

+ C2

0ï

 

 

 

 

 

 

 

 

x&

 

= - p C1

- p

C 2

=

 

ý.

 

 

 

 

 

 

0

0 ï

 

 

 

 

 

 

 

 

 

 

1 1

2

 

2

 

 

þ

 

 

 

Отсюда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C1

= -

p2kUmax

;

C1

= -

p1kUmax

.

 

 

(7.73)

 

 

 

 

 

 

1

 

 

( p1 - p2 )

2

 

 

( p1 - p2 )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5-й шаг. Рассчитываем моменты переключения, подставляя значения постоянных интегрирования (7.70) и (7.73) в их разности (7.72). При этом получим систему уравнений для определения моментов переключения t1 и t2 = tk :

1+ (1+

x2

)e

p t

- 2e

p t

= 0,

ü

 

 

1 2

1 1

ï

 

kU max

 

 

 

 

 

 

 

ï

(7.74)

 

x2

 

p t

 

p t

 

ý

1+ (1+

)e

- 2e

= 0.

 

 

 

 

2 2

 

2 1

 

ï

 

 

kU max

 

 

 

 

 

ï

 

 

 

 

 

 

 

þ

 

141

Решим оба уравнения относительно t1 :

 

 

 

1

 

 

1 éæ

 

 

x2

ö

p t

 

ù

 

t

=

 

 

 

 

ln

 

êç1

+

 

 

 

 

÷e

1 2

+1ú,

(7.75)

 

 

 

 

 

 

1

 

 

p

 

 

2

ç

 

kU

 

÷

 

 

ú

 

 

 

 

 

1

 

 

 

ê

 

 

max ø

 

 

 

 

 

 

 

 

 

 

ëè

 

 

 

 

û

 

 

 

 

1

 

 

1 éæ

 

 

x

2

ö

 

 

ù

 

t

=

 

 

 

 

ln

 

êç1

+

 

 

 

÷e p2t2

+1ú .

(7.76)

 

 

 

 

 

 

 

 

 

1

 

 

p

 

 

 

2

ç

 

 

kU

 

÷

 

 

ú

 

 

 

 

 

2

 

 

 

ê

 

 

 

max ø

 

 

 

 

 

 

 

 

 

 

ëè

 

 

 

 

 

û

 

Решая полученные уравнения графическим методом, найдем моменты переключения как координаты точки пересечения кривых (7.75) и (7.76) (рис. 7.13).

t1

t1=f1(t2)

t1=f2(t2)

t1

t2

t2

Рис. 7.13. Определение моментов переключения графическим методом

142