Добавил:

Harmor Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Уфимский Государственный Авиационный Технический Университет

Предмет:

Теория автоматического управления

Файл:

8 (1)

.pdf

Скачиваний:

Добавлен:

25.12.2022

Размер:

717.17 Кб

Скачать

☆

<<< < Предыдущая 1 23 / 33

y	0	=	f	0		(u, y, t) = G[u, y, t];
	0			0
y		=	f		(u, y, t);
1			1
. . . . . . . . . .
y	n	=	f	n		(u, y, t),
	n			n

или в общем виде

yn = fi (u, y, t)

0, ...,

(8.39)

Важную переменные ψ

роль в

0	(t), ,

принципе максимума играют вспомогательные ψn ((t) и функция

= ψi (t) fi (u, i =0

(8.40)

Функции

Важно

определением

ψi (t) определяются из дифференциальных уравнений
dψi dt = −H yi	(i = 0, ..., n)	.	(8.41)

подчеркнуть, что уравнение (8.41)			является
функций ψi (t) , и на	вопрос «Что такое		функции

ψ	(t)
i

?» исчерпывающим

ответом будет: «Это функции, которые

удовлетворяют уравнению (8.41)».

H	из (8.40), то получим
H
	dψ	i		n		f	k
		i	= −		ψk (t)		k
	dt		= −		ψk (t)
	dt		k	=0
			k	=0

Если в (8.41) подставить функцию

(u,	y, t)	(i = 0, ..., n) .	(8.42)
y		(i = 0, ..., n) .	(8.42)
y
i

Это равенство можно использовать как иную формулировку определения функций ψi (t) .

Кстати, из (8.39) и (8.40) следует, что

dy	dt = H ψ		i	(i = 0,
i
Действительно, так как		H ψi =

..., fi ,

) .

то

(8.43)

уравнения (8.43)

эквивалентны уравнениям (8.39).

Если уравнения (8.43) и (8.41) записать совместно dψi dt = − H yi ;

dyi dt = H ψi ,

то можно заметить определенную симметрию в этой системе уравнений. Уравнения такого вида называют канонически сопряженными.

Теперь сформулируем основную теорему рассматриваемого метода (принцип максимума):

213


для оптимальности управления		u(t)	и	траектории			y(t)	с
координатами соответственно	u1	(t), ..., ur		(t)	и	y1(t), ..., yr		(t)

необходимо существование такой ненулевой непрерывной функции

ψi (t)	с координатами ψ0		(t), ..., ψn (t), соответствующей функциям
u(t)	и y(t) в силу уравнений (8.42), что при любом t				(t0	t T )
функция		H [ψ(t), y(t), u]	переменного	u достигает	в	точке
u = u(t) максимума:
		H [ψ(t), y(t), u] = max		u .

Рассмотрим максимума его воздействием u(t

)

отличительную особенность вывода принципа авторами. Ограничимся одним управляющим

Как и экстремали

при

u(t)

выводе уравнения Эйлера, добавляется вариация

η(t)

предполагаемой

,вычисляется

соответствующая первая вариация функционала

δQ

и из равенства

этой вариации нулю выводятся необходимые условия оптимальности u(t) . Характерна форма вариации при выводе принципа максимума

(рис. 8.8). Это импульс в момент τ бесконечно малой длительности ε , но конечной, произвольной высоты u(τ) . Единственное условие,

которое наложено на величину

u(τ)

, – это требования ограничения

u(τ)

. Например, если

то −1 u(τ) +1. Вариация такого

вида названа игольчатой вариацией.

Рис. 8.8

Важно отметить, что игольчатая вариация существенно отличается от вариаций, с помощью которых выводится уравнение

214

Эйлера. Последние должны были представлять собой гладкие функции, в то время как игольчатая вариация является «скачкообразной». Использование скачкообразных вариаций позволяет включить в класс отыскиваемых экстремалей кусочнонепрерывные функции. А между тем, именно кусочно-непрерывные функции являются экстремалями во многих задачах оптимального управления, как это мы увидим из последующих примеров.

Прежде чем перейти к примерам, наметим план решения задачи

спомощью принципа максимума.

1.Записываем уравнения объекта в виде системы уравнений первого порядка (8.39), не забыв уравнения для функционала (8.38):

yi = fi (u,

2. Составляем функцию H

y, t)

0, ...,

= ψi (t) fi (u, i =0

3. Определяем значение

u =

, максимизирующее функцию

max	u	, ..., u	.
			r
	1

(8.44)

4. Составляем уравнения (8.41) для определения ψi (t) :

dψi	dt = −H yi (i = 0, ..., n) .
Через функции	ψi (t)	выражается искомое		оптимальное
управление.
Особенностью принципа максимума является то, что
вариационная задача нахождения функции			u(t)	доставляющей
экстремум функционалу	Q , заменена гораздо более простой задачей

математического анализа – задачей нахождения параметра u ,

доставляющего максимум вспомогательной функции	H (u) . Отсюда
понятно и название метода – принцип максимума.

Пример 8.1. Решим с помощью принципа максимума задачу 8.1 об оптимальном по быстродействию управлении объектом с уравнением y = u при ограничении на управление u 1.

Решение. Составим систему уравнений первого порядка,

описывающих объект, вводя обозначения		1		;		2	= y	:
		y	= y		y		= y
y1 = y2 ,	y2 = u .							(8.45)

215

Функционалом является длительность процесса

Q = T

T 1dt

поэтому дифференциальное уравнение для функционала вид

y0 =1.

(8.38) имеет

(8.46)

Добавляя (8.46) к (8.45), получим полную исходную систему уравнений объекта

y	0	= 1;
	0
y		= y	2	;
1			2
y	2	= u.
	2

Составляем функцию

H = ψi fi i =0

= ψ	0	1+ ψ y	2
		1

+ ψ	u
2

(8.47)

В (8.47) только последнее слагаемое

можно обеспечить максимальное значение				H

этого слагаемого, т.е. необходимо, чтобы
ψ	2	(t)u = max	u 1	.

зависит от , добившись

u , поэтому максимума

(8.48)

Значения u, максимизирующие (8.48), следует брать на

границах, т. е.

u = +1 или u = −1. Очевидно, что при

(t) 0

следует

брать

u = +1,

а при

(t) 0

необходимо

u = −1.

Этот закон

управления можно записать с помощью функции sign :

u = sign	2	(t)	.

Для определения функций ψi (t) составим

уравнения типа (8.41):

dψ0 dt = − H y0 = 0; dψ1 dt = − H y1 = 0; dψ2 dt = − H y2 = −ψi .

(8.49)

дифференциальные

Решения этих уравнений имеют вид

ψ	0	= const = C	0	;
	0		0

ψ	1	= const = C			;
	1			1
ψ	2	= C	2	− C t.
	2		2	1

Подставляя (8.50) в (8.49), получим окончательно u = sign C2 − C1t) .

(8.50)

(8.51)

216

Так как функция

ψ	2	= C	2	− C t
	2		2	1

может менять знак не более

одного раза, то оптимальное управление (8.51) представляет собой кусочно-постоянную функцию, принимающую предельные значения

+ 1

или −1

и имеющую не более двух интервалов постоянства.

Такое же решение было получено в разделе 8.3 при синтезе оптимальной системы.

На основе рассмотренного примера можно заметить, что

функцию	y0 = f0 , а			следовательно, ψ0 (t)	можно	не	включать в
выражение		для	H ,	если функционал не	содержит	в	явном виде
управления		u ,	так как в этом случае слагаемое ψ0 f0				не влияет на

максимизацию

Пример 8.2. Рассмотрим задачу 8.6 об оптимальной по быстродействию встрече двух движущихся объектов. Закон сближения объектов описывается уравнением второго порядка (8.23) T x + x = u − b с начальными условиями (8.24), которые записываются

x(0) = −a;

x(0) =

−b

. Здесь

– постоянная времени управляемого

объекта;

– скорость движения неуправляемого объекта;

–

начальное рассогласование между объектами. Все три величины:

b , a – заданные постоянные числа.

Решение. Поскольку функционалом является время процесса, то

уравнение

= f0 не включается в число уравнений задачи.

Запишем систему

уравнений типа (8.39), обозначив

= x

x = x;

= x

;

(8.52)

= (1/ T )(−x

+ u − b).

Составим функцию

H =

= ψ x

+ ψ

(1/ T )(−x

+ u − b) =

i =1

= ψ1x2 −

ψ2 x2

ψ2u −

ψ2.

(8.53)

От управления u

в (8.53)

зависит только последнее слагаемое,

поэтому H = max |u| 1,

когда

ψ2u = max |u| 1 , откуда

получаем

очевидный закон управления

u = sign [ψ2 (t)].

(8.54)

217

Составим дифференциальные уравнения для функций

dψ	/ dt = − H / x	= 0;
1	1

ψ	(t)
i

dψ	2	/ dt = − H / x	2	= −ψ	+ (1/ T )ψ	2	.
	2		2	1		2
Из первого уравнения следует
		ψ1 = const ,					(8.55)

а из второго с учетом (8.55)

ψ	2	(t) = C +
	2	1

Подставляя (8.56) в (8.54), оптимального управления

C2e	t / T	.	(8.56)

запишем			окончательно закон

u = sign (C1 + C2e	t / T	) .

На рис. 8.9 показаны графики функции сочетаний постоянных интегрирования: кривая

кривая 2 – для						1				,		2		; кривая 3 – для			1
– для	1		,		C			0			C		0			C
– для	1		,			2			. Как видно, функция							2
	C	0		C			0								ψ		(t)

	2								(8.57)
ψ	2	(t)		для различных
ψ		(t)
1 для					C	0		,	C	2	0	;
1 для					1			,		2		;
0		,	C	2		0	и кривая 4
		,		2			и кривая 4

не более одного раза

меняет знак, следовательно, оптимальное управление содержит не более двух интервалов постоянства.

Рис. 8.9

Рис. 8.10

Из физического смысла задачи (см. траектории объектов A и B на рис. 8.4, а ясно, что вначале управление должно обеспечить разгон объекта B , а затем его торможение. С учетом результата (8.57) и физического смысла задачи можно утверждать, что управление

должно состоять		из	двух интервалов (рис. 8.10): на первом для
0 t t1	u = +1,	а	на	втором для	t1 t t2 управление u = −1.
Моменты	переключения			ti и окончания процесса сближения		t2
составляют неизвестные				параметры	закона управления. Для	t t2

218

движение объектов будет проходить одинаково, если положить u = b.

При этом, как следует из закона сближения объектов (8.23),

x = x = 0 .

Определим	t1 и t2	, используя уравнения системы и граничные
условия. Принимая за единицу времени постоянную T , т. е. вводя
нормированное	время	= t / T , перепишем	дифференциальное
уравнение (8.23) закона сближения
		dx2 / d + x2 = u − b .	(8.58)

Граничные условия примут вид

x1(0) = −a;			x1(τ2 ) = 0;					x2 (0) = −b;
Подставляя для			отрезка		времени				[0, τ1]
(8.58), имеем
			x	2	+ x	2	= 1 − b		,
				2		2			,
откуда
x		= (1 − b) + Ce						−τ	(0 τ
x	2	= (1 − b) + Ce							(0 τ
	2

x2 (τ2 ) = 0 .

управление

τ1) .

(8.59) u = +1 в

(8.60)

Постоянную C

интегрирования найдем из начального условия

= −b . Подставляя в (8.60)

τ = 0

, получим

C = −1, а закон изменения

(τ) можно записать в виде

x2 = (1 − b) − e

−τ

(0 τ

τ1) .

(8.61)

Интегрируя

условий

(8.86), с учетом

начальных»

определим закон изменения

на отрезке

x (0) = −a

(τ)

[0, τ ]

(τ) = −(a +1) + (1 − b) + e

−τ

(0 τ τ1) .

(8.62)

Подставляя в уравнения (8.61) и

(8.62)

τ = τ

вычислим

1 ,

значения x

(τ )

и x

(τ

) , являющиеся начальными условиями для

дифференциального

уравнения

движения

на

втором

интервале

τ τ

2 , где u

= −1:

x (τ ) = −(a +1) + (1 − b) + e−τ ;

(8.63)

(τ ) = (1 − b) − e−τ .

Запишем уравнение движения для τ1 τ τ2 :

(8.64)

+ x

= −(1 + b)

Интегрируя (8.64) с учетом начальных условий (8.63), получим

x2 (τ) = −(1 + b) +

(2 − e

−τ

−(τ-τ

)

τ1 τ τ2.

(8.65)

Закон изменения x1(τ1)

для отрезка времени τ1 τ τ2 найдем,

проинтегрировав (8.65) с учетом начальных условий (8.63)

219

x	(τ	2
1		2

x1 По ) =

(τ) = (1 − a + условию

x2 (τ2 ) = 0 ,

2τ1) − (1 + b)τ − (2 − e	−τ	1	)e	−(τ-τ	)	τ1	τ τ2.	(8.66)
				1

задачи в момент окончания процесса
поэтому, подставляя			в	(8.65) и			(8.66)	τ = τ2

получим систему уравнений для определения моментов времени

τ2

− (1 + b) + (2 − e	−τ		)e	−(τ		-τ	)	= 0;
− (1 + b) + (2 − e		1	)e		2	1		= 0;
		1			2	1

τ1

(1 − a + 2τ	) − (1 + b)τ		− (2 − e	−τ	1 )e	−(τ		-τ	)	= 0.
(1 − a + 2τ	) − (1 + b)τ	2	− (2 − e		1 )e		2	1		= 0.
1		2

Путем несложных преобразований от этой системы уравнений можно перейти к другой более простой паре уравнений

τ2

2τ

− a − b

2 − e

−τ

τ2

;

τ2 = τ1 + ln

1 + b

Рассматривая

эти

уравнения

как функции

вида

, можно построить на плоскости с координатами

(τ

)

(8.67)

1		1		и
	(τ		)
τ1		и		τ2

соответствующие графики (рис. 8.11), определяет искомые моменты времени

точка пересечения которых и

τ1иск и τ2иск .

Рис. 8.11

8.6.Контрольные вопросы

1.Какую функцию называют кусочно-непрерывной?

2.Какие функции называют функционалами, а какие экстремалями?

220

3.Какие примеры постановки оптимального управления вы

знаете?

4.Какой вид имеет функционал при оптимальном быстродействии?

5.Что необходимо для реализации оптимального процесса в разомкнутой системе?

6.Что вы знаете о методе динамического программирования?

7.Назовите четыре основных метода в вариационном исчислении, используемых для решения задач оптимального управления?

8.Сформулируйте основную теорему принципа максимума.

9.Назовите план решения задачи с помощью принципа максимума.

10.Особенности применения принципа максимума.

221

<<< < Предыдущая 1 23 / 33

Соседние файлы в папке Лекции

#
25.12.2022301.55 Кб35.pdf
#
25.12.2022545.23 Кб56 (1).pdf
#
25.12.2022286.25 Кб66.pdf
#
25.12.2022632.21 Кб47 (1).pdf
#
25.12.2022370.95 Кб37.pdf
#
25.12.2022717.17 Кб38 (1).pdf
#
25.12.2022477.56 Кб38.pdf
#
25.12.2022598.2 Кб39 (1).pdf
#
25.12.2022323.73 Кб39.pdf