Теория автоматического управления. Волков В.Д., Смольянинов А.В

Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Воронежский государственный технический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

kf M ( xM , yM , ),

в ускоренном времени с

различными начальными условиями

y M ( j ) ( 0 ),

.pdf

Скачиваний:

Добавлен:

15.11.2022

Размер:

25.44 Mб

Скачать

☆

<<< < Предыдущая 45 46 47 48 49 50 51 52 53 54 55 56 57 5859 / 6959 60 61 62 63 64 65 66 67 68 69 > Следующая >>>

V Q( x , y,t ),

(5.230)

используемые далее при описании алгоритмов

Алгоритм с прогнозирующей моделью и численным дифференци-

рованием /32/. Алгоритм заключается в вычислении V(x(t), t) на моделируе-

мом в ускоренном времени = t/k (k – масштаб ускорения времени) движе-

нии объекта с последующим численным дифференцированием этой функции.

Таким образом, для определения оптимального в смысле управления объектом в текущий момент времени (реально – на очередной цикл форми-

рования управления ∆tu) в управляющей ЭВМ осуществляется как минимум r + 1 прогнозов движения объекта интегрированием уравнений модели

j 1,r 1, лежащими в окрестности текущего значения, полученного в пре-

дыдущем цикле. Начальные условия для первого уравнения задаются соот-

ношением

x M ( u ) x( tu ) .

На основе этих прогнозов вычисляются скалярные функции

2
V(tu ) V( u ) V3 [ xM ( 2 )] k Q[ xM ( ), ]d ,	(5.232)

где u = tu/k и 2 = t2/k – пределы интегрирования в ускоренном времени, со-

ответствующие моменту определения управляющих сигналов tu и моменту окончания интервала оптимизации t2, хм( ) – прогнозируемый в ускоренном времени вектор состояния управляемого объекта fм – векторная функция,

представляющая в модели (5.231) соответствующую функцию объекта и в общем случае не равная ей (в предположении точно известной структуры f

эта функция может отличаться вектором параметров а).

Вычисленные значения (5.232) используются для аппроксимации раз581

ностным аналогом частных производных в соотношении

определяющем искомое оптимальное управление.

Алгоритм с прогнозирующей моделью, модифицированный /32/.

Предполагается дифференцируемость по х(t) функций V3(x, y, t) и Q3(x, y, t)

функционала с квадратичной функцией затрат на управление на X Y [t1, t2].

Алгоритм связан с решением в ускоренном «обратном» времени 2

уравнений (5.228), (5.229).

Необходимость вычисления вдоль прогнозирующей траектории объек-

та функций f , f , Q , Q приводит либо к запоминанию в управляющей

x y x y

ЭВМ траектории (5.231), пройденной при предварительном моделировании,

либо к совместному решению в обратном времени уравнений

xM f M ( xM , yM , ),

yM 0,

f T

(5.234)

f T

Полученные компоненты вектора py( )=py( u)=py(tu) определяют опти-

мальное управление (5.233).

Алгоритм (5.233), (5.234) не требует численного дифференцирования и поэтому потенциально обладает более высокой точностью.

Алгоритм с прогнозирующей моделью и матрицей чувствительно-

сти. Алгоритм сводится к вычислению и использованию вдоль прогнозируе-

мого движения (5.231) чувствительности прогнозируемого состояния хм( ) к

вариациям компонент вектора входных величин yм( u) = yм(tu).

582

py(t ) xTy (t )px (t ) py(t ).

V(t ) T

Вводится обозначение частной производной py , вычис-

y(tu )

ляемой дифференцированием V(x, y, t) как сложной функции y(tu), которая отличается от явной производной py(t). Дифференцирование по y(tu) по пра-

вилу дифференцирования сложной функции дает

	T	Q(t ) T		Q(t )

py (t ) xy		(t )					,	(5.235)
					y(tu
			xc (t )			)

где xy (t ) xc (t ).

y(tu )

Для (5.235) граничное условие записывается в виде

		Q3 (t2 )	T	V3 (t2 )
p	y (t2 ) xTy (t2 )
		xc (t2 )		y(tu )

имеет место соотношение

(5.236)

Из него следует, что в момент tu, для которого определяется значение управления, в силу (5.236) вместо py(tu) можно использовать py ( tu ).

При реализации этого варианта алгоритма оптимального управления с прогнозирующей моделью в управляющей ЭВМ должно моделироваться движение (5.231) с начальными условиями x M ( u ) x( tu ) и yм( u) = y(tu). На прогнозируемом движении следует интегрировать (5.235) в форме записи с ускоренным временем .

Алгоритм с прогнозирующей моделью и синхронным детектирова-

нием /32/. Вариации начальных условий и многократный ((r + 1)-кратный)

запуск прогнозирующей модели в варианте алгоритма с численным диффе-

ренцированием можно заменить на быстроменяющиеся вариации в процессе одного запуска модели с соответствующей обработкой сигналов. Речь идет о том, чтобы использовать принцип синхронного детектирования для опреде-

ления компонент градиента в алгоритме с прогнозирующей моделью. Цель

583

этого заключается в сокращении необходимых вычислительных затрат.

Данный алгоритм изложим применительно к общей форме алгоритма с прогнозирующей моделью. Применяя формулу сложной производной, вме-

сто (5.222) записываем

[ X( x,t,t

)]

X( x,t,t

)

(5.237)

(u* ,t )

( x,t )

Q3 [ X( x,t, ), ]

X( x,t, )d

где X(x, t, 0) – по определению решение на интервале [t1,t2] уравнения сво-

бодного движения объекта

f ( X ,t )

(5.238)

при начальном условии

X ( x,t,t1 ) xt ,

где хt = х(t) – текущее значение вектора состояния объекта.

Допустим, что значению x(t) придается малая вариация δх(t) (реализа-

ция этого при численном интегрировании уравнения (5.238) описана ниже).

Тогда с точностью до малых второго порядка

X( x x,t, ) X( x,t, )		X( x,t, ) x(t ).	(5.239)
	x

Функция δх(t) задастся быстроменяющейся (в сравнении с x(t)) детер-

минированной или случайной с нулевым средним значением. Для цифровой реализации наиболее подходит детерминированная функция δх(t), каждая компонента которой представляет кодовую группу из прямоугольных им-

пульсов по типу функций Уолша. Длительность каждого прямоугольного им-

пульса соответствует шагу численного интегрирования уравнения прогнози-

рующей модели в ускоренном времени. Кодовые группы удовлетворяют ус-

ловиям, при которых

d x(t ) xT (t ) –

(5.240)

диагональная постоянная (не зависящая от t) матрица, а

584

x(t ) 0.

(5.241)

Здесь чертой обозначено усреднение по интервалу времени, равному

длительности наиболее протяженной кодовой группы.

Умножим (5.239) справа на δхт(t) и усредним по указанному интерва-

лу. С учетом медленного изменения x(t) в сравнении с δх(t) и выражений

(5.240), (5.241) получаем

		X( x,t, )d .	(5.242)
X [ x(t ) x(t ),t, ] xT (t )
	x

Подставляя это выражение в (5.237), получаем следующее непрерыв-

ное описание алгоритма с прогнозирующей моделью и синхронным детекти-

рованием:

			V3 ( X )

				X
						t2
						t2
	U	3	(u* ,t )
u*	U	3	(u* ,t )	t2 Q3 ( X )
u*				t2 Q3 ( X )
					X
					X
				t

X [ x(t ) x(t ),t,t2 ] xT (t )

где

V3 ( X )					V3 [ X( x,t,t2	)],
X				X	V3 [ X( x,t,t2	)],
Q3 ( X )	t2
	t2
			Q3 [ X( x,t, )]. .
X		X	Q3 [ X( x,t, )]. .

Цифровая численная реализация алгоритма (5.243) заключается в сле-

дующем. Как и в других алгоритмах с прогнозирующей моделью, время раз-

бивается на циклы, а циклы в ускоренном времени – на шаги (такты). В нача-

ле каждого цикла запускается прогнозирующая модель свободного движения в ускоренном времени с начальными условиями, близкими к текущему зна-

чению вектора состояния. В отличие от других вариантов алгоритма с про-

гнозирующей моделью, «запуск» занимает несколько шагов, а именно столь-

ко, сколько содержится импульсов в наиболее длинной кодовой группе ва-

риаций начальных условий δх. Пусть это число шагов равно nш. В течение

585

этих nш начальных шагов каждого цикла численное интегрирование уравне-

ний (5.238) ведется при искусственных малых возмущенных каждой из ком-

понент посредством кодовых групп, присвоенных этим компонентам. Только после nш шагов прогнозируемое движение становится действительно свобод-

ным (ограниченность разрядной сетки не учитывается).

«Умножение» на те же кодовые группы компонент прогнозируемого по шагам свободному движение и усреднение в пределах длительности кодовой группы обеспечивает согласно (5.243) определение градиента главной части функционала на прогнозируемом движении и формирование вектора опти-

мального управления на очередной цикл. Вычислительные затраты на син-

хронное детектирование («умножение» на кодовые группы и усреднение), а

также другие операции численной реализации (5.243) невелики в сравнении с затратами на численное интегрирование уравнений свободного прогнози-

руемого движения. Ввиду того, что при данном алгоритме это численное ин-

тегрирование выполняется лишь один раз за каждый цикл, необходимая вы-

числительная производительность по крайней мере в r + 1 раз меньше, чем для алгоритма с численным дифференцированием, и в 3 – 4 раза ниже, чем для модифицированного алгоритма с прогнозирующей моделью.

5.5.8.Синтез линейных непрерывных детерминированных систем

снакоплением информации о состоянии

При классической квадратичной форме критерия качества управления

(5.191) и движении объекта, описываемого уравнением (5.186), т.е.

x(t ) A(t )x(t ) B(t )u(t )

оптимальное управление определяется в соответствии с (5.208), т.е. в виде

u* ( t , x ) Q 1 ( t )BT ( t )K ( t )x ,

где симметричная матрица K(t) определяется из уравнения (5.209)

	T	(t )K(t ) K(t )A(t ) K(t )B(t )Q	1	(t )B	T
K(t ) A		(t )K(t ) K(t )A(t ) K(t )B(t )Q		(t )B		(t )K(t ) S(t ),
K(t2	)
K(t2	)
		586

При P(t)=-K(t) соотношения (5.209) принимают форму (5.207).

В законах управления предполагается, что в каждый момент времени известна информация о всех координатах вектора x. Однако вектор x может быть полностью или частично не доступен для использования в управлении.

В этом случае вводится модель измерений – соотношением

y(t ) Cx(t ), (5.244)

где y – вектор измерений, y Rm;С(t) – матрица размером (m n) причем раз-

мерность вектора измерений не больше размерности вектора состояний

(m n).

В системе измеряется вектор y(t), информация о котором накапливает-

ся.
Требуется найти управление u(t,Yt	), зависящее от всех доступных к
t1
текущему моменту времени измерений	Yt y( ),t	1	t так, чтобы
	t1	1

свойства синтезируемой системы были близки к соответствующему случаю полной информации о состоянии.

Идея		решения
состоит	в	получении
оценки	x(tˆ	) вектора

состояния x(t) в теку-

щий момент времени t

по результатам изме-

Рис. 5.42. Система с наблюдателем состояния

рений Yt и использо-

вании этой оценки в управлении (5.208) вместо x(t). Чем точнее оценка, тем ближе синтезированная система по своим свойствам к оптимальной системе при полной информации о состоянии. Структура такой субоптимальной сис-

темы приведена на рис. 5.42. В детерминированных системах процесс полу-

чения оценок вектора состояния по измерениям иногда называют восстанов-

лением или наблюдением, а устройства, позволяющие решить задачу наблю587

дения – наблюдателями.

Рассмотрим задачу синтеза наблюдателя полного порядка /9, 32/.

Если m=n и матрица C(t) не вырождена t T, то вектор состояния x(t)

может быть найден из (5.244) по формуле

x( t ) C 1 ( t )y( t ).

В этом случае ошибка оценки вектора x равна нулю и синтезируемая система совпадает с оптимальной при полной информации о состоянии. Для всех начальных состояний обеспечивается минимум функционала (5.191). В

общем случае предположим, что сигнал y(t) поступает на вход устройства,

оценивающего вектор состояния x(t), которое описывается линейным диффе-

ренциальным уравнением

ˆ
dx	D(t )x(tˆ	) H(t )u(t ) L(t )y(t ),	x(ˆ t1 ) x0* ,	(5.245)

dt

где D(t), H(t), L(t) неизвестные матрицы размера (n n), (n q), (n m).

Здесь в начальном условии учтена априорная информация о системе.

Обозначим через ( t ) x( t ) x( t ) ошибку оценивания и получим диффе-

ренциальное уравнение, описывающее ее изменение. Учитывая (5.244), по-

лучаем

d( x x )

A(t )x(t ) D(t )x(t ) [B(t ) H(t )]u(t ) L(t )C(t )y(t ).

Если принять H(t)=B(T), D(t)=A(t)-L(t)C(t), то уравнение для ошибки оценивания примет вид

d	[ A(t ) L(t )C(t )] (t ),	(t1 ) x(t1	) x0* .	(5.246)
dt

Вид ошибки оценивания полностью определяется свойствами матрицы

A(t)-L(t)C(t), и величиной начальной ошибки (t1).

Неизвестная матрица L(t) должна быть выбрана такой, чтобы ошибка достаточно быстро убывала, Если все матрицы не зависят от времени, то для

588

этого требуется, чтобы действительные части собственных значений матри-

цы A(t)-L(t)C(t) были отрицательными.

Уравнение оценивающего (наблюдающего) устройства с учетом (5.245)

и найденных матриц имеет вид

ˆ
dx	A(t )x(t ) B(t )u(t ) L(t )[ y(t ) C(t )x(t )],	x(t		) x* .	(5.247)
	A(t )x(t ) B(t )u(t ) L(t )[ y(t ) C(t )x(t )],	x(t	1	) x* .	(5.247)
dt			1	0
dt

Структура оценивающего устройства совпадает с конструкцией фильт-

ра Калмана, но здесь имеется произвол в задании матрицы L(t). Оценка зави-

сит от всех измерений до момента t, т.е. является функционалом Yt . Следо-

вательно, управление (5.208) , использующее вместо вектора x его оценку,

также зависит от Yt , что и требовалось.

Оценивающее устройство имеет порядок n по числу координат вектора

оценок, удовлетворяющего уравнению (5.247). Если начальное состояние

x(t1) совпадает с x0*, то (t)=0, x(ˆ t ) x( t ). Иначе только при правильном за-

дании матрицы L(t) получаем, что x(ˆ t ) x( t ) при t .

Для стационарных систем, у которых матрицы A,B,C в (5.186) не зави-

сят от времени, можно построить наблюдающее устройство порядка n-m (на-

блюдатель низкого порядка). Для этого следует расширить вектор измерений

y с помощью вектора z до размерности n:

	y(t )	C
			x(t )	,
z(t )		G

где G – неизвестная матрица размера (n-m) n.

Тогда, если матрица размера n n невырожденная, можно вычис-

лить значения вектора состояния по формуле

C 1		y(t )
x(t )
G	z(t ) .

Так как измерения z в модели отсутствуют, их предлагается заменить

589

оценкой zˆ, удовлетворяющей уравнению


d z
d z	Dz Hu(t ) Ly(t ),	z(t1 ) Gx0* ,	(5.248)
dt	Dz Hu(t ) Ly(t ),	z(t1 ) Gx0* ,	(5.248)
dt

где матрицы D, H, L должны выбираться из условия стремления ошибки оценивания к нулю, т.е. (t ) z(t ) z(tˆ ) 0.

Уравнение, описывающее ошибку, имеет вид

dzˆ

GAx Dzˆ (GB H )u Ly

Так как

y Cx,

z Gx,

zˆ z , то

D (GA DG LC )x (GB H )u

Если действительные части собственных значений матрицы D отрица-

тельные и выполняются условия:

GA DG LC 0, GB H 0 ,

(5.249)

то ошибка оценивания с течением времени стремиться к нулю.

На практике задают матрицы D, L и находят неизвестные матрицы G,

H из условий (5.249). Для осуществления решения в (5.249) требуется, чтобы

собственные значения матриц A и D были различными.

Зная y(t ), z(ˆ t ), оценка вектора x вычисляется по формуле

x(ˆ	C 1	y(t )		(5.250)
	t )		.
	G	z(ˆ	t )

Порядок оценивающего устройства (наблюдателя Люенбергера), опи-

сываемого соотношениями (5.248) – (5.250), равен n-m по числу координат вектора z(tˆ ), удовлетворяющего уравнению (5.248).

Пример 5.15. Модели объекта управления и измерений, а также функционал каче-

ства управления заданы в форме

590

<<< < Предыдущая 45 46 47 48 49 50 51 52 53 54 55 56 57 5859 / 6959 60 61 62 63 64 65 66 67 68 69 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]