Оптимальное и адаптивное управление
..pdf
Раздел 4. Алгоритмы идентификации
Лабораторная работа № 7.
Рекуррентная идентификация трех неизвестных параметров ( b1 , b2 и )
Для дискретной модели фонда производственного накопления и потребления
x(k 1) A( )x(k) B( )u(k) q(k),  | 
	x(0) x0 ,  | 
	(12)  | 
и модели желаемого изменения фонда потребления:
w(k 1) (1 r)w(k), w(0) w0 ,
В (12) трехмерный вектор неизвестных параметров задается в виде:
1b1
b2 .b1
Предполагается, что вектор является неизвестной константой.  | 
	Это  | 
||||||||||
означает, что динамическая модель для вектора следующая:  | 
	
  | 
||||||||||
  | 
	
  | 
	(k 1) (k) ,  | 
	(0) 0 ,  | 
	(13)  | 
|||||||
где 0  | 
	случайный вектор с характеристиками:  | 
	
  | 
	
  | 
||||||||
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	)  | 
	
  | 
	
  | 
|||
  | 
	M{ }  | 
	
  | 
	,  | 
	M{(  | 
	
  | 
	)(  | 
	
  | 
	} P .  | 
	(14)  | 
||
  | 
	0  | 
	0  | 
	0 0  | 
	0 0  | 
	0  | 
	
  | 
|||||
21
Определить матрицу G(k) G(x(k),u(k))  | 
	и вектор g(k)  | 
g(x(k),u(k)) из соотношения  | 
	
  | 
x(k 1) A( )x(k) B( )u(k) q(k) G(k) g(k) q(k) . (15)
В качестве алгоритма идентификации используется дискретный фильтр Калмана, построенный с использованием модели (13) и представлении объекта (12) в виде (15):
ˆ(k 1) ˆ(k) K (k)[x(k 1) G(k) ˆ(k) g(k)] , ˆ(0) 0 , (16)
K  | 
	(k) P (k)G(k)T [G(k)P (k)G(k)T Q] 1  | 
	,  | 
	(17)  | 
|
  | 
	
  | 
	
  | 
	
  | 
	
  | 
P (k 1) (E3  | 
	K (k)G(k))P (k) , P (0) P 0 .  | 
	(18)  | 
||
Начальные условия для уравнения (16) следующие:
0ˆ (0) 0 .
0
Матрица P (0) диагональная (элементы матрицы приведены в табли-
це 3).
ЗАДАНИЕ
Построить графики оценок неизвестных параметров при постоянных значениях управлений. Исследовать влияние на качество идентификации диагональных элементов матрицы P 0 (увеличивая их в 10 и
100 раз), диагональных элементов матрицы Q (уменьшая из в 10 и 100 раз, при этом P 0 принимает исходное значение). Сделать выводы.
22
Лабораторная работа № 8.
Рекуррентная идентификация двух неизвестных параметров ( b1 и b2 )
Для дискретной модели фонда производственного накопления и потребления
x(k 1) A( )x(k) B( )u(k) q(k), x(0) x0 ,  | 
	(19)  | 
и модели желаемого изменения фонда потребления:
w(k 1) (1 r)w(k), w(0) w0 ,  | 
	(20)  | 
В (19) вектор неизвестных параметров определить следующим соотношением:
  | 
	1  | 
	
  | 
	
  | 
|
  | 
	
  | 
	
  | 
	
  | 
|
b  | 
||||
  | 
	1  | 
	
  | 
	.  | 
|
b  | 
	
  | 
	
  | 
||
  | 
	
  | 
	2  | 
	
  | 
	
  | 
  | 
	
  | 
	
  | 
||
b1  | 
	
  | 
	
  | 
||
Предполагается, что вектор является неизвестной константой. Диагональные элементы матрицы Q , весовые коэффициенты
критерия C,  | 
	D заданы в таблицах. Интервал времени: k 0,....,200 .  | 
||||||||
В качестве алгоритма идентификации используется дискретный  | 
|||||||||
фильтр Калмана:  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
||
ˆ  | 
	
  | 
	ˆ  | 
	
  | 
	ˆ  | 
	ˆ  | 
	
  | 
	
  | 
	
  | 
	
  | 
  | 
	
  | 
	0 ,  | 
	(21)  | 
||||||
(k 1)  | 
	(k)  | 
	K (k)[x(k 1) G(k) g(k)] , (0)  | 
|||||||
K  | 
	(k) P (k)G(k)T (G(k)P (k)G(k)T Q) 1 ,  | 
	
  | 
	
  | 
	
  | 
	(22)  | 
||||
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
P (k 1) (E2  | 
	K (k)G(k))P (k) , P (0) P 0 .  | 
	
  | 
	
  | 
	
  | 
	(23)  | 
||||
23
Начальные условия для уравнения (4) следующие:
ˆ(0) 0 .0
Матрица P (0) диагональная и задана в таблице 3.
Определить матрицу G(x(k),u(k)) и вектор g(x(k),u(k)) . Учитывая, что 2-ая строка матрицы G(x(k),u(k)) нулевая, модифици-
ровать уравнения фильтрации (21 23). Эта модификация позволит вместо полного вектора x(k 1) в (21) использовать только 1-ю компоненту этого вектора.
ЗАДАНИЕ
1. Построить графики оценок неизвестных параметров.
2. Выполнить моделирование в предположении, что контроль за состоянием объекта осуществляется с ошибками. Модель системы контроля имеет вид:
y(k) Hx(k) (k) ,
где (k) гауссовская последовательность независимая от q(k) с характеристиками:
M{ (k)} 0,  | 
	M{ (k) T ( j)} V k , j .  | 
|||
Матрица V диагональная, ее элементы заданы в таблице 2. Матрица  | 
||||
системы контроля следующая  | 
	
  | 
	
  | 
	
  | 
	
  | 
  | 
	
  | 
	1  | 
	0  | 
	
  | 
H  | 
	0  | 
	1  | 
	.  | 
|
  | 
	
  | 
	
  | 
||
24
Раздел 5. Адаптивное управление по локальному критерию.
Лабораторная работа № 9. Адаптивное управление с использованием двухэтапного алгоритма идентификации
Для дискретной модели фонда производственного накопления и потребления
x(k 1) A( )x(k) B( )u(k) q(k),  | 
	x(0) x0 ,  | 
	(24)  | 
и модели желаемого изменения фонда потребления:
w(k 1) (1 r)w(k), w(0) w0.
Вектор неизвестных параметров определяется следующим соотношением:
1
b1
b2 .b1
Выполнить моделирование системы (24), реализовав адаптивное управление в предположении, что вектор x(k) контролируется с помощью следующей модели:
y(k) Hx(k) (k) ,
где (k) гауссовская случайная последовательность, независимая от q(k) , с характеристиками:
M{ (k)} 0, M{ (k) T ( j)} V k , j .
25
Матрица системы контроля равна  | 
	
  | 
	
  | 
	
  | 
  | 
	1  | 
	0  | 
	
  | 
H  | 
	0  | 
	1  | 
	.  | 
  | 
	
  | 
Для вычисления оценок вектора неизвестных параметров использовать алгоритм двухэтапной идентификации.
Адаптивное управление будет иметь вид:
  | 
	
  | 
	u(k) [B  | 
	T  | 
	
  | 
	ˆ  | 
	
  | 
	T  | 
	
  | 
	ˆ  | 
	1  | 
	B  | 
	T  | 
	ˆ  | 
	
  | 
	
  | 
|||||
  | 
	
  | 
	
  | 
	( (k))F  | 
	
  | 
	CFB( (k)) D]  | 
	
  | 
	
  | 
	( (k))  | 
	
  | 
	(25)  | 
||||||||||
  | 
	
  | 
	
  | 
	
  | 
	F  | 
	T  | 
	
  | 
	ˆ  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
|||
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
|||||
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	C[FA( (k))xˆ(k) w(k 1)],  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
||||||||||
Интервал времени: k 0,....,140 .  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
|||||||||
Оценки векторов  | 
	xˆ(k)  | 
	
  | 
	ˆ  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
|||||||
и (k ) определяются с помощью следу-  | 
||||||||||||||||||||
ющих формул:  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
||||
xˆ(k  | 
	ˆ  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	ˆ  | 
	
  | 
	
  | 
	
  | 
	(k)[ y(k 1)  | 
	
  | 
	
  | 
|||||||
1) A( (k))xˆ(k) B( (k))u(k) K f  | 
	
  | 
	
  | 
||||||||||||||||||
  | 
	
  | 
	
  | 
	
  | 
	ˆ  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	ˆ  | 
	
  | 
	
  | 
	
  | 
	x(0) ,  | 
	
  | 
	(26)  | 
||||
  | 
	
  | 
	H ( A( (k))xˆ(k)  | 
	B( (k))u(k))] , xˆ(0)  | 
	
  | 
||||||||||||||||
  | 
	
  | 
	
  | 
	
  | 
	Pf (k 1/ k)  | 
	ˆ  | 
	
  | 
	ˆ  | 
	
  | 
	T  | 
	Q ,  | 
	
  | 
	(27)  | 
||||||||
  | 
	
  | 
	
  | 
	
  | 
	A( (k))Pf  | 
	(k) A( (k))  | 
	
  | 
	
  | 
|||||||||||||
  | 
	
  | 
	K  | 
	f  | 
	(k) P (k 1/ k)H T [HP (k 1/ k)H T V ] 1 ,  | 
	
  | 
	(28)  | 
||||||||||||||
  | 
	
  | 
	
  | 
	f  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	f  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
|
  | 
	Pf (k 1) (E2 K f (k)H )Pf  | 
	(k 1/ k) ,  | 
	Pf (0) Pf0 ,  | 
	
  | 
	(29)  | 
|||||||||||||||
ˆ  | 
	
  | 
	ˆ  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	ˆ  | 
	
  | 
	
  | 
	
  | 
	
  | 
	ˆ  | 
	
  | 
	
  | 
	,  | 
	(30)  | 
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
|||||||
(k 1)  | 
	(k) K (k)[ y(k 1) HG(k) Hg(k)]  | 
	, (0) 0  | 
||||||||||||||||||
K  | 
	(k) P (k)G(k)T [G(k)P (k)G(k)T HQH T V ] 1 ,  | 
	
  | 
	(31)  | 
|||||||||||||||||
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
  | 
	
  | 
	P (k 1) (E3 K (k)G(k))P (k) ,  | 
	P (0) P 0 ,  | 
	
  | 
	(32)  | 
|||||||||||||||
где  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
  | 
	
  | 
	
  | 
	G(k) G(xˆ(k),u(k)) , g(k) g(xˆ(k),u(k)) .  | 
	
  | 
	
  | 
|||||||||||||||
26
Начальные условия для уравнения (30) следующие:
0ˆ (0) 0 .
0
Матрица P (0) диагональная (см. таблицу 3).
ЗАДАНИЕ
Построить графики переходных процессов, графики адаптивного управления и оценок неизвестных параметров. Исследовать влияние на качество идентификации диагональных элементов матрицы P 0 (увели-
чивая их в 10 и 100 раз), диагональных элементов матрицы Q и V (уменьшая из в 10 и 100 раз). Сделать выводы.
Лабораторная работа № 10.
Адаптивное управление по нелинейной модели
А) Оптимальное управление
1. Для дискретной модели фирмы, производящей 1 вид товара
x(k 1) A (x(k)) Bu(k) q(k),  | 
	x(0) x0 ,  | 
	(33)  | 
||||||
и модели желаемого изменения прибыли фирмы:  | 
	
  | 
	
  | 
||||||
  | 
	
  | 
	(k 1) (1 r)  | 
	
  | 
	(k),  | 
	
  | 
	(0) w0.  | 
	(34)  | 
|
w  | 
	w  | 
	w  | 
||||||
Вектор (x(k)) определяется в лабораторной работе № 7.  | 
	
  | 
|||||||
Компоненты вектора состояния x(k) [z(k)  | 
	v(k) w(k)] ,  | 
	где  | 
||||||
z(k) количество товаров на рынке; v(k) количество товаров у
27
потребителя, w(k) прибыль. Функция продаж в этом случае примет вид:
s(k) n0 exp( c)(1 v(k) /Y )z(k) .  | 
	(35)  | 
Вектор (x(k)) в (33) определяется в лабораторной работе № 7. В (33) матрицы A и B следующие
  | 
	
  | 
	0  | 
	1  | 
	
  | 
	
  | 
|
  | 
	1  | 
	n  | 
	exp( c) k  | 
	0  | 
	0  | 
|
A  | 
	
  | 
	n0 exp( c)  | 
	
  | 
	1 k2  | 
	0  | 
|
  | 
	
  | 
|||||
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
|
  | 
	cn  | 
	exp( c) k  | 
	3  | 
	0  | 
	1  | 
|
  | 
	
  | 
	0  | 
	
  | 
	
  | 
	
  | 
|
n0 exp( c) / Y  | 
	
  | 
	
  | 
n exp( c) / Y  | 
	
  | 
	,  | 
0  | 
	
  | 
	
  | 
  | 
	
  | 
|
cn exp( c) / Y  | 
	
  | 
|
0  | 
	
  | 
	
  | 
  | 
	1  | 
	
  | 
	
  | 
B  | 
	0  | 
	
  | 
	, (36)  | 
  | 
	
  | 
	
  | 
	
  | 
  | 
	c  | 
	
  | 
	
  | 
  | 
	0  | 
	
  | 
	
  | 
где c цена единицы продукции, c0 себестоимость, k1 коэффициент потерь, n0 коэффициент продаж, k2 коэффициент потребления, k3 стоимость хранения единицы продукции в день, Y потенциаль-
ный спрос.
Реализовать оптимальное управление фирмой:
u(k) (BT FT CFB D) 1 BT FT C(FA (xˆ(k)) w(k 1)) . (37)
где xˆ(k) вычисляется с помощью линеаризованного фильтра Калмана: xˆ(k 1) A (xˆ(k)) Bu(k) K f (k)[ y(k 1) H (A (xˆ(k)) Bu(k))],
xˆ(0) x(0) ,
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
|
  | 
	
  | 
	P (k 1/ k)  | 
	AP (k) AT Q ,  | 
	
  | 
||||
  | 
	
  | 
	f  | 
	
  | 
	
  | 
	f  | 
	
  | 
||
K  | 
	f  | 
	(k) P (k 1/ k)H T [HP (k 1/ k)H T V ] 1  | 
	,  | 
|||||
  | 
	f  | 
	
  | 
	
  | 
	f  | 
	
  | 
|||
Pf (k 1) (E2  | 
	K f (k)H )Pf (k 1/ k), Pf (0) Pf 0 ,  | 
|||||||
где матрица A определяется по формуле
(x(k))
A(k) A x(k) |xˆ (k ) .
(38)
(39)
(40)
(41)
(42)
Предполагается, что модель системы контроля имеет вид:
28
y(k) Hx(k) (k) ,  | 
	(43)  | 
где (k) гауссовская случайная последовательность, независимая от q(k) , с характеристиками:
M{ (k)} 0, M{ (k) T ( j)} V k , j .
Исходные данные, необходимые для решения задачи адаптивного управления следующие:
F (0  | 
	0  | 
	1),  | 
	C 1,  | 
	D 0,01 ,  | 
	r 0,0062 ,  | 
	c 3,5 , c0  | 
	1 ,  | 
	
  | 
	
  | 
||||||||
  | 
	
  | 
	n0 0,8 , k1  | 
	0,0001, k2  | 
	0,02, k3  | 
	0,05 ,  | 
	
  | 
	
  | 
	
  | 
	
  | 
||||||||
1  | 
	0  | 
	0  | 
	0,11  | 
	0  | 
	
  | 
	0  | 
	
  | 
	
  | 
	
  | 
	
  | 
	2,1  | 
	0  | 
	0  | 
	
  | 
	
  | 
||
H 0 1  | 
	0  | 
	, Q  | 
	0  | 
	0,08  | 
	
  | 
	0  | 
	
  | 
	
  | 
	, V  | 
	0 3, 2  | 
	0  | 
	
  | 
	,  | 
||||
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
0  | 
	0  | 
	1  | 
	
  | 
	0  | 
	
  | 
	0  | 
	0,095  | 
	
  | 
	
  | 
	0  | 
	0  | 
	0,05  | 
	
  | 
||||
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	200  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	190  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
  | 
	
  | 
	
  | 
	x(0)  | 
	110  | 
	,  | 
	xˆ  | 
	(0)  | 
	
  | 
	100  | 
	.  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
||
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	w0  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	w0  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
||
Дополнительные данные, необходимые для выполнения работы, приведены в таблице 4.
ЗАДАНИЕ
Построить графики переходных процессов, графики оптимального управления и оценок вектора. Моделирование выполнить на интервале времени от 0 до 140. Выполнить моделирование с использованием линеаризованного экстраполятора Калмана.
29
Сделать выводы.
Б) Адаптивное управление
Для дискретной модели фирмы, производящей 1 вид товара
x(k 1) A( ) (x(k)) Bu(k) q(k),  | 
	x(0) x0 ,  | 
	(44)  | 
и модели желаемого изменения прибыли фирмы:
  | 
	
  | 
	(k 1) (1 r)  | 
	
  | 
	(k),  | 
	
  | 
	(0) w0.  | 
	(45)  | 
w  | 
	w  | 
	w  | 
|||||
Компоненты вектора состояния x(k) [z(k) v(k)  | 
	w(k)] , где  | 
||||||
z(k) количество  | 
	товаров на рынке; v(k) количество товаров у  | 
|
потребителя, w(k)  | 
	прибыль. Функция продаж в этом случае примет  | 
|
вид:  | 
	
  | 
	
  | 
  | 
	s(k) n0 exp( c)(1 v(k) /Y )z(k) .  | 
	(46)  | 
где Y потенциальный спрос. В (44) вектор неизвестных параметров определен следующим соотношением:
n0 ,k2
где n0 коэффициент продаж,  | 
	k2  | 
	коэффициент потребления. Пред-  | 
||||||||||||
полагается,  | 
	что вектор  | 
	является неизвестной константой.  | 
	Матрицы  | 
|||||||||||
A( ) и B следующие  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
||
  | 
	
  | 
	1  | 
	1  | 
	
  | 
	
  | 
	
  | 
	1  | 
	
  | 
	
  | 
	
  | 
	
  | 
	1  | 
	
  | 
	
  | 
  | 
	1 exp( c) k  | 
	0  | 
	
  | 
	0  | 
	exp( c) / Y  | 
	
  | 
	
  | 
	
  | 
	
  | 
|||||
A( )  | 
	
  | 
	exp( c)  | 
	
  | 
	1  | 
	
  | 
	0  | 
	exp( c) / Y  | 
	
  | 
	,  | 
	B  | 
	
  | 
	0  | 
	
  | 
	, (47)  | 
  | 
	
  | 
	1  | 
	
  | 
	
  | 
	2  | 
	
  | 
	1  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
  | 
	c exp( c) k  | 
	
  | 
	0  | 
	
  | 
	1  | 
	c exp( c) / Y  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
||
  | 
	
  | 
	1  | 
	3  | 
	
  | 
	
  | 
	
  | 
	1  | 
	
  | 
	
  | 
	
  | 
	c0  | 
	
  | 
||
30
