
книги из ГПНТБ / Красовский, А. А. Фазовое пространство и статистическая теория динамических систем
.pdf180 |
РА В Н О В ЕС Н Ы Е РА С П Р Е Д Е Л Е Н И Я В СИСТЕМАХ [ГЛ . IV |
|
все величины A i} (t), |
A ijk (t), . . . стремятся к нулю при |
|
t ->• — |
оо. Это является предпосылкой быстрой сходимости |
|
ряда (4.57) при tx |
t2 для данного случая. |
Синтез систем оценивания. Пусть процесс, координаты которого х 1п должны быть оценены с максимальной воз
можной точностью, описывается уравнениями
(4.59)
гДе fin— известные функции, | г — белые шумы. Коорди наты х 1а измеряются с помощью датчиков, имеющих ошибки или шумы xi ш:
Ъя = Ъп + Хт, i = l , 2 , . . . , n . |
(4.60) |
В задаче фильтрации Калмана непосредственно измери мыми считаются некоторые линейные комбинации коорди нат Xia в совокупности с шумами. Однако предполагается
полная наблюдаемость по Калману, что равносильно возможности косвенного измерения всех фазовых коорди нат. Здесь рассматриваем более простой случай прямого измерения всех координат контролируемого процесса в совокупности с аддитивными шумами. Считаем, что ошибки или шумы датчиков могут быть представлены как выходные величины формирующих фильтров, на вы ходы которых действуют белые шумы:
%im4* fim (#l.im • • • >#nin> t) = |
i = 1, 2, . . . , П. (4.61) |
Требуется построить систему оценивания (фильтр) вида
Х{ф - |- f \Ф (#1 ф , • . . |
, # п ф , ^1д> |
• • ■ » *^ПД> 0 ж |
6 , |
i = |
1 , 2 , . . . , |
и, |
(4.62) |
выходные величины которой x t^ в определенном смысле
наименьшим образом отличались бы]от истинных значений координат хщ контролируемого процесса по истечении
определенного времени наблюдения. При линейных функ циях /in./iffl) /гф квадратичном критерии приближения и известном нормальном начальном распределении коорди нат эта задача имеет решение в виде фильтра Калмана
(5.11], [5.12].
§ 4.2) Ф П К -У РА В Н Е Н И Е И С И Н ТЕ З СИСТЕМ У П РА В Л Е Н И Я |
181 |
||
Представим систему уравнений (4.59)—(4.62) в виде |
|||
■^in 4" /in (^-Xnj • • • ) З-шп О *= |
ijfl, |
|
|
X-im 4* fim (®1ш> • • • »%пш, О = |
?4пц |
|
|
•^Хф4“ /гф (*1ф, ••* ) Хпф, ^ln 4" *^1ш» •••1 £пп + |
, |
(4.63) |
|
|
4" Хпт, 0 — О, |
|
|
г= 1, 2, . .. , п ,
изапишем для этой системы ФПК-уравнение в виде (1.13):
ПП
3 In р |
|
ZJ |
d in р |
|
|
|
3 In р |
|
|
|
|
dt |
|
in -^ Г ------- Z) Jim |
toim |
|
|
|
|||||
|
i=l |
/ш . tn |
|
t=i |
|
|
|
|
|||
|
S |
4 |
d In p |
1 |
n |
сП / |
3* In p |
, |
3 In p |
d In p \ |
|
|
|
||||||||||
|
|
*Ф |
Г |
* |
|
ij \dx.ndx,n |
+ |
~ Э 4 ~ |
3*,п ) |
||
|
i » l |
|
i,i—1 |
|
' |
гП 7П |
|
гП |
' |
||
|
|
|
1 v |
cm / 9* In р |
, 3 In р d In р \ _ |
||||||
|
|
~ ~ Г £ |
1 |
|
|
|
+ |
|
^ ш Г |
||
|
|
|
|
- |
I |
|
$ |
Г |
+ ^ |
+ $<*«“ ») ' |
где Si} — спектральные плотности шумов | гп, 61™— спек
тральные плотности шумов £г ш, причем шумы | jn счита ются некоррелированными по отношению к шумам £<ш. Обозначим векторы
Ха — (Хщ, . . . , хпв), |
j |
|
хш = (^1Ш) ■• • I я-пш)» |
I |
(4.65) |
Хф == ( % ф ) ■ ■ • 1 Хпф)' |
} |
|
Если бы при заданном начальном распределении
р ( х в , Хф, Хт , t-у) = P i (Хв , Хф, х ш)
удалось найти такие функции / [ф, при которых распреде
ление хп, Хф в момент времени t2 > |
ty |
00 |
|
Рг (*m Хф, <2) = \ р (хп, Хф, |
хш, t2) dXja |
(здесь интегрирование ведется по пространству ошибок датчиков) приближалось бы в определенном смысле
182 РА В Н О В ЕС Н Ы Е РА С П Р Е Д Е Л Е Н И Я В СИСТЕМАХ [ГЛ . IV
наилучшим образом к 6-распределению б (жп —£ф), то зада ча синтеза оптимальной системы оценивания была бы ре шена. Однако в такой общей постановке решение задачи встречает существенные трудности и в настоящее время не известно.
Представляя заданные функции / гп, /*ш и неизвестные функции / гф указанных аргументов в форме полиномов или рядов, можно решать уравнение (4.46) описанным выше методом рядов. При этом получается бесконечная система уравнений типа (2.11), в которой коэффициенты athi • ••», относящиеся к функциям / гп, / гш, заданы, а от
носящиеся к / гф — свободны, с учетом, однако, связей, накладываемых составом аргументов этой функции. Если ограничиться конечным числом членов разложения текущей логарифмической плотности, то указанная система обыкновенных дифференциальных уравнений становится замкнутой. Далее необходимо в пространстве коэффици ентов разложения In р назначить критерий или функцио
нал точности оценивания. Если начальное распределение задано, т. е. известны начальные значения коэффициентов разложения In р, то после всего этого задача сводится
к выбору варьируемых параметров ацц..., из условия экстремизации заданного функционала. Эта задача в принципе разрешимая, но трудная. Одна из трудностей заключается в том, что желаемое распределение является обычно концентрированным относительно ягф — а:<п (ма лые ошибки оценивания). Это может вызывать плохую сходимость разложения In р в ряд, необходимость учета
большого числа членов ряда и чрезмерную громоздкость системы уравнений типа (2.14). В связи с этим возникает мысль о решении той же задачи методом моментов, т. е. использовании линейных уравнений моментов типа (2.77). При концентрированном распределении разложение ха рактеристической функции (2.76) быстро сходится и можно ограничиться учетом моментов невысокого порядка. Одна ко начальное распределение может быть не концентри рованным по всем фазовым координатам. В этом случае возникают те же трудности, связанные с громоздкостью уравнений моментов.
Можно поставить задачу синтеза оптимальной систе мы оценивания как задачу аналитического конструирова ния. В этом случае синтезируемые функции /*ф без огра
§ 4.2] Ф П К -У РА В Н Е Н И Е И С И Н Т Е З СИСТЕМ У П РА В Л Е Н И Я |
Ig b |
ничения общности представляем в векторном изображении в форме
/ф = / п (Хф, t) — Нф (Хф, Ха + Хт, t) |
( 4 . 6 6 ) |
и рассматриваем Иф как синтезируемые управления. Такая задача решается в работе [4.8]. Трудность здесь заключается прежде всего в том, что имеет место неполная степень непосредственной наблюдаемости: в управлениях могут использоваться лишь выходные сигналы синтези руемого фильтра и датчиков. Для неполной степени наблю даемости в общем случае разработан лишь приближенный метод аналитического конструирования [4.8].
Кроме этих сложных путей синтеза существуют более простые, но, конечно, менее совершенные пути. Так, можно задаться равновесным распределением, найти условия его существования и связь параметров равновес ного распределения с параметрами фильтра. Далее пара метры фильтра выбираются так, чтобы обеспечить желае мый характер и параметры равновесного распределения. Рассмотрим этот путь, задавшись нормальным централь ным относительно Да;, = а^ф — хщ, Хщ, х ш равновесным
распределением
П
In р = Aq-|—2~ | [^-i/cXjaXfca "f" ^-ihXimXkm “Ь i, к=1
- f - А ы (х^ф — Xia) ( х кф — X ka) |
2 A i k XiaXjan - f - |
+ 2Afi^Xia (хкф— a:(in) + 2Аи^хцп (хщ ^(cn)] (4.67) |
|
и представлением функций f ia, fm |
в форме полиномов или |
рядов |
|
пп
/in = 2 |
“Ь |
2 |
^ijkXinXkn “Ь |
|
3—1 |
|
3, к=1 |
п |
|
|
|
|
|
|
|
|
|
+ 2 |
®ijklXjnXknXin + |
п |
|
п |
з, к, 1=1 |
|
|
|
( 4 . 6 8 ) |
||
/»ш — 2^I |
Q'ijXjai -f- |
21 |
&ijkXjinXкш ~f" |
|
j= l |
; |
3,4—1 |
|
|
|
|
+ |
2 |
Q-ijkt XjmXкшХ1ш H * • • , |
з, к, 1=1
184 |
РА В Н О В ЕС Н Ы Е РА С П Р Е Д Е Л Е Н И Я В СИСТЕМАХ [ГЛ . IV |
|
где «5, |
а |
а?}к, |
<&«, «W. • • |
• |
~ заданные |
коэффи |
||
циенты |
также представлением |
неизвестных |
функций |
|||||
в виде 'ряда, который с |
учетом |
(4.66) записывается в |
||||||
форме |
|
|
|
|
|
|
|
|
п |
|
|
п |
|
|
п |
|
|
Аф = 2 |
а Ь Х]ф + |
2 |
а Ш Х )Фх Кф + |
2 |
а ^к1Х ]фх К<ЬХ 1Ф + ••• |
|||
3=1 |
|
|
з, *=1 |
|
з, к, 1=1 |
|
||
п |
|
|
п |
|
|
п |
|
|
— 2 а ь^х }ф — |
2 а$ к х №х К'ф — |
2 |
а Ш1х ]фх кфх 1ф • • • |
|||||
j= l |
|
|
з,к=1 |
|
j,k ,l= 1 |
|
||
П |
|
|
|
W |
|
|
|
|
. . . — 2 |
|
(xjn Ч~ Х)ш) — 2 |
®i'3'k(х]'пЧ" х}ш) (хкп Ч" х кт) |
|||||
3=1 |
п |
|
|
3. *=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
— |
2 |
aij&!(*Уп Ч- ^з'ш)(#кп Ч" Я/сш)(#jn + ^1ш) |
|
|||||
3, »,;=i |
п |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
— 2 2 |
« А ф (^кп Ч~ х кш) |
|
з, k=i
—2 0,’з*! ^зФ (*кп Ч" ^-кш) (ХШ Ч" х 1ш)
з, к, (=1
п
— 2 аУк*д«зфХкф(х,п+х 1 т ) —... (4.69)
з, к, 1=1
Все коэффициенты здесь считаются постоянными, т. е. рас сматривается стационарный контролируемый процесс, ста ционарные шумы. Подставляя выражения (4.65)—(4.67) в. (4.64), собирая и приравнивая нулю коэффициенты при одинаковых произведениях независимых аргументов, на ходим
П
2 \аЪ(Арк + |
А% Ч- АЩ) Ч- |
|
|
Р =1 |
|
|
(4.70) |
Ч~ |
арк (A p j ч - |
-Чрз Ч* A p t )] Ч" |
|
Ч- 2 [®Р? (-^Р* — |
+ flpk (^РЗ — ^ p f ) l |
Ч- |
Р =1
§ 4,2] Ф П К -У П РА ВЛ ЕН И Е И СИ Н ТЕЗ СИСТЕМ У П РА В Л Е Н И Я 185
-Ь 2 Spq (А% + Api — Apt) (^зк+ Aqk Ачк)
Р, 3=1
2 2 |
^ Р ( И 5 Л^0»Л + 6 2 a ppik — |
Р, 3=1 |
Р=1 |
- 2 2 « № = 0,
p = i
2flpj (Арк — Арк) +
Р=1
|
|
+ 2 |
|
(<* - « # ) и # |
+ |
А% - |
А^) + |
|
|
|
|
|
Р=1 |
|
|
|
|
|
|
|
|
+ |
|
2 |
^ ря (-^pi + ^ p i — ^ pj ) (^ в к |
|
А як) |
+ |
|
|||
|
|
Р.3=1 |
|
|
п |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
+ |
2 |
s ; |
w |
= o |
, |
(4.70) |
|
|
|
|
|
Р,в=1 |
|
|
|
|
|
2 [«р; ( ^ р “ - ^ Л) + < * И ™ - ^ р;А)] - |
|
|
||||||||
Р=»1 |
|
п |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
— 2 |
[аР?-^Р А 4" аР? (^pf — -4р;')] + |
|
|
|||||
|
|
Р=1 |
|
|
|
|
|
|
||
+ 4" 2 ^РЗ (Ali + Ki - |
Alt) (ASF- AX) - |
|
||||||||
|
|
P ,3 = l |
|
|
|
|
|
|
|
|
- |
2 |
П |
|
|
|
П |
= 0, |
|
||
2 |
S p * (Apk+ ^?) < iA- 2 2 |
|
||||||||
|
|
P ,3 = l |
|
|
|
P=1 |
|
|
|
|
2 |
( |
^ |
+ a?kA™) — 2 |
apfAikA + |
|
|
|
|
||
P=1 |
|
|
|
p = i |
|
|
|
|
|
|
|
+ 4 - 2 |
sSq(AiF - AX )(AlT - |
|
A X ) - |
|
P, 3=1
186 РА В Н О В ЕС Н Ы Е Р А С П Р Е Д Е Л Е Н И Я В СИСТЕМ АХ [ГЛ . IV
• 2 <А р * + А + А ™ ) -
р,ф=1
(4.70)
— 2 2 appjj? = о,
р = 1
Эти соотношения можно рассматривать и как условия су ществования нормального равновесного распределения в рассматриваемой системе, и как уравнения для опреде
ления коэффициентов а^У*1, а!У\ а“Д ащД . . . системы оценивания, обеспечивающей заданное (в пределах воз можного) нормальное равновесное распределение ошибок оценивания и других параметров.
г л а в а v
ОСНОВЫ ТЕОРИИ ТЕПЛОВЫХ ФЛУКТУАЦИОННЫХ
КОЛЕБАНИЙ. МИКРОУПРАВЛЕНИЕ
Статистическая природа процессов микромира опреде ляет предельную потенциально достижимую точность управления. Это отчетливо проявляется как при попытках управления отдельно взятой микроскопической частицей, даже состоящей из множества атомов, так и при управле нии макрообъектами с предельно высокой точностью. Во просы, относящиеся к этой области, нередко лежат на границе статистической физики и теории управления и
вряде направлений еще слабо разработаны. Как уже от мечалось, истоки ФПК-уравнения связаны с теорией броуновского движения — раздела статистической физи ки. Естественно ожидать, что методы решения ФПК-урав нения могут быть применены к исследованию предельной
вуказанном смысле точности управления. Однако это далеко не исчерпывает потребности теоретического рас
смотрения данной области, особенно в части управления с квантовым взаимодействием контролирующей системы и объекта.
Изложение в данной главе начинается с наиболее хорошо разработанной теории тепловых флуктуационных шумов в пассивных линейных системах.
§ 5.1. Флуктуационные тепловые колебания в линейных пассивных системах
Уравнения линейной пассивной системы, находящей ся под воздействием собственных тепловых шумов, могут быть записаны в форме уравнений Лагранжа второго рода:
(5.1)
где qt, 4i — обобщенные координаты и обобщенные
188 Т ЕП Л О В Ы Е Ф Л У К Т У А Ц И О Н Н Ы Е К О Л Е БА Н И Я [ГЛ . V
скорости,
п |
п |
|
п |
— функция Лагранжа, Fi = |
2 rik(n — диссипативные и |
|
к=1 |
другие силы, линейно зависящие от обобщенных скоростей, ф( = фг (t) — центрированные случайные функции вре
мени, соответствующие собственным тепловым шумам.
Матрицы |
|
коэффициентов т — | mih ||, с = || сщ || симме |
|||||||
тричны, |
матрица |
г = | rih | |
может быть несимметричной |
||||||
(гт ф г). |
|
|
|
|
|
|
|
|
|
Подставляя в (5.1) выражения для L , фг и используя |
|||||||||
матричную |
форму |
уравнений, записываем |
|
||||||
|
|
|
|
|
mq + rq + |
cq = ф, |
|
(5.2) |
|
где |
q, ф — матрицы-столбцы. |
Симметричную |
матрицу |
||||||
г = гт имеют, |
в |
частности, |
пассивные |
электрические |
|||||
цепи, |
в |
которых |
m<h — индуктивности |
и взаимоиндук- |
|||||
тивности, |
/•;ft |
— активные |
(омические) |
сопротивления, |
|||||
cjft — емкости. |
|
|
с |
симметричной |
матрицей |
||||
Для |
пассивной системы |
при условии теплового равновесия, когда все элементы системы имеют одинаковую абсолютную температуру Т,
на основе формулы Найквиста [5.1], [5.2] можно записать следующее выражение для матрицы спектральных плот ностей тепловых шумов:
= I ST* I = 2kTr, |
(5.3) |
где к — постоянная Больцмана. В этой формуле не уч
тен так называемый квантовый множитель Планка [5.2], [5.4]. Однако изменение спектральной плотности, вызы ваемое этим множителем, наступает обычно лишь в обла сти частот инфракрасного излучения.
Таким образом, тепловые шумы в подавляющем боль шинстве случаев с полным основанием можно считать бе лыми шумами, что отражает формула (5.3) и последующие формулы.
Примером пассивных систем с несимметричной матри цей могут служить механические системы с гироскопиче-
§ 5.1] |
Ф Л У К Т У А Ц Й О Н Н Ы Е Т Е П Л О В Ы Е К О Л Е Б А Н И Я |
189 |
|
|
сними силами, электромеханические системы и др. Для таких систем в состоянии теплового равновесия [5.5], [5.7]
S<f = кТ (г -j- гт). |
(5.4) |
Опираясь на эти положения при рассмотрении более об щего случая неравновесного состояния пассивной неста ционарной системы (элементы системы имеют разные зна чения температуры), полагаем
S?, = k ( T thrik + |
T hirki). |
(5.5) |
При тепловом равновесии, когда |
T ih = Т ы = Т , |
выра |
жение (5.5) в матричной форме обращается в (5.4) и (при г — гт) в (5.3). Для системы с автономными степенями
свободы, для которой rih = 0 при к Ф i, формула |
(5.5) |
||||||||
обращается в формулу |
Найквиста |
S ti — 2кТн гп . |
(5.2) |
||||||
Считая матрицу m неособой, запишем уравнение |
|||||||||
в форме Коши, введя обозначения блочных матриц |
|
||||||||
mq II |
t |
|
I K |
|
II |
гтГ1 |
с |
|
|
X = |
|
|
и |
............. , |
(5-6) |
||||
^ — |о ’ й = |
|||||||||
?Г |
I- |
т - 1 |
0 |
|
|||||
Получаем |
t + ах = £. |
|
|
|
(5.7) |
||||
|
|
|
|
||||||
Блочная матрица спектральных |
плотностей £ равна |
||||||||
С |
|
о |
S, |
= |
К |
| , |
|
(5.8) |
|
о |
о |
|
|||||||
й — |
|
где Si* по предположению выражается формулой (5.5). Если распределение начальных значений х (0) является
нормальным, то решение ФПК-уравнения, составлен ного для линейного уравнения (5.7), также будет давать нормальное текущее распределение *)
р (х , t) = d exp zTAx^j = d exp ^----- хтМ~хх ^ .
Здесь d — скалярная постоянная, а матрица А и обрат
ная ей матрица вторых моментов
М = —А - 1
*) Начальное нормальное распределение считается цент ральным.