![](/user_photo/_userpic.png)
книги / Флуктуации в динамических системах под действием малых случайных возмущений
..pdf§ И |
ПОСТАНОВКА ЗАДАЧИ |
371 |
величины т**). Так, если мы интересуемся нашим объек том только в течение отрезка времени [О, Г], то в качестве меры неустойчивости системы можно взять Р {т * ^ Т). Если интервал времени заранее не фиксирован, то устой чивость можно характеризовать величиной Мтх. В тех случаях, когда пребывание фазовой точки вне D не приво дит к разрушению объекта, а только нежелательно, в ка честве меры устойчивости можно выбрать значение инва риантной меры процесса на дополнении множества D (если инвариантная мера существует). Эта мера будет ха рактеризовать долю *времени, проводимую траекторией
X? вне области D.
Однако точное вычисление этих вероятностных харак теристик возможно только в редких случаях, главным об
разом когда X* оказывается марковским процессом или компонентой марковского процесса в пространстве больше го числа измерений. В марковском случае рассматривае мые вероятности и средние значения являются, как из вестно, решениями некоторых краевых задач для соответ ствующих уравнений. По даже в тех случаях, когда можно написать какие-то уравнения и краевые условия, извлечь из этих уравнений полезную информацию не так-то про сто. В связи с этим представляет интерес нахождение раз ного рода асимптотик указанных вероятностных характе ристик при стремлении к нулю тех или иных параметров, вводящих в уравнение.
В целом ряде задач можно считать, что интенсивность шума в некотором смысле мала по сравнению с детермини рованными факторами, определяющими эволюцию системы. Таким образом, в задаче появляется малый параметр. Ес ли точка О — асимптотически устойчивое положение рав новесия невозмущенной системы, то выход из области D происходит за счет малых случайных возмущений, вопре ки детерминированным составляющим. В таких ситуаци
*) Заметим, что величина %х может оказаться с положительной
вероятностью равной оо. Если случайные возмущения в самом |
||
положении равновесия |
О исчезают, то Р {тх< оо) может |
стре |
миться к 0 при х —►О. |
Для дифференциальных уравнений с |
воз |
мущениями, исчезающими при приближении к положению равно весия, можно создать теорию устойчивости, близкую к классиче ской теории (см. X а с ь м и н с к и й [1J).
372 |
УСТОЙЧИВОСТЬ ПРИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЯХ [ГЛ. 8 |
|
ях, как мы знаем, оценки |
^ Т} и Мтх даются с по |
мощью функционала действия. Хотя таким образом уда ется вычислить только грубую, логарифмическую асимпто тику, этого бывает достаточно во многих задачах. Так, логарифмическая асимптотика позволит нам сравнивать различные критические области, различные векторные поля Ь(х, у), а также позволит решить некоторые задачи
оптимальной стабилизации. |
Ве и т ц е л я , Фр е й - |
||||
Такой подход развит в статье |
|||||
длиыа |
[5]. |
|
‘постановок |
задач |
об |
Введем несколько различных |
|||||
устойчивости и наметим способы их решения. |
|
|
|||
Пусть |
X?, t ^ |
0,— семейство |
случайных |
процессов |
|
в Rr, возникающее |
в результате |
малых случайных |
воз |
мущений системы (1.1); вероятности и математические ожидания, соответствующие данному значению параметра и дайной начальной точке, будем обозначать соответствен
но Р£, М*. |
Пусть K(h)SoT (ф) — функционал действия для |
||||||||
семейства |
процессов X? относительно метрики роТ (ф, ф) = |
||||||||
=« sup |ф* — ф*| |
при |
h { |
0; |
ясно, |
|
что |
функционал |
||
SоТ |
обращается в нуль на траекториях |
системы (1.1) и |
|||||||
только на |
них. |
|
|
|
|
|
|
|
|
Пусть О — устойчивое положение равновесия системы |
|||||||||
(1.1); |
D — область, содержащая его; |
xD = |
inf {t : X? ф. |
||||||
ф D } — первый момент выхода процесса из D. Пусть нас |
|||||||||
интересует |
устойчивость |
системы па конечном отрезке |
|||||||
времени[0, |
Т]. |
Будем |
характеризовать эту устойчивость |
||||||
асимптотикой вероятности Pj |
{xD ^ |
Т) |
при h { 0. |
Здесь уместно ввести следующую меру устойчивости нашей системы относительно данного вида случайных воз
мущений и области D: |
|
|
VTD'X = inf {Sor(q>):<pe |
U U |
Hxe(t)\t |
{ |
0< f < r y&D |
> |
где множество НхУ (t) состоит из всех функций ф8, опреде
ленных |
при |
s е |
[0, |
Г], таких, что ф0 = х, |
a cpt |
= у. |
||
Смысл |
|
этой |
меры |
устойчивости — следующий: |
если |
|||
нижние |
|
грани |
функционала S{)T |
по |
замыканию |
|||
(J |
(J |
IIхУ (t) |
и |
но внутренности |
этого множества |
§ i] |
ПОСТАНОВКА ЗАДАЧИ |
373 |
совпадают, то вероятность Pj{xD^ Т} логарифмически эквивалентна ехр {—X(h)VQ'x}. Заметим, что для совпа дения нижних граней по замыканию и по внутренности достаточно (в случае функционала S{)T вида, рассмотрен ного в гл. 4, 5), чтобы область D совпадала с внутрен ностью своего замыкания.
Меру |
устойчивости |
Уд* |
можно |
вычислить |
как |
inf |
и (t, х, у), |
где |
u(t, х, |
у) = inf {SoT (cp) : |
|
0<f<T,v(5£D |
|
|
|
уравнения Якоби. |
|
cpe Hx,y{t)} может быть найдена из |
|||||
Другой мерой устойчивости будет характеризоваться |
|||||
задача, в которой не фиксирован никакой отрезок |
[О, Т ] |
||||
времени наблюдения. Определим pD |
как нижнюю |
грань |
значений функционала S{)T от функций cpt, определенных
на отрезках |
[О, Т] всевозможной |
длины |
и таких, |
что |
|
ф0 — О, фг |
ф D. Вычислить j.iD |
можно |
как |
нижнюю |
|
грань по у ф. D от квазипотенциала |
|
|
|
||
V(0, у) = |
inf {SuT (ф) : Фо = о, |
фг = у, 0 < |
Т < |
оо}, |
который (теорема 4.3 гл. 5) находится как решение соот ветствующей задачи для уравнения в частных производ ных первого порядка. Согласно результатам гл. 4—7 при соответствующих предположениях относительно про
цессов Xht я области D среднее время выхода из области
M*T D ^логарифмически эквивалентно |
exp {A,(/&)fiD} |
для |
всех точек х из D, для которых начинающаяся из них |
||
траектория системы (1.1), не выходя |
из области D, |
стре |
мится к положению равновесия О (теоремы 4.1 гл. 4, 5.3 гл. 6, 6.1 гл. 7). В этом случае математическое ожидание представляет собой типичное с точностью до логарифми ческой эквивалентности значение времени выхода; а имен но, для любого у > О
!im Р£{ехр {k(h) [|.i0 — у]} < t D < ехр {Х(Д)[|л0 + у]}} = 1 h\,О
(теорема 4.2 гл. 4). Кроме того, значение нормированной
инвариантной для Xht меры на множестве Rr \ D лога рифмически эквивалентно ехр {—X(/i)jiD} (теоремы 4.3 гл. 4, 4.2 гл. 5). Таким образом, если отрезок времени за
374 УСТОЙЧИВОСТЬ ПРИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЯХ [ГЛ. 8
ранее не фиксирован, константа цл является в некотором смысле универсальной мерой устойчивости для заданного вида возмущений и критической области. Если критиче ская область не задана, то такой универсальной харак теристикой устойчивости положения равновесия будет функция V(0, у)— квазипотенциал случайных возмущений.
Через функцию V(0, у) выражается и «самая опасная точка» па границе критической области: при некоторых предположениях «разрушение» объекта происходит с по давляющей при малых h вероятностью вблизи точек у е dD, где V(0, у) достигает своей нижней грани по мно жеству dD.
Теперь рассмотрим задачу выбора оптимальной крити ческой области. Предположим, что для областей D, содер жащих положение равновесия О иевозмущенной системы, определен монотонный функционал H(D); для определен ности будем считать, что этот функционал имеет вид
j* h(x)dx, где h(x) — положительная функция. Мы стре-
D
мимся к тому, чтобы среди областей D с заданным значе нием функционала 11(D) = П0 выбрать такую, чтобы ве роятность выйти из этой области за фиксированное время Т была наименьшей или математическое ожидание време ни выхода — наибольшим. Оптимальная критическая^область зависит, вообще говоря, от h. Мы будем искать асимптотическое решение этой задачи, т. е. будем стремить ся построить область, которая лучше любой другой (не за висящей от /г) области при достаточно малых h.
Ясно, что эта задача сводится к максимизации соот
ветствующей меры устойчивости — Vj)’x или Легко видеть, что она должна решаться следующим образом:
берутся области Dc вида |
{у : |
inf |
u(t, х, |
у) < |
с) (co |
|
ответственно |
{у : V(0, у) < |
o le r |
|
|
|
|
с}); и из этого расширяюще |
||||||
гося семейства областей выбирается та, |
для |
которой |
||||
H(DC) = Н0. |
Если функция |
inf u(t, х, у) |
(или |
V(0, у)) |
||
|
|
0 < /< Г |
|
свойства об |
||
гладка по у, это обеспечивает хорошие |
||||||
ласти Dc. Любую область, |
граница |
которой не |
является |
|||
поверхностью уровня функции |
inf |
u(t, х, |
у) |
(соответ- |
||
|
|
|
0 < £ < Г |
|
|
ственно V(0, г/)), можно уменьшить, сохранив то же
§ и |
ПОСТАНОВКА ЗАДАЧИ |
375 |
значение inf inf u(t, х, у) (или inf V(0, г/)), а затвхМ
V & D О « < Т |
l'£ D |
заменить большей областью Dc с прежним значением Я.
Так, для системы xt= |
с нормальной матрицей Л |
ивозмущений типа «белого шума» (т. е. Xf = АХ]
+-eu;t) оптимальная критическая область для задачи без фиксированного отрезка времени имеет вид эллипсоида (см. пример 3.2 гл. 4).
Перейдем к задачам оптимальной стабилизации. Предположим, что в возмущенном уравнении (1.3)
содержится параметр, которым можно управлять (или несколько параметров). Выбор способа управления про цессом состоит в выборе вида зависимости управляющего параметра от значений управляемого случайного процес са Введем следующее ограничение на характер этой за висимости. Пусть каждому рассматриваемому виду а за
висимости управляющего параметра от значений процесса
отвечает семейство случайных процессов X]'h. Предпола гается, что для них всех существует функционал действия k(h)Sa (ф), в котором нормирующий коэффициент K(h) не зависит от выбора управления.
Решение определенных задач оптимального управле ния процессом при малых /г будет связано с функциона
лом Sa (ф) = Sir |
(ф) |
и |
квазипотенциалом |
Va (х, |
у) = |
||||
= inf |
{S(iT (ф): Фо = |
я, |
Фг = У\ |
0 <!2" < |
со}. |
В |
част |
||
ности, правдоподобно,что задача выбора управления, |
мак |
||||||||
симизирующего |
(асимптотически |
при |
h | 0) |
среднее |
|||||
время |
выхода из какой-либо области |
будет |
связана |
||||||
с функцией |
|
|
|
|
|
|
|
|
|
|
|
V(x, |
у) = |
sup Г |
(х, у), |
|
|
|
(1.4) |
где верхняя грань берется по всем допустимым способам' управления.
Мы ограничимся рассмотрением однородных по време ни управляемых марковских процессов. В качестве клас са допустимых управлений будем рассматривать такие,- в которых значение управляющего параметра в данный момент t является определенной функцией a(Xt) от значе ния процесса в тот же самый момент времени. Такие управ ления приводят к однородным по времени марковским
376 УСТОЙЧИВОСТЬ ПРИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЯХ [ГЛ. 8
процессам X^'h (см. К р ы л о в [2 ]); их локальные ха рактеристики в каждой точке х зависят от х и от значения управляющего параметра а(х) в этой точке.
Итак, пусть класс допустимых управлений состоит из функций а(х), значения которых в каждой точке принад лежат множеству допустимых в данной точке управле ний Щя) (и которые подчинены еще некоторым требова ниям регулярности). Каждой допустимой функции отве
чает марковский процесс |
Р*’л) |
(соответствующие |
|||
математическое ожидание, |
нормированный функционал |
||||
действия, |
квазипотенциал |
обозначаем |
Ml'h, |
SQT (ф), |
|
Va (х, у)). Будем |
рассматривать следующую |
задачу: |
|||
выбрать |
функцию |
а так, чтобы |
максимизировать |
Пт Щ )-1In M}i'axD. hi О
Решение этой задачи, как мы уже говорили, скорее
всего связано с функцией V(x, у), определяемой формулой (1.4). Здесь возникает ряд вопросов: как можно найти мак
симальный квазипотенциал V(x, у)? и как с его помощью решать задачу об оптимальном управлении? В следующих параграфах мы рассмотрим эти вопросы (для определен ного класса управляемых марковских процессов), а также примеры.
§ 2. Задача оптимальной стабилизации
Класс семейств случайных процессов, для которого мы будем рассматривать эту задачу,— это семейства локаль но безгранично делимых процессов, рассмотренные в
гл. 5. Предположим, что при каждом х е |
Rr задано мно |
жество П(я) с : R1. Пусть каждой паре х е |
i?r , а ^ Щх) |
поставлены в соответствие: вектор Ь(х, а) |
= (Ь1(х, а), . . . |
. . ., Ьг {х, а)); симметричная неотрицательно определенная
матрица (а'1(х, а)) порядка г; |
мера р,(£, а, •) на Rr \ { 0 } |
||
такая, что |
J |Р|2|л(;г, а, |
c?(J) < |
оо. |
Процесс |
(Х*’а, Р* а), |
отвечающий значению парамет |
ра h (из (0, оо)) и выбору управляющей функции а(х) (при надлежащей при каждом значении аргумента множеству Щя)), мы определим как марковский процесс с инфините зимальным оператором, определенным на финитных дваж-
§ 21 |
ЗАДАЧА ОПТИМАЛЬНОЙ СТАБИЛИЗАЦИИ |
377 |
ды непрерывно дифференцируемых функциях формулой
Ah'a1{x) =
яг\{0>
|
( 2. 1) |
Разумеется, может |
оказаться, что данной функции |
а(х) при каком-то h > |
0 не отвечает никакой марковский |
процесс; в этом случае будем считать управляющую функ цию недопустимой. Обозначим класс допустимых управ лений Я.
Вопросу о том, при каких условиях данному набору локальных характеристик отвечает локально безгранично делимый процесс, посвящено большое число работ; особен но широко исследован вопрос в случае диффузионных про цессов, т. е. ц = 0. Достаточно, например, равномерной невырожденности и непрерывности матрицы диффузии,
ограниченности и измеримости вектора сноса (см. |
К р ы- |
|||||
л о в |
[1 ], |
С т р у к и |
В а р а д а н |
[1 ]). Случай |
ц, от |
|
личного от |
нуля, |
рассматривался в статьях К о м а ц у |
||||
Ц], |
С т р у н а |
[1], |
Л е п е л ь т ь е |
и М а р ш а л я |
||
[1 ] и др. |
|
|
|
|
|
|
Вероятности маловероятных событий для процессов |
||||||
{Xht'a,Px'a) |
при |
различном выборе функции а(х) |
будут |
|||
связаны с функцией от трех аргументов: |
|
И (х , а, |
а) = ^ |
ь\х , а) Щ + у 2 (*> а) a ia i + |
|
+ |
j |
[exp 12 РЧ) — 1 -- 2РЧ1 |
45), (2.2) |
|
Rr\{0> |
|
|
которую мы будем предполагать конечной и непрерывной по всем аргументам вместе с ее производными по а/. При выполнении условий теоремы 2.1 гл. 5 функционал действия
для семейства процессов (Х^,а, Р* я) при h j 0 будет
378 |
УСТОЙЧИВОСТЬ ПРИ СЛУЧАЙНЫХ ВОЗМ ЛЦЕНИЯХ |
[ГЛ. 8 |
|
задаваться формулой |
|
|
|
|
т |
|
|
|
h~lSor (ф) = h r1j L (Ф„ а (ф(), ф() dt, |
(2.3) |
|
|
О |
|
|
где |
L(x, а, |3) — преобразование Лежандра |
от функции |
|
Н(х, а, а) по третьему аргументу. |
L(x, (5) непре |
||
|
В гл. 5 мы требовали от функций Н{х, a), |
рывности по х; поэтому хорошо было бы рассматривать только непрерывные управляющие функции а(х). Однако известно, что в задачах оптимального управления редко удается обойтись только непрерывными управлениями. Оказывается, необходимые нам результаты переносятся на случай, когда функции Н(х, а), L(x, (5) терпят разрыв в одной точке (или в конечном числе точек), ио не сохра няются, вообще говоря, если разрыв имеет место вдоль какой-нибудь линии (или тем более поверхности). Поэтому мы вводим следующий класс функций. Пусть а(х) —
определенная на Rr функция со значениями в R1 . Будем
писать |
а е п, если эта функция непрерывна при всех |
х е R' |
, кроме, может быть, одной точки, и при каждом х |
значение этой функция принадлежит множеству разрешен ных в точке х управлений П(.г).
Теоремы 2.1—2.3 для диффузионных процессов со
держатся |
в статье В е н т ц е л я , |
Ф р е й д л и н а [5]. |
Т е о р е м а 2.1. Пусть TD |
— момент выхода процес |
|
са Х^'а |
из ограниченной области D, граница которой |
совпадает с границей ее замыкания. Для любой управляю
щей функции a G П f] й |
равномерно по х е D |
lim h In М£,аТд ^ V 0 |
= max min sup Va(x0, */). (2.4) |
h | 0 |
XQ D yEzdD а & И |
Заметим, что Va — в свою очередь нижняя грань зна чений функционала Sa (ср) по функциям, ведущим из х0 в у, так что в правой части (2.4) фигурирует весьма слож ная комбинация максимумов и минимумов: max min sup inf.
Д о к а з а т е л ь с т в о теоремы проводится следую щим образом: для произвольного у > 0 выбираем Т > О так, чтобы для любой управляющей функции а е П и любого х0е D существовала функция ф*, 0 ^ t ^ Тх та
380 |
УСТОЙЧИВОСТЬ ПРИ |
СЛУЧАЙНЫХ ВОЗМУЩЕНИЯХ |
(ГЛ. 8 |
|
Положим теперь |
|
|
|
Н (х, а) = |
inf И (х, а, а). |
|
|
Т е о р е м а 2.2. Пусть F(x) — решение задачи |
RXQ |
|
для уравнения |
|
|
|
|
Щх, v'7(*)) = о |
(2.7) |
в области D. Тогда для любой функции а, принадлежащей классу П (т. е. а непрерывна всюду, кроме одной точки^ п а(х) е П(х) при любом х), квазипотенциал
|
|
|
|
V- (х0, х) < F(x) |
|
|
|
|||||
/г/ж яегх х |
|
из |
множества |
|
|
|
|
|
|
|||
|
В = |
{хее D (J |
dD : F (x)< |
inf F (у)}. |
||||||||
|
|
|
|
|
|
|
|
|
y€zdD |
|
|
|
Пусть, кроме того, существует непрерывная на мно |
||||||||||||
жестве |
{(х, |
|
а) |
: я =?£= х0, |
а =т^=0, |
Я(х, |
а) |
= 0} |
функция |
|||
а(х, а) |
такая, что а(х, |
а) ^ |
П(х), |
и |
Я(х, |
а(х, |
а), а) — |
|||||
= Я(х, |
а) |
- |
0. |
Тогда |
|
|
|
|
|
|
|
|
|
|
|
|
sup Fa (х0, х) — |
I7 (х) |
|
|
|||||
|
|
|
|
OG11 |
|
|
|
|
|
|
|
|
для всех х е |
|
Я, |
и верхняя грань достигается па функции |
|||||||||
а(х) = |
а(х, |
у F(x)). |
|
|
|
|
|
|
|
каком-то |
||
Д о к а з а т е л ь с т в о . Допустим, что при |
||||||||||||
а е П , |
каком-то х е |
В и каком-то |
е >> 0 |
|
||||||||
|
|
|
Fa (х0, х) > е + |
(1 |
+ |
e)F(x). |
|
|
||||
пт |
|
|
|
|
/ |
= |
Va (хи<#*)— У (а?*) |
где х* — |
||||
Можно считать, что г=£ |
— —— =------- * , |
|||||||||||
точка, где функция а(х) терпит разрыв. |
|
|
||||||||||
Рассмотрим множество А = |
В f] |
{х : Fa (х0, х) > е + |
||||||||||
+ (1 + |
e)F(x)}; это множество — открытое в Я. Положим |
|||||||||||
F0 = inf {F(x) : х ^ |
Л }. |
Нижняя грань F0 не достига |
||||||||||
ется; пусть |
Хоо—предельная точка множества А на поверх |