Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Флуктуации в динамических системах под действием малых случайных возмущений

..pdf
Скачиваний:
4
Добавлен:
12.11.2023
Размер:
21.91 Mб
Скачать

§ И

ПОСТАНОВКА ЗАДАЧИ

371

величины т**). Так, если мы интересуемся нашим объек­ том только в течение отрезка времени [О, Г], то в качестве меры неустойчивости системы можно взять Р {т * ^ Т). Если интервал времени заранее не фиксирован, то устой­ чивость можно характеризовать величиной Мтх. В тех случаях, когда пребывание фазовой точки вне D не приво­ дит к разрушению объекта, а только нежелательно, в ка­ честве меры устойчивости можно выбрать значение инва­ риантной меры процесса на дополнении множества D (если инвариантная мера существует). Эта мера будет ха­ рактеризовать долю *времени, проводимую траекторией

X? вне области D.

Однако точное вычисление этих вероятностных харак­ теристик возможно только в редких случаях, главным об­

разом когда X* оказывается марковским процессом или компонентой марковского процесса в пространстве больше­ го числа измерений. В марковском случае рассматривае­ мые вероятности и средние значения являются, как из­ вестно, решениями некоторых краевых задач для соответ­ ствующих уравнений. По даже в тех случаях, когда можно написать какие-то уравнения и краевые условия, извлечь из этих уравнений полезную информацию не так-то про­ сто. В связи с этим представляет интерес нахождение раз­ ного рода асимптотик указанных вероятностных характе­ ристик при стремлении к нулю тех или иных параметров, вводящих в уравнение.

В целом ряде задач можно считать, что интенсивность шума в некотором смысле мала по сравнению с детермини­ рованными факторами, определяющими эволюцию системы. Таким образом, в задаче появляется малый параметр. Ес­ ли точка О — асимптотически устойчивое положение рав­ новесия невозмущенной системы, то выход из области D происходит за счет малых случайных возмущений, вопре­ ки детерминированным составляющим. В таких ситуаци­

*) Заметим, что величина может оказаться с положительной

вероятностью равной оо. Если случайные возмущения в самом

положении равновесия

О исчезают, то Р {тх< оо) может

стре­

миться к 0 при х —►О.

Для дифференциальных уравнений с

воз­

мущениями, исчезающими при приближении к положению равно­ весия, можно создать теорию устойчивости, близкую к классиче­ ской теории (см. X а с ь м и н с к и й [1J).

372

УСТОЙЧИВОСТЬ ПРИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЯХ [ГЛ. 8

ях, как мы знаем, оценки

^ Т} и Мтх даются с по­

мощью функционала действия. Хотя таким образом уда­ ется вычислить только грубую, логарифмическую асимпто­ тику, этого бывает достаточно во многих задачах. Так, логарифмическая асимптотика позволит нам сравнивать различные критические области, различные векторные поля Ь(х, у), а также позволит решить некоторые задачи

оптимальной стабилизации.

Ве и т ц е л я , Фр е й -

Такой подход развит в статье

длиыа

[5].

 

‘постановок

задач

об

Введем несколько различных

устойчивости и наметим способы их решения.

 

 

Пусть

X?, t ^

0,— семейство

случайных

процессов

в Rr, возникающее

в результате

малых случайных

воз­

мущений системы (1.1); вероятности и математические ожидания, соответствующие данному значению параметра и дайной начальной точке, будем обозначать соответствен­

но Р£, М*.

Пусть K(h)SoT (ф) — функционал действия для

семейства

процессов X? относительно метрики роТ (ф, ф) =

=« sup |ф* — ф*|

при

h {

0;

ясно,

 

что

функционал

SоТ

обращается в нуль на траекториях

системы (1.1) и

только на

них.

 

 

 

 

 

 

 

Пусть О — устойчивое положение равновесия системы

(1.1);

D — область, содержащая его;

xD =

inf {t : X? ф.

ф D } — первый момент выхода процесса из D. Пусть нас

интересует

устойчивость

системы па конечном отрезке

времени[0,

Т].

Будем

характеризовать эту устойчивость

асимптотикой вероятности Pj

{xD ^

Т)

при h { 0.

Здесь уместно ввести следующую меру устойчивости нашей системы относительно данного вида случайных воз­

мущений и области D:

 

 

VTD'X = inf {Sor(q>):<pe

U U

Hxe(t)\t

{

0< f < r y&D

>

где множество НхУ (t) состоит из всех функций ф8, опреде­

ленных

при

s е

[0,

Г], таких, что ф0 = х,

a cpt

= у.

Смысл

 

этой

меры

устойчивости — следующий:

если

нижние

 

грани

функционала S{)T

по

замыканию

(J

(J

IIхУ (t)

и

но внутренности

этого множества

§ i]

ПОСТАНОВКА ЗАДАЧИ

373

совпадают, то вероятность Pj{xD^ Т} логарифмически эквивалентна ехр {—X(h)VQ'x}. Заметим, что для совпа­ дения нижних граней по замыканию и по внутренности достаточно (в случае функционала S{)T вида, рассмотрен­ ного в гл. 4, 5), чтобы область D совпадала с внутрен­ ностью своего замыкания.

Меру

устойчивости

Уд*

можно

вычислить

как

inf

и (t, х, у),

где

u(t, х,

у) = inf {SoT (cp) :

0<f<T,v(5£D

 

 

 

уравнения Якоби.

cpe Hx,y{t)} может быть найдена из

Другой мерой устойчивости будет характеризоваться

задача, в которой не фиксирован никакой отрезок

[О, Т ]

времени наблюдения. Определим pD

как нижнюю

грань

значений функционала S{)T от функций cpt, определенных

на отрезках

[О, Т] всевозможной

длины

и таких,

что

ф0 — О, фг

ф D. Вычислить j.iD

можно

как

нижнюю

грань по у ф. D от квазипотенциала

 

 

 

V(0, у) =

inf {SuT (ф) : Фо = о,

фг = у, 0 <

Т <

оо},

который (теорема 4.3 гл. 5) находится как решение соот­ ветствующей задачи для уравнения в частных производ­ ных первого порядка. Согласно результатам гл. 4—7 при соответствующих предположениях относительно про­

цессов Xht я области D среднее время выхода из области

M*T D ^логарифмически эквивалентно

exp {A,(/&)fiD}

для

всех точек х из D, для которых начинающаяся из них

траектория системы (1.1), не выходя

из области D,

стре­

мится к положению равновесия О (теоремы 4.1 гл. 4, 5.3 гл. 6, 6.1 гл. 7). В этом случае математическое ожидание представляет собой типичное с точностью до логарифми­ ческой эквивалентности значение времени выхода; а имен­ но, для любого у > О

!im Р£{ехр {k(h) [|.i0 — у]} < t D < ехр {Х(Д)[|л0 + у]}} = 1 h\,О

(теорема 4.2 гл. 4). Кроме того, значение нормированной

инвариантной для Xht меры на множестве Rr \ D лога­ рифмически эквивалентно ехр {—X(/i)jiD} (теоремы 4.3 гл. 4, 4.2 гл. 5). Таким образом, если отрезок времени за­

374 УСТОЙЧИВОСТЬ ПРИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЯХ [ГЛ. 8

ранее не фиксирован, константа цл является в некотором смысле универсальной мерой устойчивости для заданного вида возмущений и критической области. Если критиче­ ская область не задана, то такой универсальной харак­ теристикой устойчивости положения равновесия будет функция V(0, у)— квазипотенциал случайных возмущений.

Через функцию V(0, у) выражается и «самая опасная точка» па границе критической области: при некоторых предположениях «разрушение» объекта происходит с по­ давляющей при малых h вероятностью вблизи точек у е dD, где V(0, у) достигает своей нижней грани по мно­ жеству dD.

Теперь рассмотрим задачу выбора оптимальной крити­ ческой области. Предположим, что для областей D, содер­ жащих положение равновесия О иевозмущенной системы, определен монотонный функционал H(D); для определен­ ности будем считать, что этот функционал имеет вид

j* h(x)dx, где h(x) — положительная функция. Мы стре-

D

мимся к тому, чтобы среди областей D с заданным значе­ нием функционала 11(D) = П0 выбрать такую, чтобы ве­ роятность выйти из этой области за фиксированное время Т была наименьшей или математическое ожидание време­ ни выхода — наибольшим. Оптимальная критическая^область зависит, вообще говоря, от h. Мы будем искать асимптотическое решение этой задачи, т. е. будем стремить­ ся построить область, которая лучше любой другой (не за­ висящей от /г) области при достаточно малых h.

Ясно, что эта задача сводится к максимизации соот­

ветствующей меры устойчивости — Vj)’x или Легко видеть, что она должна решаться следующим образом:

берутся области Dc вида

:

inf

u(t, х,

у) <

с) (co­

ответственно

{у : V(0, у) <

o le r

 

 

 

с}); и из этого расширяюще­

гося семейства областей выбирается та,

для

которой

H(DC) = Н0.

Если функция

inf u(t, х, у)

(или

V(0, у))

 

 

0 < /< Г

 

свойства об­

гладка по у, это обеспечивает хорошие

ласти Dc. Любую область,

граница

которой не

является

поверхностью уровня функции

inf

u(t, х,

у)

(соответ-

 

 

 

0 < £ < Г

 

 

ственно V(0, г/)), можно уменьшить, сохранив то же

§ и

ПОСТАНОВКА ЗАДАЧИ

375

значение inf inf u(t, х, у) (или inf V(0, г/)), а затвхМ

V & D О « < Т

l'£ D

заменить большей областью Dc с прежним значением Я.

Так, для системы xt=

с нормальной матрицей Л

ивозмущений типа «белого шума» (т. е. Xf = АХ]

+-eu;t) оптимальная критическая область для задачи без фиксированного отрезка времени имеет вид эллипсоида (см. пример 3.2 гл. 4).

Перейдем к задачам оптимальной стабилизации. Предположим, что в возмущенном уравнении (1.3)

содержится параметр, которым можно управлять (или несколько параметров). Выбор способа управления про­ цессом состоит в выборе вида зависимости управляющего параметра от значений управляемого случайного процес­ са Введем следующее ограничение на характер этой за­ висимости. Пусть каждому рассматриваемому виду а за­

висимости управляющего параметра от значений процесса

отвечает семейство случайных процессов X]'h. Предпола­ гается, что для них всех существует функционал действия k(h)Sa (ф), в котором нормирующий коэффициент K(h) не зависит от выбора управления.

Решение определенных задач оптимального управле­ ния процессом при малых /г будет связано с функциона­

лом Sa (ф) = Sir

(ф)

и

квазипотенциалом

Va (х,

у) =

= inf

{S(iT (ф): Фо =

я,

Фг = У\

0 <!2" <

со}.

В

част­

ности, правдоподобно,что задача выбора управления,

мак­

симизирующего

(асимптотически

при

h | 0)

среднее

время

выхода из какой-либо области

будет

связана

с функцией

 

 

 

 

 

 

 

 

 

 

V(x,

у) =

sup Г

(х, у),

 

 

 

(1.4)

где верхняя грань берется по всем допустимым способам' управления.

Мы ограничимся рассмотрением однородных по време­ ни управляемых марковских процессов. В качестве клас­ са допустимых управлений будем рассматривать такие,- в которых значение управляющего параметра в данный момент t является определенной функцией a(Xt) от значе­ ния процесса в тот же самый момент времени. Такие управ­ ления приводят к однородным по времени марковским

376 УСТОЙЧИВОСТЬ ПРИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЯХ [ГЛ. 8

процессам X^'h (см. К р ы л о в [2 ]); их локальные ха­ рактеристики в каждой точке х зависят от х и от значения управляющего параметра а(х) в этой точке.

Итак, пусть класс допустимых управлений состоит из функций а(х), значения которых в каждой точке принад­ лежат множеству допустимых в данной точке управле­ ний Щя) (и которые подчинены еще некоторым требова­ ниям регулярности). Каждой допустимой функции отве­

чает марковский процесс

Р*’л)

(соответствующие

математическое ожидание,

нормированный функционал

действия,

квазипотенциал

обозначаем

Ml'h,

SQT (ф),

Va (х, у)). Будем

рассматривать следующую

задачу:

выбрать

функцию

а так, чтобы

максимизировать

Пт Щ )-1In M}i'axD. hi О

Решение этой задачи, как мы уже говорили, скорее

всего связано с функцией V(x, у), определяемой формулой (1.4). Здесь возникает ряд вопросов: как можно найти мак­

симальный квазипотенциал V(x, у)? и как с его помощью решать задачу об оптимальном управлении? В следующих параграфах мы рассмотрим эти вопросы (для определен­ ного класса управляемых марковских процессов), а также примеры.

§ 2. Задача оптимальной стабилизации

Класс семейств случайных процессов, для которого мы будем рассматривать эту задачу,— это семейства локаль­ но безгранично делимых процессов, рассмотренные в

гл. 5. Предположим, что при каждом х е

Rr задано мно­

жество П(я) с : R1. Пусть каждой паре х е

i?r , а ^ Щх)

поставлены в соответствие: вектор Ь(х, а)

= (Ь1(х, а), . . .

. . ., Ьг {х, а)); симметричная неотрицательно определенная

матрица (а'1(х, а)) порядка г;

мера р,(£, а, •) на Rr \ { 0 }

такая, что

J |Р|2|л(;г, а,

c?(J) <

оо.

Процесс

(Х*’а, Р* а),

отвечающий значению парамет­

ра h (из (0, оо)) и выбору управляющей функции а(х) (при­ надлежащей при каждом значении аргумента множеству Щя)), мы определим как марковский процесс с инфините­ зимальным оператором, определенным на финитных дваж-

§ 21

ЗАДАЧА ОПТИМАЛЬНОЙ СТАБИЛИЗАЦИИ

377

ды непрерывно дифференцируемых функциях формулой

Ah'a1{x) =

яг\{0>

 

( 2. 1)

Разумеется, может

оказаться, что данной функции

а(х) при каком-то h >

0 не отвечает никакой марковский

процесс; в этом случае будем считать управляющую функ­ цию недопустимой. Обозначим класс допустимых управ­ лений Я.

Вопросу о том, при каких условиях данному набору локальных характеристик отвечает локально безгранично делимый процесс, посвящено большое число работ; особен­ но широко исследован вопрос в случае диффузионных про­ цессов, т. е. ц = 0. Достаточно, например, равномерной невырожденности и непрерывности матрицы диффузии,

ограниченности и измеримости вектора сноса (см.

К р ы-

л о в

[1 ],

С т р у к и

В а р а д а н

[1 ]). Случай

ц, от­

личного от

нуля,

рассматривался в статьях К о м а ц у

Ц],

С т р у н а

[1],

Л е п е л ь т ь е

и М а р ш а л я

[1 ] и др.

 

 

 

 

 

Вероятности маловероятных событий для процессов

{Xht'a,Px'a)

при

различном выборе функции а(х)

будут

связаны с функцией от трех аргументов:

 

И (х , а,

а) = ^

ь\х , а) Щ + у 2 (*> а) a ia i +

 

+

j

[exp 12 РЧ) — 1 -- 2РЧ1

45), (2.2)

 

Rr\{0>

 

 

которую мы будем предполагать конечной и непрерывной по всем аргументам вместе с ее производными по а/. При выполнении условий теоремы 2.1 гл. 5 функционал действия

для семейства процессов (Х^,а, Р* я) при h j 0 будет

378

УСТОЙЧИВОСТЬ ПРИ СЛУЧАЙНЫХ ВОЗМ ЛЦЕНИЯХ

[ГЛ. 8

задаваться формулой

 

 

 

т

 

 

 

h~lSor (ф) = h r1j L (Ф„ а (ф(), ф() dt,

(2.3)

 

О

 

 

где

L(x, а, |3) — преобразование Лежандра

от функции

Н(х, а, а) по третьему аргументу.

L(x, (5) непре­

 

В гл. 5 мы требовали от функций Н{х, a),

рывности по х; поэтому хорошо было бы рассматривать только непрерывные управляющие функции а(х). Однако известно, что в задачах оптимального управления редко удается обойтись только непрерывными управлениями. Оказывается, необходимые нам результаты переносятся на случай, когда функции Н(х, а), L(x, (5) терпят разрыв в одной точке (или в конечном числе точек), ио не сохра­ няются, вообще говоря, если разрыв имеет место вдоль какой-нибудь линии (или тем более поверхности). Поэтому мы вводим следующий класс функций. Пусть а(х)

определенная на Rr функция со значениями в R1 . Будем

писать

а е п, если эта функция непрерывна при всех

х е R'

, кроме, может быть, одной точки, и при каждом х

значение этой функция принадлежит множеству разрешен­ ных в точке х управлений П(.г).

Теоремы 2.1—2.3 для диффузионных процессов со­

держатся

в статье В е н т ц е л я ,

Ф р е й д л и н а [5].

Т е о р е м а 2.1. Пусть TD

момент выхода процес­

са Х^'а

из ограниченной области D, граница которой

совпадает с границей ее замыкания. Для любой управляю­

щей функции a G П f] й

равномерно по х е D

lim h In М£,аТд ^ V 0

= max min sup Va(x0, */). (2.4)

h | 0

XQ D yEzdD а & И

Заметим, что Va — в свою очередь нижняя грань зна­ чений функционала Sa (ср) по функциям, ведущим из х0 в у, так что в правой части (2.4) фигурирует весьма слож­ ная комбинация максимумов и минимумов: max min sup inf.

Д о к а з а т е л ь с т в о теоремы проводится следую­ щим образом: для произвольного у > 0 выбираем Т > О так, чтобы для любой управляющей функции а е П и любого х0е D существовала функция ф*, 0 ^ t ^ Тх та­

§ 2]

ЗАДАЧА ОПТИМАЛЬНОЙ СТАБИЛИЗАЦИИ

379

кая, что ф0 =

х0, ф* выходит из D при каком-то t е

[О, ЗГ],

и SQT (ф) <

V0 -f у. Далее доказывается

 

 

Л е м м а

2.1. Для любого а е

П f'| St при достаточно

малых h и всех х е

D

 

 

 

РМ {тв <

Т + 1} > ехр { -

h r 1 (V0+ 2v)).

(2.5)

До к а з а т е л ь с т в о проводится так же, как для

п.а) теоремы 4.1 гл. 4: функция ф* продолжается за преде­ лы области D ; используется нижняя оценка вероятности прохождения трубочки, даваемая теоремой 2.1 гл. 5. Единственное отличие — это то, что условия теоремы 2.1

гл. 5 не выполнены в окрестности точки , где функция а{х) терпит разрыв. Однако соответствующий отрезок функции ф* заменяется отрезком прямой, и нужную оценку дает

Л е м м а 2.2. Пусть (Х?’а, Р.£’а) — семейство ло­ кально безгранично делимых процессов с инфинитезималь­ ным оператором вида (2.1); пусть соответствующая функ­ ция Н(х, а(х), а) ограничена с первыми и вторыми произ­ водными по а в любой конечной области изменения а {но мо­ жет быть сколь угодно разрывна как функция х). Тогда

для любого у >

0 и любого 6 >> О существует р0>

0 такое,

что при достаточно малых h >

0 для любых точек х, у

С \У— « К

Ро

 

 

 

Pl’a1ро/„ ( * М , Ф) < 6} > exp I - yh~l}t

(2.6)

где <pt = х +

t

0 < I <

t0 = |г/ — х\.

 

Д о к а з а т е л ь с т в о копирует соответствующую часть доказательства теоремы 2.1 гл. 5, но без использова­ ния непрерывности функций Н или L.

Когда (2.5) доказано, доказательство теоремы 2.1 за­ вершается применением марковского свойства:

Р*'° <тв >П {Т + 1)} < [1 — ехр { -

h r 1 (F0 + ) }]";

< (Т + 1) 2 Р£’° {tD > п (Т +

1)} <

п==0

 

^ ( r + O e x p U - 1(F0 + 2v)).

380

УСТОЙЧИВОСТЬ ПРИ

СЛУЧАЙНЫХ ВОЗМУЩЕНИЯХ

(ГЛ. 8

 

Положим теперь

 

 

 

Н (х, а) =

inf И (х, а, а).

 

 

Т е о р е м а 2.2. Пусть F(x) — решение задачи

RXQ

для уравнения

 

 

 

Щх, v'7(*)) = о

(2.7)

в области D. Тогда для любой функции а, принадлежащей классу П (т. е. а непрерывна всюду, кроме одной точки^ п а(х) е П(х) при любом х), квазипотенциал

 

 

 

 

V- (х0, х) < F(x)

 

 

 

/г/ж яегх х

 

из

множества

 

 

 

 

 

 

 

В =

{хее D (J

dD : F (x)<

inf F (у)}.

 

 

 

 

 

 

 

 

 

y€zdD

 

 

Пусть, кроме того, существует непрерывная на мно­

жестве

{(х,

 

а)

: я =?£= х0,

а =т^=0,

Я(х,

а)

= 0}

функция

а(х, а)

такая, что а(х,

а) ^

П(х),

и

Я(х,

а(х,

а), а) —

= Я(х,

а)

-

0.

Тогда

 

 

 

 

 

 

 

 

 

 

 

sup Fa (х0, х) —

I7 (х)

 

 

 

 

 

 

OG11

 

 

 

 

 

 

 

для всех х е

 

Я,

и верхняя грань достигается па функции

а(х) =

а(х,

у F(x)).

 

 

 

 

 

 

 

каком-то

Д о к а з а т е л ь с т в о . Допустим, что при

а е П ,

каком-то х е

В и каком-то

е >> 0

 

 

 

 

Fa (х0, х) > е +

(1

+

e)F(x).

 

 

пт

 

 

 

 

/

=

Va (хи<#*)— У (а?*)

где х* —

Можно считать, что г=£

— —— =------- * ,

точка, где функция а(х) терпит разрыв.

 

 

Рассмотрим множество А =

В f]

{х : Fa (х0, х) > е +

+ (1 +

e)F(x)}; это множество — открытое в Я. Положим

F0 = inf {F(x) : х ^

Л }.

Нижняя грань F0 не достига­

ется; пусть

Хоо—предельная точка множества А на поверх­