книги / Флуктуации в динамических системах под действием малых случайных возмущений
..pdf§ 2] |
ЗАДАЧА ОПТИМАЛЬНОЙ СТАБИЛИЗАЦИИ |
381 |
ности уровня {X : V(x) = F0}. Пусть xv . . хп, . . . — последовательность точек из А, сходящаяся к хм (рис. 18).
Ясно, что точки поверхности {х : V(x) = F0} не принад лежат А, и V(xn) > F 0. Заметим, что в силу выбора е Ф е* точка Хоо не совпадает с точкой х* разрыва функции а.
Рассмотрим векторы |
V F(^oo) и |
Poo |
= V a //(#«>> |
а(х«*,), |
|||||||
V F(^oo)). |
В |
силу |
свойств |
преобразования |
Лежандра |
||||||
(VF (Хео), |
P o o ) = |
L (хх , а (хж), |
Р о с) + |
Н (хх, а (хх), W |
(хх)). |
||||||
|
|
|
|
|
|
|
|
|
|
( 2.8) |
|
Функция ЦХ", а(хм), |
(3) всюду неотрицательна, а обра |
||||||||||
щается в нуль только при Р =S7aH(Xoo, |
а(.?«,), |
0); |
но |
||||||||
V V(xOQ) Ф |
0 |
(потому |
что |
V — решение |
задачи |
RXo)i |
|||||
поэтому первое слагаемое в (2.8) |
положительно. Второе |
||||||||||
слагаемое здесь не меньше чем |
Н(х«>, VF^*»)) = |
0. |
|||||||||
Поэтому |
скалярное |
произведение |
(V V(xQO)^ |
Poo) > |
0, |
||||||
т. е. вектор роо |
направлен наружу поверхиости _{.r : F(#) = |
||||||||||
= F0} в точке Хж- |
В |
силу непрерывности V V(x), |
то |
же |
|||||||
будет и в точках, близких к х |
|
|
|
|
|
|
|||||
Определим для каждой точки хп функцию |
|
|
|
||||||||
|
|
ф/ ) = |
хп “Ь фоо, |
t^ O . |
|
|
|
|
|||
При хп, достаточно близких к х^ |
(т. е. при достаточно |
||||||||||
больших /2), прямая cpjn) пересечет поверхность {х : V(x) |
= |
||||||||||
= F0} при малом |
отрицательном |
значении tn, причем |
382 |
УСТОЙЧИВОСТЬ ПРИ СЛУЧАЙНЫХ |
ВОЗМУЩЕНИЯХ [ГЛ. 3 |
при |
п оо |
|
|
Ч * п) - г * |
|
|
(V^(*oo)’ Ро.)’ |
|
Знаменатель здесь не меньше чем |
L (х^, а (х^), Роо), |
|
так что |
|
при тг оо.
Оценим значение функционала Sa от функции ф*п) при
S lo (ф(п)) = I L W r\ a Wtn)), poo) dt ~
<П
~ | |^ (x oo, CL(.Zoo), Poo) ^ (F (#n) |
F0) (1 + О (1)) (2.9) |
при n -+oo. В силу определения |
квазипотенциала Va |
имеем |
|
{x0,x ) ^ V a(z0, ф^) + ^ п0(ф(п)).
Первое слагаемое здесь не превосходит е + (1 + е) X X V е -f (1 + e)F0; второе оценивается формулой
(2.9). Значит, при достаточно больших л будет выполнять ся неравенство
Va ixoi xn) < е + (1 + е) V0+ (1 + е) (V (xn) — F0) —
|
|
= |
8 + |
(1 + e) F (xn). |
Но это противоречит тому, что хп е Л, т. е. |
Va(xQ, хп) > |
|||
> 8 + |
(1 -f e)F(^u). Остается |
принять, |
что |
множество А |
пусто. |
Первая часть теоремы |
доказана. |
|
|
Для доказательства второй части достаточно восполь зоваться теоремой 4.3 гл. 5 в применении к непрерывным
при |
хф хц |
функциям Н(х, а(х), |
а)+ + L(xf |
а(х), |
Р), где |
а(х) |
= а{х, |
V V{x)). |
|
|
|
Предположим теперь, что существует функция а(х, а), |
|||||
упоминаемая в условии теоремы |
2.21 что |
для |
каждого |
§ 2] |
ЗАДАЧА ОПТИМАЛЬНОЙ СТАБИЛИЗАЦИИ |
383 |
х0е й |
существует функция V(x) = VXQ(х ), |
удовлетво |
ряющая условиям этой теоремы, и что при любом х0функ
ция аХо (х) = а(х, V^F*^)) принадлежит классу §1 до пустимых управлений. Из этих условий вытекает, в част ности, что для любых двух достаточно близких точек х0, xL^ D существует управляющая функция а(х) такая, что из xL ведет в х0 «наиболее вероятиая>> траектория —
решение уравнения xt — b(xt, a(xt)). Введем дополнитель ное требование, состоящее в том, чтобы 0 был при каждом
х изолированной |
точкой |
множества |
{а : Н(х, |
а) = 0 } . |
||
Тогда достижение |
точки |
х0 из |
х1 происходит |
за |
ко |
|
нечное время; и легко доказать, |
что этот факт остается |
|||||
верен для произвольных |
х0, хх <= D, |
а не только |
для |
близких.
Т е о р е м а 2.3. Пусть выполнены сформулированные
только что |
условия. Выберем точку х0, в которой |
min VXQ (у) |
достигает максимума {равного F0). Выбе- |
рем управляющую функцию а{х) следующим образом: в пре
делах множества |
ВХо = |
fx: VXo {х) ^ min VXo(у)} |
положим |
||
_ |
|
I |
V<E0L) |
J |
|
а(х) = а(х, V ,Г *. |
(х)); |
а для |
остальных |
х |
произ |
вольным образом, лишь бы а{х) было непрерывно, и из любой
точки области D решение системы xt = b(xt, a(xt)) при положительных t, оставаясь в пределах D, достигало мно жества ВХо. Тогда при любом х е D
lim h\nMh/'TD= V0. |
(2.10) |
|
h4 0 |
|
|
Вместе с теоремой 2.1 это означает, что функция а дает |
||
решение нашей задачи оптимальной стабилизации. |
точек |
|
Д о к а з а т е л ь с т в о проводится |
так: для |
|
ВХо функция VXQ {х) является функцией |
Ляпунова |
для |
системы xt = b{xt, a{xt))\ это, вместе с устройством функ
ции а{х) для остальных»х, показывает, что точка х0— единственное положение устойчивого равновесия, к кото рому притягиваются траектории, выпущенные из всех точек области. Теперь (2.10) вытекает из теоремы 4Л гл. 4* обобщенной такл как это указывается в § 4 гл. 5.
384 |
УСТОЙЧИВОСТЬ ПРИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЯХ 1ГЛ. 8 |
§3. Примеры
Вконце главы 5 мы рассмотрели пример вычисления квазипотенциала и асимптотик среднего времени выхода из окрестности устойчивого положения равновесия и ин вариантной меры для семейства одномерных процессов, делающих скачки вправо и влево на h с вероятностями
li~xr(x)dt, h~xl(x)dt за время dt. Тем самым мы нашли харак теристики устойчивости положения равновесия. Этот пример допускает много различных интерпретаций; в частности — процесс деления и гибели большого числа клеток (см. § 2 гл. 5). Вопрос устойчивости положения равновесия такой системы, т. е. вопрос о времени, в тече ние которого численность клеток остается в данных пре делах, может представлять большой интерес, особенно если речь идет не о численности колонии бактерий, а, на пример, о численности клеток определенного рода в кро ветворной системе организма.
Другая конкретная интерпретация той же схемы — система, состоящая из большого числа элементов N, ко торые выходят из строя независимо друг от друга после показательного срока работы. Эти элементы начинают ре монтироваться; время ремонта показательное, с показа телем ц, зависящим от доли вышедших из строя элементов. Изменение этой доли х с течением времени — процесс указанного вида с h = N~x, r(x) = (1 — х)-Х (X — показа тель распределения срока работы), 1(х) — х-ц(х).
Не показательный срок ремонта или не показательное время между последовательными делениями клетки при водят к другим схемам; см. Ф р е и д л и н [8], Л е в и- н а, Л е о н т о в и ч, П я т е ц к и й- Ш а п и р о [1 ].
Рассмотрим |
примеры оптимальной стабилизации. |
П р и м е р |
3.1. Пусть рассматриваемое семейство |
управляемых процессов устроено во всех точках одинако во; иными словами, функция Н и множество допустимых управлений в данной точке не зависят от х:
П(х, а, а) = Я(а, а); П(х) = П.
В этом случае не зависит от х и функция Я:
II (хх а ) = Н (а) = inf Я (а, а);
—аеп
§ 31 |
ПРИМЕРЫ |
385 |
|
и уравнение (2.7) превращается |
в |
|
|
|
tf(V V(x)) = |
0. |
(3.1) |
Функция //(а) обращается в нуль только на одном век
торе каждого направления (кроме а = 0). Геометрическое место концов этих векторов обозначим А. Уравнение (3.1)
можно переписать в виде VV(x) е А.
Уравнение (3.1) имеет бесконечное множество реше нии — r-мерных плоскостей вида VXo(X (х) = (а0, х — х0), а0 е А; но ни одно из них не является решением задачи RXo для этого уравнения. Чтобы найти это решение, за метим, что решения-плоскости зависят от (г — 1)-мерного параметра а0 е А и независимого от него одномерного параметра — скалярного произведения (а0, х0); это се мейство — полный интеграл уравнения (3.1). Как извест но (см. К у р а н т [1], стр. 111), огибающая произволь ного (г — 1)-параметрического семейства таких решений
также есть решение. Если у семейства плоскостей FXoa„ (я) при фиксированном х0 есть гладкая огибающая, то это и
есть искомое решение |
VXo(x) |
задачи R Xo. |
|
Во всяком случае, это решение задается конической |
|||
поверхностью (т. е. |
Г*0(я) — положительно однородная |
||
функция степени единица от х — я0); ее |
удобно задавать |
||
единичной (г — 1)-мерпой |
поверхностью |
уровня Ux = |
|
= {х — х0 : VXo (х) = |
1) (она не зависит |
от х0). Поверх |
ность Ux имеет но одной точке |30 на каждом луче, выходя щем из начала координат; посмотрим^ как найти эту точку.
Пусть образующая конуса VXo{x), соответствующая точке ро, является линией касания его с плоскостью
FXoa0(#) (а0 определяется единственным образом, потому что направление этого вектора задано: это — направле ние внешней нормали к Ux в точке |50). Тогда в сечении го ризонтальной плоскостью на высоте 1 получим (г — 1)- мерную плоскость {Р: (а0, Р) = 1}, касающуюся поверх ности Ul в точке ро (рис. 19). Ближайшая к началу коор динат точка этой плоскости находится от него в том же направлении, что точка а0, на расстоянии |а0|-1, т. е.
386 |
УСТОЙЧИВОСТЬ ПРИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЯХ |
[ГЛ. 8 |
это — точка 7(а0), получаемая из а0 инверсией |
относи |
|
тельно единичной сферы с центром в 0. |
|
|
|
Итак, чтобы найти поверхность уровня UXl нужно под |
вергнуть поверхность А инверсии; через каждую точку полученной поверхности 1(A) проводим плоскость, орто гональную соответствующему радиусу, и берем огибаю щую этих плоскостей. Это геометрическое преобразова ние не всегда приводит к гладкой выпуклой поверх ности: могут появиться «угол ки» или ребра возврата. Мож но дать критерий гладкости Ux в терминах центров кри
Рис. 19. визны исходной поверхнос ти А .
Если полученная поверхность Ux оказывается гладкой (один раз непрерывно дифференцируемой), решение зада чи оптимального управления получается следующим об разом. В область D вписывается наибольшая фигура, го мотетичная Ux с положительным коэффициентом подобия с, то есть фигура вида х0 + cUx, где х0 — какая-то точка из D (определяющаяся, вообще говоря, не единственным образом). Внутри этой фигуры оптимальное управляющее
поле а(х) определяется так: берется точка ро е E/i, нахо дящаяся на луче с тем же направлением, что х — х0; на ходится соответствующая точка а0 поверхности А; и
в качестве |
а (х) берется то значение а0управляющего пара |
||
метра из |
П, |
при котором |
достигается min//(а , а0) |
. |
0; |
предполагается, |
оеп |
(= # (а 0) = |
что этот минимум дости |
гается и что я0 непрерывным образом зависит от а0, про
бегающего А). |
на каждом |
радиусе, выходящем |
|
Таким |
образом, |
||
из х0, |
значение |
управляющего |
параметра а(х) бу |
дет постоянно. В точках х, лежащих снаружи от поверх
ности х0 + с11х, поле а(х) определяется почти произволь но, лишь бы оно «загоняло» все точки внутрь указанной поверхности.
Среднее время выхода будет при h | 0 логарифмиче ски эквивалентно exp {ch~1}.
§ 3] |
ПРИМЕРЫ |
337 |
В статье |
В е н т ц е л я , Ф р е й д л и на |
[5] рас |
сматривался частный случай этого примера, где речь шла об управлении диффузионным процессом с малой диф фузией при помощи выбора сноса.
П р и м е р 3.2. Имеется динамическая система, воз мущаемая малым белым шумом; мы можем подвергать ее управляющим воздействиям, величина которых в нашей власти, но которые сами по себе содержат шум. Матема тическая модель этой ситуации:
+ а ( Л Г ) № Г ) + е а (А Г )^ ] ,
где wtl wt •— независимые вииеровские процессы, а а(х) — управляющая функция, которая выбирается в пределах множества II(х).
Рассмотрим |
простейший |
случай — одномерный, а, Ъ |
|||||
и а — положительные константы, |
Ь(х) — непрерывная |
||||||
функция; |
область |
D — интервал |
(хх, |
х2); |
управляющий |
||
параметр |
а(х) |
в |
каждой |
точке |
меняется |
в пределах |
± [26“ 1тах |Ь(^)| + а—1а] (или в пределах любого боль-
[хихг]
шего отрезка П(.г)). Имеем
Н (х, а, а) = |
(Ъ(х) + аЬ) а + |
(а2 + |
а2д2) а2; |
II (я, а) = |
min II (х, а, а) |
(х) а — |
ОГ-СГ |
— |
а |
|
|
при I а О [2а2 6 2 |
|Ь(х) |+ оаЪ *] ,причем этот ми |
нимум достигается при а = —for-2а -1. Функция II(х, а) обра
щается в нуль при а = а\ (х) = |
Ь(х) |
|
о2 |
||
|
||
< 0 и при а = а2 (#) = — |
Ь(х) |
|
|
а 2 ‘ |
а также при а = 0, что, впрочем, для нахождения опти мального квазипотенциала несущественно (легко проверяетсяА что |ах(.г)| и |а2(я)| превосходят указанную гра-
388 УСТОЙЧИВОСТЬ ПРИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЯХ [ГЛ. з
нпцу для |а|). Задача RXoдля уравнения Н (х, VXo (х)) = О сводится к уравнению
У (х\ _ |
(ai ('Г) |
ПрИ |
^ < *ох |
|
х° ' ' ~~ 1а2 (х) |
при |
х0 < х ^ . х 2 |
|
|
с дополнительным |
условием |
lim VXo (х) = 0 . |
Легко |
|
__ |
_ |
|
|
|
видеть, что min (VXQ(.r^, VXO(д\,)) достигает наибольшего
значения при таком х0, для которого VXo(^) и VXo(.г2) равны между собой. Это приводит к уравнению для х0
dx = |
|
|
|
|
|
|
х2 |
[ |
I f |
Ь{х)* 1 |
|
Ъ(х) |
|
- Г |
6г - |
dx, |
||||
J |
|
|
~ |
a2a2 |
о1 |
|
*0 |
[ |
V |
|
|
|
которое имеет единственное решение. После того как оптимальное положение равновесия х0 найдено, оптималь ное управление находится по формуле:
— Ьо '2ах (х) 1 левее точки хог
а(х) =
— Ьо 2а2(^)~1 правее точки х0.
Г Л А В А 9
УТОЧНЕНИЯ И ОБОБЩЕНИЯ
§1. Локальные теоремы, точная асимптотика
Вглавах 3, 4, 5, 7 были установлены предельные тео ремы о больших уклонениях, касающиеся грубой асимпто тики вероятностей типа Р {Xh ^ А }. Возникает вопрос: нельзя ли получить для семейств случайных процессов более тонкие результаты (которые получены для сумм независимых случайных величин) — локальные предель ные теоремы о больших уклонениях и теоремы о точной
асимптотике? Кое-что в этом направлении сделано; в этом параграфе мы дадим обзор этих результатов.
Если Xht — семейство случайных процессов, локаль ная теорема о больших уклонениях может касаться асимп
тотики при h \ 0 плотности распределения pf (у) значения рассматриваемого процесса в момент t, где точ ка у отлична от «наиболее вероятного» при малых /г зна чения x(t) (причем, учитывая, что плотность определяет ся, вообще говоря, неоднозначно, мы должны указать, что речь идет, скажем, о непрерывном варианте плотно сти). Могут быть локальные теоремы, касающиеся сов
местной |
плотности |
. . . , tn(yii ••ч Уп) случайных |
величин |
Х^, ... , Xh . Речь может идти также об асимпто |
тике плотности распределения какого-либо функционала F(Xh) в точках, отличных от «наиболее вероятного» зна чения F(x(-)).
Однако получение такого рода результатов, касающих ся сколько-нибудь широкого класса функционалов F и семейств случайных процессов Х л, пока нереально, хо тя бы потому, что предварительно должны быть получены результаты о существовании непрерывной плотности рас-
390 |
УТОЧНЕНИЯ II ОБОБЩЕНИЯ |
[ГЛ.9 |
пределення у случайной величины F(Xh). По той же при чине исследования в области локальных теорем о больших уклонениях, касающихся плотностей значений процесса в отдельные моменты времени, пока ограничиваются слу чаем семейств диффузионных процессов, для которых вопрос существования плотности хорошо исследован и ре шается при минимальных ограничениях, в случае невырож денной матрицы диффузии, положительно. Плотность веро ятностей перехода ph(t, х, у) для значения диффузионного
процесса X*} в предположении, чтоХо=#, имеет смысл фун даментального решения соответствующего параболического дифференциального уравнения (или в случае диффузион ного процесса в области с достижимой границей функции Грина для соответствующей задачи). Это дает и дополни тельный способ исследования плотности рн, и область возможных применений.
Начнем с работы Ф р и д м а и а [1 ] — потому, что ее результаты более непосредственно примыкают к тому, о чем шла речь до сих пор (хотя она и вышла чуть позже работы К и ф е р а [1 ], содержащей более сильные резуль таты). Пусть ph(t, х, у) — фундаментальное решение урав
нения |
^ - = Lh и в r-мерном пространстве, |
где |
|
|||
|
Lhu |
' aij (х) д*. U |
+ |
(х) ди |
( l . i ) |
|
|
|
д х гд х 3 |
|
|
7 дх |
|
иначе |
говоря, |
ph(t, х , у) — негр |
рывный |
вариант |
плот |
ности вероятностей перехода соответствующего диффу
зионного процесса (Х^, Р*). (Здесь нам удобнее обоз начать малый параметр при матрице диффузии А, а не е2, как мы это делали, начиная с гл. 4.) Полагаем
|
V{t, х, |
у) |
= min (£ 0, (ф) : ф0 =х, ф( = у}, |
(1.2) |
|
где |
h~xSot |
— функционал действия для |
семейства про |
||
цессов (Х^, |
Рх) |
функционал SQt задается, |
как |
мы зна |
|
ем, |
формулой |
|
|
|
t
s 0i (ф)= j2 а и (ф*)Ы— ь1(ф.))Ы- ь’ (ф»))* * t
о
(1.3)