Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Острем К.Ю. Введение в стохастическую теорию управления

.pdf
Скачиваний:
35
Добавлен:
24.10.2023
Размер:
10.97 Mб
Скачать

•60

 

 

 

Глава 3

 

 

 

 

где P(t)

удовлетворяет

условию

 

 

 

 

 

P(t + \) =

0(t

+

\;t)P(t)0T(t+\;t)

+

R1

(3.7)

с начальным условием

 

 

 

 

 

 

 

 

Если матрицы Ф и Ri

Р (to) = Ro-

 

 

(3.8)

постоянны, то из условий

(3.7)

и (3.8)

следует, что

 

 

 

 

 

 

 

 

 

Р (t) =-- ф'/?0 ( Ф Т У +

t—\

 

 

 

 

Е Ф ^ х (Ф Г ) 5 .

 

(3.9)

Если

все собственные

значения

матрицы

Ф строго

меньше

•единицы, то ряд в выражении

(3.9) сходится

и существует предел

 

 

 

Px

=

limP(t).

 

 

(3.10)

Перейдя к пределу в уравнении (3.7), найдем, что Я» удовлет­ воряет следующему уравнению:

Р„ = ФР„ФТ + R,.

Таким образом, для линейных стохастических разностных урав­ нений условные распределения будущих состояний при задан­ ном x(t) нормальны. Средние значения и ковариации распреде­ ления легко вычисляют при помощи рекуррентных уравнений.

Упражнения

1. Динамическая система описывается разностным урав­ нением

 

v

'

V—sinh

cosh/

w '

 

тде /г=зт/4т. Начальное состояние

x(0) нормально

со средним

значением

 

 

 

 

 

 

 

 

 

Ех{0)

 

 

 

 

и ковариационной

функцией

 

 

 

 

 

 

cov

[*(0),*(0)]

 

 

 

 

Определить наименьшее значение

i*,

такое,

что компоненты х\

и х2 независимы

при

t=t*.

Найти

распределение

x(t*).

2. Управление динамической системой осуществляется сто­ хастическим разностным уравнением

 

Стохастические

модели

достояния

61

x(t+l)

= ( 1 , 5

1 \x(t)

+

(l'°)e(t),

 

где (е(^), teT}—последовательность

независимых

нормальных

случайных величин с параметрами (0, 1). Найти ковариацию распределения для устойчивого состояния.

3. Случайный процесс определяется разностным

стохасти­

ческим уравнением

 

 

 

 

 

x(t+l)

= ax(t) + e(t),

М < 1 ,

 

где {e(t),

teT}—последовательность

независимых нормальных

случайных

величин

с параметрами (0, а).

Начальное

состояние

JC(I?Q) нормально с параметрами (0, ст0). а переменные

{e(t), teT}

независимы от x(t0).

Найти дисперсию x(t)

и предел

дисперсии

при ^->-оо или при tQ-+oo. Показать, что если а0 выбрана так, что

<Jo =

lim P(t)

и если множество

Г = { ^ 0 , £i +

l , . . . } ,

то

процесс

{x{t),

teT} стационарен.

Найти

ковариационную

функцию

и

спектральную

плотность

для данного

стационарного процесса.

4. Рассмотреть стационарный

случайный

процесс,

который

удовлетворяет

стохастическому

разностному

уравнению

 

 

 

x(t+l)

= Ox(t) +

e(t),

 

 

 

 

где

{e(t),teT}—последовательность

 

независимых

одинаково

распределенных векторов

с нулевыми

средними значениями

и

ковариационной матрицей Ri. Пусть характеристический много­ член для Ф имеет вид

det

[W — Ф] п + ах\п-1 + • •.

я.

Показать, что

ковариационная функция

r(t) произвольной

линейной комбинации компонент состояния удовлетворяет соот­ ношению

г (t) + atr (t 1)+ • • • +anr (t — n) = 0, t> n.

4.СИСТЕМЫ С НЕПРЕРЫВНЫМ. ВРЕМЕНЕМ

Вэтом разделе мы рассмотрим системы с непрерывным вре­ менем. Так же, как и для систем с дискретным временем, попы­ таемся построить модель состояния прибавлением случайной помехи к обыкновенному дифференциальному уравнению. По­ следовательное проведение этой аналогии встречает ряд труд­ ностей. Для их преодоления мы введем (пока только эвристиче­ ски) понятие стохастического дифференциального уравнения. Точное определение этих уравнений и их решение даны в по­ следующих разделах данной главы.

62

Глава 3

Неудачная модель

По аналогии с системами с дискретным временем (разд. 2) мы начнем с детерминированной модели состояния, описывае­ мой обыкновенным дифференциальным уравнением

 

(4.1)

которое означает, что скорость изменения

состояния однознач­

но определяется его текущим значением.

Для получения стоха­

стической модели состояния мы предположим, что вероятност­

ное распределение случайной

величины dx/dt однозначно опре­

деляется временем и текущим

значением вектора

состояния.

Следовательно,

 

 

 

 

-^- = f(x,t)

+

v(x,t),

(4.2)

где {v(x, t), teT}—случайный

 

процесс с нулевым

математиче­

ским ожиданием. Последнее

условие

не ограничивает общности

рассуждений и всегда может

быть

выполнено за

счет выбора

функции f. Теперь остается определить соответствующие свойст­ ва случайного процесса {v(x, t), teT}. Чтобы уравнение (4.2) было моделью состояния, необходимо потребовать независимо­

сти v(x, t) и v (у, в)для любого хну

при t¥*s,

в противном

слу­

чае вероятностное распределение dx/dt

будет

зависеть не толь­

ко от текущего состояния, но и от его предыстории. Чтобы

урав­

нение

(4.2) имело смысл, необходимо

наложить условие

регу­

лярности. Если пользоваться среднеквадратической

нормой, то

естественно потребовать, чтобы случайная величина dx/dt

обла­

дала

конечной дисперсией, т. е. чтобы

случайная

величина v

имела

конечную дисперсию. Необходимо также наложить некото­

рые условия непрерывности, например чтобы v была непрерыв­ на в среднеквадратическом. Проанализируем структуру случай­ ного процесса, обладающего этими свойствами.

Теорема 4.1. Пусть {v(t), teT}—-непрерывный случайный процесс с конечной дисперсией, обладающий следующими свой­

ствами:

 

 

 

 

 

 

1. v (t)

и v(s)

независимы при

t=£s.

 

 

2.

v(t)

непрерывен в среднеквадратическом для

всех 2 еТ и

имеет

конечную

дисперсию.

 

 

 

3. Ev (t)

= 0 .

 

 

 

 

 

Тогда £ о 2 ( 0 = 0 .

Так как процесс {v(t),

teT}

 

Доказательство.1

непрерывен,

то для него можно

определить

интеграл в

среднеквадратиче-

ском

(4.3)

\1

о

Стохастические модели состояния

63

Отсюда следует, что

/i

Ей (t) =E^v (s) ds = j Ev (s) ds = 0.

о0

Второе равенство вытекает из теоремы 6.2 гл. 2. Далее имеем

Ей* (/) =

£ ( J о (s) ds)* = Е ( l i m £ v{t.)

[t.+l

-Ц)]2

 

=

 

о

 

 

 

 

 

 

 

 

=

Е lim £

£ о

ft)

о (I,)

-

*,)

-

<,)

=

=

lira ц £

£о

ft)

* ft) ft+1

-

tt) (ti+l

-

t,)

=

ii

=l i m £ £ ^ f t ) f t + 1 - ^ ,

где ( 0 = £ o i

*ь—, tN.=

t)—разбиение

интервала ;(0, i ) . Последнее

равенство

следует

из свойства

J. Так

как

{v(t)}

имеет

ограни­

ченную дисперсию, то Ev2^.c.

Пусть теперь max

(t{+i—£,) стре­

мится к нулю таким образом, что max

 

1{) ^.a/N.

Тогда

Ей2

(() == lim £t>*

ft) ft+1

/,)2 <Шп

с {jrfN

= °>

откуда Eu2(t)

—0.

Из

уравнения

(4.3)

вытекает, что

средний

квадрат производной существует, поэтому

 

 

 

E*=El-^)'

 

=

E lim lim " ( ' + *>-"(*> " « + * > - » № =

 

\ dt I

 

 

л-о fc->-o Л

 

 

£

 

= lim lim —

Е [u(t

+ h) — и (ft]

[и (* + Jfe) и (Л]

= 0 ,

где последнее

равенство

следует

из

неравенства

Шварца

 

 

| Ей (Л u (s) |а <

£ и 2 (s) Ей2

(t) = 0.

 

 

Сравним этот результат с формулой (4.5) гл. 2. Получим, что v(t) равно нулю в среднеквадратическом, и теорема доказана.

Обсудим следствия этой теоремы, относящиеся к рассматри­ ваемой модели '(4.2). Так как процесс {v(x, t), teT} равен нулю в среднеквадратическом, то его можно не учитывать при реше­ нии уравнения (4.2). Проинтегрировав предложенную стохасти­ ческую модель состояния и сравнив ее с детерминированной моделью-(4.1), найдем, что решения совпадают в среднеквадра­ тическом. Таким образом, попытка построить стохастическую модель состояния с желаемыми свойствами оказалась не­ удачной.

Для получения корректной стохастической модели состояния системы с непрерывным временем необходимо изменить требо-

64

Глава

3

вания, предъявляемые

к процессу

{и(t), teT}. Кроме предполо­

жения о нулевом среднем, которое несущественно, остаются два условия:

1. v(s) и v(t) независимы

2. v имеет конечную дисперсию.

Тогда, чтобы получить модель состояния, условие 2 необходимо ослабить. Это естественно приводит к вопросу о справедливости

уравнения

(4.2), так как, если v не имеет конечной дисперсии,

то и dx/dt

не имеет конечной дисперсии. Следовательно, при по­

строении стохастической модели состояния мы не можем ожи­ дать существования процесса dx/dt.

Продолжение анализа

Таким образом, первая попытка построить стохастическую модель состояния для систем с непрерывным временем не уда­ лась. Предпримем следующую попытку. Сначала заметим, что обыкновенное дифференциальное уравнение можно получить с помощью предельного перехода. Начав с разностного урав­ нения

 

x(t±h)

— x (0 = /(*,/) Л + о (ft),

 

 

(4.4)

получим выражение (4.1),

разделив на Л и перейдя к

пределу

при h-*-oo. Так

как соотношение (4.4) является разностным

уравнением, то

можно

легко получить стохастическое

разност­

ное уравнение, добавив

помеху к

правой

части. Пусть

{v(t),

teT}—случайный

процесс с независимыми приращениями. Рас­

смотрим модель

 

 

 

 

 

 

 

x(t +

h) — x (t) = f (х, t)h +

v (х, t) — v(t)

+ o (ft).

 

(4.5)

Так как {u(t),

teT}—процесс

с независимыми

приращениями,

то модель (4.5)

является, очевидно, моделью

состояния для

всех

/г. По аналогии с предыдущим предположим, что условное рас­

пределение v(t-\-h)—v(t)

при

заданном

x,(t)

нормально,

по­

этому

 

 

 

 

 

 

 

 

 

v(t + h) — v(t)

= a{x,t)

[w(t

+

h) — w(t)},

(4.6)

где {w(t), teT}—винеровский

процесс

с единичной дисперсией.

Таким образом,

получим

следующую

стохастическую модель

состояния:

 

 

 

 

 

 

 

 

 

х (t - f Л) — х (t) = f(x,t)h

+ <s (x, t) [w(t

+

h) — w (t)} + о (ft).

(4.7)

Имеем

 

 

 

 

 

 

 

 

 

E

[x(t

+ h) — x{t)\

=f(x,f)h

 

+ o(ft),

(4.8)

var

[x(t

+ ft) — x(t)]

=

a2 (x,t)E[w(t

+ h) — w(/)]2

+

 

 

+ о (ft) =

fta2 (x, t) + o (ft).

(4.9)

Стохастические модели

состояния

65

Заметим, что дисперсия приращения

пропорциональна

h, а не

2. Таким образом, мы не можем разделить уравнение

(4.7) на

h, допустив, что А.->-0, так как производная винеровского про­

цесса не существует (см. также разд. 6 гл. 2). Однако

мы мо­

жем формально допустить, что h стремится к нулю в уравнении (4.7), и тогда получим следующее выражение:

 

 

 

dx = f(x,t)dt + o (х, t) dw,

(4.10)

которое называется

стохастическим

дифференциальным

уравне­

нием.

Модель

(4.7)

означает, что приращение переменной состо­

яния

представляет

собой сумму двух членов. Первый член —

детерминированный

и равен

произведению функции

состояния

на временное

приращение.

Второй

член — стохастический и

равен произведению функции состояния на приращение винеров­ ского процесса.

Стохастическое дифференциальное уравнение называется линейным, если функция / линейна по х и если а не зависит от х. Это уравнение можно легко написать в векторной форме

dx = Axdt + dv,

(4.11)

где х—n-мерный вектор, {v(t), teT} — д-мерный

винеровский

процесс с ковариацией приращений R\dt. Элементы

матриц А и

Ri могут быть непрерывными функциями времени. Заметим, что в уравнении (4.10) Е (dw)=dt. Это означает, что dw имеет раз­ мерность У<И в среднеквадратической метрике, поэтому сле­ дует соблюдать осторожность при формальных преобразованиях

выражений, включающих

dw.

 

 

 

 

 

Отметим

также, что

если

принять

понятие

белого шума е

непрерывным

временем, то уравнение

(4.10)

можно представить

в следующем виде:

 

 

 

 

 

 

 

 

=

f{x,t)

+ a(x,t)e(t),

 

 

(4.12)

 

 

at

 

 

 

 

 

 

где {e(t),

t еТ} —белый шум с непрерывным

временем.

 

При

сравнении уравнения (4.12). с тем, что говорилось

в на­

чале этого раздела, обнаруживаем, что если

мы хотим

полу­

чить нетривиальную стохастическую модель состояния добавле­ нием помехи к правой части обыкновенного дифференциального уравнения, то помеха не должна иметь конечную дисперсию и должна быть подобна белому шуму.

Используя понятие стохастического дифференциального уравнения, можно придать точный смысл дифференциальному уравнению, в которое входит белый шум. Следует отметить, что формальные преобразования уравнения (4.12) могут легко при­ вести к неправильным результатам.

5—403

66

Глава 3

Прежде чем приступать к изложению следующего материа­ ла, рассмотрим кратко использование стохастического диффе­ ренциального уравнения как модели физических процессов. Про­ изводная dxjdt в уравнении (4.10) не существует в обычном смысле, поэтому использование уравнения (4.10) как модели физического процесса выглядит странным. Однако имеется мно­ го практических задач как в управлении, так и в теории связи, где предпочтительно не иметь дела с производными некоторых сигналов. Поэтому моделирование таких сигналов стохастиче­ скими дифференциальными уравнениями допустимо.

Обратные разности

Необходимо соблюдать осторожность при интерпретации стохастического дифференциального уравнения (4.10) как пре­ дела в среднеквадратическом разностного уравнения. Выше уравнение (4.10) рассмотрено как предел выражения

х {t + h) — х (t) = f (x (t), t)h + a(x (t), i) [w{t + h) — w (t)] + о (A). (4.13)

Однако мы получим совсем другие результаты, если рассматри­

вать уравнение

(4.10) как предел выражения

 

х{t)

x{t

h) = f (х(/),t)h + a(x(t),t) [w(t) —

 

 

 

 

— w(t — h)]+o(h)

(4.14)

(даже, если

/

и а

непрерывны). Для доказательства

вычислим

первые два момента приращения процесса (4.14) в случае, когда функция f непрерывно дифференцируема и функция а дважды

непрерывно дифференцируема. Разность {w(t)—w,{t—К)}

не за­

висит

от x(t—К),

но зависит

от x(t). Разложим правую

часть

выражения (4.14) в ряд Тэйлора

в окрестности точки

 

{x(t—h),

th)

и получим

 

 

 

 

 

 

 

 

 

 

 

x(t)

— x(t—h)

= f (х(t — h),t

— h)h + o(x{t

h),t — h) [w(() —

 

 

 

— w (t — h)\ - f

ax (x (t — h),t h) [w (t) —

 

 

 

 

 

— w(t — h)] [xif) — x(t — h)} +o{h).

 

(4.15)

Третий член в правой

части

появляется

потому, что

как

\x{t)—x(t—h)],

так и

[w{t)—w(t—h)]

имеют

порядок \fh

в

среднеквадратической

метрике.

 

 

 

 

 

 

 

Так как только член a [w(t)—w(t—h)\

 

в правой

части вы­

ражения

(4.14) имеет порядок

~/h , то

 

 

 

 

 

 

 

x(t)

— x(t — h) = f(x(t

— h),t

— h)h

+ o{x(t—h),t

— h),

 

[w(t) — w(t~h)]

+ ax(x(t

— h),t — h)a(x(t

— h),t — h)[w(t)

 

—w(t — h)]2+o(h).

Стохастические модели состояния

67

Перейдя к математическому ожиданию, получим

Е [x{t) — x(l — h)} = /{x(t — h),t — h)h + ax{x(t — h),

t — h)a (x (t h),t — h)h-ho

(h),

(4.16)

var [x(t) — x{t — h)]= a2 (x(t

— h),t — h)h + o(h).

(4.17)

Сравнение выражений (4.8) и (4.16) показывает, что среднее приращение процесса зависит от типа используемой разности

E d x

f / ( * . ' ) Л

(прямая

разность),^ { ^

 

\ f (х, t) dt +

ах {х, t) а (х, t) dt (обратная

разность).

Если использовать смешанную разность

Ах(()

=

(1 X) [х(t + h) — х (t)\ + X [х(t) — х (t — h)},

(4.19)

TO

 

 

 

Edx

=

/ (x, t) dt + Xax (x, f) a (x, t) dt.

(4.20)

Аналогично можно найти дисперсию приращения

 

 

 

var(dx) = c2(x,t)dt.

(4.21)

Хотя полученные результаты сходны, очень важно при опре­ делении стохастического дифференциала учитывать тип исполь­ зуемой разности. В эвристическом доказательстве, которое при­ вело к стохастическому дифференциальному уравнению, мы фак­ тически ввели f(x, t)h как среднее значение приращения. Для

сохранения этого интуитивного представления мы

должны ин­

терпретировать

стохастическое

дифференциальное

уравнение

как предел прямого разностного уравнения типа

(4.13).

Уточним эвристическую мотивировку

стохастического диф­

ференциального

уравнения. Используя

теорию

обыкновенных

дифференциальных уравнений,

можно получить

желаемый ре­

зультат по крайней мере двумя разными способами: либо пере­ ходом к пределу в разностном уравнении, либо преобразовани­ ем дифференциального уравнения в интегральное, которое мож­ но решить методом последовательных приближений. При этом можно попытаться определить уравнение (4.10) как предел раз­

ностного уравнения

или доказать

существование

и

единствен­

ность решения интегрального уравнения

 

 

 

t

t

 

 

х{t) = х{t0)+

§f(x(s),s)ds+^o(x(s),s)dw

(s).

(4.22)

 

и

и

 

 

Первый метод был использован Бернштейном, Леви и Гихманом. Интегральное уравнение изучалось Ито. Для решения уравнения (4.22) необходимо сначала придать точный смысл ин­ тегралам в правой части уравнения. Это сделано в следующих разделах.

68

Глава

3

 

Упражнения

 

 

 

 

1. Пусть {w(t),

teT} — винеровский процесс с единичным па­

раметром дисперсии и

 

 

 

 

Aw (t) =w{t

+

h)~w

(t).

Показать, что

 

 

 

 

 

h

 

 

w [t.)]2 = h

 

j' {dwf = lim

E

[w (t.+l)

 

6

 

 

 

свероятностью 1.

5.СТОХАСТИЧЕСКИЕ ИНТЕГРАЛЫ

Впредыдущем разделе введен интеграл типа

 

mt)dy(t),

(5.1)

где {y{t), teT}—процесс

с независимыми нормальными

при­

ращениями. Этот интеграл необходим для придания точного

смысла стохастическому

дифференциальному

уравнению.

В частных

случаях

у

может быть

винеровским

процессом.

Такой процесс

непрерывен

с вероятностью 1, однако

почти все

выборочные функции

имеют неограниченную

вариацию. Инте­

грал

(5.1)

нельзя интерпретировать как обычный интеграл Стиль-

тьеса.

В

этом

разделе

 

мы

подойдем

к определению

интеграла

(5.1), а также рассмотрим некоторые его свойства, которые пред­ ставляют интерес для задач управления и моделирования. Мно­ гие результаты приведены без доказательства. Более подробно

эти вопросы

освещены в работе [11] (раздел 11 данной главы).

Сначала

рассмотрим

случай,

когда / — детерминированная

функция, а

затем случай,

когда

/ — случайный

процесс. В

пос­

леднем случае интеграл

(5.1)

имеет некоторые

свойства,

кото­

рые существенно отличаются

от

свойств интеграла Стильтьеса.

Интеграл от детерминированной функции

Если / — детерминированная функция, то существует по крайней мере два способа определения интеграла (5.1). Если f —- достаточно гладкая функция, то интеграл можно определить следующим образом:

\ f (0 dy (0 = / ф) y(b)-f

(а) у (а) - j у (t) df (t).

(5.2)

О

а

 

Так как выборочные функции процесса {y(t),

t еТ} непрерывны

с вероятностью 1, то интеграл в правой части

существует почти

Стохастические модели состояния

69

для всех выборочных функций, если f имеет ограниченную вари­ ацию.

Особенность такого определения интеграла

состоит

в том,

что его можно интерпретировать как интеграл

от

выборочных

функций. Однако это определение нельзя обобщить

на

случай,

когда / — случайный процесс (например, винеровский процесс). Это определение также не сохраняет интуитивного представле­ ния о том, что интеграл является пределом сумм независимых случайных величин.

Поэтому дадим другое определение интеграла (5.1), исполь­ зуя обычные методы интегрального исчисления. Сначала опре­

делим интеграл для

случая, когда / — кусочно постоянные

функ­

ции, а затем распространим это определение

на

более

общий

класс

функций. Предположим,

что f — постоянна

в

интервалах

[ti, ti+i]. Тогда

интеграл

(5.1)

 

можно определить

 

следующим

образом:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

/ =

| / (0 dy ft) = £

/

 

(т.) [у (t[+l)

-

у (t.)],

 

(5.3)

где ^<лгг<С^-н. Интеграл обладает свойством

 

 

 

 

 

EI

= £

f (т,) Е \у

ft,+1)

-

 

у ft,)] =

j f f t )

dmy

 

ft),

(5.4)

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

my(t)

=

 

Ey(t).

 

 

 

 

(5.5)

Это следует из теоремы 6.2 гл. 2.

 

 

 

 

 

 

 

Далее имеем

 

 

 

 

 

 

 

 

 

 

 

var / =

var 2

f (т,-) [у (tt+l -

у «,)]

 

=

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

=

2 2 /

Ы

f N

cov {[у [ti+l)~

у (tt)],

 

-

у (/,)]} =

= 2 / , К ) [ г ( / | + 1 ) - г ( / | ) ]

 

= j f ( x ) d r ( T ) .

 

 

 

(5.6)

Пусть теперь функция / является пределом последовательно­ сти кусочно постоянных функций {fn}, т. е.

m a x [ j ( / „ - / ) 2 d r , j | f „ - / r > 7 2 J - > 0 .

Интеграл от функции / можно получить, используя обычный метод обобщения. Таким образом, интеграл от функции / опре­ деляется следующим образом:

/ = lim $fn(t)dy(l),

(5.7)