Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Соболь И.М. Численные методы Монте-Карло

.pdf
Скачиваний:
24
Добавлен:
24.10.2023
Размер:
9.56 Mб
Скачать

1 6 8

РЕШЕНИЕ ЛПНЕПНЫХ УРАВНЕНИЙ

 

[ГЛ.

5

функцию а(Р), удовлетворяющую в G условию

 

 

 

0< а (Я ) < 1.

 

 

 

Пусть

s(P) = l—а(Р), а плотности р(Р)

и р{Р, Р')

такие же, как в п. 1.2.

 

 

 

 

 

Определим в G траектории f v

случайной длины ѵ

 

 

Т ѵ = ( Qo - * ■ Qi

- > Qv)

 

 

 

по следующим правилам:

в соответствии с плотностью

а)

точка Qо выбирается

Р(Р).

в точке Qi (где / = 0,

1, ...)

траектория с вероят­

б)

ностью a(Qj) заканчивается и с вероятностью s(Qt)

про­

должается;

 

 

то точка

Q,+i

в)

если траектория не заканчивается,

выбирается в соответствии с плотностью p(Qs, Р).

Естественно назвать а(Р) вероятностью поглощения

случайной точки в точке Р и s ( P) вероятностью рас­ сеяния этой точки.

Вероятность получить і-звенную траекторию Гѵ с со­ ответствующими вершинами, расположенными в окрест­ ностях точек Ро, Р.......... Ри равна произведению

р (Р0) dPüs (Р0) П р (Р ,- ь Р,) dPjS (Pi) р і_ ь Pi)dPia(Pi).

/=1

Введем обозначение

Pi (Р0, ...,P t) = p (Р0) fl s (Pi-0 p (Pi- j, Pt) a (Pi); (15) /=і

тогда вероятность получить t'-звенную траекторию Тѵ равна

Р{ѵ = і}= J . . .

Jpi(P 0, ... , Pt)dPо ...dPi.

a

a

Запишем также условную плотность вероятностей тра­ ектории Тѵ при условии, что ѵ— і:

рѵ (Р0, . . Рі\ѵ = і) = pt (P0, . .. , Pi)/P {V = i}.

Вдоль траектории f v рассмотрим функции (Р, (веса), определенные (для /^ ѵ ) рекуррентной формулой

= 1 ■ W, = 1[/( (Q/-i, QO/s (Qi—0 p (Qi-^u Qi)\- (16)

ИНТЕГРАЛЬНЫЕ ПРЕОБРАЗОВАНИЯ

169

Сравнивая (16) с (5), легко заметить, что

 

W, (Я0........Р,) =

(Р0, ... , Р,) s (Р0) . . . s

(17)

Обозначим через Ѳ,[т|>] случайную величину

 

Ѳ< !Ф1 = Ш / Р (Qo)l Wt [cp (Qi)/a (Qf)].

(18)

Т е о р е м а 2. Если условия,

перечисленные в начале

п. 1.2, выполнены, то условное

математическое ожида­

ние величины Ѳ,[ф] равно

 

 

 

М {0£ [ф||ѵ = і} =

(ф, К1ф)/Р {ѵ = і}.

(19)]

Д о к а з а т е л ь с т в о . По определению

 

 

М {0,- [ф]|ѵ =

і} = J ....[ 0£ [ф] рѵ(Qo, . . . . Qi|v =

і) dQ0 ...

 

I

dQo • ■■dQt

 

.. d Q i = j

... j Ф (Q0) П

 

К ( Q i - i , Q i ) ф (Q i ) P (v= i)

'

 

/=i

 

 

 

 

 

 

(Ф , / < V )

 

 

 

P ( v =

ІГ

Теорема 2 позволяет сформулировать метод Монте-

Карло для расчета (ф, /(Чр) с помощью траекторий Тѵ. В самом деле, реализовав N таких траекторий, получим среди них Ni траекторий, состоящих из і звеньев. Оче­ видно,

N,INttP{v = i}.

А из (19) вытекает, что

(Ф. Д »

Ni

(20)!

 

s—1

где О,-[ф]. — значение Ѳ,[ф] на s-й траектории (из числа і-звенных траекторий). Заметим, что последнюю фор­ мулу можно заменить формулой

N,

 

(Ф. к 1ф) ~ дг Е 0. [ФЬ-

( 21),

S—1

 

1.5. Сравнение точности оценок (8) и (20). В оценке (8) осредняются значения случайной величины Ѳ,- [г))], математическое ожида­

ние которой равно (ф ,/(?ф). В (20) осредняются значения случайной

170 РЕШЕНИЕ ЛИНЕЙНЫХ УРАВНЕНИЙ [ГЛ. 5

величины і,-= Р {ѵ = і}0

£

[ф],

условное математическое ожидание

которой равно также(ф,

К'ц).

Для того чтобы сравнит)) дисперсии

этих величин, достаточно

сравнить математические ожидания их

квадратов. В первом случае

 

 

 

 

т ] Іф] =

J . . .

Уо? [ф] Р ( (Qo.........

Q() dQ0

... dQ(,

(22)

 

 

G G

 

 

4

 

 

a do втором

 

 

 

 

 

 

 

M {I? |v = i) =

f .

. . f

(Qu

..........Q,|v =

I) dQ0 ...

dQ[ =

 

 

G

G

 

 

 

 

 

=

P (V = i)

f . . .

. Го ? [ф] p .

(Qg, . . . ,

Q.) dQg . . .

dQr

GG

Спомощью формул (3), (6) и (I5), (IS), приняв во внимание соот­

ношение (17), нетрудно проверить, что имеет место тождество

 

о? т Рі

= 0 ?

l'b'Ü s (Qo)

• ■• 5 (<?,_,) а (Ql).

 

(23)

Используем

(23),

чтобы

преобразовать последнее выражение

для

М(|2.|ѵ = і]

=

f ... j Of [»Мл», Р {у =

П ‘(Qo •

<iQi

(24)

 

 

 

 

 

s (Qo)

s ( Q i_ i)

a (Qj)’

 

Вообще

говоря,

выражение (24)

может быть как меньше,

так и

больше, чем (22). Однако в весьма важном частном случае, когда

поглощение

постоянно во

всей области G пли,

другими словами,

а ( Р ) = а , эти выражения

равны. В самом деле, в этом случае

р {V =

І) = as1 Г . .

УРі (/>„, . . . , Pi) dP0 . . .

dPi =-

GG

идробь, стоящая в (24), равна dQ0 . . . dQ-, Следовательно, в случае a(P)s=a дисперсии равны

DO,- m = D{yv=i}.

Для того чтобы количество слагаемых в формулах (8) и (20) было одинаковым и равнялось /V*, в первом случае надо построить /Ѵ = = N* траекторий типа Г,-, а во втором случае, чтобы W,-= /V *, надо

построить

в среднем

N*/P{v = i } > N * траекторий

типа

7’ѵ . Таким

образом,

оценка (20)

для

(ф, К 1ср)

оказывается

менее

выгодной.

На различных

других

оценках

величины (ф, К 1ф) мы останав­

ливаться

не будем.

Кроме случайных траекторий типа Т { и Тѵ, воз­

можны и другие типы траекторий. Например, «поглощение» может происходить при пересечении некоторых заранее заданных линий или зависеть только от направления звена траектории и т. п.

§ 21

н е о д н о р о д н ы й и н т е г р а л ь н ы е у р а в н е н и я

171

§2. Неоднородные интегральные уравнения

2.1.Постановка задачи. Ряд Неймана. Рассмотрим интегральное уравнение

г (Р ) = К (Р,

Р') г (P')dP' -I- /

(Р),

G

 

 

 

которое с учетом (1) можно записать в виде

z= K z+ f.

 

(25)

Здесь z ( P ) — искомая

функция,

К(Р,

Р ') — заданная

функция, называемая ядром уравнения,

f ( P ) — задан­

ная функция (свободный член).

К(Р,

P ') ^ L 2{G'X_G).

Предположим, что f ( P ) ^ L 2(G),

Можно попытаться искать решение методом последова­

тельных приближений. Пусть z<0) =

cp( Р ) — произволь­

ная функция из Lo{G). Пусть далее

при і— \,

2, ...

z ^ = Kzl,~u+f.

 

(26);

-Нетрудно вычислить, что

 

 

г«'1= f + K f + . . . +Д'<І- 1)/+/СІФ.

(27)

Последовательные приближения г(0 сходятся при г—ѵоо к решению z уравнения (25) тогда п только тогда, когда это решение представимо в виде ряда Неймана

 

 

2 =

NJ А''/-

 

 

(28)

 

 

 

і=0

 

 

 

 

Условия

сходимости ряда

Неймана

имеются,

например,

в [63].

 

 

 

 

 

 

 

В частности, если

 

 

 

 

 

 

 

 

П / О Ч М P ’) d P d P ’ < 1,

 

 

 

а а

 

 

 

 

 

то ряд (28)

сходится в среднем:

 

 

 

 

 

:

lim [ z - ^ / C V ,

г -

‘Ѵ

А,''/ =

0.

 

^

і=о

 

і=0

У

Если, кроме того, для

всех P e S s G

 

 

 

 

 

 

[ К 2 (Р, P') dP'

< С,

 

 

 

 

 

G

 

 

 

 

 

то ряд (28)

сходится абсолютно и равномерно в В.

 

 

1 7 2 РЕШЕНИЕ ЛІІНЕПНЫХ УРАВНЕНИЙ |ГЛ 5

Л е м м

а.

Если

ряд

(28)

сходится

в

среднем,

то для

любой

функции і|і(Л)

из Li{G)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

lim

И J,

2

 

К '/) =

№> г)-

 

 

 

 

 

 

 

т-*«

V

 

і=о

/

 

 

 

 

Д о к а з а т е л ь с т в о .

Рассмотрим

разность

 

 

 

 

 

 

 

[

 

 

т

 

. \

I

 

,п

 

 

 

 

(Ф, г) — ( Ф. Д ] А'7 1 = (ф> z — 2 А г/

 

 

Из неравенства

(1) на стр. 292 следует, что

 

 

 

 

т

 

\ 2

 

 

 

/

 

/'1

 

го

 

 

ф,

г -

V

 

к-if

<

(ф,

ф)

\

г -

V

/Сг/', г - V

/<г/ ) _

0,

 

 

1=0

/

 

 

 

 

 

і=0

 

1=0

 

когда

т

с».

 

 

 

 

 

 

 

 

 

 

 

 

 

Формулы

 

(27)

и

 

(28)

показывают, что

вычисление

2(і) или 2 сводится к вычислению суммы итерирован­ ных функций.

2.2. Оценка линейных функционалов от Z (i). Резул таты § 1 позволяют указать методы Монте-Карло для вычисления скалярных произведений (ф, z(i>), где ф(Р) — любая заданная функция из L2(G).

В самом деле, рассмотрим случайные траектории Т{,

определение которых дано в п.

1.2, и введем случай­

ные величины £і[ф],

зависящие

от таких

траекторий:

h

№1

№ )

SV //(Q /)

■T ^ іф ( Q i )

(29);

 

 

 

p (Qo) L=o

 

 

'(При г = 0

полагать

квадратную

скобку в

(29) равной

WVp(Qo).)

Легко доказать, что математическое ожидание этих

величин равно

 

М£,-[ф] = (ф. 2<‘>),

(30);

ибо каждое слагаемое в (29) — это величина типа Ѳ,[тр] з

МЕ,[.и - 2 М{K g «V Ш ] + м {ig j Wtt {«,)] -

*= 2 (Ф. к 1!) + (Ф. К'ф) = (Ф,

1 -0

§ 2] -НЕОДНОРОДНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ 173

Соответствующий (30) метод Монте-Карло:

 

1 N

o n

ш ь ,

ІѴ

s = 1

 

где £,[ф]а— значение ^,-[г|>]

на s-й траектории.

Очевидно, по одним и тем же траекториям типа Т{

можно вычислять значения

(ф, г и>) для

нескольких

функций ф(Р) и даже для нескольких уравнений (25) — с одним и тем же ядром К(Р, Р'), но с разными f(P). Сами значения zU)(P) можно вычислять любым из трех методов, указанных в п. 1.3. Если ряд Неймана

(28) сходится, то при достаточно больших

і значения

(Ф, 2<0) могут служить приближениями к (ф,

z).

2.3.Метод существенной выборки для траекторий Г

Впредыдущем пункте рассматривались траектории Tit построенные по произвольным допустимым р(Р) и р(Р, Р'), но не было никаких указаний па то, как лучше вы­ бирать эти плотности. Однако от их выбора зависят дисперсии D^,[ор], определяющие точность метода Мон­ те-Карло (31). Особенно нежелательна большая диспер­ сия тогда, когда начальное приближение z(0)= cp(P) близко к точному решению z(P), так как можно «ис­ портить» это приближение.

Если функция zu,(P) известна, и интеграл (ф, zU))

вычисляется с помощью существенной выборки (гл. 3, п. 3.2), то минимальная дисперсия такой оценки, соглас­ но теореме 3 гл. 3, равна

Di = (|Ф|, \гЩ)й -

(ф, г</>)2.

(32)

Т е о р е м а 3.

Предположим, что ядро

уравнения

(25) и его решение неотрицательны

 

К(Р, Р ' ) > о,

2 (Р )> о ,

 

а траектории Т{ строятся с начальной плотностью

р(Р) = |ф(Р) |ф (Р)/(|ф |, ср)

(33);

и с плотностью вероятностей перехода

 

р(Р,

Р ')= К (Р, Р')(р(Р')ІК<р(Р).

(34)

Если начальное приближение ср(Р) равно решению z(P),

то при любом / = 0, 1, 2, . . . , і

D£/ [ ф] = Dp

(35),

174 РЕШЕНИЕ Л 1111ЕПНЫХ УРАВНЕНИИ [ГЛ. 5

 

Д о к а з а т е л ь с т в о .

Если

ср =

/Сср-|-/ и выполнено

равенство

(34),

то

 

 

 

 

 

£і[ф] =

 

 

 

 

Q i) Ф( Q i ) / р (Qo, Q i ) ]

 

=

['l’ (Q o )/ р (Q c )] [/(Q u )“l~/v(Qo.

=

=

i[K Q o) /p ( Q ü) ] [A'

( Qd) Ч - А ' ф ( Q o ) ] =

 

 

 

 

 

 

 

= ф (Q o) t ( Q o ) / p ( Q o ) = ьо[ф ]-

В то же время при

2 из

(29)

следует, что

 

S/-1 1Ф1 -

£/ ІФ]

= ^

[П Д -.т (Qy-i) -

\V,-xf (Qi-о -

 

-

W ff (Qi)] =

[ф (Q0)/p (Q„)l IE/-! [cp (Qi-Q - f (Qi-Q -

 

 

 

 

 

 

 

— A > (Q / - i) l

= 0.

Следовательно, при любом / значение £,[ф] зависит лишь от Qo и, с учетом (33), равно ^[ф] = sg n ф(р0) X Х (|ф |, ф)- Поэтому дисперсия £;[ф] равна

DC; [ф] = М£/ [ф] — (ф, 2</))2 = (|ф|, ср)2— (ф, г</>)2.

А так как из ф(P)=z(P)

следует,

что

все

zU)(P) —

= z ( P ) ,

то последнее выражение для

D^j[ф]

совпадает

с (32). Теорема доказана.

 

 

(33) и (34)

с ф ( Р ) =

Как и в гл. 3, п. 3.2.1, плотности

= z(P) практически использовать нельзя,

так как реше­

ние z(P)

неизвестно. Однако, имея «хорошее» прибли­

жение zQ(P) t ü z (P) , мы

можем (в

принципе)

выбрать

Ф(Р) — Zo(P), и дисперсии

0^[ф]

будут

близки к ми­

нимальным.

знакопостоянна,

то

очевидно,

Если

функция ф(Р)

Ь,= 0.

2.4.Оценка линейных функционалов от z. Рассмо рим бесконечные случайные траектории

Тоо= (Qo- *- Qi-+■ ■ ■ ■ Q < - * - ■ ■ ■ ),

которые строятся по тем же правилам, что траектории

Tt. Тогда любой начальный участок

(Q0->-

Q.)

этой траектории представляет собой

траекторию

типа

Т'і и плотность его Pi(Qo,

•••, Qi) выражается формулой

(3). Предположим, что

начальная плотность р(Р)

до­

пустима по. отношению к ф(Р), а плотность вероятно­

стей перехода

р(Р,

Р') допустима по

отношению к

К(Р, Р'). Тогда

из

теоремы 1 следует,

что при каж­

дом і

 

 

 

M { h > ( Q o ) / P ( Q o ) W ( Q < ) } = f o . Щ ) -

§ 2] НЕОДНОРОДНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ 7 5

Рассмотрим случайную величину Л 1І']> зависящую от траектории ТА,:

 

 

СО

 

 

 

 

 

 

SW

WiHQi)-

 

 

(36)

При некоторых

условиях

справедливы равенства

со

 

 

 

 

 

 

 

M£ H) ] =2 m {

| ^ 1VV(Q,)} =

 

 

 

 

 

 

со

 

/

с о

 

\

 

 

= S (Ф. К‘Г) =

Д

Ф, 2

/С'7

/

= (Ф’г)’

 

йо

 

і=о

 

 

и математическое ожидание величины ЦгЬ] оказывается равным вычисляемому функционалу:

МГЛф] = (ф,

г).

(37)

Например, достаточно

потребовать,

чтобы было К{Р,

Р ' ) ^ 0, Д Р ) > 0 и ряд

Неймана

(28)

сходился в сред­

нем. Более общие условия приведены ниже в теореме 4. Если (37) справедливо, то для оценки (ф, г) можно использовать N траекторий типа ТА, по каждой из них вычислить значение Цф]5 (s— помер траектории) и ос-

реднпть результат

(зз)

Конечно, построить бесконечную траекторию численно невозможно. На практике траекторию строят до тех пор, пока слагаемые в (36) не становятся пренебрежимо малыми по сравнению со всей суммой, и тогда траекто­ рию «обрывают». Часто в качестве условия обрыва ис­ пользуют неравенство

«'А<е,

где е> 0 — некоторое наперед заданное малое число,, а / — номер последней точки траектории.

Можно обойтись без искусственного обрыва траек­ торий, если вместо траекторий 7А использовать траекто­

рии с поглощением Тѵ (п. 1.4) В самом деле, рассмот­ рим случайную величину

Л Іф] = [Ф (Qo)/р (Qu)J 'Ф V [/ (Q v)/« (Qv)J

(39)

176 РЕШЕНИЕ ЛПИЕПНЫХ УРАВНЕНИИ [ГЛ. 5

со случайным номером ѵ, равным количеству звеньев траектории Тѵ.

При некоторых условиях математическое ожидание

случайной величины £ѵ[ф], зависящей от случайного ин­ декса V, можно вычислить по формуле

00

М?ѵ [ф] = J М U v [ф] IV = і } р {ѵ = г'},

(—0

аналогичной формуле полной вероятности. Так как при

\ — і и / = ср величина £ѵ[ф] =Ѳі[ф], то из теоремы 2 вытекает, что

М (Uv [ф] IV = і } = (ф, K‘f)/P {ѵ = t}.

Следовательно,

мЁѵіФі =

S (Ф, K‘f) =

( Ф, S

K‘f] =

(Ф, z)

и окончательно

I—0

\ t—о

/

 

МІѵ [ф] =

(Ф, г).

 

(40)

 

 

 

Формула

(40)

также будет

справедлива в случае, ког­

да К(Р,

Р ') ^ 0

, f(P) ^ 0 и ряд Неймана

(28) сходится

в среднем. Более общие условия см. ниже в теореме 5. Соответствующий формуле (40) метод Монте-Карло

ОМ) « * 4 - 2

сѵ ГФк,

(4і)

ІѴ S- 1

 

 

где ^ѵ[ф], — значение £ѵ[ф] на s-й траектории типа Тѵ,

аV— номер последней точки этой траектории.

2.4.1.Метод Монте-Карло (31) позволяет оценить функционал (ф, г), если только ряд Неймана (28) сходится в среднем, так как

можно фиксировать столь большое і, чтобы разность |(ф, z ^ )— (ф, г) |

была меньше любого заданного е > 0 . Казалось бы, методы (38) и (41) также должны сходиться при этом единственном условии. К со­

жалению,

переход в

бесконечномерное

пространство

G X G X ■• ■

заставляет

наложить несколько

более жесткие ограничения, связан-

 

 

 

 

СО

 

 

 

ные с тем,

что сходимость

ряда

2 Мт];

не

обеспечивает вообще

 

 

СО

;=о

 

 

 

 

 

 

 

 

 

'говоря, существования

М 2

Л; п

приходится

требовать,

чтобы схо-

 

СО

і—0

 

 

 

 

 

 

 

 

 

 

 

дился ряд

2

 

 

 

 

 

 

f=0

§ 21

НЕОДНОРОДНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ

177

Интегральное уравнение

 

 

 

 

г (Р) = J I * (Р, P') I г (P') dP' +

\f (Р) I

 

(25)

 

G

 

 

 

назовем

мажорантным по отпошепнга к уравнению

(25). Так

как

J/< '/1=£2

|* |* |/|, то пз сходимости (в среднем)

ряда

Неймана

для

мажорантного уравнения следует абсолютная сходимость (в

сред­

нем) ряда (28).

 

 

 

Те о р е м а 4. Если ряд Неймана для мажорантного уравнения

(25)сходится в среднем, то имеет место равенство (37).

Те о р е м а 5. Если ряд Неймана для мажорантного уравнения

(25)сходится в среднем, то имеет место равенство (40).

Легко видеть, что _в случае, когда К(Р, Р')72?0 и

f ( P ) ^ 0 ,

ма­

жорантное уравнение (25) совпадает с уравнением

(25)

и пз теорем

4 и 5 вытекают достаточные условия, приведенные в п. 2.4.

 

Перейдем к д о к а з а т е л ь с т в у теоремы 4.

Из

теоремы

1

следует, что

 

 

 

M { |m ) /P ( < ? o ) ll" W ) |} = (Ж .

№ /!)•

Сумма таких математических ожиданий равна

 

m

= 2 (ж. 1*14/1) =

ж-2 1*14/1

У М Ф (Qu) W J (Q,)

і=0 р (Qu)

1=0

 

и (по лемме п. 2.1) стремится к конечному пределу, равному (|ф |.г)'. Сходимость этого ряда обеспечивает существование МС[г|>] и спра­ ведливость равенства

 

 

со

 

У (Qo)

 

 

 

 

 

 

 

 

мс ж

= 2

м

 

 

 

 

 

 

 

 

р (Qu)

 

 

 

 

 

 

 

 

 

і= 0

 

 

 

 

 

 

 

 

 

 

Еще раз применяя лемму п. 2.1, получим, что

 

 

 

 

 

со

("ф. * 7 ) = Hm

m

 

(Ф. *7)= Hm

/

ш

 

 

 

 

2

2

 

U

, V

/<'/

=

( Ф . 2 ) .

i=0

 

m->c° i=0

 

 

m-*a \

i=0

 

 

 

Аналогично

д о к а з ы в а е т с я

и теорема 5.

Из

теоремы

2 вы­

текает,

ЧТО

3 V1

,

 

 

 

 

 

(ж. 1*1' I/O

М{ІСѵ[ф]І1ѵ = /} = м

Ф (Qo)

fis / (Qt)

 

PlQu)

«(Qi)

 

Р [V =

()

 

 

 

 

 

 

 

 

 

 

Затем с помощью леммы п. 2.1 доказывается сходимость ряда

 

2

м U^v ж I |ѵ =

f]

р {V = i}

= 2

(іФі- i*r\ f \

) =

(іфі.

ij.

і=0

 

 

 

 

і=0

 

 

 

 

 

 

которая обеспечивает существование М£ѵ [і|-] и справедливость

12 И. М. Соболе

Соседние файлы в папке книги из ГПНТБ