Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теор.вероятн. и матем.стат / Практ-ум по Теор.Вер-й и Матем. Стат.,ч.3.doc
Скачиваний:
113
Добавлен:
13.02.2015
Размер:
2.44 Mб
Скачать

2.2. Марковские процессы.

Однородные цепи Маркова представляют собой частный случай марковских процессов, а именно – марковские процессы с дискретным временем. В этом пункте мы изучим основные свойства марковских процессов с непрерывным временем.

Определение. Случайный процесс ξ(t) называется марковским, если для любого момента времени t1 при известном значении ξ(t1) случайные величины ξ(t) с t > t1 не зависят от случайных величин ξ(s) c s < t1 . Таким образом, марковские процессы (процессы без последействия) характеризуются тем, что вероятностные свойства процесса в момент tt1 определяются состоянием в момент t1 и не зависят от состояний процесса до момента t1.

Рассмотрим вначале марковские процессы с непрерывным временем и с конечным или счётным множеством состояний X = {x1, x2, …}. Подробнее всего рассмотрим случай конечного множества состояний, так как он отличается от цепей Маркова лишь тем, что здесь время изменяется непрерывно и переход системы из одного состояния xi в другое xj происходит в любой момент времени. Введём вероятности перехода pi j (s, t):

pi j (s, t) = P{ ξ(t) = xj | ξ(s) = xi}, pi j (s, t) 0. (2.2.1)

Очевидно,

, s ≤ t, pi i (t, t) = 1, pi j (t, t) = 0, i j. (2.2.2)

Обозначим через ai начальное распределение вероятностей, t = t0,

ai 0 , , (2.2.3)

а через p j (t) – абсолютную вероятность, т. е. вероятность того, что система будет в состоянии xj в момент t, tt0 . В силу формулы полной вероятности очевидны следующие равенства:

p j (t) = , (2.2.4)

pi j (s, t) = . (2.2.5)

Теорема 2.1. Пусть переходные вероятности pi j (s, t) имеют частные производные по t и s. Тогда при s t

(2.2.6)

(2.2.7)

где

Ai k (t) = Ai k (t) ≥ 0, i k, Ak k (t) ≤ 0,

. (2.2.8)

Уравнения (2.2.6) и (2.2.7) называются прямой, а уравнения (2.2.8) обратной системой уравнений Колмогорова.

Физический смысл величин Ai j (t)dt есть вероятность перехода из состо-яния xi в состояние xj за время от t до t +dt. Если функции Ai j (t) непрерывны, то функции pi j (s, t) представляют единственное решение системы уравнений (2.2.6), удовлетворяющее начальным условиям pi i (s, s) = 1, pi j (s, s) = 0, i j. Таким образом, рассматриваемый марковский процесс полностью определяется заданием функций Ai j (t). Нетрудно показать также, что если заданы любые непрерывные функции Ai j (t), удовлетворяющие условиям, налагаемым на них в (2.2.8), то решение pi j (s, t) системы (2.2.6) при начальных условиях pi i (s, s) = 1, pi j (s, s) = 0, i j, будет неотрицательным (pi j (s, t) ≥ 0), справедливо равенство (2.2.5), так что pi j (s, t) будут определять некоторый марковский процесс.

Основываясь на прямой системе уравнений Колмогорова, получим дифференциальные уравнения для абсолютных вероятностей pi (t). Если ai, задаваемые (2.2.3) – начальное распределение вероятностей, то заменяя в (2.2.4) j на i и дифференцируя это соотношение по t, используя (2.2.6), а затем снова преобразованное (2.2.4), получаем систему уравнений

. (2.2.9)

Начальные условия для этой системы таковы: pi (t0) = ai, i = 1, …, N.

Для однородного марковского процесса вероятности перехода pi j (s, t) зависят лишь от разности ts. В этом случае, согласно определению (2.2.8) Ai j – константы, и система уравнений (2.2.6) приобретает вид

(2.2.10)

Замечание 2.5. В случае счётного числа состояний X =(x1, x2, …) прямая и обратная системы уравнений Колмогорова (2.2.6) – (2.2.8) остаются справедливыми, но для их обоснования надо дополнительно требовать равномерной сходимости соответствующих рядов.

П р и м е р ы.

1. Двусторонняя реакция. Система может находится в двух состояниях: x1 – нераспавшаяся частица, x2 – распавшаяся частица. Возможен как процесс распада с вероятностью α dt, так и процесс восстановления с вероятностью βdt время dt. В этом случае A12 = α, A21 = β, а тогда A11 = – α, A22 = – β. Уравнения (2.2.9) дают

(2.2.11)

Пусть задано начальное распределение вероятностей состояний, например

a1 = 1, a2 = 0. (2.2.12)

Тогда легко получить решения системы уравнений (2.2.11) и показать, что при t → ∞ существуют предельные, не зависящие от времени вероятности p1(t) → β/( α + β), p2(t) → α /(α + β), т. е. процесс эргодичен.

2. Пуассоновский поток требований. Пусть на некоторую систему обслуживания поступают требования так, что ξ(t) – число требований за время t – образует однородный марковский процесс со счётным числом состояний xi = 0, 1, 2, … . Из состояния i система непосредственно может перейти только в состояние i+1, i = 0, 1, 2, … . Таким образом, Ai,i+1 = α, остальные Ai j = 0 при ij и согласно (2.2.8) Ai i = – α. Для абсолютных вероятностей pj (t), то есть вероятностей того, что за время t поступит j требований, имеем бесконечную систему уравнений (2.2.9)

(2.2.13)

с начальными условиями

p0(0) = 1, pi (0) = 0, i = 1, 2, … . (2.2.14)

Перепишем систему (2.2.13) подробнее:

(2.2.15)

Эта система легко решается и при заданных начальных условиях её решения:

(2.2.16)

то есть рассмотренный поток требований является пуассоновским.

3. Пусть однородный марковский процесс обладает свойством эргодичности: pi j (t) → pj при t → ∞. Тогда, как видно из системы уравнений (2.2.13), стационарные вероятности pj удовлетворяют системе уравнений

= 0, k = 1, 2, …, (2.2.17)

кроме того выполнено условие нормировки .

Пусть, например, Ai,i +1 = A, Ai +1, i = B, B > A, A11 = – A, Ai i = – (A + B), i > 1, Ai j = 0 для других i и j. Тогда указанная выше система уравнений имеет вид

Bp2 – Ap1 = 1, k = 1,

Bpk +1 – Apk = Bpk – Apk –1, k = 2, 3, … . (2.2.18)

Отсюда получаем pk = (A/B)k1p1, а условие нормировки даёт p1 = 1 – A/B. Таким образом, стационарные вероятности в этом случае равны

pk = (2.2.19)

Теперь рассмотрим марковские процессы ξ(t) с непрерывным множеством состояний.

Наиболее интересным и важным с точки зрения приложений является случай процессов, у которых n-мерная функция распределения с любым n имеет плотность распределения вероятностей. Конкретнее: пусть ξ(t) – случайный процесс, t T, и пусть при каждом наборе моментов времени t1, t2, …, tn T n-мерная случайная величина (ξ(t1), ξ(t2), …, ξ(tn)) имеет n-мерную плотность вероятности pn (t1, x1; t2, x2; …, tn, xn). Эта плотность обладает двумя очевидными свойствами:

1) pn (t1, x1; t2, x2; …, tn, xn) симметрична относительно перестановок любых пар аргументов (ti, xi), ибо pn (t1, x1; t2, x2; …, tn, xn)dx1dxn выражает вероятность совместного осуществления событий xi ≤ ξ(ti) ≤ xi + dxi , i = 1, …, n и стало быть не зависит от порядка их перечисления;

2) все конечномерные плотности pn для различных n должны бы согласованы в том смысле, что плотность любого k-мерного распределения при k < n определяется с помощью n-мерного распределения:

.(2.2.20)

Согласно определению плотности условной вероятности (см. §2 ч.I Практикума) pn (t1, x1; t2, x2; …, tn, xn) =

= pn1 (t1, x1; t2, x2; …, tn1 , xn1 ) qn (tn, xn | t1, x1; t2, x2; …, tn1 , xn1 ).

Так как свойство марковости процесса означает, что вероятностные свойства процесса в момент tn определяются состоянием в момент tn1 и не зависят от протекания процесса в предшествующие моменты времени, то

qn (tn, xn | t1, x1; t2, x2; …, tn1 , xn1 ) = qn (tn, xn | tn1 , xn1 ). (2.2.21)

Условную вероятность q (t, x | τ , y ) называют переходной плотностью вероятности.

Подставляя (2.2.21) в определение плотности условной вероятности, получаем

pn (t1, x1; t2, x2; …, tn, xn) = pn1 (t1, x1; t2, x2; …, tn1 , xn1 ) qn (tn, xn | tn1 , xn1 ).

Применяя эту формулу последовательно для n, n1, …, 2 получим

pn (t1, x1; t2, x2; …, tn, xn) = p1(t1, x1)q(t2, x2 | t1, x1)… qn (tn, xn | tn1 , xn1 ). (2.2.22)

Полученное равенство означает, что для задания n-мерной плотности вероятности марковского процесса достаточно знать лишь две функции: одномерную плотность p1(t1, x1) и переходную плотность вероятности q (t, x | τ , y ).

Основным в теории непрерывных марковских процессов является уравнение Смолуховского (оно также называется уравнением Колмогорова – Чепмена – см. (2.1.6) и замечание 2.4):

q (t, x | t0 , x0 ) = (2.2.23)

для любых трёх моментов времени t0 < τ < t, t0, τ, tT.

Для однородного марковского процесса переходная плотность вероятности зависит лишь от разности моментов времени q (t, x |τ , y ) = q (x |tτ , y ).

Уравнение Смолуховского в этом случае принимает вид

q (x |tt0 , x0 ) = . (2.2.24)

В теории марковских процессов многие результаты можно и удобно получать при рассмотрении математической модели, описывающей блуждание частицы под действием случайных толчков (размерность пространства при этом может широко варьироваться). Поскольку такая модель (с определёнными дополнениями и изменениями) имеет широкое применение в физических и технических приложениях, ограничимся в дальнейшем её рассмотрением.

В уравнении Смолуховского промежуточный момент времени τ может быть выбран между t и t0 произвольным образом. Возьмём его весьма близким к t, положив τ = tΔ , и сделаем предположения о существовании следующих пределов.

Во-первых, предполагаем, что

(2.2.25)

Смысл этого выражения очевиден: –это условное среднее значения перемещения за время Δ из фиксированной точки y, так что A(y, t) – это средняя скорость изменения состояния в момент t в точке y (так называемый коэффициент сноса).

Во-вторых, допускаем, что

= B(y, t). (2.2.26)

Величина есть мера разброса возможных конечных точек x относительно фиксированной исходной точки y. Предполагается таким образом, что этот разброс при удалении от момента tΔ на Δ растёт по диффузионному

Условия (2.2.25) и (2.2.26) задают т. н. диффузионное приближение, которого достаточно для описания марковского процесса с непрерывным множеством возможных состояний с помощью упрощённого приёма: время t и множество состояний x разбиваются на весьма малые промежутки Δ t и Δ x, составляются уравнения для марковской последовательности, а затем делается переход к пределу при Δ t0 и Δ x 0. Коэффициент B(y, t), точнее B/2, называется коэффициентом диффузии (и таковым и является в физических приложениях).

Возвращаясь к заявленной в начале этого подраздела модели случайных блужданий под действием случайных толчков, что является частным проявлением движения рассматриваемой системы под действием случайной силы, можно показать, что B(y, t) характеризует интенсивность толчков.

В-третьих, предположим, что

= 0. (2.2.27)

Таким образом, предполагается, что вероятность больших изменений |xy | достаточно быстро стремится к нулю при Δ0, так быстро, что убывает быстрее Δ. Именно это требование и позволяет рассматривать x в системе, подвергающейся действию случайных толчков, как непрерывно меняющуюся величину, т. е. как среднее за время, гораздо большее промежутка между двумя толчками. Эти выводы неприменимы, следовательно, к промежуткам времени, малым по сравнению со временем между толчками.

Н а п р и м е р, вероятность соударения молекул газа за время τ, малое по сравнению со временем свободного пробега θ, есть 1 – eτ/θτ/θ . При соударении скорость молекулы u (которая и представляет собой в этом случае величину x, описывающую состояние молекулы) меняется в среднем на конечную величину Δu = ± a. Следовательно, для τ « θ и условие не выполнено.

Принимая условие (2.2.27), мы ограничиваемся марковскими процессами, у которых непрерывно не только множество возможных значений, но и само протекание процесса во времени, т. е. смена состояний происходит непрерывно (в вероятностном смысле), без скачков. Такие марковские процессы часто называют диффузионными.

Для таких марковских процессов, преобразуя, с учётом предположений (2.2.25) – (2.2.27), уравнение Смолуховского (2.2.23), получаем

=. (2.2.28)

Это параболическое уравнение (типа диффузионного) называют уравнением Эйнштейна – Фоккера – Планка или прямым (первым) уравнением Колмогорова. По самому смыслу переходной вероятности, решение этого уравнения должно быть не отрицательным (q (t, x | t0 , x0 ) ≥ 0) и нормированным на единицу (и) и удовлетворять начальному условию

q (t, x | t0 , x0 = δ(xx0). (2.2.29)

Однако, это же решение q (t, x | t0 , x0 ), удовлетворяющее тем же вышеприведённым условиям, удовлетворяет ещё одному уравнению

=, (2.2.30)

называемому обратным (вторым) уравнением Колмогорова. Уравнение (2.2.30) следует решать в обратную сторону по времени, для t0t.

Замечание 2.6. Наглядно уравнение (2.2.28) можно истолковать следующим образом. В момент t0 из точки x0 выходит большое число (ансамбль) частиц, движущихся независимо друг от друга. Их концентрация (относительная «частота») в точке x в момент t будет q (t, x | t0 , x0). Поток частиц Q складывается из систематического («гидродинамического») потока Aq, где Aскорость систематического движения в точке x в момент t, и из диффузионного потока –, гдеB/2 – коэффициент диффузии: Q = Aq .

Тогда уравнение Фоккера – Планка – это просто уравнение непрерывности:

,

выражающее сохранения числа частиц.

Пусть в начальный момент t0 задана плотность распределения вероятности p(t0, x) случайной величины ξ(t0). Тогда двумерная плотность распределения вероятности для произвольного момента времени tt0 и начального момента t0 равна

p2(t, x; t0, x0) = p(t0, x0) q (t, x | t0 , x0), (2.2.31)

а одномерная плотность случайного процесса ξ(t) для момента t равна

p1(t, x) = . (2.2.32)

Если теперь уравнение (2.2.28) Эйнштейна – Фоккера – Планка умножить на p(t0, x0) и проинтегрировать по x0, то в силу (2.2.32) найдём, что плотность p1(t, x) удовлетворяет тому же уравнению

=. (2.2.33)

Решение этого уравнения должно удовлетворять условиям

p1(t, x) ≥ 0; ;p1(t, x= p(t0, x).

П р и м е р ы.

1. Пусть марковский процесс однороден по времени, т. е. q (t, x | t0 , x0) = = q (x | tt0 , x0). В этом случае в условиях (2.2.25), (2.2.26) функции A и B не зависят от t. Пусть, кроме того, одномерная плотность p1 также не зависит от времени (стационарный марковский процесс). Тогда уравнение (2.2.33) записывается в виде

d/dx{A(x)p1(x) – 1/2∙ d/dx[B(x) p1(x)]} = 0. (2.2.34)

Если на границах изменения x (т. е. в области значений процесса ξ(t)) поток Ap1 – 1/2∙ d/dx(B p1) равен нулю, то в силу (2.2.34) он равен нулю всюду

A(x)p1(x) – 1/2∙ d/dx[B(x) p1(x)] = 0. (2.2.35)

Интегрируя это дифференциальное уравнение (для этого полагаем υ = B p1), получим

p1(x) = (2.2.36)

где C – постоянная определяемая из условий нормировки плотности.

Физическим примером, в котором существует стационарное распределение p1(x), является броуновское движение частиц над отражающей границей при наличии силы тяжести. Здесь A = mg. Ясно, что на отражающей границе выполнено условие обращения потока в нуль, так что уравнение (2.2.35) имеет место. Выражение (2.2.36) с постоянными A и B даёт

p1(x) ==

т. е. получили барометрическую формулу, причём B = 2kT, kпостоянная Больцмана, T – абсолютная температура.

2. Рассмотрим марковский процесс, однородный по координате, т. е. q(t, x | t0 , x0) = q(t, xx0 | t0). В этом случае в условиях (2.2.25), (2.2.26) функции A и B зависят лишь от t и уравнение (2.2.33) имеет вид

. (2.2.37)

С помощью замены переменных (t, x) → (τ, y) по формулам

y = xx0, τ =,

приходим к уравнению теплопроводности

.

Его решение, удовлетворяющее условиям нормировки и начальным условиям (2.2.29), имеет вид

q(τ, y) = (2πτ) – 1/2exp(– y2/2τ),

или в старых переменных

q(t, xx0 | t0) = (2π) – 1/2exp{– ( xx0)2/2}. (2.2.38)

Пусть, в частности, A(t) = 0, а B(t) = B – const. Тогда

q(t, xx0 | t0) = .

Отсюда среднее смещение частицы в броуновском движении равно нулю, а средний квадрат смещения равен B(tt0), то есть растёт пропорционально времени (результат впервые получен Эйнштейном).

И в заключение этого раздела немного о скачкообразных марковских процессах, т. е. процессах, для которых не выполняется ограничение (2.2.27), но и цепями Маркова они считаться не могут. Пример такого процесса приводился ранее: при столкновении молекул газа скорость отдельной молекулы меняется скачком, но множество возможных значений скорости после удара непрерывно. Кроме соударений микрочастиц (молекул, атомов, электронов и т. д.) в эту схему укладываются и квантовые переходы, и некоторые импульсные процессы.

Обозначим a(t, x) – вероятность скачка (из состояния x в начальный момент скачка t) и φ(z | t, x) – плотность условной вероятности значений z, принимаемых в результате скачка (зависимость этих величин не только от предшествующего значения x, но и от времени t, делает процесс ξ(t) уже нестационарным).

Потребуем также выполнения, с точностью до первого порядка относительно Δt соотношения

q(t + Δt, z|t, x) ≈ [1 – a(t, x) Δt]δ(zx) + a(t, x) Δt φ(z | t, x). (2.2.39)

В предположении (2.2.39) и при некоторых дополнительных требованиях (непрерывности a и φ как функций t и ограниченности a на любом конечном интервале t) из уравнения Смолуховского вытекает прямое интегро-дифференциальное уравнение Колмогорова – Феллера

= a(t, x)q(t, x | t0, x0) + ∫a(t, y)∙φ(x | t, y)q(t, y | t0, x0)dy. ( 2.2.40)

Справедливо и обратное (t0 > t) уравнение Колмогорова – Феллера

= a(t0, x0)[ q(t, x | t0, x0) – ∫φ(y |t0, x0)q(t, x| t0, y)dy]. (2.2.41)

При начальном условии

q(t0, x | t0, x0) = δ(xx0)

оба уравнения имеют единственное решение, причём одно и то же.

В общем случае сочетания в едином процессе диффузионной и скачкообразной составляющих интегро-дифференциальные уравнения Колмогорова – Феллера по прежнему верны, но к их правой части добавляется правая часть первого или второго уравнений Колмогорова (Фоккера – Планка).

Уравнение Колмогорова – Феллера ( 2.2.40) можно записать также в виде классического кинетического уравнения Больцмана, основного уравнения кинетической теории газов. Введём плотность вероятностей скачка в момент времени t из состояния y в состояние x:

u (y | t, x) = a(t, y)∙φ(x | t, y). (2.2.42)

Справедливость этого равенства вытекает из следующего ряда соображений: a(t, y)∙dt – вероятность скачка из y куда-нибудь (то есть вероятность того, что в интервале времени от t до t +dt в y был скачок), а φ(x | t, y)dx – условная вероятность того, что при наличии скачка процесс перешёл в (x, x + dx). Произведение этих вероятностей представляет собой условную вероятность u, как она определена выше. Интегрируя (2.2.42) по всем x, учитывая при этом, что ∫φ(x | t, y)d x = 1, и меняя местами переменные (xy), получаем

u (y | t, x)dy = a(t, x). (2.2.43)

Если подставить (2.2.43) в первый член правой части (2.2.40), а (2.2.42) – во второй, то уравнение (2.2.40) примет вид

= – q(t, x |t0, x0) ∫u (y |t, x)dy + q(t, y |t0, x0)u (y |t, x)dy. (2.2.43)

Это и есть уравнение Больцмана (для одномерного процесса). Из него хорошо видно, что это, по существу, уравнение баланса: скорость изменения q (например, концентрации частиц в точке x) равна разности двух обусловленых скачками ежесекундных потоков – из x в какое либо другое состояние и из всех других состояний в x.