![](/user_photo/2706_HbeT2.jpg)
- •И математической статистике
- •Ч а с т ь III
- •2. Описание случайных процессов и полей
- •3. Представления и преобразования случайных функций
- •4. Стационарность и однородность случайных функций;
- •5. Непрерывность, дифференцируемость и интегрируемость
- •6. Спектральное представление случайных процессов и полей
- •§2. Марковские процессы
- •2.1. Последовательности зависимых испытаний. Цепи Маркова.
- •2.2. Марковские процессы.
- •§3. Элементы теории систем массового обслуживания (смо)
- •3.1. Основные понятия, определения и компоненты моделей смо
- •3.2. Потоки событий.
- •3.3. Классификация смо и их основные характеристики
- •Раздел 2. Вариаты практических заданий задачи для самостоятельного решения
- •Раздел 3. Решения вариатов типовых заданий задача 1.
- •Задача 2.
- •Задача 3.
- •Задача 4.
- •I. Свойства дельта- функции и некоторых других обобщённых функций
- •II. Использование таблиц распределения пуассона при решении задач смо
- •III. Статистические таблицы
- •Примечания:1) функция Лапласа и интеграл ошибоксвязаны соотношением;
- •Содержание
- •Часть III
2.2. Марковские процессы.
Однородные цепи Маркова представляют собой частный случай марковских процессов, а именно – марковские процессы с дискретным временем. В этом пункте мы изучим основные свойства марковских процессов с непрерывным временем.
Определение. Случайный процесс ξ(t) называется марковским, если для любого момента времени t1 при известном значении ξ(t1) случайные величины ξ(t) с t > t1 не зависят от случайных величин ξ(s) c s < t1 . Таким образом, марковские процессы (процессы без последействия) характеризуются тем, что вероятностные свойства процесса в момент t ≥ t1 определяются состоянием в момент t1 и не зависят от состояний процесса до момента t1.
Рассмотрим вначале марковские процессы с непрерывным временем и с конечным или счётным множеством состояний X = {x1, x2, …}. Подробнее всего рассмотрим случай конечного множества состояний, так как он отличается от цепей Маркова лишь тем, что здесь время изменяется непрерывно и переход системы из одного состояния xi в другое xj происходит в любой момент времени. Введём вероятности перехода pi j (s, t):
pi j (s, t) = P{ ξ(t) = xj | ξ(s) = xi}, pi j (s, t) ≥ 0. (2.2.1)
Очевидно,
,
s
≤ t,
pi
i (t,
t)
= 1, pi
j (t,
t)
= 0, i
≠
j. (2.2.2)
Обозначим через ai начальное распределение вероятностей, t = t0,
ai
≥ 0
,
, (2.2.3)
а через p j (t) – абсолютную вероятность, т. е. вероятность того, что система будет в состоянии xj в момент t, t ≥ t0 . В силу формулы полной вероятности очевидны следующие равенства:
p
j (t)
=
, (2.2.4)
pi
j (s,
t)
=
. (2.2.5)
Теорема 2.1. Пусть переходные вероятности pi j (s, t) имеют частные производные по t и s. Тогда при s ≤ t
(2.2.6)
(2.2.7)
где
Ai
k
(t)
=
Ai
k
(t)
≥ 0, i
≠
k,
Ak
k
(t)
≤ 0,
. (2.2.8)
Уравнения (2.2.6) и (2.2.7) называются прямой, а уравнения (2.2.8) обратной системой уравнений Колмогорова.
Физический смысл величин Ai j (t)dt есть вероятность перехода из состо-яния xi в состояние xj за время от t до t +dt. Если функции Ai j (t) непрерывны, то функции pi j (s, t) представляют единственное решение системы уравнений (2.2.6), удовлетворяющее начальным условиям pi i (s, s) = 1, pi j (s, s) = 0, i ≠ j. Таким образом, рассматриваемый марковский процесс полностью определяется заданием функций Ai j (t). Нетрудно показать также, что если заданы любые непрерывные функции Ai j (t), удовлетворяющие условиям, налагаемым на них в (2.2.8), то решение pi j (s, t) системы (2.2.6) при начальных условиях pi i (s, s) = 1, pi j (s, s) = 0, i ≠ j, будет неотрицательным (pi j (s, t) ≥ 0), справедливо равенство (2.2.5), так что pi j (s, t) будут определять некоторый марковский процесс.
Основываясь на прямой системе уравнений Колмогорова, получим дифференциальные уравнения для абсолютных вероятностей pi (t). Если ai, задаваемые (2.2.3) – начальное распределение вероятностей, то заменяя в (2.2.4) j на i и дифференцируя это соотношение по t, используя (2.2.6), а затем снова преобразованное (2.2.4), получаем систему уравнений
. (2.2.9)
Начальные условия для этой системы таковы: pi (t0) = ai, i = 1, …, N.
Для однородного марковского процесса вероятности перехода pi j (s, t) зависят лишь от разности t – s. В этом случае, согласно определению (2.2.8) Ai j – константы, и система уравнений (2.2.6) приобретает вид
(2.2.10)
Замечание 2.5. В случае счётного числа состояний X =(x1, x2, …) прямая и обратная системы уравнений Колмогорова (2.2.6) – (2.2.8) остаются справедливыми, но для их обоснования надо дополнительно требовать равномерной сходимости соответствующих рядов.
П р и м е р ы.
1. Двусторонняя реакция. Система может находится в двух состояниях: x1 – нераспавшаяся частица, x2 – распавшаяся частица. Возможен как процесс распада с вероятностью α dt, так и процесс восстановления с вероятностью βdt время dt. В этом случае A12 = α, A21 = β, а тогда A11 = – α, A22 = – β. Уравнения (2.2.9) дают
(2.2.11)
Пусть задано начальное распределение вероятностей состояний, например
a1 = 1, a2 = 0. (2.2.12)
Тогда легко получить решения системы уравнений (2.2.11) и показать, что при t → ∞ существуют предельные, не зависящие от времени вероятности p1(t) → β/( α + β), p2(t) → α /(α + β), т. е. процесс эргодичен.
2. Пуассоновский поток требований. Пусть на некоторую систему обслуживания поступают требования так, что ξ(t) – число требований за время t – образует однородный марковский процесс со счётным числом состояний xi = 0, 1, 2, … . Из состояния i система непосредственно может перейти только в состояние i+1, i = 0, 1, 2, … . Таким образом, Ai,i+1 = α, остальные Ai j = 0 при i ≠ j и согласно (2.2.8) Ai i = – α. Для абсолютных вероятностей pj (t), то есть вероятностей того, что за время t поступит j требований, имеем бесконечную систему уравнений (2.2.9)
(2.2.13)
с начальными условиями
p0(0) = 1, pi (0) = 0, i = 1, 2, … . (2.2.14)
Перепишем систему (2.2.13) подробнее:
(2.2.15)
Эта система легко решается и при заданных начальных условиях её решения:
(2.2.16)
то есть рассмотренный поток требований является пуассоновским.
3. Пусть однородный марковский процесс обладает свойством эргодичности: pi j (t) → pj при t → ∞. Тогда, как видно из системы уравнений (2.2.13), стационарные вероятности pj удовлетворяют системе уравнений
=
0, k
= 1, 2,
…, (2.2.17)
кроме
того выполнено условие нормировки
.
Пусть, например, Ai,i +1 = A, Ai +1, i = B, B > A, A11 = – A, Ai i = – (A + B), i > 1, Ai j = 0 для других i и j. Тогда указанная выше система уравнений имеет вид
Bp2 – Ap1 = 1, k = 1,
Bpk +1 – Apk = Bpk – Apk –1, k = 2, 3, … . (2.2.18)
Отсюда получаем pk = (A/B)k –1p1, а условие нормировки даёт p1 = 1 – A/B. Таким образом, стационарные вероятности в этом случае равны
pk
=
(2.2.19)
Теперь рассмотрим марковские процессы ξ(t) с непрерывным множеством состояний.
Наиболее интересным и важным с точки зрения приложений является случай процессов, у которых n-мерная функция распределения с любым n имеет плотность распределения вероятностей. Конкретнее: пусть ξ(t) – случайный процесс, t T, и пусть при каждом наборе моментов времени t1, t2, …, tn T n-мерная случайная величина (ξ(t1), ξ(t2), …, ξ(tn)) имеет n-мерную плотность вероятности pn (t1, x1; t2, x2; …, tn, xn). Эта плотность обладает двумя очевидными свойствами:
1) pn (t1, x1; t2, x2; …, tn, xn) симметрична относительно перестановок любых пар аргументов (ti, xi), ибо pn (t1, x1; t2, x2; …, tn, xn)dx1…dxn выражает вероятность совместного осуществления событий xi ≤ ξ(ti) ≤ xi + dxi , i = 1, …, n и стало быть не зависит от порядка их перечисления;
2) все конечномерные плотности pn для различных n должны бы согласованы в том смысле, что плотность любого k-мерного распределения при k < n определяется с помощью n-мерного распределения:
.(2.2.20)
Согласно определению плотности условной вероятности (см. §2 ч.I Практикума) pn (t1, x1; t2, x2; …, tn, xn) =
= pn –1 (t1, x1; t2, x2; …, tn –1 , xn –1 ) qn (tn, xn | t1, x1; t2, x2; …, tn –1 , xn –1 ).
Так как свойство марковости процесса означает, что вероятностные свойства процесса в момент tn определяются состоянием в момент tn –1 и не зависят от протекания процесса в предшествующие моменты времени, то
qn (tn, xn | t1, x1; t2, x2; …, tn –1 , xn –1 ) = qn (tn, xn | tn –1 , xn –1 ). (2.2.21)
Условную вероятность q (t, x | τ , y ) называют переходной плотностью вероятности.
Подставляя (2.2.21) в определение плотности условной вероятности, получаем
pn (t1, x1; t2, x2; …, tn, xn) = pn –1 (t1, x1; t2, x2; …, tn –1 , xn –1 ) qn (tn, xn | tn –1 , xn –1 ).
Применяя эту формулу последовательно для n, n – 1, …, 2 получим
pn (t1, x1; t2, x2; …, tn, xn) = p1(t1, x1)q(t2, x2 | t1, x1)… qn (tn, xn | tn –1 , xn –1 ). (2.2.22)
Полученное равенство означает, что для задания n-мерной плотности вероятности марковского процесса достаточно знать лишь две функции: одномерную плотность p1(t1, x1) и переходную плотность вероятности q (t, x | τ , y ).
Основным в теории непрерывных марковских процессов является уравнение Смолуховского (оно также называется уравнением Колмогорова – Чепмена – см. (2.1.6) и замечание 2.4):
q
(t,
x
|
t0
, x0
) =
(2.2.23)
для любых трёх моментов времени t0 < τ < t, t0, τ, t T.
Для однородного марковского процесса переходная плотность вероятности зависит лишь от разности моментов времени q (t, x |τ , y ) = q (x |t –τ , y ).
Уравнение Смолуховского в этом случае принимает вид
q
(x
|t
– t0
, x0
) =
. (2.2.24)
В теории марковских процессов многие результаты можно и удобно получать при рассмотрении математической модели, описывающей блуждание частицы под действием случайных толчков (размерность пространства при этом может широко варьироваться). Поскольку такая модель (с определёнными дополнениями и изменениями) имеет широкое применение в физических и технических приложениях, ограничимся в дальнейшем её рассмотрением.
В уравнении Смолуховского промежуточный момент времени τ может быть выбран между t и t0 произвольным образом. Возьмём его весьма близким к t, положив τ = t – Δ , и сделаем предположения о существовании следующих пределов.
Во-первых, предполагаем, что
(2.2.25)
Смысл
этого выражения очевиден:
–это условное
среднее значения перемещения за время
Δ
из фиксированной точки y,
так что A(y,
t)
– это средняя
скорость изменения состояния в
момент t
в точке y
(так называемый коэффициент
сноса).
Во-вторых, допускаем, что
=
B(y,
t). (2.2.26)
Величина
есть
мера разброса возможных конечных точек
x
относительно фиксированной
исходной точки y.
Предполагается таким образом, что этот
разброс при удалении от момента t
– Δ
на Δ
растёт по
диффузионному
Условия (2.2.25) и (2.2.26) задают т. н. диффузионное приближение, которого достаточно для описания марковского процесса с непрерывным множеством возможных состояний с помощью упрощённого приёма: время t и множество состояний x разбиваются на весьма малые промежутки Δ t и Δ x, составляются уравнения для марковской последовательности, а затем делается переход к пределу при Δ t → 0 и Δ x → 0. Коэффициент B(y, t), точнее B/2, называется коэффициентом диффузии (и таковым и является в физических приложениях).
Возвращаясь к заявленной в начале этого подраздела модели случайных блужданий под действием случайных толчков, что является частным проявлением движения рассматриваемой системы под действием случайной силы, можно показать, что B(y, t) характеризует интенсивность толчков.
В-третьих, предположим, что
=
0. (2.2.27)
Таким
образом, предполагается, что вероятность
больших изменений |x
– y
| достаточно быстро стремится к нулю
при Δ
→ 0, так
быстро, что убывает быстрее
Δ.
Именно это требование и позволяет
рассматривать x
в системе,
подвергающейся действию случайных
толчков, как непрерывно
меняющуюся величину, т. е. как среднее
за время, гораздо большее промежутка
между двумя толчками. Эти выводы
неприменимы, следовательно, к промежуткам
времени, малым по сравнению со временем
между толчками.
Н
а п р и м е р, вероятность
соударения молекул газа за время τ,
малое по сравнению со временем свободного
пробега θ,
есть 1 – e
–τ/θ
≈ τ/θ
. При
соударении скорость молекулы u
(которая и представляет собой в этом
случае величину x,
описывающую состояние молекулы) меняется
в среднем на конечную величину Δu
= ± a.
Следовательно, для τ
« θ
и условие
не выполнено.
Принимая условие (2.2.27), мы ограничиваемся марковскими процессами, у которых непрерывно не только множество возможных значений, но и само протекание процесса во времени, т. е. смена состояний происходит непрерывно (в вероятностном смысле), без скачков. Такие марковские процессы часто называют диффузионными.
Для таких марковских процессов, преобразуя, с учётом предположений (2.2.25) – (2.2.27), уравнение Смолуховского (2.2.23), получаем
=
. (2.2.28)
Это
параболическое уравнение (типа
диффузионного) называют уравнением
Эйнштейна – Фоккера – Планка или
прямым
(первым) уравнением Колмогорова. По
самому смыслу переходной вероятности,
решение этого уравнения должно быть не
отрицательным (q
(t,
x
|
t0
, x0
) ≥ 0)
и нормированным на единицу (и
)
и удовлетворять начальному условию
q
(t,
x
|
t0
, x0
=
δ(x
– x0). (2.2.29)
Однако, это же решение q (t, x | t0 , x0 ), удовлетворяющее тем же вышеприведённым условиям, удовлетворяет ещё одному уравнению
=
, (2.2.30)
называемому обратным (вторым) уравнением Колмогорова. Уравнение (2.2.30) следует решать в обратную сторону по времени, для t0 ≤ t.
Замечание
2.6. Наглядно
уравнение (2.2.28) можно истолковать
следующим образом. В момент t0
из точки
x0
выходит большое число (ансамбль) частиц,
движущихся независимо друг от друга.
Их концентрация (относительная «частота»)
в точке x
в момент t
будет q
(t,
x
|
t0
, x0).
Поток частиц Q
складывается
из
систематического
(«гидродинамического») потока Aq,
где A
– скорость
систематического
движения в
точке x
в момент t,
и из диффузионного
потока –,
гдеB/2
– коэффициент диффузии: Q
= Aq
–
.
Тогда уравнение Фоккера – Планка – это просто уравнение непрерывности:
,
выражающее сохранения числа частиц.
Пусть в начальный момент t0 задана плотность распределения вероятности p(t0, x) случайной величины ξ(t0). Тогда двумерная плотность распределения вероятности для произвольного момента времени t ≥ t0 и начального момента t0 равна
p2(t, x; t0, x0) = p(t0, x0) q (t, x | t0 , x0), (2.2.31)
а одномерная плотность случайного процесса ξ(t) для момента t равна
p1(t,
x)
=
. (2.2.32)
Если теперь уравнение (2.2.28) Эйнштейна – Фоккера – Планка умножить на p(t0, x0) и проинтегрировать по x0, то в силу (2.2.32) найдём, что плотность p1(t, x) удовлетворяет тому же уравнению
=
. (2.2.33)
Решение этого уравнения должно удовлетворять условиям
p1(t,
x)
≥ 0;
;p1(t,
x
=
p(t0,
x).
П р и м е р ы.
1. Пусть марковский процесс однороден по времени, т. е. q (t, x | t0 , x0) = = q (x | t – t0 , x0). В этом случае в условиях (2.2.25), (2.2.26) функции A и B не зависят от t. Пусть, кроме того, одномерная плотность p1 также не зависит от времени (стационарный марковский процесс). Тогда уравнение (2.2.33) записывается в виде
d/dx{A(x)p1(x) – 1/2∙ d/dx[B(x) p1(x)]} = 0. (2.2.34)
Если на границах изменения x (т. е. в области значений процесса ξ(t)) поток Ap1 – 1/2∙ d/dx(B p1) равен нулю, то в силу (2.2.34) он равен нулю всюду
A(x)p1(x) – 1/2∙ d/dx[B(x) p1(x)] = 0. (2.2.35)
Интегрируя это дифференциальное уравнение (для этого полагаем υ = B p1), получим
p1(x)
=
(2.2.36)
где C – постоянная определяемая из условий нормировки плотности.
Физическим примером, в котором существует стационарное распределение p1(x), является броуновское движение частиц над отражающей границей при наличии силы тяжести. Здесь A = – mg. Ясно, что на отражающей границе выполнено условие обращения потока в нуль, так что уравнение (2.2.35) имеет место. Выражение (2.2.36) с постоянными A и B даёт
p1(x)
==
т. е. получили барометрическую формулу, причём B = 2kT, k – постоянная Больцмана, T – абсолютная температура.
2. Рассмотрим марковский процесс, однородный по координате, т. е. q(t, x | t0 , x0) = q(t, x – x0 | t0). В этом случае в условиях (2.2.25), (2.2.26) функции A и B зависят лишь от t и уравнение (2.2.33) имеет вид
. (2.2.37)
С помощью замены переменных (t, x) → (τ, y) по формулам
y
= x
– x0
–
,
τ
=
,
приходим к уравнению теплопроводности
.
Его решение, удовлетворяющее условиям нормировки и начальным условиям (2.2.29), имеет вид
q(τ, y) = (2πτ) – 1/2exp(– y2/2τ),
или в старых переменных
q(t,
x
– x0
|
t0)
= (2π)
– 1/2exp{–
( x
– x0
–
)2/2
}.
(2.2.38)
Пусть, в частности, A(t) = 0, а B(t) = B – const. Тогда
q(t,
x
– x0
|
t0)
=
.
Отсюда среднее смещение частицы в броуновском движении равно нулю, а средний квадрат смещения равен B(t – t0), то есть растёт пропорционально времени (результат впервые получен Эйнштейном).
И в заключение этого раздела немного о скачкообразных марковских процессах, т. е. процессах, для которых не выполняется ограничение (2.2.27), но и цепями Маркова они считаться не могут. Пример такого процесса приводился ранее: при столкновении молекул газа скорость отдельной молекулы меняется скачком, но множество возможных значений скорости после удара непрерывно. Кроме соударений микрочастиц (молекул, атомов, электронов и т. д.) в эту схему укладываются и квантовые переходы, и некоторые импульсные процессы.
Обозначим a(t, x) – вероятность скачка (из состояния x в начальный момент скачка t) и φ(z | t, x) – плотность условной вероятности значений z, принимаемых в результате скачка (зависимость этих величин не только от предшествующего значения x, но и от времени t, делает процесс ξ(t) уже нестационарным).
Потребуем также выполнения, с точностью до первого порядка относительно Δt соотношения
q(t + Δt, z|t, x) ≈ [1 – a(t, x) Δt]δ(z – x) + a(t, x) Δt∙ φ(z | t, x). (2.2.39)
В предположении (2.2.39) и при некоторых дополнительных требованиях (непрерывности a и φ как функций t и ограниченности a на любом конечном интервале t) из уравнения Смолуховского вытекает прямое интегро-дифференциальное уравнение Колмогорова – Феллера
=
– a(t,
x)∙q(t,
x
|
t0,
x0)
+ ∫a(t,
y)∙φ(x
|
t,
y)∙q(t,
y
|
t0,
x0)dy.
( 2.2.40)
Справедливо и обратное (t0 > t) уравнение Колмогорова – Феллера
=
a(t0,
x0)[
q(t,
x
|
t0,
x0)
– ∫φ(y
|t0,
x0)∙q(t,
x|
t0,
y)dy]. (2.2.41)
При начальном условии
q(t0, x | t0, x0) = δ(x – x0)
оба уравнения имеют единственное решение, причём одно и то же.
В общем случае сочетания в едином процессе диффузионной и скачкообразной составляющих интегро-дифференциальные уравнения Колмогорова – Феллера по прежнему верны, но к их правой части добавляется правая часть первого или второго уравнений Колмогорова (Фоккера – Планка).
Уравнение Колмогорова – Феллера ( 2.2.40) можно записать также в виде классического кинетического уравнения Больцмана, основного уравнения кинетической теории газов. Введём плотность вероятностей скачка в момент времени t из состояния y в состояние x:
u (y | t, x) = a(t, y)∙φ(x | t, y). (2.2.42)
Справедливость этого равенства вытекает из следующего ряда соображений: a(t, y)∙dt – вероятность скачка из y куда-нибудь (то есть вероятность того, что в интервале времени от t до t +dt в y был скачок), а φ(x | t, y)dx – условная вероятность того, что при наличии скачка процесс перешёл в (x, x + dx). Произведение этих вероятностей представляет собой условную вероятность u, как она определена выше. Интегрируя (2.2.42) по всем x, учитывая при этом, что ∫φ(x | t, y)∙d x = 1, и меняя местами переменные (x ↔ y), получаем
∫u (y | t, x)dy = a(t, x). (2.2.43)
Если подставить (2.2.43) в первый член правой части (2.2.40), а (2.2.42) – во второй, то уравнение (2.2.40) примет вид
=
– q(t,
x
|t0,
x0)
∫u
(y
|t,
x)dy
+ ∫q(t,
y
|t0,
x0)u
(y
|t,
x)dy.
(2.2.43)
Это и есть уравнение Больцмана (для одномерного процесса). Из него хорошо видно, что это, по существу, уравнение баланса: скорость изменения q (например, концентрации частиц в точке x) равна разности двух обусловленых скачками ежесекундных потоков – из x в какое либо другое состояние и из всех других состояний в x.