
- •Московский государственный открытый университет коломенский институт
- •1. Введение.
- •2. Основные понятия теории марковских процессов.
- •3. Классификация состояний марковских цепей
- •4. Марковские процессы принятия решений
- •5. Модель динамического программирования с конечным числом этапов
- •6. Модель с бесконечным числом этапов.
- •7. Метод полного перебора
- •8. Метод итерации по стратегиям
- •9. Порядок работы с программой ²Имитационное моделирование марковского процесса на бесконечном горизонте планирования²
- •10. Задание к лабораторной работе.
- •Структура отчета
- •12 Литература.
3. Классификация состояний марковских цепей
Определение: марковская цепь считается неприводимой, если любое состояние Ej может быть достигнуто из любого другого состояния Ej за конечное число переходов, то есть при i ¹ j:
> 0 при 1£ n £ ¥.
При этом все состояния цепи называются сообщающимися.
Определение: множество С состояний в марковской цепи называется замкнутым, если система, однажды оказавшаяся в одном из состо-яний этого множества, будет находится в нем в течении бесконечного интервала времени.
Частным случаем замкнутого множества является единственное состояние Ej с переходной вероятностью pij = 1. Такое состояние Ej называется поглощающим.
Пример. Рассмотрим следующую марковскую цепь, заданную графом состояний:
1
1/4
1/2
2
1/3
1/4
1
1/3
1/3
Тогда соответствующая матрица переходных вероятностей имеет вид:
.
Здесь состояние 4 - поглощающее и образует замкнутое множество. Цепь не является неприводимой.
Пусть
система находится в состоянии Ej
. Число
шагов, за которое система возвращается
в состояние Ej
называется первым временем возвращения.
Обозначим через
вероятность того, что первое время
возвращения соответствует n-му
шагу. Тогда при заданной матрице
переходных вероятностей P
= {pij }
формулы для вычисления
определяется так:
или
По индукции можно доказать, что:
Тогда
.
Вероятность по крайней мере одного возвращения в состояние Ej:
.
Система обязательно вернется в состояние Ej , если fjj = 1.
Обозначим через mjj среднее время возвращения, тогда по определению математического ожидания:
.
Если fjj < 1, то неизвестно, вернется ли система в состояние Ej, значит mjj = ¥.
Вводится следующая классификация состояний марковской цепи:
состояние является невозвратным, если fjj < 1, то есть mjj = ¥;
состояние возвратно , если fjj = 1;
возвратное состояние является нулевым, если mjj = ¥ и ненулевым, когда mjj < ¥ (то есть конечно);
состояние называется периодичным с периодом t, если возвращение в него возможно только через число шагов t, 2t, … . Это значит, что если n не делится на t без остатка, то
;
возвратное состояние называется эргодическим, если оно ненулевое и апериодичное.
Любая неприводимая цепь Маркова является эргодической, если все её состояния - эргодические. В этом случае распределение полных вероятностей всегда однозначно сходится к предельному (финальному) распределению при n ® ¥, которое не зависит от исходных вероятностей .
Имеет место следующая теорема. Все состояния в неприводимой бесконечной марковской цепи могут принадлежать к одному из следующих трех классов: невозвратных, возвратных нулевых или возвратных ненулевых состояний. Во всех случаях все состояния являются сообщающимися и имеют один и тот же период. В частном случае цепи с конечным числом состояний она не может содержать только невозвратные состояния или нулевые состояния.
Ранее
указывалось, что при числе переходов n
®
¥,
полные вероятности системы
перестают
зависеть от
.
Имеет место теорема: если в неприводимой апериодической марковской цепи:
все состояния - невозвратные или нулевые, то pjj ® 0 при n ® ¥ для всех i и j и предельное распределение не существует;
все состояния эргодические, то
где bj - предельное (установившееся) распределение. Вероятности bj существуют однозначно и не зависят от . Величинs bj определяются из уравнений:
Одно из этих уравнений является избыточным.
Среднее время возвращения в состояние j при этом определяется формулой:
.
Пример.
Рассмотрим марковский процесс со следующей матрицей переходных вероятностей:
.
Определим предельные вероятности из следующей системы уравнений:
Любое из первых двух уравнений системы может быть отброшено. После этого получаем систему двух уравнений относительно двух неизвестных. Решение системы имеет вид:
b1 = 0.4286 , b1 = 0.5714 .
Тогда
.
Если цепь Маркова имеет матрицу переходных вероятностей Р такую, что:
,
то матрица Р называется дважды стохастической. Для дважды стохастической матрицы имеет место соотношение:
для
всех j,
где S - размер матрицы { pij }.
Пример.
Цепь Маркова имеет следующую матрицу переходных вероятностей:
и
является дважды стохастической. Так
как S = 3,
то:
,
j = 1, 2, ... .