- •Московский государственный открытый университет коломенский институт
- •1. Введение.
- •2. Основные понятия теории марковских процессов.
- •3. Классификация состояний марковских цепей
- •4. Марковские процессы принятия решений
- •5. Модель динамического программирования с конечным числом этапов
- •6. Модель с бесконечным числом этапов.
- •7. Метод полного перебора
- •8. Метод итерации по стратегиям
- •9. Порядок работы с программой ²Имитационное моделирование марковского процесса на бесконечном горизонте планирования²
- •10. Задание к лабораторной работе.
- •Структура отчета
- •12 Литература.
1. Введение.
Задачи оптимального управления очень сложны для формализации и аналитического исследования. Системы марковского типа представляют из себя простейший пример управляемого объекта. Ограничения, накладываемые на исследуемый процесс в этом случае достаточно жесткие и для большинства реальных систем не выполняются. Тем не менее выводы, которые следуют из теории оптимального управления в марковских системах имеют большое значение для теории оптимального управления в целом, так как являются основой разработки вычислительных алгоритмов управления для более сложных объектов и позволяют определить основные тенденции оптимального управления конкретной системой.
2. Основные понятия теории марковских процессов.
Рассмотрим
дискретные моменты времени {tk},
k = 1, 2, ... .
Пусть
-
случайные величины (СВ), характеризующее
состояние системы в момент времени tk
.
Семейство СВ {
},
k=1, 2,...
образует стохастический процесс
(случайный процесс). Состояния системы,
в которых она может находиться в момент
tk,
то есть допустимые значения случайных
величин
,
образуют полную группу несовместных
событий. Число состояний системы может
быть конечным или бесконечным.
Система, состояние которой описывается стохастическим процессом, называется стохастической.
Марковский процесс описывает поведение стохастической системы, в которой наступление некоторого состояния зависит только от непосредственно предшествующего состояния и не зависит от других предшествующих состояний. Если t0 < t1 < ... < tn - моменты времени, то семейство случайных величин { } является марковским процессом, при условии, что оно обладает следующим марковским свойством:
при
всех возможных значениях
.
Вероятность
называется переходной вероятностью.
Она представляет собой условную
вероятность того, что система находится
в состоянии xn
в момент
времени tn
, если
известно, что в момент tn-1
она находилась в состоянии xn-1
. Эту
вероятность еще называют одношаговой
переходной вероятностью, так как она
описывает изменение состояния системы
между соседними моментами времени.
Аналогично, m - шаговая переходная вероятность определяется следующим образом:
.
Пусть
E1
, ... , Ej
, ... , EN
представляют
собой полную группу несовместных событий
и обозначают возможные состояния системы
в любой момент времени. В момент t0
система
может находится в любом из состояний
Ej
. Обозначим
- вероятность того, что в начальный
момент времени t0
система
находится в состоянии Ej.
Пусть данная система является марковской.
Для упрощения дальнейших преобразований
будем для обозначения состояния Ej
использовать обозначение j.
Определим вероятность:
как одношаговую вероятность перехода из состояния i в момент времени tn-1 в состояние j в момент tn . Будем считать вероятности pij стационарным по времени. Вероятности pij можно представить в виде матрицы:
Матрица Р называется матрицей переходных вероятностей (стохастической матрицей).
Вероятности pij должны удовлетворять условиям:
,
pij
³
0 для любых
i и
j.
Определение:
матрица переходных вероятностей P
совместно с исходными вероятностями
полностью задает марковскую цепь, то
есть процесс перехода системы из
начальных состояний в последующие.
Обозначим
- полные вероятности состояний системы
после n
переходов,
то есть в момент tn.
Величины
вычисляется следующим образом:
-
по формуле полной вероятности;
где
- двухшаговая вероятность или вероятность
второго порядка (вероятность перехода
из состояния k
в состояние i
за 2 шага).
Аналогично, по индукции можно показать, что:
где
- есть n-шаговая
переходная вероятность, определяемая
рекуррентной формулой:
.
В общем виде для перехода из состояния i на шаге m в состояние j на шаге n используются уравнения:
,
называемые уравнениями Колмогорова-Чепмена.
Если вероятности рассматривать как элементы матриц перехода высших порядков { }, то матрица перехода второго порядка вычисляется по формуле:
или в общем виде:
,
то есть переходные вероятности можно определить, возводя в соответствующую степень одношаговую матрицу переходных вероятностей.
Если полные вероятности определены в векторной форме:
,
то для их вычисления используется формула:
.
Рассмотрим следующую марковскую цепь с двумя состояниями:
с вектором начальных вероятностей состояний системы:
.
Определим
полные вероятности состояний системы
.
Предварительно вычислим соответствующие матрицы переходных вероятностей:
Тогда полные вероятности состояний системы будут равны:
В
матрице Р8
строки
незначительно отличаются друг от друга
и соответствующих элементов вектора
.
Это общий результат марковских цепей:
долгосрочные полные вероятности не
зависят от начального состояния (то
есть от вектора
).
Эти вероятности называются установившимися.
