
- •Исследование операций
- •Основные определения
- •Примеры типичных задач исследования операций. Показатель эффективности.
- •Общая постановка задачи исследования операций Детерминированный случай
- •Постановка задачи в условиях неопределенности
- •Исследование операций случайных процессов с использованием цепей Маркова и уравнений Колмогорова Марковские случайные процессы
- •Марковские случайные процессы с дискретными состояниями и дискретным временем
- •Однородная марковская цепь
- •Неоднородная марковская цепь
- •Марковские случайные процессы с дискретными состояниями и непрерывным временем. Уравнения Колмогорова для вероятностей состояний.
- •Правила формирования уравнений Колмогорова
- •Пример построения и решения уравнений Колмогорова для однородной непрерывной марковской цепи
- •Теория игр и принятия решений Предмет и задачи теории игр. Основные понятия
- •Антагонистические матричные игры Платежная матрица
- •Нижняя и верхняя цена игры. Принцип минимакса
- •Устойчивые и неустойчивые стратегии. Игры с седловой точкой. Чистые стратегии
- •Целесообразность случайного выбора стратегии в игре без седловой точки
- •Смешанные стратегии. Основная теорема теории игр
- •Решение игры без седловой точки. Поиск оптимальных смешанных стратегий
- •Пример решения задачи на нахождение оптимальных смешанных стратегий
- •Графическое решение игр вида 2×n
Марковские случайные процессы с дискретными состояниями и дискретным временем
Случайный процесс называется процессом с дискретным временем, если переходы системы из состояния в состояние возможны только в строго определенные, заранее фиксированные моменты времени t1, t2, … . В промежутке времени между этими моментами система сохраняет свое состояние.
Рассмотрим физическую систему S, которая может находиться в любом из множества состояний: S1, S2, …, Sn. Моменты перехода из состояния в состояние фиксированы: t1, t2, t3, … , tk , … .
Будем называть эти моменты шагами и рассматривать случайный процесс, происходящий в системе S как функцию целочисленного аргумента: 1, 2, …, k, … (номер шага). Случайный процесс, происходящий в системе, состоит в том, что в последовательные моменты времени t1, t2, t3, … система S оказывается в тех или других состояниях, ведя себя, например, следующим образом:
.
В общем случае в моменты времени t1, t2, t3, … система может не только менять состояние, но и оставаться в прежнем, например:
.
Обозначим через
событие, состоящее в том, что после k-го
шага система находится в состоянии Si.
Очевидно, что при любом k
события
образуют
полную группу (то есть система
обязательно будет находиться в одном
из состояний) и несовместны (система не
может находиться в двух и более состояниях
в один момент времени).
Процесс, происходящий в системе, можно представить как последовательность (цепочку) событий, например:
Такая случайная последовательность
событий называется марковской цепью,
если для каждого шага вероятность
перехода из любого состояния
в
не зависит от того, когда и как система
пришла в состояние
.
Марковская цепь описывается с помощью
вероятностей состояний. Обозначим
через
вероятность того, что после k-го
шага система окажется в состоянии
:
.
Например, вероятности состояний после первого шага:
,
вероятности состояний после второго шага:
,
…
вероятности состояний после k-го шага:
Очевидно, что для каждого шага k сумма вероятностей состояний равна единице:
,
так как это вероятности несовместимых событий, образующих полную группу.
Для удобства расчетов запишем вероятности состояний системы после k-го шага в виде вектора вероятностей состояний v(k):
Теперь можно сформулировать основную
задачу при исследовании марковских
процессов: определить вероятности
состояний системы
(элементы вектора v(k))
для любого шага k.
Иначе говоря, необходимо ответить на
вопрос: какова вероятность того, что
после шага k система
окажется в состоянии
,
какова вероятность, что окажется в
состоянии
и т.д.
В качестве примера рассмотрим некоторую систему S со следующим графом состояний:
Рис. 5.
Случайный процесс (марковскую цепь) можно представить себе так, как будто точка, изображающая систему, случайным образом перемещается (блуждает) по графу состояний, перескакивая из состояния в состояние в моменты времени t1, t2, … , а иногда и задерживаясь на какое-то число шагов в одном и том же состоянии. Например, последовательность переходов
можно изобразить на графе состояний пунктирными дугами, взвешенными номерами шагов:
Рис. 6.
(Задержка системы в состоянии на третьем шаге обозначена петлей при вершине .)
Для любого шага (момента времени t1, t2, … , tk, … или номера 1, 2, … , k, … ) существует вероятности перехода системы из любого состояния в любое другое (некоторые из них равны нулю, если непосредственный переход за один шаг невозможен), а также вероятности задержки системы в данном состоянии. Эти вероятности называются переходными вероятностями марковской цепи и обозначаются pij (вероятность перехода из состояния в за один шаг).
Разница между и pij:
– вероятность состояния (вероятность, что после k-го шага система окажется в состоянии );
pij – вероятность перехода (вероятность перехода из состояния в за один шаг).
Переходную вероятность pij
можно записать как условную вероятность
наступления события
при условии, что перед этим произошло
событие
:
.
Существует два вида марковских цепей:
однородная – если переходные вероятности не зависят от номера шага (одинаковые для каждого шага);
неоднородная – если переходные вероятности зависят от номер шага (различаются от шага к шагу).