
- •36. Определение случайного процесса.
- •37. Статистические средние характеристики случайных процессов.
- •38. Сходимость в среднем квадратичном для случайных процессов.
- •39. Непрерывность случайных процессов.
- •40. Дифференцируемость случайных процессов.
- •41. Интегрирование случайных процессов.
- •42. Стохастические обыкновенные дифференциальные уравнения.
- •43. Разложение случайных процессов по ортогональным функциям.
- •44. Процессы с независимыми приращениями.
- •45. Обобщенный пуассоновский процесс.
- •46. Гауссовский случайный процесс.
- •47. Винеровский случайный процесс.
- •48. Марковские случайные процессы и цепи маркова определения.
- •49. Однородные цепи Маркова.
- •50. Уравнения Чепмена-Колмогорова.
- •51. Нахождение вероятностей переходов с помощью производящих функций.
- •52. Классификация состояний цепи Маркова по арифметическим свойствам вероятностей перехода
- •53. Классификация состояний по асимптотическим свойствам переходных вероятностей
- •54.Эргодические цепи Маркова
- •55. О средних временах переходов между состояниями
- •56. Стационарные цепи Маркова
- •57. Оптимальные стратегии в марковских цепях
- •58. Некоторые определения и их свойства.
- •59. Система диф.Ур-ий Колмогорова для однородной цепи Маркова с конеч.Числом состояний.
- •60. Процесс гибели и размножения
- •63. Обобщенное уравнение Маркова
- •64.Диффузионные процессы
- •65. Обратное уравнение Колмогорова
56. Стационарные цепи Маркова
Всякое
неотрицательное решение
,
удовлетворяющее условию нормировки,
принято называть стационарным,
или
инвариантным,
распределением
вероятностей Марковской цепи с матрицей
переходных вероятностей
.
Опр.
Набор
чисел
называется
стационарным
распределением цепи Маркова с дискретным
временем, если:
1)
является распределением вероятностей,
т.е.
.
2)
имеет место равенство
.
В
частности, если начальное распределение
совпадает со стационарным, то на любом
шаге цепь Маркова будет иметь стационарное
распределение, поэтому такая цепь
Маркова называется стационарной.
Т.1
(эргодическая
теорема Маркова- Бернштей-на). Если
существуют такие
и
,
что
выполняется неравенство
,то
цепь Маркова является эргодической;
существует единственное стационарное
распределение этой цепи, совпадающее
с эргодическим.
Опр.
Цепь
Маркова с дискретным временем называется
неприводимой,
если
такое, что
.
Т.2 (эргодическая теорема Феллера). Неприводимая апериодическая цепь Маркова относится к одному из следующих двух классов:
а) все состояния цепи невозвратны (либо нулевые), в этом
случае
,
и
не существует стационарного распределения
цепи;
б) все состояния цепи положительны, в этом случае
при этом
является стационарным распределением
цепи и не существует других ее стационарных
распределений.
Т.3
(эрг-кая
т. Фостера). Для
того чтобы неприводимая апериодическая
цепь Маркова была эргодич-на, необходимо
и достаточно, чтобы система уравнений
имела
нетривиальное решение
,
такое, что
При этом существует единственное
стационарное распределение, которое
совпадает с эргодическим.
Теорема
10.10 (эрг-кая
т. Маркова). Для
того, чтобы неприводимая апериодическая
цепь Маркова была эргодична, достаточно
существования
,
натурального
числа i0
и
набора неотрицательных чисел х0,х1,х2,...
таких, что
для
,
для
.
При этом существует единственное стационарное распределение, совпадающее с эргодическим.
57. Оптимальные стратегии в марковских цепях
Рассмотрим
цепь Маркова с конечным множеством
состояний
и матрицей вероятностей переходов
.
Пусть при переходе из состояния
.
в состояние ik
мы
получаем некоторое вознаграждение rjk
. Например,
пусть
,
-
различные места в городе; переход из
в ik
означает
перевозку пассажиров такси по данному
маршруту; тогда
-
это прибыль, входящая в плату за проезд
из (
)
в (ik).
Найдем общее вознаграждение, которое
следует ожидать после переходов цепи
Маркова за п
шагов.
Предположим,
что цепь Маркова находится в состоянии
и пусть
-
суммарное среднее вознаграждение за п
шагов,
если вначале цепь находилась в состоянии
.
Тогда
средний выигрыш после первого шага.
Если после первого шага цепь Маркова
находится в состоянии
,
то средний выигрыш на оставшихся п-1
шагах
составит
.
Поэтому полный средний выигрыш за п
шагов
равен
.
Введем
матричные обозначения
,
.
Тогда в матричной форме последнее соотношение может быть переписано как
V(n) = Q + PV(n-1).
В
стационарном режиме среднее вознаграждение
за один шаг может быть найдено в виде
,
(10.22) где
,
финальные вероятности состояний.