
- •Запишите рекуррентные соотношения Беллмана для задачи о замене оборудования.
- •Дайте определение унимодальной функции.
- •Какая идея лежит в основе методов сечений для отыскания экстремума унимодальной функции?
- •Какой сп называется полумарковским?
- •Какой сп называется процессом гибели и размножения?
- •Динамическое программирование: предмет исследования, математическая модель многошагового процесса.
- •Математическое программирование: предмет исследования, общие сведения о численных методах отыскания экстремумов.
- •Метод множителей Лагранжа.
- •Численные методы: общая характеристика методов отыскания экстремума функции одной переменной.
- •Численные методы одномерной минимизации: метод квадратичной интерполяции.
- •Численные методы одномерной минимизации: методы первого и второго порядка.
- •Отыскание экстремума функции n переменных. Градиент, линия уровня, их свойства.
- •Отыскание экстремума функции n переменных. Общая схема методов спуска.
- •Методы наискорейшего и покоординатного спуска для отыскания экстремума функции n переменных.
- •Решение задач математического программирования путем сведения их к задачам безусловного экстремума. Метод штрафных функций.
- •Решение задач математического программирования путем сведения их к задачам безусловного экстремума. Метод барьерных функций.
- •Понятие случайного процесса, классификация.
- •Дискретные цепи Маркова: определение, матрица переходных вероятностей, уравнение Чепмена-Колмогорова.
- •Дискретные цепи Маркова: стационарное распределение вероятностей.
- •Дискретные цепи Маркова: распределение времени пребывания в одном и том же состоянии.
- •Процессы гибели и размножения. Уравнения Чепмена-Колмогорова.
Дискретные цепи Маркова: определение, матрица переходных вероятностей, уравнение Чепмена-Колмогорова.
Дискретной цепью Маркова будем называть последовательность случайных величин, принимающих значение из множества х={0, 1, 2,…, n,…} и обладающих свойством Маркова: Р(xk+1=xk+1| xk=ik, xk-1=ik-1,,…x0=i0)=P(xk+1=ik+1| xk=ik)
Pij(0)=Pij(1)=…=Pij(k)=…Pij – вероятность перехода из состояния i в состояние j.
P – матрица переходных вероятностей.
P=(pij, i=0, n; j=0,n)
P=
Pii
– система остается в том же состоянии.
Pijk - вероятность перехода из i в j за к-шагов.
Pk – вся матрица перехода за k-шагов.
Дискретные цепи Маркова: стационарное распределение вероятностей.
0 1 2 3 4 5
П0 П1…. П5
Пi(k)=( П0(k), П1(k),…, Пn(k))T - вектор распределения вероятностей состояния на к-том шаге.
х0, х1,…хn
П(0) П(1)…П(k)
П(k+1)=PT П(k)
Р – матрица переходных вероятностей за 1 шаг.
П(k)→ 1) существует предел П
k→∞ 2) не существует предел П
Дискретную цепь Маркова назовем эргодической, если существует предельное распределение вероятностей П=
П(k+1)= PT П(k)
k→∞ k→∞
П= PT П
П(0)=P П(1)=PT П П(2)=П….
Если ДЦ является эргодической, то предельное распределение вероятности П является одновременно и стационарной. Если взять его в качестве начального, оно не будет изменяться.
Т: для неприводимой опериодической конечной цепи Маркова всегда существует предельное распределение вероятности - , независящая от начального распределения вероятности. При этом выполняются соотношения:
1) Пj= 1/Mj, о=0,n (все состояния цепи Маркова являются возвратными
2) П= PT П ненулевыми) (*)
Соотношение (*) используется для нахождения стационарного распределения для ДЦМ.
Дискретные цепи Маркова: распределение времени пребывания в одном и том же состоянии.
Рассм. вероятность того, что на протяжении m шагов цепь М будет находиться в некот. i-ом состоянии, а на m+1 покинет это i-ое состояние% Дискретные цепи Маркова: распределение времени пребывания в одном и том же состоянии;
т |
i |
i |
1 |
pii |
1-p |
2 |
Pii2 |
pii(1-pii) |
3 |
Pii3 |
Pii2(1-pii) |
…. |
….. |
….. |
m |
piim |
piim-1(1-pii) |
P(X=m)=pm+1(1-p)- геометр. распределение
Время пребывания дискретной цепи Маркова в одном и том же состоянии распределено по геометр. распределению.
Можно показать, что из cсвойства Маркова для дискрет. цепи вытекает геометрическое распределение времени пребывания в одном и том же состоянии и ,наоборот, если установлено, что для ДУ время пребывания в одном и том же состоянии распределено по геометр. закону, то эта цепь обладает свойством Маркова.
Непрерывные цепи Маркова: определение, уравнение Чепмена-Колмогорова. Непрерывной цепью Маркова будем называть случайный процесс (СП) с дискретным множеством состояний, непрерывно изменяющимся временем и обладающий свойством Маркова. Пусть t и t+Δt – два момента времени, Δt>0. Используя соотношение (3) можем записать
.
Поэтому
.
Рассмотрим предел:
.
Доказано, что при
определенных условиях этот предел
существует. Будем считать, что он
существует и обозначим его
.
(n×n)-матрицу Q называют матрицей интенсивностей однородной НЦМ.
В силу сделанного предположения существует предел
.
Но
.
Следовательно
. (2)
Дифференциальное матричное уравнение (2) называют уравнением Чепмена-Калмогорова для однородных НЦМ.
Непрерывные цепи Маркова: стационарное распределение вероятностей. Свяжем с каждым состоянием i цепи Маркова функцию πi(t)=P(X(t)=i) – вероятность того, что в момент времени t система находиться в состоянии i. Из этих функций составим вектор распределения вероятностей состояний цепи Маркова в момент времени t:
.
Пусть t1,
t2
– два момента времени, t1<t2.
По аналогии с ДЦМ можно показать, что
или
, (3)
где верхний индекс T обозначает операцию транспонирования.
Из (3) следует, что
если π(0)
начальное распределение вероятностей
состояний, то
(4)
Продифференцируем равенство (4) и используем уравнение Чепмена –Колмогорова (2):
.
Таким образом
получено дифференциальное уравнение,
которому удовлетворяет распределение
вероятностей состояний в произвольный
момент времени:
, (5)
которое
вместе с начальным состоянием π(0)
равенством
используется для отыскания функций
.
Однородную непрерывную цепь Маркова назовем эргодической, если существует ненулевой предел .
Вектор π будем называть предельным распределением вероятностей.
Очевидно, если взять предельное распределение вероятностей в качестве начального, то распределение вероятностей не будет изменяться во времени. Отсюда следует, что предельное распределение вероятностей π одновременно является стационарным распределением вероятностей состояний однородной НЦМ.