- •Лекціі по дисципліні «дослідження операції»
- •1. Динамічне програмування
- •1.1. Поняття динамічного програмування
- •1.2 Принцип поетапної побудови оптимального керування.
- •1.3 Задача про мінімізацію витрат пального літаком при наборі висоти і швидкості.
- •1.4 Метод функціональних рівнянь.
- •1.5 Задача розподілу ресурсів
- •1.5 Задача заміни устаткування
- •1.3.3. Задача планування виробництва з урахуванням попиту, виробничих потужностей підприємства й обсягу його складських приміщень
- •1.4. Детерміновані процеси
- •1.5. Стохастичні задачі динамічного програмування
- •1.5.1. Задача розподілу ресурсів у стохастичному варіанті
- •1.5.2. Задача видобутку корисної копалини
- •Випадкові процеси. Марковські випадкові процеси
- •2.1. Марковські ланцюги, матриця переходів
- •2.2. Властивості стохастичних матриць
- •2.2.1. Властивості стохастичних матриць і деякі їх різновиди.
- •2.3. Ергодична властивість ланцюгів Маркова. Перехідний режим
- •2.4. Марковський процес із дискретними станами і безупинним часом. Рівняння Колмогорова для ймовірностей станів системи
- •2.4.1. Граничні ймовірності станів для н.М.Л. Теорема Маркова
- •3. Теорія масового обслуговування (т.М.О.) Задача і предмет т.М.О.
- •3.1. Класифікація систем масового обслуговування і їх основні характеристики.
- •3.2. С.М.О. Із відмовами. Рівняння Ерланга
- •3.2.1. Сталий режим обслуговування. Формули Ерланга
- •3.3. Система м.О. З очікуванням
- •3.4. Багатоканальні с.М.О. Із необмеженою чергою
- •4.Теорія ігор
- •4.1. Визначення гри, види моделей
- •4.2. Антагоністична гра у нормальній формі. Принцип гарантованого результату
- •4.3. Проблема рівноваги в грі, чисті і змішані стратегії
- •4.4. Теорія про мінімакс. Усталеність одержуваних рішень
- •4.5. Засоби пошуку оптимальних стратегій. Загальні підходи
- •4.6. Рішення ігор 22, 2n, m2. Графоаналітичний метод
- •4.7. Розв’язання ігор mn
- •5. Елементи теорії статистичних ігор. Поняття про статистичні ігри
- •5.1. Вибір оптимальної стратегії статиста
- •Список літератури
2.4. Марковський процес із дискретними станами і безупинним часом. Рівняння Колмогорова для ймовірностей станів системи
Раніше ми розглянули М.П. із дискретними станами і дискретним (фіксованим) часом переходу системи із стану в стан.
Але на практиці, звичайно, переходи системи зі стану в стан трапляються не у фіксовані, а у випадкові моменти часу. Наприклад, вихід з ладу (відмова) будь-якого елемента апаратури може відбутися в будь-який, не фіксований, момент часу.
Визначення. Марковський процес із дискретними станами і безперервним часом називається безперервним марковським ланцюгом.
Позначимо
Pi(t)
- ймовірність того, що в t момент часу
система буде знаходитися у стані Si
(i = 1; ... ; n). Тоді
Pi(t)
= 1, так як події Si
- повна група несумісних подій. Визначимо
Pi(t).
Для цього треба знати характеристики
процесу, аналогічні перехідним
ймовірностям марковського ланцюга. У
випадку Н.М.Л. Pij(t)=0,
також як і ймовірність будь-якого
окремого значення безперервного
випадкової величини. Тому замість
Pij(t)
вводяться в розгляд щільності ймовірностей
переходу ij.
Визначення. Щільність ймовірності переходу ij
(2.17 )
де Pij ( t) - ймовірність переходу системи із Si у Sj за час t , причому ij визначається тільки при i = j
З (2.17) випливає, що при малому t
Pij ( t) = ij t (2.18)
Визначення Якщо ij(t) = ij, тобто не залежать від t, то М.П. однорідний, якщо ij(t), тобто ij функція часу, то М.П. неоднорідний.
Наведемо приклад розміченого графа станів системи із станами S1, S2, S3, S4, мал.7, якщо ймовірності переходу, з огляду на (18), задаються щільностями переходу ij.
Мал. 7 |
Покажемо, як, знаючи ij, можна визначити ймовірності станів P1(t); P2(t); P3(t); P4(t). Виявляється, ці ймовірності задовольняють системі диференційованих рівнянь, що називається рівняннями Колмогорова. Вирішуючи ці рівняння і знаходять Pi(t) |
Покажемо методику виводу цих рівнянь на розглянутому прикладі. Знайдемо P1(t), тобто що система в момент t буде знаходитися в стані S1. Додамо t мале збільшення t і знайдемо P1(t + t), тобто, що система в момент t + t буде знаходитися в S1. Тоді з урахуванням (18)
P1 (t + t) = P1(t) . P11( t) + P3(t) . P31( t) (2.19)
P11 ( t) = 1 - P12( t) = 1 - 12 t; P31( t) = 31 t
і
P1 (t + t) = P1(t) (1 - 12 t) + P3(t) . 31 t (2.20)
Звідси
(2.21)
Аналогічно можна одержати диференційовані рівняння для інших Pi(t)
P2(t) = -(23 + 24) P2(t) + 12P1(t) +42P4(t)
P3(t) = -( 31 + 34) P3(t) + 23P3(t) (2.22)
P4(t) = - 42 . P4(t) + 24P2(t) + 34P3(t)
Рівняння (2.21) - (2.22) для ймовірностей системи і називаються рівняннями Колмогорова.
Інтегрування цієї системи рівнянь і дає нам шукані Pi(t) з урахуванням початкових умов: у якому стані знаходилась система S у момент t=0. Наприклад, у S1.
Тоді P1(0) = 1; P2(0) = P3(0) = P4(0) = 0
Зауваження 1. З огляду на те, що Pi(t) = 1, одне з рівнянь можна виключити із системи. Наприклад, P4 = 1 - (P1 + P2 + P3) підставити в систему.
Зауваження 2. Всі рівняння із системи (2.21) - (2.22) побудовані по загальному правилу, яке можна сформулювати так:
1) у лівій частині кожного рівняння знаходиться похідна Pi(t), i = 1, ..., n, а права частина містить стільки членів, скільки стрілок пов'язано із даним станом Si;
2) якщо стрілка спрямована із стану, відповідний член має знак мінус, у стояння плюс;
3) кожний член дорівнює добутку щільності ймовірності переходу ij, що відповідає даній стрілці, помноженій на ймовірність того стана, із якого виходить стрілка.
Це плавило загальне для будь-якого числа станів П. і справедливе для будь-якого Н.М.Л.
