- •Лекціі по дисципліні «дослідження операції»
- •1. Динамічне програмування
- •1.1. Поняття динамічного програмування
- •1.2 Принцип поетапної побудови оптимального керування.
- •1.3 Задача про мінімізацію витрат пального літаком при наборі висоти і швидкості.
- •1.4 Метод функціональних рівнянь.
- •1.5 Задача розподілу ресурсів
- •1.5 Задача заміни устаткування
- •1.3.3. Задача планування виробництва з урахуванням попиту, виробничих потужностей підприємства й обсягу його складських приміщень
- •1.4. Детерміновані процеси
- •1.5. Стохастичні задачі динамічного програмування
- •1.5.1. Задача розподілу ресурсів у стохастичному варіанті
- •1.5.2. Задача видобутку корисної копалини
- •Випадкові процеси. Марковські випадкові процеси
- •2.1. Марковські ланцюги, матриця переходів
- •2.2. Властивості стохастичних матриць
- •2.2.1. Властивості стохастичних матриць і деякі їх різновиди.
- •2.3. Ергодична властивість ланцюгів Маркова. Перехідний режим
- •2.4. Марковський процес із дискретними станами і безупинним часом. Рівняння Колмогорова для ймовірностей станів системи
- •2.4.1. Граничні ймовірності станів для н.М.Л. Теорема Маркова
- •3. Теорія масового обслуговування (т.М.О.) Задача і предмет т.М.О.
- •3.1. Класифікація систем масового обслуговування і їх основні характеристики.
- •3.2. С.М.О. Із відмовами. Рівняння Ерланга
- •3.2.1. Сталий режим обслуговування. Формули Ерланга
- •3.3. Система м.О. З очікуванням
- •3.4. Багатоканальні с.М.О. Із необмеженою чергою
- •4.Теорія ігор
- •4.1. Визначення гри, види моделей
- •4.2. Антагоністична гра у нормальній формі. Принцип гарантованого результату
- •4.3. Проблема рівноваги в грі, чисті і змішані стратегії
- •4.4. Теорія про мінімакс. Усталеність одержуваних рішень
- •4.5. Засоби пошуку оптимальних стратегій. Загальні підходи
- •4.6. Рішення ігор 22, 2n, m2. Графоаналітичний метод
- •4.7. Розв’язання ігор mn
- •5. Елементи теорії статистичних ігор. Поняття про статистичні ігри
- •5.1. Вибір оптимальної стратегії статиста
- •Список літератури
1.4 Метод функціональних рівнянь.
Як показав Р. Бельман, знаходження оптимального рішення багатоетапного процесу зводиться до вирішення деякого функціонального рівняння. Роздивимося приклад багатоетапного процесу розподілу. Нехай є деяка кількість засобів х, які треба вкласти в розвиток двох неоднорідних підприємств. Відомо, якщо в перше підприємство вкласти у, а в 2-е - х - у засобів, то прибуток буде відповідно g(у) і h(х-у). Необхідно вибрати у так, щоб загальний прибуток
W1(х; у) = g(y) + h (x-y) (4.1.) був максимальний.
Таким чином, потрібно визначити max W1 (x; y)
Якщо g(y) і h(x-y) функції безперервні для х > 0, то така задача має рішення. Цей процес одноетапний.
Зауваження. х і g(y) можуть вимірюватися в різних величинах наприклад, х - грошова сума, g(y) кількість людино-годин, зекономлених у результаті застосування машин, куплених за засоби у.
Ускладнимо задачу. Розглянемо двохетапний процес. Припустимо, що за рахунок витрат, необхідних для одержання прибутку g(y), початкова кількість засобів зменшується до а. у, 0 < a < 1, аналогічно для 2-го підприємства: х-у зменшується до b(х-у), 0<b<1. Таким чином, після здійснення одноетапного процесу залишок засобів складає ау + b(х-у). Повторимо процес розподілу сумарного залишку, вважаючи, що ау + b(х-у) = х1 = у1 + (х1-у1), де 0 < y1 < x1. У результаті цього розподілу на 2-ом етапі одержимо прибуток g(y1) + h(x1-y1), а повний прибуток за два етапи W2(x, y, y1) = g(y) + h(x-y) + g(y1) + h(x1-y1), причому max W2 (x, y, y1) знаходиться по двохмірної області 0 < y < x, 0 < y1 < x1.
Роздивимося N-етапний процес, у якому операція розподілу повторюється послідовно N разів. Визначимо повний прибуток від цього процесу
WN(x; y; y1; ... ; yN-1)=g(y)+h(x-y)+g(y1)+h(x1-y1)+ ... +g(yN-1)+h(xN-1-yN-1) (1.1)
де x1 = ay + b(x-y); 0 < y < x
x2 = ay1 + b(x1 - y1) 0 < y1 < x1 (1.2)
xN-1 = ayN-2 + b(xN-2 - yN-2) 0 < yN-2 < xN-2 0 < yN-1 < xN-1
Одержуємо max WN по області (1.2.), N - мірної області. Рішення такої задачі складне. Тому вирішимо задачу поетапно, наслідуючи принципу умовної оптимальності в N-етапному процесі. Визначимо функцію fN(x) як максимум прибутку, отриманого від N-етапного процесу, що починається з розміру х, для N=1, 2, ..., і x > 0, тобто fN(x) = max WN(x; y; y1; ... ; yN-1) (1.3)
0<y<x
f1(x) = max g(y) + h(x-y) (1.4)
0<y<x
Розглянемо двохетапний процес. Повний прибуток складається з прибутків 1 і 2-го етапів, причому на 2-ому етапі для розподілу залишається сума ау+b(x-y). Необхідно одержати максимальний прибуток, тому якою б не була обрана у, сума, що залишилася до наступного етапу ау + b(х-у), повинна бути використана щонайкраще (принцип умовної оптимальності), тобто від другого етапу одержимо прибуток f1[ay + b(x-y)]. Тоді повний max прибуток за два етапи висловиться рекурентним співвідношенням
f2(x)
= max {g(y) + h(x-y) + f1[ay
+ b(x-y)]} (1.5)
0<y<x
Міркуючи аналогічно, у випадку N-етапного процесу отримуємо основне функціональне рівняння
f(x) = max {g(y) + h(x-y) + fN-1[ay + b(x-y)]} (1.6)
0<y<x
Використовуючи (1.6.) знаходимо f1, потім f2 і т.д., причому на кожному k-етапі одержуємо й оптимальне уk(х).
Застосування розглянутого методу функціональних рівнянь до рішення задач Д.П. дозволяє призвести рішення однієї N-мірної задачі до послідовності однотипних рішень N одномірних задач.
Якщо врахувати, що в Д.П. процес розглядається від кінця до початку, то типове функціональне рівняння, що описує дискретний процес має вигляд
fN(x) = max [gN(yN) + fN-1(x-yN)] (1.7)
0<yN<x
де f - критерій процесу, N - число етапів, х - змінна, що характеризує стан процесу на N-ому етапі, fN(x) - результуюче значення критерію, що може бути отримане за N- етапів, що залишилися, починаючи зі стану x, yN - керуюча перемінна, від вибору якої залежить величина fN; gN(xN) - величина критерію, отримана на N-ому етапі при оптимальному виборі yN, 0<yN<x; fN-1 (x-yN) - результуюче оптимальне значення критерію за N-1 етапів , що залишилися, починаючи зі стану x - yN.
Нехай на N-ому етапі обране оптимальне рівняння yN = yN*. Тоді стан системи на N-1 етапі описується функціональним рівнянням
fN-1(x-yN*) = max [gN-1(yN-1) + fN-2(x-y*-yN-1)] (1.8)
0<yN-1 <x-yN*
