- •Лекціі по дисципліні «дослідження операції»
- •1. Динамічне програмування
- •1.1. Поняття динамічного програмування
- •1.2 Принцип поетапної побудови оптимального керування.
- •1.3 Задача про мінімізацію витрат пального літаком при наборі висоти і швидкості.
- •1.4 Метод функціональних рівнянь.
- •1.5 Задача розподілу ресурсів
- •1.5 Задача заміни устаткування
- •1.3.3. Задача планування виробництва з урахуванням попиту, виробничих потужностей підприємства й обсягу його складських приміщень
- •1.4. Детерміновані процеси
- •1.5. Стохастичні задачі динамічного програмування
- •1.5.1. Задача розподілу ресурсів у стохастичному варіанті
- •1.5.2. Задача видобутку корисної копалини
- •Випадкові процеси. Марковські випадкові процеси
- •2.1. Марковські ланцюги, матриця переходів
- •2.2. Властивості стохастичних матриць
- •2.2.1. Властивості стохастичних матриць і деякі їх різновиди.
- •2.3. Ергодична властивість ланцюгів Маркова. Перехідний режим
- •2.4. Марковський процес із дискретними станами і безупинним часом. Рівняння Колмогорова для ймовірностей станів системи
- •2.4.1. Граничні ймовірності станів для н.М.Л. Теорема Маркова
- •3. Теорія масового обслуговування (т.М.О.) Задача і предмет т.М.О.
- •3.1. Класифікація систем масового обслуговування і їх основні характеристики.
- •3.2. С.М.О. Із відмовами. Рівняння Ерланга
- •3.2.1. Сталий режим обслуговування. Формули Ерланга
- •3.3. Система м.О. З очікуванням
- •3.4. Багатоканальні с.М.О. Із необмеженою чергою
- •4.Теорія ігор
- •4.1. Визначення гри, види моделей
- •4.2. Антагоністична гра у нормальній формі. Принцип гарантованого результату
- •4.3. Проблема рівноваги в грі, чисті і змішані стратегії
- •4.4. Теорія про мінімакс. Усталеність одержуваних рішень
- •4.5. Засоби пошуку оптимальних стратегій. Загальні підходи
- •4.6. Рішення ігор 22, 2n, m2. Графоаналітичний метод
- •4.7. Розв’язання ігор mn
- •5. Елементи теорії статистичних ігор. Поняття про статистичні ігри
- •5.1. Вибір оптимальної стратегії статиста
- •Список літератури
1.5 Задача розподілу ресурсів
У розглянутої раніше задачі передбачалося, що повний прибуток залежить тільки від початкової кількості засобів і числа етапів N і не залежить від часу початку процесу. Припустимо, що в результаті розподілу засобів х на величини y і х-у на k-ому році отриманий прибуток gk(x; y) і для подальшого розподілу залишилася кількість засобів rk(x; y). Необхідно визначити керування, що дозволяє максимізувати повний прибуток N-етапного процесу.
Нехай ф. gk(x; y) і rk(x; y) неперервні для x > 0 і 0 < y < x; а rk(x; y) у цій області 0 < rk(x; y) < ax; а < 1 для k =1, 2.
Нехай fk N(x) повний прибуток від N - етапного процесу, що починається з величини х на k-ом році, якщо дотримувався принцип оптимальності. Тоді при N=1
fk1(x) = max gk(x; y)
0<y<x
при N > 2, аналогічно міркуючи, отримаємо
fkN(x) = max {[gk(x;y) + fk+1, N-1 [rk(x;y)]}
0<y<x
Для спрощення запису замість подвійних індексів будемо використовувати один. Положимо, що кожному етапу відповідають значення k = 1; 2; ...; N і визначимо fk(x) як повний прибуток від процесу, що починається з величини х на k-ому етапі і закінчується на N-ому етапі, якщо дотримується принцип оптимальності. Тоді маємо такі функціональні рівняння:
при k=N
fN(x) = max gN(х; y) (1.9)
0<y<x
при k = N - 1, ... , 2, 1
fk(x) = max {[gk(x;y) + fk+1 (rk+1(xk;y)] (1.10.)
0<y<x
Приклад
1.2. Для розвитку двох галузей 1 і II на 5
років виділено х
засобів.
Кількість засобів
у, вкладених у галузь I, дозволяє одержати
за один рік прибуток
(у)
= у2
і зменшується до розміру
(у)
=0,75у.
Кількість засобів
х
- у, вкладених у галузь II, дозволяє
одержати за один рік прибуток (х-у)
= 2(х-у)2
і
зменшується до величини
(х-у)
= 0,3 (х-у).
Необхідно так розподілити виділені ресурси між галузями по роках планованого періоду, щоб повний прибуток був максимальний.
Рішення. П'ять років розіб'ємо на 5 етапів, тобто N=5; k = 1; 2, ..., 5, хоча процес безперервний, величини х та у для наочності будемо позначати індексами.
Умовну оптимізацію почнемо з 5-го етапу, розподіляючи залишок засобів ху. Для цього визначимо оптимальне значення у5. Складемо вираження для (4.9.)
g5(x4;
x5)
=
(у5)
+
(х4-у5)
= y52
+
2(x4-x5)2
f5(x4) = max [y52 + 2(x4 - y5)2].
0<y<x
Так як для 5-го етапу х4 є постійною величиною, то потрібно знайти max функції на відрізку [0; x4].
= 2у5
- 4(х4
- у5)
= 0; у5
=
х4.
=
q4
(х4;
у5)
= 6 > 0; тобто точка
у5
=
х4
точка
min.
Визначимо значення ф. на кінцях: q5 (x4; 0) = 2x42;
q5 (x4; x4) = x42.
Одержимо, що ф. q5 (x4; х5) приймає max при у5 = 0, отже f5(x4) = 2x42.
Таким чином, max прибуток на 5-ому етапі досягається при вкладенні всіх засобів, що залишилися, у II галузь.
Для 4-го етапу, використовуючи рівняння (4.10)
Тут х4 - сума засобів , що залишилися, якщо на 4-ому етапі було витрачено у4 засобів у галузі I і х3-у4 у галузі II.
Таким чином х4 = 0,75у4 + 0,3 (х3 - у4).
Тоді
Для рішення знаходимо
= 2у4
- 4(х3
- у4)
+ 4(0,75-0,3) [(0,75y4 +
0,39x3
- y4)]
= 0;
6,81 y4 - 3,46x3 = 0 y4 = 0,5x3
=
6,81 > 0, тобто це
точка
min f4(x3)
= 1,3 x32.
Знаходимо значення z4 на кінцях [0; x3]
z4(x3; 0) = 2x32 + 0,18x32 = 2,18 x32
z4(x3; x3) = x32 + 1,125x32 = 2,125 x32
Тоді max z4 при у4 = 0 і f4(x3) = 2,18 x32
Отже, максимальний прибуток на 4 етапі буде, якщо на його початку всі засоби, що залишилися, укласти в II галузь.
Запишемо функціональне рівняння для III-го етапу
Тут х3 - сума засобів , що залишилися після 3 етапу, якщо на 3-му етапі було витрачено у3 засобів у галузі I і х2-у3 у II галузі.
х3 = 0,75у3 + 0,3 (х2 - у3).
Тоді
Вирішуючи його, одержуємо: у точці min z3=0,5х2; z3(x3; 0,5х2)=1,35x22 при у3=0 z3(x2; 0)=2,2x22 при у3 = х2 z3(x2; x2) = 2,23x22
Тоді f3(x2) = 2,23 x22
Одержимо max прибуток на 3-му етапі при вкладенні всіх засобів х2, що залишилися у I-у галузь.
Запишемо функціональне рівняння для II-го етапу
Так як х2 = 0,75у2 + 0,3 (х1 - у2), то
Вирішуючи це рівняння, одержуємо min z2 = 1,36х12 при у2 = 0,5х1 z2(x1; 0) = 2,21 x12; z2(x1; x1) = 2,25x12. Отже, f2(x1) = =2,25 x12
Таким чином, для одержання max прибутку на 2-ому етапі всі засоби, що залишилися після І етапу вкласти в I-у галузь.
Запишемо функціональне рівняння для I-го етапу
Вирішуючи, маємо:
z1(x;0)=2,2x2
z1(x;
x) = 2,27x2
Тобто для одержання максимального прибутку на І-ому етапі всі засоби треба вкласти в I-у галузь.
Висновок. Оптимальне керування процесом розподілу виділених засобів полягає в наступному: на протязі перших трьох років усі засоби варто вкладати тільки в I-у галузь, а на протязі останніх двох - у II галузь.
Визначимо величини засобів, що перерозподіляються для кожного етапу, з огляду на те, що знайдене оптимальне керування справедливе для x>0
I рік - усі засоби х в I галузь, залишок на початок 2-го року 0,75х
II рік - 0,75х в I-у галузь, залишок 0,752х = 0,56х
III рік - 0,56х вкладаємо в I-у галузь, залишок 0,750,56х = 0,42 х
IV рік - 0,42х вкладаємо в 2-у галузь, залишок 0,420,3х = 0,126х
V рік - 0,126х вкладаємо в 2-у галузь, залишок 0,30,126х = 0,038х.
При такому розподілі max прибуток за 5 років f(x) = 2,27х2.
Методом функціональних рівнянь можуть бути вирішені і більш складні задачі розподілу ресурсів.
Задача 1.3. Є деяка кількість засобів зв'язку х, яку можна використовувати N різноманітними засобами. Нехай xi - кількість засобів, використовувана при i-ому способі розподілу (i = 1; 2; N) qi(xi) прибуток, отриманий у цьому випадку. Необхідно визначити, яку кількість засобів і якого засобу варто використовувати, щоб одержати максимальний загальний прибуток.
Рішення. Запишемо математичну модель задачі
Максимальний загальний прибуток залежить тільки від Х та N. Тому можна визначити послідовність функцій
для x>0
k = 1; ...; N
Одержуємо такі функціональні рівняння:
для одноетапного процесу
(1.11)
для N - етапного процесу
N = 2; 3; ...
(1.12)
Використовуючи (1.12-1.13) вирішимо задачу про завантаження літака.
Задача 1.4. Нехай є літак вантажопідіймальністю W і його варто завантажити предметами N різноманітних типів і різноманітної цінності. Необхідно завантажити літак предметами максимальної цінності, якщо відомо, що Pi - вага одного предмета i-го типу, xi - число предметів i-го типу. Ci - вартість предмета i-го типу i = 1; ...; N.
Рішення. Складемо математичну модель задачі.
Знайти max F (x1;
x2;
...; xn)
=
Cixi
при Рixi < W, xi = 0; 1; 2; ...
У силу цілочисленості xi це не задача Л.П.
Вирішимо задачу, рахуючи W - довільною величиною.
Якщо завантажувати літак тільки предметами 1-го типу, то рішення очевидно x1 = [W/Рi] - ціла частина. f1(W) = [W/Р1] . C1
Нехай літак завантажується предметами 1-го і 2-го типів.
Позначимо max вартість у цьому випадку f2(W).
Якщо завантажувати x2 - предметів 2-го типу, то вага предметів 1-го типу не повинна перевищувати W2 - P2x2, а їхня вартість C2x2.
Тоді max вартість вантажу предметів І типу - f1(W - P2x2)
Продовжуючи процес, додаючи предмети нових типів, через N кроків
де fN-1 (W - PNxN) - максимальна вартість вантажу, що складається з предметів N-1 типу, загальна вага котрих < W - PNxN.
Умови. Нехай W = 83 од., а вага і вартість предметів відповідно рівні: Р1 = 24; Р2 = 22; Р3=16; Р4=10; С1=96; С2=85; С3=50; С4=20.
Тому що для знаходження значень fN(W) необхідно знати значення fN-1 (W-PNxN), то при рішенні будуть потрібні значення функції f(W) для всіх W 0 < W < 83.
Нехай літак завантажують тільки предметами 1-го типу. Тоді можна завантажити максимальну кількість [83/24]=3, тобто х1 = 0; 1; 2; 3.
Тоді таблиця 1 f1(W) має вигляд.
Таблиця 1 Таблиця 2
W |
f1(W) |
x1 |
|
W |
f2(W) |
x2 |
x1 |
0-23 |
0 |
0 |
|
0-21 |
0 |
0 |
0 |
24-47 |
96 |
1 |
|
22-23 |
85 |
1 |
0 |
48-71 |
192 |
2 |
|
24-43 |
96 |
0 |
1 |
72-83 |
288 |
3 |
|
44-45 |
170 |
2 |
0 |
|
|
|
|
46-47 |
181 |
1 |
1 |
|
|
|
|
48-67 |
192 |
0 |
2 |
|
|
|
|
68-69 |
266 |
2 |
1 |
|
|
|
|
70-71 |
277 |
1 |
2 |
|
|
|
|
72-83 |
288 |
0 |
3 |
Нехай літак завантажують предметами першого і 2-го типів (2 етап) Тому що Р2 = 22 од., то х2 = 0; 1; 2; 3 ([W/P2] = [83/22] = 3.
Розмір вантажопідіймальності розбиваємо на інтервали, з огляду на Р1 і Р2. За допомогою таблиці 1 і функціонального рівняння
Переходимо до 3-го і 4-го етапів, що полягають відповідно в послідовному завантаженні літака предметами 1-го, 2-го, 3-го типу і 1-го, 2-го, 3-го і 4-го типу. На 3-му етапі, використовуючи таблицю 2, складаємо таблицю 3.
Таблиця 3 Таблиця 4
W |
f3(W) |
х3 |
x2 |
x1 |
|
W |
f4(W) |
х4 |
х3 |
x2 |
x1 |
0-15 |
0 |
0 |
0 |
0 |
|
0-9 |
0 |
0 |
0 |
0 |
0 |
16-21 |
50 |
1 |
0 |
0 |
|
10-15 |
20 |
1 |
0 |
0 |
0 |
22-23 |
85 |
0 |
1 |
0 |
|
16-21 |
50 |
0 |
1 |
0 |
0 |
24-31 |
96 |
0 |
0 |
1 |
|
22-23 |
85 |
0 |
0 |
1 |
0 |
32-37 |
100 |
2 |
0 |
0 |
|
24-31 |
96 |
0 |
0 |
0 |
1 |
38-39 |
135 |
1 |
1 |
0 |
|
32-37 |
100 |
0 |
2 |
0 |
0 |
40-43 |
146 |
1 |
0 |
1 |
|
38-39 |
135 |
0 |
1 |
1 |
0 |
44-45 |
170 |
0 |
2 |
0 |
|
40-43 |
146 |
0 |
1 |
0 |
1 |
46-47 |
181 |
0 |
1 |
1 |
|
44-45 |
170 |
0 |
0 |
2 |
0 |
48-63 |
192 |
0 |
0 |
2 |
|
46-47 |
181 |
0 |
0 |
1 |
1 |
64-67 |
242 |
1 |
0 |
2 |
|
48-57 |
192 |
0 |
0 |
0 |
2 |
68-69 |
266 |
0 |
2 |
1 |
|
58-63 |
212 |
1 |
0 |
0 |
2 |
70-71 |
277 |
0 |
1 |
2 |
|
64-67 |
242 |
0 |
1 |
0 |
2 |
72-83 |
288 |
0 |
0 |
3 |
|
68-69 |
266 |
0 |
0 |
2 |
1 |
|
|
|
|
|
|
70-71 |
277 |
0 |
0 |
1 |
2 |
|
|
|
|
|
|
72-81 |
288 |
0 |
0 |
0 |
3 |
|
|
|
|
|
|
82-83 |
308 |
1 |
0 |
0 |
3 |
На підставі таблиці 4 можна зробити висновок, що max вартість завантаження вантажу 308 од., причому першого типу 3 од. і 4-го типу 1 од.
Висновок. Знайдено оптимальні рішення не тільки вантажопідіймальністю W = 83 од., але і для літаків будь-якої вантажопідіймальності 0 < W < 83 од.. Це характерна риса динамічного програмування.
Інша інтепретація задачі: стрижень довжиною W потрібно розкроїти на заготовки довжиною L1, L2, L3, L4 з вартостями відповідно, C1, C2, C3, C4, так щоб сумарна вартість була max.
Таким чином, метод Д.П. можна успішно застосовувати і для розкрою матеріалів.
