- •Лекціі по дисципліні «дослідження операції»
- •1. Динамічне програмування
- •1.1. Поняття динамічного програмування
- •1.2 Принцип поетапної побудови оптимального керування.
- •1.3 Задача про мінімізацію витрат пального літаком при наборі висоти і швидкості.
- •1.4 Метод функціональних рівнянь.
- •1.5 Задача розподілу ресурсів
- •1.5 Задача заміни устаткування
- •1.3.3. Задача планування виробництва з урахуванням попиту, виробничих потужностей підприємства й обсягу його складських приміщень
- •1.4. Детерміновані процеси
- •1.5. Стохастичні задачі динамічного програмування
- •1.5.1. Задача розподілу ресурсів у стохастичному варіанті
- •1.5.2. Задача видобутку корисної копалини
- •Випадкові процеси. Марковські випадкові процеси
- •2.1. Марковські ланцюги, матриця переходів
- •2.2. Властивості стохастичних матриць
- •2.2.1. Властивості стохастичних матриць і деякі їх різновиди.
- •2.3. Ергодична властивість ланцюгів Маркова. Перехідний режим
- •2.4. Марковський процес із дискретними станами і безупинним часом. Рівняння Колмогорова для ймовірностей станів системи
- •2.4.1. Граничні ймовірності станів для н.М.Л. Теорема Маркова
- •3. Теорія масового обслуговування (т.М.О.) Задача і предмет т.М.О.
- •3.1. Класифікація систем масового обслуговування і їх основні характеристики.
- •3.2. С.М.О. Із відмовами. Рівняння Ерланга
- •3.2.1. Сталий режим обслуговування. Формули Ерланга
- •3.3. Система м.О. З очікуванням
- •3.4. Багатоканальні с.М.О. Із необмеженою чергою
- •4.Теорія ігор
- •4.1. Визначення гри, види моделей
- •4.2. Антагоністична гра у нормальній формі. Принцип гарантованого результату
- •4.3. Проблема рівноваги в грі, чисті і змішані стратегії
- •4.4. Теорія про мінімакс. Усталеність одержуваних рішень
- •4.5. Засоби пошуку оптимальних стратегій. Загальні підходи
- •4.6. Рішення ігор 22, 2n, m2. Графоаналітичний метод
- •4.7. Розв’язання ігор mn
- •5. Елементи теорії статистичних ігор. Поняття про статистичні ігри
- •5.1. Вибір оптимальної стратегії статиста
- •Список літератури
1.2 Принцип поетапної побудови оптимального керування.
Д.П. являє собою поетапне планування багатошагового процесу, при якому на кожному етапі, з огляду на розвиток усього процесу, оптимізують тільки один крок, тобто при прийнятті рішення враховується майбутнє. Проте в кожному процесі є останній k-ий крок, прийняття рішення на якому не залежить від майбутнього. Тому на цьому крокові вибирають керування, що дозволяє одержати найбільший ефект. Спланувавши цей крок, до нього можна приєднати передостанній k-1 крок, до якого, у свою чергу k-2 і т.д. В остаточному підсумку приходять до початкового стану S0. Процес Д.П. так би мовити «розвертається» від кінця до початку.
Формалізуємо сказане. Нехай на (k-1)- ому кроку можливі стани системи Sk-1, i (i = 1, 2, ... , r). На останньому k-ому крокові знайдемо для кожного з них оптимальні керування U*k;i (Sk-1,i) i = 1; ...; r, що називаються умовно оптимальними. Таким чином, k-й крок спланований, тому що який би стан не мала система на k-ому кроці відомо, яке керування треба приймати на k-ому кроці. Аналогічно вчинюють на k-1-ому кроці, тільки умовно оптимальне керування на цьому крокові треба обирати з урахуванням умовно оптимальних рішень на k-ому крокові і т.д. У результаті ми прийдемо до початкового стану S0 Є 0.
Для 1-го кроку можливий стан системи одне S0, причому воно відоме, тому знаходимо для нього оптимальне керування з урахуванням знайдених умовно оптимальних керувань для 2-го кроку. Проходячи тепер навпаки від S0 до Sk, одержуємо шукане оптимальне керування для всього процесу.
Зауваження
1.
З принципу поетапної побудови оптимального
керування
випливає,
що критерій W повинний
мати властивість адитивності,
тобто
,
де Wi
значення критерію на i-ому
етапі.
Принцип, у якому оптимальне продовження процесу відшукується відносно стану, досягнутого в даний момент, називається принципом оптимальності Р.Белмана.
1.3 Задача про мінімізацію витрат пального літаком при наборі висоти і швидкості.
Постановка задачі. Нехай літак, що знаходиться на висоті H0 і має швидкість V0 повинний піднятися на висоту Нk і набрати швидкість Vk. Відома витрата пального при підйомі літака з будь-якої висоти Н1 на будь-яку висоту Н2 > Н1 при постійній швидкості, а також витрата пального при збільшенні швидкості від будь-якої V1 до V2 (V2 >V1) при незмінній висоті. Знайти оптимальне керування набором висоти і швидкості, при якому витрати пального мінімальні.
Рішення. Т. я. стан системи S (літака) визначається двома параметрами: швидкістю V і висотою Н, причому V0<V<Vk, H0<H<Hk, то рішення (траєкторію польоту) будемо шукати на площині V0H, а точне на прямокутнику,
що і є
областю
припустимих
рішень.
Для рішення
задачі
методом Д.П. розіб'ємо відрізок
[H0;
Hk]
на n1
відрізків
довжини
|
|
Умовимося
вважати,
що за один крок (етап) літак може або
збільшити висоту
на
Н
, або швидкість на
V.
Очевидно, існує множина
траєкторій польоту літака, ламаних
ліній, по яких точка
S може переміщатися з S0
у Sk.
Потрібно знайти таку траєкторію, що
дозволяє мінімізувати
W, витрату
пального. Можна перебрати всі
можливі траєкторії польоту і вибрати
найкращу,
але якщо n1
і n2
великі,
то
це
трудомістке
навіть із застосуванням ЕОМ.
Простіше вирішується задача методом Д.П. Розглянемо рішення задачі, умови якої наведені на мал. 2. Числа на вертикальних лініях означають витрату пального при наборі висоти з постійною швидкістю на даному етапі, а числа на горизонтальних лініях - витрату пального при збільшенні швидкості без зміни висоти. |
|
Точки перетинання вертикальних і горизонтальних прямих назвемо вузлами, котрі ми будемо позначати кружечками. Весь процес розіб'ємо на етапи в залежності від числа кроків до пункту Sk. Очевидно, що до одного етапу будуть належати вузли, що лежать на рівнобіжних відрізках, зображених, на мал. 2. Число етапів k = n1 + n2 = 3 + 5 = 8. Так як умовну оптимізацію почнемо з кінця, тобто від стану Sk, то до першого кроку, належать вузли А1, В1. У кружечках будемо записувати умовно оптимальні значення витрати пального, а строчками на кожному кроці будемо позначати умовно оптимальні траєкторії, і т.д. Після 8-го кроку ми приходимо в точку S0. Рухаючись з урахуванням умовно оптимальних траєкторій, позначених стрілками з точки S0 у точку Sk ми одержимо оптимальну траєкторію для всього процесу, якій відповідає мінімальна витрата пального = 67 од. Як випливає з мал. 2 оптимальне керування не єдине.
У розглянутій задачі значно спрощений процес, тому що не враховується можливість одночасного набору висоти і збільшення швидкості.
Розглянемо модель, що враховує цей факт. Очевидно, що це буде прямування по діагоналі в напрямку до Sk. Тепер кожна вузлова точка, за винятком точок, що лежать на прямих Н=Нk і V=Vk, пов'язана з трьома іншими. Старий засіб нумерації числа кроків не проходить, тому що він не враховує додатковий зв'язок по діагоналі. Нумерацію вузлових точок по кроках |
|
зручніше усього провести по ознаці їхніх координат, наприклад, по величині залишку швидкості, яку повинний набрати літак за кроки, що залишилися. При такій нумерації останнім кроком є той, що переводить точку S із вертикальної прямої k-1 на вертикальну пряму k, передостаннім - той, що переводить т. S з прямої k-2 на k-1 і т.д.
Побудуємо оптимальні рішення процесів. Умовно оптимальні рішення, як і раніше, будемо зображувати стрілками, а мінімальну витрату пального записувати в кружках.
Рухаючись від S0 до Sk по умовно оптимальних рішеннях, ми одержуємо оптимальне рішення, причому таких рішень два, обидва вони забезпечують мінімальних витрату пального, рівну 58 од.

,
а [V0;
Vk]
на n2
відрізків
довжини
,