
- •Розділ 3. Елементи теорії ігор
- •3.1. Предмет і деякі основні поняття теорії ігор
- •3.2. Матричні ігри. Розв’язування матричних ігор в чистих стратегіях
- •3.3. Розв’язування матричних ігор в змішаних стратегіях
- •Приклад 3.3. Виконати всі можливі спрощення платіжної матриці
- •Приклад 3.4. Спростити платіжну матрицю
- •3.4. Числові методи розв’язування матричних ігор
- •3.5. Елементи теорії статистичних ігор
- •Контрольні запитання та задачі
- •Які ситуації називаються конфліктними?
- •Розділ 4. Нелінійне програмування (нп)
- •4.1. Відомості з теорії функцій багатьох змінних
- •4.1.1. Функція. Частинні похідні. Диференціал
- •4.1.2. Екстремум функції багатьох змінних
- •4.2. Задача нелінійного програмування
- •4.3. Дробово-лінійне програмування
- •4.4. Метод множників Лагранжа. Економічний зміст множників Лагранжа
- •4.5. Графічний метод розв'язування задач нп
- •4.6. Теорема Куна-Таккера
- •Контрольні запитання та задачі
- •5.1. Основні поняття дп
- •5.2. Постановка задач дп. Метод функціональних рівнянь р.Белмана
- •5.3. Економічні задачі, що розв'язуються методом дп
- •5.3.1. Задача розподілу ресурсів
- •5.3.2. Задача про збільшення виробничих потужностей за рахунок відрахувань з прибутку
- •5.3.3. Задача про вибір найбільш економного маршруту постачання вантажу
- •5.3.4. Задача мінімізації витрат пального літаком при набиранні висоти і швидкості
- •5.3.5. Задача заміни обладнання
- •5.4. Детерміновані та стохастичні задачі дп
- •Контрольні запитання та задачі
- •Розділ 6. Елементи стохастичного програмування
- •6.1. Загальна характеристика задач стохастичного програмування
- •6.2. Задача розподілу ресурсів в стохастичному варіанті
- •6.3 Задача про агента
- •Контрольні запитання та задачі
- •Розділ 7. Використання Пакетів прикладних програм при розв’язуванні злп
- •7.1. Загальні зауваження
- •7.2. Розв’язування задач математичного програмування за допомогою ms excel
- •7.2.1. Розв’язування злп записаних в стандартному вигляді
- •Ввести умову задачі:
- •Розв’язати задачу:
- •Послідовність виконання операцій
- •Ввід початкових даних.
- •7.2.2. Розв’язування зцлп
- •Після натискання кнопки Выполнить отримуємо:
- •У кінцевому звіті маємо: .
- •7.2.3.Транспортна задача
- •7.3. Використання пакету Maple для розв’язування задач лінійного програмування
- •Зразки контрольних робіт та індивідуальні завдання
- •Контрольна робота №1
- •Критерій оцінювання
- •Контрольна робота №2
- •Критерій оцінювання
- •Індивідуальні завдання Індивідуальне завдання 1
- •Індивідуальне завдання 2
- •Індивідуальне завдання 3
- •Індивідуальне завдання 4
- •Індивідуальне завдання 5
- •Індивідуальне завдання 6
- •Індивідуальне завдання 7
- •Індивідуальне завдання 8
- •Індивідуальне завдання 9
5.2. Постановка задач дп. Метод функціональних рівнянь р.Белмана
Розглянемо деякий керований
процес, який розвивається в часі і
розпадається на N
кроків (етапів). Стан процесу на початку
кожного кроку характеризуватимемо
вектором
,
який називають вектором стану процесу.
Множину всіх станів, в яких може
знаходитися процес на початку і-го
кроку, позначимо через
.
Початковий стан процесу вважається
відомим, якщо вектор
заданий.
Розвиток процесу полягає
в послідовному переході з одного стану
в інший. Якщо процес знаходиться в стані
,
то його стан на наступному кроці
,
визначається не тільки вектором
,
але і розв'язком
,
одержаним на і-му
кроці, тобто
.
Очевидно, що розв'язок на кожному кроці
не може бути довільним. Його слід вибирати
з деякої множини
можливих розв'язків. Розвиток процесу
протягом розглядуваного періоду можна
однозначно описати
послідовністю станів
де
.
Будь-яка послідовність
допустимих розв'язків,
яка переводить процес з початкового
стану
в кінцевий стан
буде визначати стратегію. Для повного
опису
-крокового
процесу кожній стратегії потрібно
поставити у відповідність деяку оцінку
– значення цільової функції
,
яку задамо у вигляді
суми функцій
,
значення яких одержуються на кожному
етапі процесу при переході зі стану
в стан
,
тобто
.
Тепер можна сказати, що
багатокроковий процес повністю описаний,
адже задані допустима множина станів
,
допустима множина
розв'язків
,
правила переходу з одного стану в інший.
Таким чином, загальну задачу
ДП можна сформулювати так: знайти
стратегію
,
для якої функція
досягає екстремуму.
Опишемо алгоритм розв'язування і застосуємо його до конкретної задачі.
Нехай
і
– відповідно початковий і кінцевий
стани
-
крокового процесу. Позначимо через
екстремальне значення цільової функції,
отримане за N кроків при оптимальній стратегії управління процесом, який знаходився в початковому стані .
Припустимо, що на першому
кроці ми отримали розв'язок
і процес перейшов із стану
в стан
.
Досягнутий при цьому ефект характеризується
значенням
функції
.
Вважаємо, що після першого кроку для
управління процесом застосовувалася
оптимальна стратегія, при якій на решта
кроках цільова функція
досягала екстремального значення. При
описаних умовах загальна оцінка якості
управління за
кроків виразиться сумою
,
а екстремальне значення
цільової функції за N
кроків дорівнюватиме
.
Позначимо через
екстремум цільової функції, отриманий
на
останніх
кроках, якщо початковим
був стан
.
Тоді за аналогією з останньою рівністю
одержимо:
,
.
(5.1)
Вираз (5.1) і представляє
собою математичний запис принципу
оптимальності. Його називають основним
функціональним рівнянням ДП. Рівняння
(5.1) дозволяє розгорнути процедуру
прийняття покрокових рішень і поступово
сформувати оптимальну стратегію
управління всім
- кроковим процесом. Із (5.1) видно, що при
обчисленні значення функції
,
в якості аргументу використовується
попереднє значення функції
.
Співвідношення, які мають таку властивість, називають рекурентними. Вся послідовність обчислень, яка приводить до , може бути виконана, якщо встановлено значення функцій . Рівняння (5.1) носить назву
функціонального рівняння Р.Белмана.
Метод функціональних рівнянь є одним із основних методів розв'язування задач ДП.