Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по Дослідження операцій.doc
Скачиваний:
3
Добавлен:
01.07.2025
Размер:
2.51 Mб
Скачать

1.4. Детерміновані процеси

Якщо при оптимізації багатоетапного процесу результат будь-якого рішення визначався однозначно вибором цього рішення, то такий процес називається детермінованим.

Для детермінованого процесу N-етапного процесу стан системи Si (i = 1, ..., N) задається вектором. Перетворення вектора станів від етапу до етапу здійснюється впливом на нього вектора керування Ui, тобто Vi(Si; Ui). Послідовність перетворень, починаючи з N-го етапу і закінчуючи першим, можна записати

SN-1 = VN (SN; UN)

SN-2 = VN-1 (SN-1; UN-2) (1.24)

.....................................................

SК = V1 (S1; U1)

Якщо перші підставляти в наступні, то одержимо кінцевий стан Sk, виражений через початковий SN:

Sk = V1 (V2(V3(... VN-1(VN(SN; UN); UN-1); UN-2 ...) (1.25)

Послідовність векторів UN, UN-1, ..., U1, що відповідають послідовним перетворенням (1.24), називається поведінкою або стратегією. Якщо перетворення обрані відповідно до якимось визначеного критерію, то такі перетворення називаються оптимальною стратегією або оптимальним поводженням.

Тоді задачу для N-етапного процесу можна записати max W = qi (Si; Ui) або, слідуючи принципу оптимальності fN(SN) = max [qN(SN; UN) + fN-1(SN-1)]

UN

або fN(SN) = max {qN(SN; UN) + fN-1[VN(SN; UN)]} (1.26)

UN

f1(S1) = max q(S1; U1)

U1

Зауваження. У всіх розглянутих задачах критерій W має властивість адитивності, тобто значення W, досягнуте за весь процес, є сумою його часних значень, отриманих на визначених етапах. У більшості задач Д.П. критерій адитивний. Якщо він не має цю властивість, то змінюють або самий критерій, або постановку задачі.

1.5. Стохастичні задачі динамічного програмування

Визначення: Якщо в задачі керований процес не цілком визначається початковим станом системи й обраного керування, а в якійсь мірі залежить від випадку, то такі задачі називаються стохастичними і ймовірностними.

Наприклад:

1) якщо не можна точно визначити стан системи на кожному етапі;

2) якщо змінні, що характеризують стан системи, є випадковими величинами з відомою функцією розподілу;

3) якщо змінюється ціль задачі;

4) якщо планування здійснюється на тривалий період, то в цьому випадку неможливо точно зазначити значення усіх нормативів і коефіцієнтів, оскільки вони можуть змінитися під впливом непередбачених причин і т.і.

Для рішення багатоетапних екстрем. стохастичних задач з адитивним критерієм можна використовувати метод Д.П. У стохастичній моделі перетворення від i-го етапу до (i-1)-го містить деяку непевність. У результаті перетворення Vi(Si; Ui) відомий вектор стана Si переходить у випадковий вектор стана

Zi-1 із функцією розподілу G(Si; Zi-1; Ui). Тому, перед тим , як прийняти рішення на i-1 етапі, необхідно покласти, що дійсне значення вектора стана Si-1 спостерігалося і відоме. Для стохастичного процесу, як і для детермінованого можна записати послідовність перетворень

ZN-1 = VN (SN; UN)

ZN-2 = VN-1 (SN-1; UN-2) (1.27)

.....................................................

ZК = V1 (S1; U1)

Але не можна висловити Zk як функцію початкового ZN. Це обумовлено тим, що результати перетворень відомі тільки після безпосередніх спостережень.

Величини Zi - випадкові, тому і Ui теж випадкові в тому змісті, що їхнє застосування дає невизначений результат для розміру критерію.

Критерій W = qi (Si; Ui) як функція випадкових величин теж випадковий, тому говорити про його оптимальне значення не має сенсу. Тому в ролі критерію використовують деяку середню характеристику можливих результатів. Такою характеристикою є середнє арифметичне, тобто математичне чекання. Властивість лінійності дозволяє спростити функціональне рівняння (у силу адитивності), а властивість інваріантності , показує, що майбутні рішення засновуються тільки на стані системи в даний момент і не залежать від її передісторії.

fN(SN) = max M{ qi [Vi (Si; Ui), Ui]} =

= max M{ qi (Zi-1; Ui)]} (1.28 )

Тоді для дискретного випадку

fN(SN) = max { [qN (S(N-1)j; UN) + fN-1(Z(N-1)]Pj (1.29)

де Pj (j = 1; ...; m) можливості m можливих дискретних станів, що може приймати випадковий вектор ZN-1, 0 < Pj < 1 pi = 1