Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Материалы по курсу (часть 1).docx
Скачиваний:
50
Добавлен:
14.06.2020
Размер:
7.69 Mб
Скачать

12. Управление переходом организма из исходного состояния в конечное в условиях неопределенности.

До сих пор мы рассматривали детерминированную модель (аналитическое представление закономерности, операции и т.п., при которых для данной совокупности входных значений на выходе системы может быть получен единственный результат.) динамического программирования. В реальной жизни как на состояние системы, так и на целевую функцию влияют случайные факторы, и поведение системы зависит не только от начального состояния S0 и выбранного управления x, но и от случайности.

Рассмотрим стохастическую (т.е. случайную) модель задачи о кратчайшем пути на ациклической сети. Допустим существование в системе условных вероятностей P (Si / Si−1 , xi ) того, что на i-м шаге управления система перейдет в состояние Si при условии, что до этого она находилась в Si−1 и было применено управление xi . Это условие представляет собой допущение о марковском свойстве системы, согласно которому вероятность перехода системы в какое-либо состояние Si зависит только от состояния Si−1 , из которого совершается переход, и от применяемого управления xi , но никак не зависит от предыстории системы, предшествующей ее переходу в Si−1.

Таким образом, теперь управляющее воздействие xi на 1-м шаге управления может лишь изменить вероятности перехода из данного состояния Si−1 в другие состояния Si . Теперь, находясь в каком-либо состоянии и применяя некоторое управление, можно говорить только о средних затратах времени достижения конечного состояния, которые вычисляются как взвешенные по соответствующим вероятностям затраты, рассмотренные по всем возможным из данного состояния траекториям. В этом случае, очевидно, задача заключается в нахождении такого множества оптимальных управлений (по одному для каждого состояния), которое дает минимальное среднее значение времени перехода из S0 в Sm .

Применение принципа оптимальности к таким задачам приводит к стохастической модели динамического программирования. Пусть обозначает конкретное состояние системы, в которое она переходит на i-м шаге, – временные затраты на перевод организма в состояние на i-м шаге из состояния .

Рис. 4

Допустим, что для части сети (рис. 4) известны условные минимальные средние временные затраты i+1 (Si ) на достижение конечного состояния из Si (Si ∈{ , }). На рис. 4 через p1, p2, …, pn обозначены условные вероятности перехода

pj = P ( | Si−1, xi ), причем

Если, например, находясь в состоянии Si−1 , мы применяем управление xi , то средние затраты времени i (Si−1 | xi ) на достижение конечного состояния из Si−1 равны

Так как вариантов управления на i-м шаге может быть несколько, т. е. xi может принимать разные значения xi ∈{ , }, выберем то из них, при котором i (Si−1|xi) становится минимальным. При этом стохастическое обобщение основного рекуррентного уравнения (см. в предыдущем вопросе его) имеет вид

или в развернутой форме

Поскольку применяются условные вероятности, то

Далее следуют примеры:

Пример 2.3. на странице 48 в печатной методе и 49 в электронной

Пример 2.4. на странице 51 в печатной методе и 52 в электронной