![](/user_photo/21626_SPZlF.png)
- •1) Методы принятия оптимальных решений. Математические модели операции: детерминированный случай, оптимизация решений в условиях неопределенности.
- •1) Детерминированный случай
- •2) Оптимизация решений в условиях неопределенности
- •2) Методы принятия оптимальных решений. Оценка операции по нескольким показателям.
- •3) Оценка операции по нескольким показателям.
- •3) Основная задача линейного программирования (озлп). Допустимые решения и оптимальное решение задачи лп.
- •4) Геометрическая интерпретация озлп.
- •Анализ положения l относительно одр.
- •Дадим геометрическую интерпретацию поиска оптимального решения.
- •Тогда (x1*, x2*, …, xn*) – оптимальное решение
- •Некоторые выводы
- •5) Задача лп с ограничениями-неравенствами. Переход от нее к основной задаче.
- •6) Симплекс-метод решения задачи лп.
- •7) Табличный алгоритм замены переменных.
- •8. Отыскание опорного решения задачи лп на основе табличного алгоритма замены переменных.
- •9. Отыскание оптимального решения задачи лп на основе табличного алгоритма замены переменных.
- •10. Метод динамического программирования (дп). Алгоритм решения задач управления состоянием организма в биотехнических системах. Основное рекуррентное уравнение дп.
- •11. Управление переходом организма из исходного в конечное состояние методом дп: использование ориентированного графа.
- •12. Управление переходом организма из исходного состояния в конечное в условиях неопределенности.
- •13. Игровые методы обоснования решений. Основные понятия теории игр. Платежная матрица.
- •14. Нижняя и верхняя цена игры. Принцип минимакса. Решение игры в чистых стратегиях.
- •15. Решение игры в смешанных стратегиях.
- •16. Игры 2х2 и их решение.
- •17. Геометрическая интерпретация решений игры 2х2.
- •18. Решение игр 2хn.
- •19. Решение игр mх2.
- •20. Решение игр mxn.
- •3.2. Элементы теории статистических решений
10. Метод динамического программирования (дп). Алгоритм решения задач управления состоянием организма в биотехнических системах. Основное рекуррентное уравнение дп.
Рассмотрим управляемый процесс, который переводит некоторую систему G из нач. состояния S0 в конеч. состояние Sm. При наличии промежуточных состояний такой перевод представляется в виде траектории, состоящей из конкретной последовательности промежуточных состояний (рис. 1). Если промежуточные состояния могут быть различными, то траектория перевода G из S0 в Sm неоднозначна и зависит от вырабатываемых управляющих воздействий x.
Рис.1.
Введя целевую функцию W =W(x), зависящую от выбранного управления x, можно сравнивать (по величине W) траектории друг с другом и ставить задачу об отыскании оптимальной траектории, при которой достигается экстремум W (т.е. мин или мах функции).
В зависимости от содержания целевой функции в процессе оптимизации ее стремятся либо мах-ть, либо мин-ть. Далее будет рассматриваться оптимизация, при которой W → min. Таким образом, задача заключается в отыскании оптимального управления x*, при котором целевая функция W достигает своего минимального значения W*, т. е.
.
Представим себе процесс управления состоящим из конечного числа последовательных шагов. В этом случае траектория перехода G из S0 в Sm будет иметь вид последовательности промежуточных состояний S0, S1, S2, …, Sm, которая является результатом пошагового управления x, также имеющего вид последовательности x = x1, x2, …, xm.
Пусть
Si
- состояние системы G, а xi
–
управление на i-м шаге для произвольной
траектории. Для конкретной траектории
конкретное управление
переводит G в конкретное состояние Si′.
(!) управления x1, x2, …, xm в общем случае не числа, а векторы, функции, и т. п. (!) Пусть на каждом отдельном i-м шаге, заключающемся в переходе из Si−1 в Si, известно значение целевой функции W, которое обозначается wi . Считая выбранный критерий W аддитивным (суммирующимся), т. е. полагая, что
задачу оптимизации можно сформулировать следующим образом.
Требуется найти такое оптимальное управление x* = x1*, x2*, …, xm* (где xi* – оптимальное шаговое управление на i-м шаге), при котором целевая функция W принимает минимальное значение, т. е.
Последовательность оптимальных шаговых управлений x1*, x2*, …, xm* приводит к оптимальной траектории S0, S1*, S2*, …, Sm-1*, Sm перевода G из S0 в Sm.
Что-то вроде примера
Рис.2
Для примера, приведенного на рис. 2, существуют два варианта управлений и две возможных траектории, для каждой из которых можно подсчитать значение целевой функции.
|
I вариант |
II вариант |
Управление Траектория Целевая функция |
|
|
Пусть W′ > W′′ , тогда второй вариант является оптимальным, т. е. x* = x′′, W* =W′′ .
Тут типо конец примера и важный вывод:
(!)Поиск оптимального управления x∗ методом ДП основан на использовании общего принципа, известного как принцип оптимальности:
каково бы ни было состояние S системы G в результате какого-то числа шагов, мы должны выбирать управление на ближайшем шаге так, чтобы оно в совокупности с оптимальным управлением на всех последующих шагах приводило к минимальному значению целевой функции на всех оставшихся шагах, включая данный.(!)
Схема решения (Алгоритм).
После выбора способа описания состояний управляемой системы и разбиения всего процесса управления на шаги применяется следующая процедура:
1) Перечислить набор шаговых управлений xi для каждого шага и налагаемые на них ограничения.
2)
Для каждого i-го шага определить значение
в функции от состояния Si−1
на
(i−1) -м шаге и от шагового управления xi
=
fi
(Si−1,
xi
) .
3) Определить, как изменяется состояние Si−1 системы G под влиянием управления xi на i-м шаге: оно переходит в новое состояние
Si = ϕi (Si−1, xi ) .
(не пугаемся, ϕ – это произвольная функция)
4) Пусть Wi (Si−1) – условный оптимум (наилучший вариант) целевой функции, получаемый на всех последующих шагах, начиная с i-го и до конца. Надо записать основное рекуррентное уравнение динамического программирования, выражаю-
щее Wi (Si−1)) через уже известную функцию Wi+1 (Si),
Этому условному оптимуму целевой функции соответствует условное оптимальное управление на i-м шаге xi (Si−1), которое совместно с оптимальным управлением на всех последующих шагах обращает целевую функцию на всех оставшихся шагах, начиная с данного, в минимум.
5) Произвести условную оптимизацию последнего, m-го шага, задав множество состояний Sm−1, из которых можно за один шаг дойти до конечного состояния, вычисляя для каждого Sm−1 условный оптимум целевой функции по формуле
и находя условное оптимальное управление xm (Sm−1), для которого этот минимум достигается.
6) Произвести условную оптимизацию (m – 1)-го, (m – 2)-го и т. д. шагов по
формуле из п.4, полагая в ней i = (m −1), (m − 2), …, и для каждого шага указать
условное оптимальное управление xi (Si−1), при котором достигается минимум.
Так как начальное состояние системы S0 одно и оно известно, то на первом шаге варьировать состояние системы не нужно – оптимальное значение целевой функции для S0 находится непосредственно. Это и есть оптимум функции цели за весь процесс перевода:
W*=W1(S0) .
7) Произвести безусловную оптимизацию управления, учитывая выработанные ранее рекомендации на каждом шаге. На первом шаге оптимальное шаговое управление x1* = x1(S0) . Пользуясь формулой из пункта 3, находим изменившееся состояние системы S1, для него определяем оптимальное управление на втором
шаге x2*, и т. д. до конца.