Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
TOP-4.doc
Скачиваний:
2
Добавлен:
01.04.2025
Размер:
701.95 Кб
Скачать

§2. Принцип оптимальности Беллмана и его обоснование

Под принципом оптимальности понимается любое правило, которое помогает построить оптимальное управление. Одним из таких принципов является принцип максимума Понтрягина, который предлагает построить оптимальное управление по признакам прихода траектории к границе области достижимости и максимизации некоторого скалярного произведения. Как следует из материала разделов 2 и 3, в некоторых случаях этот метод дает необходимое и достаточное условия оптимальности, а в общем случае – лишь необходимое условие оптимальности управления.

В основе принципа оптимальности Беллмана лежит идея "попятного движения" при построении оптимальной траектории (начиная с конечных состояний из терминального множества M(T)). Рассмотрим это схематично.

Пусть . Сначала находим оптимальное программное управление для каждой задачи , , в результате мы знаем, как действовать дальше в случае прихода системы в любую точку . Затем аналогичным образом рассматриваем задачу , , и т.д. до , (см. рис. 4.4).

Как видно из рисунка, в какую бы точку x(t)M(t) ни пришла система в момент t, дальнейшее развитие определено оптимально. Идея принципа Беллмана заключается в том, чтобы минимизацию функционала (4.4) свести к минимизации аналогичного интеграла на для любого t с учетом оптимального значения "оставшейся части" функционала (4.4) в текущих (tx)-задачах с начальными состояниями x(t)M(t). Если этот принцип выдерживается для всех t, то при t = t0 получаем оптимальную траекторию.

Как видим, в случае дискретной задачи оптимального управления, когда вместо [t0,T] рассматриваются фиксированные точки t0 < t1 < ... < tk < T, оптимальное синтезирующее управление строится пошагово за k шагов от T до t0 . В случае непрерывной задачи (4.1)-(4.4) построение оптимального синтезирующего управления сводится к решению некоторого уравнения в частных производных (уравнение Беллмана).

Дадим строгую формулировку принципа оптимальности Беллмана в задаче (4.1)-(4.4).

Принцип оптимальности. Если – оптимальный процесс в (4.1)-(4.4), то на любом отрезке [t,T], t[t0,T], управление является оптимальным в текущей задаче (x(t), – t) для любого x(t)M(t) независимо от того, как система попала в эту точку x(t).

По форме принцип оптимальности Беллмана – это необходимое условие оптимальности. Действительно, предположим противное: найдется такой момент t[t0,T] и допустимое управление в задаче (x(t), – t), что

где – оптимальное управление, удовлетворяющее принципу оптимальности Беллмана.

Прибавляя к обеим частям предыдущего неравенства интеграл

получаем:

Так как управление по определению является допустимым, то последнее неравенство противоречит оптимальности управления . Таким образом, справедливость принципа оптимальности Беллмана как необходимого условия оптимальности установлена.

С помощью принципа оптимальности в следующем параграфе будет построено уравнение Беллмана, которое является, в общем случае, достаточным условием оптимальности в задаче синтеза (4.1)-(4.4).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]