Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции ТОУ.doc
Скачиваний:
8
Добавлен:
01.03.2025
Размер:
525.82 Кб
Скачать

Случаи:

  1. Постоянная индикатриса, т.е.,

=

  1. Индикатриса с ограниченной нелинейностью по управлению.

  1. Выпуклая , её исследование можно провести с помощью принципа максимума. В соответствии с принципом необходимо построить функцию Гамильтона.

т.к., ограничений на построение x и u нет, то применим необходимое условие максимума функции Гамильтона.

отсюда получаем

(4)

система уравнения процесса и сопряжённое уравнение, используя ограничение (2)

(5)

Решая систему двух дифференциальных уравнений 2 и 5 относительно искомых переменных х и , с учётом выражения 4 получаем процесс, удовлетворяющий необходимым условиям.

Тема 14. Уравнение Беллмана.

1. Идея, основные элементы уравнения Беллмана.

При постановке задачи ТОУ предполагалось, что такие элементы, как начальное состояние и начальный момент t, фиксированы. Но это не всегда выполняется на практике. При решении конкретной задачи оказывается удобным рассматривать её в составе множества качественно однотипных задач, описываемых теми же уравнениями процесса и функционалом, но с различными значениями перечисленных параметров.

Определяя оптимальное управление сразу для всего множества таких задач, получим решение в форме синтеза, которое будет представлять зависимость качественных свойств оптимального управления от состояния системы и текущего момента времени. Из этой задачи нетрудно получить решение для любых фиксированных начальных условий в обычной форме, т.е. найти оптимальное управление как функцию времени.

Решение подобных задач обладает рядом преимуществ. Главное из них состоит в том, что имеется полная информация об оптимальном управлении. Если при этом реализовались заранее неизвестные значения состояния системы, а на практике это типичная ситуация, то значение синтеза оптимального управления позволяет принять оптимальное решение в данной ситуации.

Поиск синтеза оптимального управления, т.е. совокупности качественно однородных свойств системы, – это более трудоемкая процедура по сравнению с решением обычной задачи оптимального управления.

С математической точки зрения отыскания синтеза оптимального управления сводится к решению нелинейного дифференциального уравнения с частными производными, называемого уравнением Гамильтона – Якоби – Беллмана (для непрерывных процессов). Сложность численного решения этого уравнения сильно возрастает с увеличением размерности решаемой задачи. Для дискретных процессов это менее сложно.

По исследованию операции представление о преемственности метода лишь к дискретным процессам.

Рассмотрим задачи оптимального управления с условием:

(1)

(2)

х(0)=х0; uÎVtх (3)

Из условий видно что отсутствуют ограничения на состояние, а множества допустимых управлений Vtх в отличие от принципа максимума (uVt) не зависит от состояния х.

Т.е. множество при всех t[0;T] совпадает с пространством х, а при t=0 задано начальное условие – фиксированная точка х0. Ограничения на состояние х в момент t=T не задан.

Для получения уравнения Гамильтона – Якоби – Беллмана необходимо воспользоваться теоремой о достаточных условиях оптимальности, согласно которой если есть допустимый процесс

V*= (x*(t), u*(t))М и непрерывно дифференцируемая функция (t, x) такие что при всех t, x

R(t, x*(t), u*(t))= R(t, x, u), t[0;T]

при t=T

то процесс (x*(t), u*(t)) оптимален, т.е.,

(x*, u*)=

Известно, что

Ф(х)=(Т,х) + F(х)

Введём функцию:

Р(t,х) = max R(t, x, u)

(заданная и непрерывная функция) предположим, что удалось так определить функцию (Т,х) что

Р(t,х) =с(t)

с(t) – произвольное число, которое м.б. равно 0.

Ф(х)=с1

Т.к. функция (t, x) задана, следовательно задана и функция R(t, x, u) максимизируя которую по управлению uVtх, найдём u*(t, x):

u*(t, x)= R(t, x, u)

u*(t,x) является синтезом оптимального управления, решением рассматриваемой оптимизационной задачи. Для определения оптимального состояния вектора x*(t) подставим синтез от управлений u*(t, x) в уравнение процесса

х(0)=x0 (4)

Определение оптимального состояния x*(t) сводится к решению задачи Коши (4) для уравнения процесса, замкнутого синтезом оптимальных управлений с начальными условиями х(0)= x0

В отличие от синтеза оптимального управления u*(t, x) функцию

(5)

называют оптимальной программой управления.

Данное определение отражает, что оптимальная программа управления (ОПУ), определяемая формулой (5) отвечает уже не произвольному состоянию х, а конкретному оптимальному х*(t).

Изложенный метод нахождения процесса (х*(t); u*(t)), при априорных5 ограничениях наложенных на функцию (t,x), называется методом Гамильтона – Якоби – Беллмана. В этом случае процесс х*(t), u*(t) является оптимальным.