Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
gos-part1.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
1.42 Mб
Скачать

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца.

Динамическаязадача – задача распределения ограниченных ресурсов для достижения комплекса конкурирующих целей на протяжении некоторого промежутка времени от начального момента до конечного.

  • управляющие параметры нек-е переменные величины.

  • Мн-во управления – мн-во ф-ций времени

Задача в выборе управляющих параметров как функций времени, принадлежащих множеству управлений.

  • Выбранные функции времени определяют вид функции времени некоторых других переменных, с помощью которых описывается поведение системы. Эти переменные называют фазовыми координатами.

  • Значения фазовых координат в каждый момент времени выбираются таким образом, чтобы максимизировать заданный целевой функционал, зависящий от фазовых координат и управляющих параметров (и те, и другие рассматриваются как функции времени).

  • Функции времени для управляющих параметров и для фазовых координат связаны с помощью системы дифференциальных уравнений, называемых уравнениями движения. Задача, представленная в указанной форме, называется задачей управления.

Времяt измеряется как непрерывная величина. Предполагается, что t изменяется в некотором фиксированном промежутке: от начального момента t0, который обычно известен, до конечного момента t1, который часто требуется определить. Следовательно, время задано на промежутке .

Фазовые коор-ты: Состояние системы в любой момент времени t из указанного промежутка характеризуется с помощью n вещественных чисел , , …, , называемых фазовыми координатами.

Фазовый вектор: Составленный из фазовых координат n-мерный вектор-столбец

x (t) = ,можно геометрически интерпретировать как точку в n-мерном евклидовом пространстве En.

Фазовая траектория: Каждая фазовая координата считается непрерывной функцией времени, поэтому фазовая траектория{x (t)} = {x (t) }

представляет собой непрерывную вектор-функцию времени, значениями которой в каждый момент времени t из указанного промежутка являются фазовые векторы.Представляет собой некоторую кривую, состоящую из точек пространства En. Началом этой кривой является фиксированное начальное состояниеx (t0) = x0, а окончанием – конечное состояниекоторое во многих задачах требуется определитьx (t1) = x1,

Выборы (решения), которые нужно осуществлять в каждый данный момент времени t из указанного интервала, характеризуются с помощью r вещественных чисел , , …, , называемых управляющими параметрами.

Управляющий в-р: Составленный из управляющих параметров r-мерный вектор-столбец

u (t) = , называемый управляющим вектором, геометрически как точка в Er.

Управлением («траекторией управления») называется функция

{u (t)} = {u (t) }.

управление представляет собой кусочно-непрерывную функцию времени. Управление представляет собой некоторую кривую, состоящую из точек пространства, причем эта кривая непрерывна всюду, за исключением, возможно, некоторого конечного числа точек разрыва второго рода.

Предполагается, что возможные значения управляющих параметров удовлетворяют некоторым ограничениям. Управляющий вектор в каждый момент времени из интервала должен принадлежать некоторому фиксированному непустому подмножеству Ω r-мерного евклидова пространства множеству управлений

u (t) . (11.1.8)

Управление должно принадлежать указанному множеству управлений, т.е.{u (t)} . Фазовая траектория {x (t)} определяется из уравнений движения, т.е. из системы дифференциальных уравнений, в которых скорость изменения каждой фазовой координаты представлена в виде функции фазовых координат, управляющих параметров и времени

(t) = f (x (t), u (t), t),

или в развернутом виде

Предполагается, что каждая из заданных n функций является непрерывно дифференцируемой.

Целевой функционал, максимум которого требуется найти, представляет собой отображение управлений (функций времени) на точки вещественной прямой.

J = J{u (t)} = (x (t), u (t), t)dt + F (x1, t1).

Задача Больца.

Принцип максимума применяется к общей задаче управления, имеющей вид

= (x, u, t)dt + F (x1, t1)

= f (x, u, t),

x (t0) = x0,

x (t1) = x1,

{u (t)} .

Здесь I (…), F (..) и f (…) – заданные непрерывно дифференцируемые функции;

t0, x0 – фиксированные параметры;

t1 или x1 – фиксированные параметры

Траектория управления {u (t)} должна принадлежать фиксированному множеству управлений U, причем u (t) – кусочно-непрерывная функция времени, значения которой должны принадлежать некоторому фиксированному множеству Ω, являющемуся непустым компактным подмножеством пространства Er.

При решении задач методом Лагранжа вводят множители Лагранжа для каждого ограничения, затем строят Лагранжиан и ищется максимум по исходным переменным и минимум по новым переменным. Принцип максимума - распространение метода множителей Лагранжа на задачи динамической оптимизации (задачи управления).

при решении задачи с помощью принципа максимума сначала вводятся n сопряженных переменных y (t) и определяется ф-я Гамильтона H (x, u, y, t) = I (x, u, t) + yf (x, y, t).

Затем отыскиваются функции {u (t)}, {у (t)} и {x (t)}, удовлетворяющие следующим условиям:

(x, u, y, t) при всех t, ,

, x (t0) = x0 (14.1.29)

, .

Эти условия необходимы для существования локального максимума. Форма искомого решения, т.е. оптимального управления, очень часто может быть найдена непосредственно в результате максимизации гамильтониана.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]