Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
RK6_Методы_Оптимизации / Все вместе / Оптимизация Глава 12.doc
Скачиваний:
425
Добавлен:
10.02.2015
Размер:
5.99 Mб
Скачать

§5. Приближенное решение задачи оптимального управления методом вариаций в пространстве управлений

Метод разработан в ИМП АН СССР Федоренко Р.П. Рассмотрим задачу оптимального управления

(1)

(2)

Обратим внимание на то, что данная постановка задачи оптимального управления не содержит граничного условия и ограничений на вектор фазовых координат.

Положим, что известно некоторое приближение к оптимальному управлению , которое мы будем называтьневозмущенным управлением.

В рассматриваемом методе существенно используется производная функционала . Если для любых достаточно малых возмущений невозмущенного управлениясправедливо соотношение

,

то - вектор-столбецназываетсяфункциональной производной в смысле Фреше функционала на невозмущенной траекториии обозначается

. (3)

Здесь транспонированный вектор,- некоторая векторная норма.

Техника дифференцирования функционалов, определенных на траекториях динамической системы, достаточно сложна и ее рассмотрение выходит за рамки данного курса. Будем полагать, однако, что мы умеем вычислять функциональные производные (3).

Заметим, что метод вариаций в пространстве управлений применим и к функционалам, отличным от функционала (2), например, к функционалу вида

.

По существу, при этом изменяется лишь техника вычисления функциональных производных.

В методе вариаций в пространстве управлений на каждой итерации вариация управленияопределяется путем минимизации линейной части приращения функционала, вызванного этой вариаций:

. (4)

Здесь - некоторая малая окрестность невозмущенного управления.

Окрестность имеет важное технологическое значение – удачное построение этой окрестности может значительно повысить вычислительную эффективность метода. Однако задача построения этой окрестности однозначного решения не имеет.

При построении множества следует учитывать следующие требования.

  1. Из того факта, что , должно следовать, что.

  2. Множество должно быть достаточно малой окрестностью траектории, чтобы линейная частьприращения функционаладостаточно точно описывала это приращение.

  3. Множество должно быть достаточно большой окрестностью траектории, чтобы сходимость управления к оптимальному управлению не была слишком медленной.

  4. Множество должно бытьполной окрестностью невозмущенного управления . Окрестностьтраекторииназывается полной, если для любой допустимой вариации управления(т.е. такой вариации, что) существует такое число, чтодля всехи для всех. Понятие полной окрестности формализует требование полноты допустимых вариаций – окрестностьдолжна содержать вариации невозмущенного управления во всех допустимых направлениях.

Схема метода вариаций в пространстве управлений.

  1. Из каких либо соображений задаем начальное приближение к оптимальному управлению и полагаем счетчик числа итераций равным.

  2. С управлением решаем задачу Коши для системы ОДУ (1) – получаем фазовую траекторию.

  3. Вычисляем - значение критерия качества управления (2) на невозмущенной траектории.

  4. В окрестности невозмущенной траектории выполняем линеаризацию задачи – вычисляем функциональную производную

и определяем окрестность невозмущенной траектории.

  1. Из условия

(5)

находим приращение управления.

  1. Полагаем .

  2. Если условие окончания итераций выполнено (см. ниже), то в качестве приближения к оптимальному управлению принимаем управление и заканчиваем вычисления. Иначе – полагаеми переходим к п. 2●

В качестве условия окончания итераций естественно принять условие

,

где - некоторая функциональная норма,заданная константа.

Заметим, что задача (5) может быть сведена к задаче линейного программирования, что является значительным достоинством метода.

Входные термины:

  • задача оптимального быстродействия;

  • фазовое пространство;

  • динамическая система.

Выходные термины:

  • принцип оптимальности;

  • функция Беллмана;

  • уравнение динамического программирования Беллмана;

  • метод динамического программирования Беллмана.