Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный технический университет им. H.Э.Баумана

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

RK6_Методы_Оптимизации / Все вместе / Оптимизация Глава 12.doc

Скачиваний:

425

Добавлен:

10.02.2015

Размер:

5.99 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 45 / 95 6 7 8 9 > Следующая >>>

§5. Приближенное решение задачи оптимального управления методом вариаций в пространстве управлений

Метод разработан в ИМП АН СССР Федоренко Р.П. Рассмотрим задачу оптимального управления

(1)

(2)

Обратим внимание на то, что данная постановка задачи оптимального управления не содержит граничного условия и ограничений на вектор фазовых координат.

Положим, что известно некоторое приближение к оптимальному управлению , которое мы будем называтьневозмущенным управлением.

В рассматриваемом методе существенно используется производная функционала . Если для любых достаточно малых возмущений невозмущенного управлениясправедливо соотношение

то - вектор-столбецназываетсяфункциональной производной в смысле Фреше функционала на невозмущенной траекториии обозначается

. (3)

Здесь транспонированный вектор,- некоторая векторная норма.

Техника дифференцирования функционалов, определенных на траекториях динамической системы, достаточно сложна и ее рассмотрение выходит за рамки данного курса. Будем полагать, однако, что мы умеем вычислять функциональные производные (3).

Заметим, что метод вариаций в пространстве управлений применим и к функционалам, отличным от функционала (2), например, к функционалу вида

По существу, при этом изменяется лишь техника вычисления функциональных производных.

В методе вариаций в пространстве управлений на каждой итерации вариация управленияопределяется путем минимизации линейной части приращения функционала, вызванного этой вариаций:

. (4)

Здесь - некоторая малая окрестность невозмущенного управления.

Окрестность имеет важное технологическое значение – удачное построение этой окрестности может значительно повысить вычислительную эффективность метода. Однако задача построения этой окрестности однозначного решения не имеет.

При построении множества следует учитывать следующие требования.

Из того факта, что , должно следовать, что.
Множество должно быть достаточно малой окрестностью траектории, чтобы линейная частьприращения функционаладостаточно точно описывала это приращение.
Множество должно быть достаточно большой окрестностью траектории, чтобы сходимость управления к оптимальному управлению не была слишком медленной.
Множество должно бытьполной окрестностью невозмущенного управления . Окрестностьтраекторииназывается полной, если для любой допустимой вариации управления(т.е. такой вариации, что) существует такое число, чтодля всехи для всех. Понятие полной окрестности формализует требование полноты допустимых вариаций – окрестностьдолжна содержать вариации невозмущенного управления во всех допустимых направлениях.

Схема метода вариаций в пространстве управлений.

Из каких либо соображений задаем начальное приближение к оптимальному управлению и полагаем счетчик числа итераций равным.
С управлением решаем задачу Коши для системы ОДУ (1) – получаем фазовую траекторию.
Вычисляем - значение критерия качества управления (2) на невозмущенной траектории.
В окрестности невозмущенной траектории выполняем линеаризацию задачи – вычисляем функциональную производную

и определяем окрестность невозмущенной траектории.

Из условия

(5)

находим приращение управления.

Полагаем .
Если условие окончания итераций выполнено (см. ниже), то в качестве приближения к оптимальному управлению принимаем управление и заканчиваем вычисления. Иначе – полагаеми переходим к п. 2●

В качестве условия окончания итераций естественно принять условие

где - некоторая функциональная норма,заданная константа.

Заметим, что задача (5) может быть сведена к задаче линейного программирования, что является значительным достоинством метода.

Входные термины:

задача оптимального быстродействия;
фазовое пространство;
динамическая система.

Выходные термины:

принцип оптимальности;
функция Беллмана;
уравнение динамического программирования Беллмана;
метод динамического программирования Беллмана.

<<< < Предыдущая 1 2 3 45 / 95 6 7 8 9 > Следующая >>>

Соседние файлы в папке Все вместе

#
10.02.201534.3 Кб87Введение.doc
#
10.02.20157 Mб115Оптимизация Глава 1.doc
#
10.02.20151.7 Mб97Оптимизация Глава 10.doc
#
10.02.20153.71 Mб129Оптимизация Глава 11.doc
#
10.02.20155.99 Mб425Оптимизация Глава 12.doc
#
10.02.20152.38 Mб107Оптимизация Глава 2.doc
#
10.02.2015424.45 Кб94Оптимизация Глава 3.doc
#
10.02.20152.88 Mб99Оптимизация Глава 4.doc
#
10.02.2015889.34 Кб104Оптимизация Глава 5. doc.doc
#
10.02.20151.93 Mб149Оптимизация Глава 6_1.doc