
- •7.5. Основные результаты раздела
- •8. Стохастические оптимальные системы
- •8.1. Метод динамического программирования
- •Достаточное условие оптимальности.
- •8.2. Синтез оптимальной системы при полной информации о состоянии
- •8.3. Синтез оптимальных систем управления при неполной информации
- •Наблюдатель Калмана - Бьюси
- •Наблюдатель при цветном шуме объекта
- •Наблюдатель при цветном шуме наблюдения
- •8.4. Стохастическая линейная оптимальная система управления при неполной информации. Принцип разделимости
- •8.5. Основные результаты раздела
- •9. Оптимальные дискретные системы
- •9.1. Синтез оптимальной линейной системы при квадратичном критерии
- •9.2. Стохастическая оптимальная линейная система при полной информации о состоянии
- •9.3. Наблюдатель (фильтр) Калмана
- •9.4. Стохастическая система управления при неполной информации
- •Приложение 1 п1. Функционал и его экстремумы
- •Приложение 2 п2. Матрицы. Дополнительные сведения
- •Характеристическая матрица, характеристические уравнения и собственные значения
9. Оптимальные дискретные системы
Большинство понятий, введенных при рассмотрении непрерывных систем, без изменений переносятся на дискретные системы: управляемость, стабилизируемость, наблюдаемость, восстанавливаемость, обнаруживаемость. В силу специфических свойств дискретных систем отдельные определения требуют уточнения, в частности понятие управляемости дискретного объекта.
Если рассмотреть дискретную линейную нестационарную систему, описываемую уравнениями:
то замена интегрирования суммированием для дискретного варианта матрицы управляемости Грама приводит к выражению
,
где
- переходная матрица дискретной системы,
такой, что
,
и удовлетворяет уравнению
,
причём
.
Таким образом, справедливо
.
Тогда система
управляема в том смысле, как обсуждалось
в разделе 4, если ранг матрицы
равен размерности вектора
,
то есть
,
или, другими словами, матрица
невырождена.
При рассмотрении
систем, инвариантных во времени, т.е.
матрицы А, В и С постоянны,
справедливо утверждение, что система
вполне управляема, если ранг матрицы
управляемости (7.6) равен
.
Если же исследуется вопрос управляемости
по выходу для стационарной системы с
выходом
,
то справедливо требование (4.8).
Точно так же можно рассмотреть и вопрос наблюдаемости (восстанавливаемости) дискретных систем. Для не инвариантных во времени систем критерием наблюдаемости является ранг матрицы
.
Критерий должен быть равен размерности вектора , а для инвариантных или, другими словами, стационарных систем с постоянными матрицами А, В и С справедливо требование (5.4).
Как и для непрерывных систем, для дискретных систем можно использовать понятия и критерии стабилизируемости, обнаруживаемости и произвести вывод уравнений наблюдателей полного и пониженного порядка подобно, как в разделе 5, с учётом методов перехода к дискретным изображениям дифференциальных уравнений.
9.1. Синтез оптимальной линейной системы при квадратичном критерии
Пусть объект описывается линейным уравнением
(9.1)
и задан критерий оптимальности
, (9.2)
где
h(i)
- известная векторная функция; F,
Q(i)
- симметричные неотрицательно определенные
матрицы
R(i)
- симметричная положительно определенная
матрица
Требуется найти оптимальное управление, при котором критерий (9.2) принимает минимальное значение при произвольном условии x(i0)=x0.
Для решения задачи воспользуемся методом динамического программирования. Введем функцию Беллмана
,
. (9.3)
Уравнение Беллмана в этом случае принимает вид
,
из которого, используя уравнение объекта (9.1) и опуская для краткости записи аргумент i , получим
. (9.4)
Решение этого уравнения будем искать в виде
(9.5)
где k(i) - симметричная матрица; p(i) - вектор - столбец размера n; q(i) - скалярная функция.
В силу граничного условия (9.3) имеем:
Подставив (9.5) в (9.4), получим
Правая часть
полученного соотношения как функция
от управления является квадратным
трехчленом, причем этот трехчлен имеет
вид
и является положительно определенной
квадратичной формой, так как по условию
R
0 и k(i)
0, i0
i
if
-1 (будет показано ниже). Поэтому
указанный трехчлен имеет минимум,
который достигается в стационарной
точке, и последнее уравнение можно
представить в виде эквивалентной системы
уравнений:
(9.7)
Из последнего уравнения имеем
откуда после операции транспортирования получим соотношение для оптимального уравнения
(9.8)
где
(9.9)
k(i) - симметричная неотрицательно определенная матрица, определяемая следующим образом. Подставив выражение для управления и используя обозначение (9.9), уравнение (9.7) можно преобразовать к виду
Из последнего уравнения, приравняв отдельно матрицы при квадратичных и линейных относительно x членах, получим при граничном условии k(tf)=p,
,
(9.10)
где p(i) - вектор - столбец размером n определяется из уравнения
(9.11)
при граничном условии p(if) = 0. Приравняв в том же уравнении свободные члены, получим
. (9.12)
Если h(i) = 0, то p(i) = 0. Уравнение (9.12) при p(i) = 0 имеет единственное решение q(i) = 0, удовлетворяющее граничному условию (9.6). Поэтому при h = 0 функция (9.5) принимает вид
Из (9.3) следует S(x(i),i) 0 и k(i) 0 при любом i [i0 , if]. Так как уравнение (9.10), из которого находится матрица k(i) не зависит от h, то сказанное справедливо при любом h. В случае h=0 оптимальное управление имеет вид
(9.13)