Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Лабораторная работа 4

.pdf
Скачиваний:
20
Добавлен:
26.03.2016
Размер:
117.14 Кб
Скачать

Лабораторная работа № 4. Стохастические оптимальные системы

Цель работы: изучение свойств стохастической оптимальной системы, синтезированной на основе синтеза фазовой плоскости.

4.1. Теоретические сведения

Для строго детерминированных систем управления не имеет значения, какое управление – программное или с обратной связью – используется, так как знание управления и начального состояния позволяет однозначно определять состояние системы в любой момент времени. Наблюдение за текущим состоянием системы не дает новой информации. В стохастических системах управления, т.е. в системах, подверженных случайным воздействиям, по известным управлению и начальному состоянию предсказать ход протекания процесса невозможно. И возможности качественного управления такими системами существенно зависят от той информации, которая может быть получена путем измерения (наблюдения) и обработки выходными (наблюдаемыми) переменными. Поэтому стохастические системы управления должны быть замкнутыми.

При рассмотрении детерминированных систем управления также основное внимание. Уделяется замкнутым системам, так как практически все системы управления подвержены случайным или неслучайным, но заранее не прогнозируемым, воздействиям. Т.е. строго детерминированных систем управления не бывает. Однако при анализе и синтезе рассматриваются детерминированные модели в виду их простоты по сравнению со стохастическими моделями, когда случайные воздействия не оказывают существенных влияний.

Стохастическое оптимальное управление при полной информации.

Уравнение объекта имеет вид

x = f(x,u,t) + V0 (t) , x(t0 ) = x0 ,

где х0 – гауссова случайная величина, V0(t) – гауссов белый шум, х0 и V0(t) не коррелированы; белый шум имеет следующие характеристики:

M [V0 (t)]= 0 , M [V0 (t)V0T (t)]= Q0 (t)δ(t t) .

Пусть требуется определить управление с обратной связью, доставляющее минимум критерию оптимальности.

 

t f

 

J = M g0

(x(t f ),t f ) + f0

(x,u,t)dt .

 

t0

 

 

 

Такое управление называется стохастическим оптимальным управлением. Итак, рассматривается задача стохастического оптимального

управления, в которой шум объекта является гауссовым белым шумом и входит в уравнение аддитивно; ограничение на правый конец траектории отсутствует, фазовый вектор наблюдается полностью и без помех. В этой задаче x(t) является марковским процессом (так как случайное воздействие является белым шумом), и вся информация, которая может быть использована при определении характеристики будущего состояния, содержится в x(t). Поэтому оптимальное управление должно быть функцией только от текущего состояния и, быть может, текущего времени.

Управление u = (x(t), t) считается допустимым, если функция u(t) = (x(t),t) кусочно-непрерывна. Кроме того, предполагается, что при допустимом управлении уравнение

x = f (x,u(x,t),t)

при каждом фиксированном х(t0) = х0 имеет единственное решение на интервале [t0,tf]. Функции f0(x, u, t), f(x, u, t) и Q0(t) предполагаются непрерывными.

Стохастическая оптимальная линейная система при полной информации о состоянии. Пусть уравнение объекта и критерий оптимальности имеют вид

 

x = Ax + Bu + V

, x(t

0

) = x0

 

(4.1a)

 

0

 

 

 

 

 

t f

 

 

 

 

 

J = M xT (t f )Fx(t f ) + [xT (t)Qx(t) +uT

(t)Ru(t)]dt .

(4.1б)

 

t0

 

 

 

 

 

 

 

 

 

 

 

Здесь V0 – гауссов белый шум, х0 — гауссова случайная величина; V0 и х0 не коррелированы и имеют следующие характеристики:

Mx0 = x0 , M [(x0 x0 )(x0 x0 )T ]= P0

M[V0 (t)] = 0 , M[V0 (t)V0T (t)] = Q0 (t)δ(t t) ;

матрицы А, В, Q и R, вообще говоря, являются функциями времени, R – положительно определенная матрица, Q, Р0, Q0 – положительно полуопределенные матрицы, объект стабилизируем. Требуется найти

оптимальное управление объекта с обратной связью, обеспечивающее минимум заданному критерию оптимальности, при условии, что фазовый вектор доступен точному измерению.

Теорема 4.1. Стохастическое оптимальное управление с обратной связью для объекта (4.1а) при критерии оптимальности (4.1б) имеет вид

u = −R1BT Kx

(4.2а)

где К – симметрическая матрица, которая определяется из матричного уравнения Риккати

K = −KA AT K + KBR1BT K

(4.2б)

при граничном условии

 

K(t f ) = F .

(4.2в)

Оптимальный закон управления (4.2) совпадает с оптимальным законом управления в детерминированном случае. Таким образом, случайное воздействие на объект и случайное начальное условие не влияют на оптимальный закон управления, если имеется полная информация о фазовом векторе.

Стохастическое оптимальное управление при неполной информации о состоянии. Принцип разделения. Постановка задачи. Пусть уравнения объекта и наблюдения и критерий оптимальности имеют вид

 

x = Ax + Bu +V , x(t

0

) = x0

 

(4.3a)

 

0

 

 

 

 

y = Cx +Vн

 

 

 

(4.3б)

 

t f

 

 

 

 

J = M xT (t f )Fx(t f ) + [xT (t)Qx(t) +uT

(t)Ru(t)]dt .

(4.3в)

 

t0

 

 

 

 

 

 

 

 

 

Здесь V0, Vн – гауссовы белые шумы, x0 — гауссова случайная величина; V0, Vн и x0 не коррелированы и имеют следующие характеристики:

Mx0 = x0 , M [(x0 x0 )(x0 x0 )T ]= P0 ;

M[V0 (t)] = 0 , M[V0 (t)V0T (t)] = Q0 (t)δ(t t) ;

M[Vн(t)] = 0 , M[Vн(t)VнT (t)] = R0 (t)δ(t t)

матрицы A, В, Q и R, вообще говоря, являются функциями времени, R, R0 – положительно определенные матрицы, Q, Р0, Q0 – положительно полуопределенные матрицы. Требуется найти управление

u = u{y(τ),t0 τ t}, t0 t t f ,

при котором критерий оптимальности (4.3а) принимает минимальное значение.

Эта задача отличается от задачи стохастического оптимального управления с полной информацией тем, что в данном случае управление формируется на основе информации, получаемой путем обработки измеряемой с помехой выходной переменной.

Теорема 4.2. Стохастическое оптимальное управление с обратной связью для объекта (4.3а), (4.3б) при критерии оптимальности (4.3в) имеет вид

 

 

u = −R

1

B

T

 

 

 

 

 

(4.4а)

 

 

 

 

Kx ,

 

 

 

 

где К – симметрическая матрица, которая определяется из матричного

 

уравнения Риккати

 

 

 

 

 

 

 

 

 

 

 

 

 

 

K

= −KA AT K + KBR1BT K Q

(4.4б)

при граничном условии

 

 

 

 

 

 

 

 

 

 

 

 

 

 

K(t f ) = F ,

 

 

 

 

 

 

(4.4в)

x – оптимальная оценка, получаемая фильтром Калмана-Бьюси

 

 

 

 

0

 

 

 

 

 

0

 

 

(4.5а)

x

= Ax + Bu + K

 

(y Cx) , x(t0 ) = x

 

 

 

 

 

K 0 = PCT R1

(10.20б)

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

P = AP + PAT PCT R1CP +Q

, P(t

0

) = P

(4.5в)

 

 

 

 

 

0

 

0

 

 

0

 

Оптимальный закон управления (4.4) совпадает с оптимальным законом управления в детерминированном случае и стохастическим оптимальным управлением при полной информации лишь с тем отличием, что в законе управления (4.4а) используется не сам фазовый вектор, а его оценка, которая определяется фильтром Калмана-Бьюси. Таким образом, при неполной информации стохастически оптимальный регулятор состоит из оптимального фильтра (фильтра Калмана-Бьюси) и детерминированного оптимального регулятора. Этот результат известен как принцип разделения, или принцип стохастической эквивалентности. В соответствии с этим принципом задача синтеза стохастической оптимальной системы управления при неполной информации сводится к двум задачам: задаче синтеза фильтра Калмана-Бьюси и задаче синтеза детерминированной оптимальной системы. Если шумы и начальное состояние подчиняются нормальному закону распределения, то в результате такого синтеза получим стохастическую оптимальную систему, в противном случае (шумы и начальное состояние подчиняются другим законам) можем только гарантировать, что полученная таким путем система будет оптимальной в классе линейных систем.

4.2. Порядок выполнения работы

4.2.1Определить стохастическое оптимальное управление при полной информации.

4.2.2Собрать схему стохастической оптимальной системы управления.

4.2.3Построить графики переходных процессов по переменным состояния и управляющему воздействию и фазовый портрет системы.

4.3. Содержание отчета

4.3.1Цель работы.

4.3.2Исходные данные для выполнения работы, модель системы, структурная схема.

4.3.3Расчет оптимального управления и оптимальных траекторий движения системы.

4.3.4Фазовый портрет и временные характеристики.

4.3.5Выводы по работе.

4.4. Варианты заданий

Математическая

Начальное

 

 

 

Функционал

 

 

 

 

 

модель

условие

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

x1 = x2 ,

x2 = 2u +V2O

x(0) = x0

J = M

10

(x2

+ 2x x

 

+

 

2x2

+u2 )dt

 

min

 

 

 

 

2

 

 

 

 

 

 

 

1

 

1

 

 

 

 

 

2

 

 

 

u

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

x1 = x2 ,

x2 = 4u +V2O

x(0) = x0

J = M

10

(x2

+ x

2

+

2x x

 

+

4u2 )dt

 

min

 

 

 

 

2

 

 

 

 

 

 

1

 

2

 

 

 

1

 

 

 

 

u

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

x1 = x2 ,

 

x(0) = x0

J = M

10

(x2

+ 4u

2 )dt

 

min

 

 

 

 

 

 

 

 

 

 

x2 = −x2 + 2u +V2O

 

 

1

 

 

 

 

 

 

 

 

u

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

x1 = x2 ,

 

x(0) = x0

J = M

10

(2x2 + x

2 +u

2 )dt

 

min

 

 

 

 

 

 

 

 

x2 = −2x2 +u +V2O

 

 

 

1

 

2

 

 

 

 

 

 

 

 

u

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

x1 = x2 ,

 

x(0) = x0

J = M

10

(x2

+ x

2

+u2 )dt

 

min

 

 

 

 

 

 

 

 

 

 

x2 = x1 x2 + 2u +V2O

 

 

1

 

2

 

 

 

 

 

 

 

 

 

u

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

x1 = x2 ,

 

x(0) = x0

J = M

10

(x2

+ x

2

+ 4u

2 )dt

 

min

 

 

 

 

 

 

 

 

x2 = −2x1 x2 + 2u +V2O

 

 

1

 

2

 

 

 

 

 

 

 

 

 

u

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

x1 = x2 ,

 

x(0) = x0

J = M

10

(x2

+ 2x

2 + 2u2 )dt

 

min

 

 

 

 

 

 

x2 = −x1 2x2 +u +V2O

 

 

1

 

 

2

 

 

 

 

 

 

 

 

u

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

x1 = x2 ,

 

x(0) = x0

J = M

10

(2x2 + 4x2

+u2 )dt

 

min

 

 

 

 

 

 

x2 = −2x1 2x2 + 2u +V2O

 

 

 

1

 

2

 

 

 

 

 

 

 

u

 

 

 

 

0