Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2488

.pdf
Скачиваний:
6
Добавлен:
07.01.2021
Размер:
12.38 Mб
Скачать

х t A KC х t B KD u t Ky t ;

у t Cх t Du t ; r t Q y t у t ,

где r t Rp – остаточный вектор; xˆ, yˆ – оценки векторов состояния и выходного сигнала соответственно; матрица Q Rp m – матрица весов остатков.

Системное уравнение для вектора ошибки оценивания состояния e t x t xˆ t и вектора остатка r t :

е t (A KC)e t Ed t R1 f t KR2 f t ;

r t QCe t QR2 f t .

Преобразование Лапласа отклика остатка на неисправности и возмущения:

r s QR2 f s QC sI A KC 1 R1 KR2 f sQC sI A KC 1E d s e 0 ,

где e 0 – начальное значение ошибки оценивания состояния. Очевидно, что остаток r t и ошибка оценивания e t ненулевые

даже при отсутствии неисправностей. Трудно отличить влияние неисправностей от влияния возмущений, действующих на систему. Влияние возмущений приводит к ложным срабатываниям FDI, поэтому для минимизации ложных срабатываний необходимо формировать остатки, декомпозированные относительно возмущений и неисправностей.

Многокритериальная диагностика неисправностей. И неис-

правности и возмущения действуют на остаток, трудно различить эти два эффекта. Необходимо увеличить влияние неисправностей на остаток и уменьшить влияние возмущений. Увеличить влияние неисправностей можно максимизацией следующего индекса в заданном диапазоне частот:

inf QR2

QC j I A KC 1

1

, что экви-

R1 KR2

 

1, 2

 

QR2 QC j I A KC 1

 

1

,

 

 

 

валентно 1 K,Q

sup

R1 KR2

1, 2

где , обозначают минимальные и максимальные сингулярные зна-

чения матрицы соответственно.

171

Влияние возмущений и начальных условий можно редуцировать

минимизацией индекса: 2 K,Q

sup

QC j I A KC 1 .

 

1, 2

Кроме неисправностей и возмущений на остаток влияет шум. Пусть t шум входного сигнала; t шум чувствительного элемента; системные уравнения в этом случае

x t Ax t Bu t R1 f t t ;

y t Cx t Du t R2 f t t .

Шум чувствительного элемента, так же как неисправности, действуя через R2 f t , действует на остаток таким же образом, но диапазоны частот неисправностей и шума различны. Для редуцирования влияния шума на остаток необходимо минимизировать норму

Q QC j I A KC 1K .

Влияния возмущений и неисправностей могут быть разделены при использовании различных частотно-зависимых весовых штрафов:

 

 

 

 

1

 

1 K,Q sup

 

W1 j QR2 QC j I A KC 1 R1 KR2

.

1, 2

 

 

Для минимизации влияния шума на остаток введем индекс

 

 

 

 

1

 

 

3 K,Q

sup

W3 j Q I C j I A KC 1K

.

 

1, 2

Для максимизации влияния неисправностей на низких частотах и минимизации шумов на высоких вводится частотно-зависимый весовой множитель W1 j , имеющий большое значение амплитуды на низких частотах и малое значение на высоких. Частотный эффект W3 j должен быть обратным: W3 j W1 1 j .

Рассмотрим установившееся значение остатка: r QR2 f QC A KC 1 KR2 R1 f A KC 1d . По-

сле времени переходного процесса стационарное значение остатка играет важную роль в FDI. Идеально это должно реконструировать сигнал неисправности. Влияние возмущения на остаток может быть

редуцировано минимизацией индекса: 4 K A KC 1 ; при этом

матрица K увеличивается и норма A KC 1K приближается к по-

стоянному значению. Это означает, что влияние неисправности на ос-

172

таток не изменяется уменьшением влияния возмущения, что и требуется для хороших характеристик FDI.

Распределение возмущений и локализация неисправности.

Предположим, что матрица распределения возмущений известна: d t Ed' t , где E известная матрица; d' t неизвестный вектор. В

этом случае 2 K,Q

sup

W2 j QC j I A KC 1E .

 

1, 2

Для локализации неисправности должно быть сформировано структурированное остаточное множество. Структурированный означает чувствительность к одним неисправностям и нечувствительность к другим. Неисправности могут быть разделены на две группы: f1 t , f2 t уравнение системы в этом случае запишется

x t Ax t Bu t R11 f1 t R12 f 2 t d t ; y t Cx t Du t R21 f1 t R22 f 2 t .

Если проектировать остаток, чувствительный к f1 t и нечувствительный к f2 t , то индекс 1 K,Q должен быть изменен:

 

 

 

 

W1 j QR21

 

 

1

.

1 K,Q

sup

 

QC j I A KC 1 R11

KR21

 

 

1, 2

 

 

 

 

Индекс 5 K,Q должен быть минимизирован для формирования

нечувствительности остатка к f2 t .

 

 

 

 

 

 

W5 j QR22

 

 

1

.

5 K,Q

sup

 

QC j I A KC 1 R12

KR22

 

1, 2

Многокритериальная диагностика неисправностей. В общем случае не существует решения, которое минимизирует все индексы характеристик. Параметр, обеспечивающий минимизацию частного индекса, может привести к недопустимому росту других индексов характеристик, следовательно, проектирование должно проводиться с компромиссами. Подходом к решению многокритериальной задачи оптимизации при проектировании СУ является метод неравенств в комбинации с Gas, основная концепция которого в замене минимизации индексов ограничениями в форме неравенств на индексы характеристик. То есть многокритериальная оптимизация переформулируется как задача нахождения множества параметров Z,W,Q, удовлетворяющих следующим неравенствам: i Z,W,Q i, i 1,...,5, где действительные числа i представляют численные границы (требования разработчика) индексов характеристик i Z,W,Q .

173

Если минимальное значение i Z,W,Q , достигаемое минимиза-

цией, есть i*, то границы критериев должны удовлетворять неравен-

ству i i*, так как множество параметров минимизирующих частные индексы характеристик могут увеличивать другие индексы. Если

i* Zi*,Wi*,Qi* минимальное

значение

для i Z,W,Q при

пара-

метрах Zi*,Wi*,Qi* , то выполняются

следующие неравенства:

i Zi*,Wi*,Qi* i* Zi*,Wi*,Qi* , где i j для i, j 1, 2, 3, 4, 5 ;

общее

правило для формирования границ i :

 

 

i* Zi*,Wi*,Qi* i

max

i Zi*,Wi*,Qi* .

 

 

i, j 1,2,3,4,5 ;i j

 

Задача многокритериальной оптимизации – найти множество параметров для размещения всех индексов характеристик в приемлемых областях. Регулируя границы i , можно акцентировать любую из це-

лей. Если индекс j важен для задачи, можно приблизить j к *j .

Пусть i множество параметров Z,W,Q , для которых выполняется i-й критерий: i Z,W,Q : i Z,W,Q i . Тогда допустимое

множество параметров, для которых

выполняются все

критерии:

Z,W,Q : i Z,W,Q i; i 1,...,5 .

Это допустимое

множество

может быть найдено методом неравенств в сочетании с GAs.

3.5. Нахождение равновесия Нэша динамических игр n лиц

Игра n лиц определена множеством Sk ; k 1,...,n допустимых стратегий каждого игрока k и платежными функциями fk . Предполагается, что игроки могут выбрать свои стратегии независимо друг от друга. Однако в некоторых приложениях общая сумма ресурсов, используемых всеми игроками, ограничена. Будем использовать стратегическое представление игры n лиц в виде

 

 

G n,S1,...,Sn,S S1 ... Sn,f1,..., fn .

 

Введем

обозначения: x x1,...,xn ,

x k x1,...,xk 1, xk 1,...,xn ,

x x k ,xk .

Лучшее отображение реакции игрока k с окружением

x k :

gk xk arg max fk x k ,xk | x k ,xk S .

 

 

xk

 

174

 

Равновесие Нэша игры G такой вектор x* x1*,...,xn* S ,

что

xk* gk xk* , k ; следовательно,

fk x*k ,xk fk x*k ,xk* .

 

 

 

 

 

Введем отображение x g x g1 x ... gn x ,

тогда x* рав-

новесие Нэша, если и только если x* g x* .

 

 

 

 

 

 

Пример олигополии Карно. Предположим, что n фирм производят

одно и то же

изделие;

xk

выпуск продукции фирмы k;

Ck xk

 

функция стоимости фирмы k;

p s

функция цены;

s x1 ,..., xn

 

полный выпуск продукции. Если Lk

предел возможностей фирмы k,

то

Sk 0, Lk

множество всех достижимых стратегий фирмы k;

 

 

 

 

 

 

n

 

Ck xk – её платежная функция. Если отсут-

fk x1,...,xn xk p

xi

 

 

 

 

i 1

 

 

 

 

 

 

Такую игру n лиц называют

ствуют ограничения,

то S S1 ... Sn.

олигополией

Cournot.

Предположим,

что

p' s Ck" xk 0;

'

s xk p

"

s

0;

xk

 

 

 

 

 

n

 

 

 

 

 

 

p

 

0, Lk ;s 0,

Li . Введем обозначение

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

sk

xi ,

тогда fk sk ,xk xk p sk xk Ck xk

строго вогнутая в

 

i k

 

 

 

 

 

 

 

 

 

 

функцию от s,

 

 

 

 

xk . Удобно рассматривать xk как

тогда

1)

если

p s Ck' 0 0, то

лучший

выбор

фирмы k:

xk s 0;

2)

если

p s xk p' s Ck'

Lk 0,

xk s Lk ; 3)

иначе лучший выбор может

быть получен как решение уравнения

p s xk p' s Ck' xk 0

на

интервале 0, Lk .

 

Левая часть этого уравнения непрерывно диффе-

ренцируема и строго уменьшающаяся в

xk , её значение в xk 0

положительно

и

 

в

 

xk Lk

отрицательно;

поэтому существует

единственное

решение

xk xk s .

Дифференцируя

уравнение

 

p s xk p' s Ck' Lk 0,

получим p' s xk' s p' s xk s p" s Ck" xk s xk' s 0, считая, что

xk' s p' s xk s p" s p' s Ck" xk s 0. Равновесие Нэша –

единственное решение s* монотонного уравнения с одним неизвест-

n

ным: xk s s 0, где s* полный выпуск продукции в точке рав-

k 1

новесия и равновесный выпуск продукции фирмы k: xk* xk s* .

175

Вычисление равновесия Нэша. Существует несколько различных концепций вычисления равновесия Нэша. Рассмотрим три наиболее часто используемых метода: решение для фиксированных точек, редуцирование к вариационным неравенствам и преобразование задачи о равновесии к задаче оптимизации.

Пусть g лучшее отображение реакции x g x g1 x ... gn x ,

тогда x* равновесие Нэша, если и только если x* g x* . Если g x

функция одной переменной, то x* фиксированная точка, если и только если x* g x* ; в этом случае необходимо решить систему алгебраических уравнений. Если g x множество, то существует система неравенств, независимых от x, необходимо найти допустимое решение этих неравенств.

Введем

функцию

n

агрегирования: Hr x,y rk fk x k,yk с

r rk 0.

 

k 1

Очевидно,

что x* равновесие если и только если

Hr x* ,x* Hr x* ,y ; x S, то max h x,r T x x* 0, где h: S RM:

 

x S

 

 

h x,r r1 1 f1 x ...

rn n fn x T ;

M m1 ... mn;

mk размер-

ность xk ; r r1,...,rn

неотрицательный вектор. Рассмотрим сле-

дующий итеративный алгоритм: пусть задан произвольный x 1 S ;

решим задачу оптимизации max f x,x 1 ;x S .

Пусть x 2

решение

этой задачи, определим 1

f x 2 ,x 1 . Если

0, то x 1

равнове-

 

 

1

 

 

 

сие, иначе 1 0. Общий k-й шаг следующий:

для существующих

x 1 ,...,x k , 1,..., k 1 0

найдем

x k 1 , k

для

задачи

max ; f x,x i ;x S;i 1,...,k .

Существует

подпоследователь-

ность итерационной последовательности x 1 ,x 2 ,..., которая сходится к единственному равновесию Нэша.

Распространение на динамические системы. Рассмотрим ди-

намическую игру олигополии одного продукта. Маржинальная при-

 

fk

 

 

'

 

'

быль фирмы k:

 

x p

xi

xk p

xi

Ck xk . Если маржи-

xk

 

 

i

 

i

 

нальная прибыль положительна (отрицательна), то фирма увеличивает (уменьшает) выпуск своей продукции; если маржинальная прибыль

176

равна нулю, то (учитывая вогнутость fk в xk ) выпуск максимизирует прибыль. Корректирующая концепция может моделироваться следующим образом:

xk t Kk p i xi xk p' i xi Ck' xk ;Kk 0; k 1,...,n.

Динамическое равновесие этой системы имеет точку внутреннего равновесия. При исследовании динамических игр рассмотрим только асимптотическое поведение траектории t . Локальная асимптотическая устойчивость исследуется на основе локальных собственных значений якобиана. Якобиан имеет структуру J D a 1T , где

 

 

 

'

 

1

 

 

'

 

 

n

 

 

T

D diag K1 p xi

Cn

x1 ,...,Kn p xi

Cn

xn ;

1 1,...,1 ;

 

 

 

i

 

 

 

 

 

i

 

 

 

 

 

 

 

'

 

 

 

"

 

 

 

'

 

 

"

 

T

a K1 p

xi x1 p xi

... Kn p

xi

xn p xi

.

 

 

i

 

 

i

 

 

 

i

 

 

i

 

 

Пусть di

обозначает i-й диагональный элемент D и ai

i-й эле-

мент вектора a. Характеристический полином якобиана:

 

 

 

det D a1Τ I det D I det I D I 1a1Τ

 

n

 

 

 

n

ai

 

 

 

 

 

 

 

 

 

di

1

 

 

0.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1 di

 

 

 

 

 

 

 

Это уравнение эквивалентно полиномиальному уравнению степени n. Найдем n действительных отрицательных корней, следовательно, динамическое равновесие локально асимптотически устойчиво.

3.6. Исследование СУ с помощью дифференциальных игр

Рассмотрим задачу дифференциальных игр – в нашем случае обобщенную задачу оптимального управления с двумя игроками.

Один игрок выбирает управление u t u Rmu и минимизирует свой функционал качества, другой игрок выбирает управление v t v Rmυ и максимизирует свой функционал качества. Дифференциальная игра называется игрой с нулевой суммой, если два функционала качества идентичны. Дифференциальные игры интересны в связи H теорией робастного управления.

177

Применение теории оптимального управления к теории дифференциальных игр является прямым: в принципе максимума Понтрягина функция Гамильтона минимизируется по отношению к управлению u; в принцип минимакса Нэша-Понтрягина функция Гамильтона одновременно минимизируется по отношению к u и максимизируется по отношению к v.

Будем рассматривать системы, инвариантные во времени, с неограниченными управлениями u, v и свободным (незакрепленным) состоянием в финальное время tb .

Общая постановка задачи. Найти такие непрерывные управления u: ta,tb Rmu ; v: ta,tb Rmv , что система x t f x t ,u t ,v t переводится из начального состояния x ta xa в терминальное с временем

tb

tb с функционалом качества J u,v K x tb (x x t ,u t ,v t dt, ми-

ta

нимизируемым по отношению к u и максимизируемым по отношению к v.

Подзадача 1. Оба игрока используют разомкнутое управление: u t u t,xa,ta ;v t v t,xa,ta .

Подзадача 2. Оба игрока используют замкнутое управление: u t ku x t ,t ;v t kv x t ,t .

Специальная постановка задачи с разделением переменных.

Функции f и L могут быть разделены:

f x t ,u t ,v t =f1 x t ,u t +f2 x t ,v t ;L x t ,u t ,v t =L1 x t ,u t +L2 x t ,v t .

Принцип минимакса Нэша-Понтрягина. Функция Гамильтона

H :Rn Rmu Rmv Rn R.

H x t ,u t ,v t , t L x t ,u t ,v t T t f x t ,u t ,v t .

Если uo : ta,tb Rmu ; vo : ta,tb Rmv

оптимальные управле-

ния, то выполняются следующие условия:

a)xo t = H=f xo t ,uo t ,vo t ;

xo ta =xa;

 

 

 

f

T

 

o t = xH= xL xo t ,uo t ,vo t

 

 

xo t ,uo t ,vo t

o t ;

 

 

 

 

 

 

 

x

 

 

o tb = xK xo tb ;

178

б) гамильтониан H xo t ,u t ,v t , o t имеет седловую точку по отношению к u Rmu ; v Rmv ; t ta, tb .

H xo t ,uo t ,vo t , o t H xo t ,u t ,vo t , o t ; u Rmu ; H xo t ,uo t ,vo t , o t H xo t ,uo t ,v t , o t ; v Rmv ;

в) далее в случае подзадачи 2 при применении закона управления v t kv x t , t , uo минимизирующее управление задачи оптимального управления; при применении закона управления u t ku x t , t , vo максимизирующее управление задачи оптимального управления.

Теория Hamilton-Jacobi-Isaacs (HJI). В принципе минимакса Нэ-

ша-Понтрягина выражено необходимое условие для H для получения равновесия Нэша в седловой точке uo, vo формированием нера-

венств H xo,uo,v, o H xo,uo,vo, o H xo,u,vo, o .

Для распространения теории HJI на теорию дифференциальных игр сформулируем необходимое условие равновесия Нэша в виде minmaxH xo,u,v, o maxminH xo,u,v, o H xo,uo,vo, o .

u v

v

u

 

 

 

Рассмотрим задачу дифференциальных игр, инвариантную во

времени:

найти

два

таких

закона

управления

u x :Rn Rmu ; v x :Rn

Rmv ,

что

динамическая

система

x t f x t ,u t ,v t развивается от начального состояния x ta xa к конечному со временем tb и функционалом качества:

tb

J u,v K x tb L x t ,u t ,v t dt,

ta

минимизируемая управлением u и максимизируемая v.

Предположим, что функция Гамильтона H L x,u,v T f x,u,v

имеет единственное равновесие Нэша для x, Rn . Соответствую-

щие H-минимизиующие и H-максимизирующие управления: u~ x, ,

~v x, .

Если функция

J x, t

удовлетворяет

граничным условиям

J x, tb K x и

HJI

PDE,

J

minmaxH x,u,v, xJ

 

~

 

t

u v

 

 

 

 

~

 

n

ta,tb ,

maxminH x,u,v, xJ H x,u

x, xJ ,v(x, xJ), xJ ; x, t R

 

v u

~

x, xJ ;

~

 

 

 

 

 

то закон управления u x u

v x v(x, xJ) оптимальный.

179

 

LQ задача дифференциальной игры. Найдем такие непрерыв-

ные

неограниченные управления u: ta,tb Rmu ;

v: ta,tb Rmv ,

что

система x t Ax t B1 u t B2v t переводится

из начального

состояния x ta xa в состояние с финальным временем tb и функционал качества

 

tb

 

 

J u,v 0,5xT tb Fx tb 0,5 xT t Qx t uT t u t 2vT t v t dt,

 

ta

 

 

F ; Q 0

одновременно уменьшается выбором u и увеличивается

выбором v.

 

 

 

Решение LQ дифференциальной игры на основе принципа

минимакса

Нэша-Понтрягина.

Функция

Гамильтона:

H 0,5xTQx 0,5uTu 0,5 2vT v T Ax T B1u T B2v .

Необходи-

мые условия, следующие из принципа минимакса Нэша-Понтрягина: xo= H=Axo+B1uo+B2vo;

o= xH= Qxo AT o;

uH=0=uo+B1T o;

vH=0= 2vo+B2T o .

Таким образом, минимаксная функция Гамильтона определяет H-минимизирующие и H-максимизирующие законы управления: uo t B1T o t ;vo t 2B2T o t . Подстановка их в дифференциальное уравнение для x приведет к линейной двухточечной граничной задаче: xo t =Axo t B1 B1T o t + 2B2B2T o t ; o t = Qxo t AT o t ; xo ta =xa; o tb =Fxo tb .

Два дифференциальных уравнения однородны в xo, o и в ко-

нечное время tb вектор o tb линейная функция вектора xo tb ; поэтому примем o t K t xo t , где K t n n матрица.

Дифференцированием найдем

 

Kx Kx Kx KAx KB

B1T Kx 2KB B2T Kx Qx AT Kx

 

K AT K KA KB

1

2

 

или

B1T K

2KB B2T K Q x 0; t

ta, tb .

 

2

 

2

 

 

Результирующие

законы

оптимального

управления:

uo t B1T K t xo t ;vo t 2B2T K t xo t , где симметричная положи- тельно-определенная n n матрица K t решение дифференциального

180

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]