![](/user_photo/_userpic.png)
книги из ГПНТБ / Егоров С.В. Элементы идентификации и оптимизации управляемых систем учеб. пособие
.pdfвующих тактах, поэтому работу схемы можно описать с по мощью линейного уравнения
р{/г]= a\p[k— 1]® ci2p[k — 2]® . . •© amp[k —m], (3-55)
где коэффициенты |at) принимают значения 0 или 1 [3-12]. С л о ж и в п о модулю 2 обе части (3-55) с p[k], перепишем вы
ражение в виде
anp[k—m]® . . .©aip{& — 1]©р[6]=0.
Введем оператор D задержки на один такт (Dh обозна |
|||
чит тогда задержку на k тактов) и |
перепишем |
последнее |
|
выражение с учетам того, что коэффициенты |
]а;] |
равны О |
|
или 1, в виде |
|
|
|
(Dm© Dm~x 0 • • • ф D © |
/) р [fe] = |
О, |
|
где l= D ° — оператор идентичности. Поскольку рЩф 0, то
выражение
£>”* © . . . © /=0, |
(3-56) |
является характеристическим уравнением М-регистра. |
|
Полином задержек в левой части (3-56) |
называется ха |
рактеристическим. Справедливо следующее утверждение: |
|
Чтобы М-регистр генерировал М-сигнал, |
характеристи |
ческий полином должен быть примитивным, т. е. ■неразло
жимым на множители, степени которых меньше пг. |
нес |
||
Для данной степени пг существует в общем случае |
|||
колько примитивных |
полиномов, число |
которых |
равно |
W-1-ф(2т —1), где ф — функция Эйлера |
в теории |
чисел |
|
[3-15]. Таким образом, |
для нахождения примитивных |
поли |
номов надо разложить выражение D2m-1®/ на множители
ивыбрать среди них примитивные.
Втабл. 3-1 приведены некоторые из примитивных поли номов для от—5, ..., 10, по которым можно реализовать М-регистр, причем для полинома при т = 8 М-регистр имеет
три схемы антисовпадения в цепи обратной связи, а для ос тальных — только одну.
Задержка М-сигнала на число тактов L<M также легко осуществляется при помощи схем аятисовпадений [3-15].
При одновременной идентификации нескольких, напри мер, г каналов многомерных объектов, возникает необходи
мость в получении либо нескольких некоррелированных в смысле (3-536) пробных сигналов, либо одного сигнала с пе риодом гТд.
121
m
5
6
7
8
9
10
S: 1! to 3 1
31
63
127
255
511
1023
|
|
Таблица 3-1 |
||
n r 1 • ф (TV) |
Примеры п р и м и т и в н ы х |
|||
ПОЛИ Н О МО В |
||||
|
||||
6 |
D6 0 |
D * 0 / |
||
6 |
D * 0 D 0 / |
|
||
18 |
D7 0 |
D3 0 |
/ |
|
16 |
О8© D* 0 |
D *0 D20 / |
||
48 |
D* 0 |
D4 0 |
/ |
|
60 |
O10 0 |
D* 0 |
/ |
Один из путей получения таких сигналов состоит в об разовании последовательностей {pi) длиной Nk, элементы
которых равны
|
|
Pi, s Фл |
о(2> |
, |
, |
(3-57) |
|
|
12^ |
Ps I |
1 2 |
|
|||
где |
— элементы ПСДС периода |
N, <р(, — элементы ±1 |
|||||
Ps |
двоичной последовательности <р<периода k, когда N in k не
имеют общих множителей, s — сдвиг. Если в качестве {ф(} взять систему ортогональных на интервале (О, Л] функций типа Радемахера или Уолша, присвоив значениям этих функций на интервалах постоянства величины *1, то полу ченные последовательности будут ортогональны при любом сдвиге. Поясним образование их на примере функций Раде махера для k = 2\ i= 0, 1, 2, .... Эти функции легко получить как строки (или столбцы) матриц Адамара Нк, т. е. квадрат ных матриц размера (kXk) с элементами *1, образованных
из клеточных матриц более низкого порядка по реккурентной формуле
H2n
H2i-i
! Н2ы |
|
1 |
i = l , 2 , . . . ; # 0 = 1. (3-58) |
T |
При этом последовательность р^,, полученная с по
мощью первой строки матрицы Адамара и состоящая из еди ниц, представляет лишь 2‘ периодов исходной последователь
ности |
последовательность |
полученная из второй |
строки, |
также состоит из 2' периодов последовательности |
122
р|5), но в четных периодах последняя имеет обратный знак своих элементов (кососимметричная последовательность) и т. д. Все сигналы {pf\} для i> l имеют в отличие от ис
ходной последовательности нулевое среднее значение, что полезно в смысле условия '(3-53).
Для 'идентификации нелинейных систем следует приме нять многоуровневые сигналы, удовлетворяющие условиям (3-53), ](3-54). Хотя при этом сигнальная матрица уже не может быть сделана диагональной, применение пробных сиг налов, обладающих ортогональностью первого и более вы сокого порядка, т. е. удовлетворяющих условию
т
(3-59)
при несовпадающем хотя бы одном индексе стандартных ре акций, существенно улучшает обусловленность нормальных уравнений для нахождения коэффициентов модели.
При определении нелинейной модели второго порядка целесообразно применять трехуровневые пробные сигналы (р(3)) с уровнями +а, 0, —а, (3-11, 3-13]. Такие сигналы мо
гут быть получены, например, с помощью |
трехуровневых |
||
Af-регистров или из двоичной |
последовательности р(2> по |
||
формуле |
|
|
|
pf) = ( - 1 у (р<« - |
/>£>,), s = 0, |
1, ... |
(3-60) |
Такая троичная последовательность некоррелирована с исходной и кооосимметричной последовательностям^.
§ 3-7. Метод адаптивной модели
Рассмотренные выше методы идентификации являются разомкнутыми в том смысле, что в них отсутствует проверка
правильности получаемой модели. С этой точки зрения, идентификация, использующая алгоритмы подстройки моде ли по рассогласованию между нею и объектом, является более точной. Поскольку структура модели задается, то за дача сводится к определению алгоритма настройки парамет ров модели С|, .... cN (рис. 3-9), минимизирующих заданный
123
критерий идентификации /, являющийся выпуклым функ ционалом от ошибки:
г
J И = Т I F'[у'{t)~ |
{t' С))dt• |
(3'61} |
|
и |
|
|
|
Направление изменения вектора |
параметров |
С=(с\, .... |
|
cN) T, определяется градиентом |
т |
|
|
|
|
|
|
VcJ = T ' ~ d c $ F{e(t’ C))dt = |
|
||
=*4 ^ |
•(■£)! |
(3-62> |
Рис. 3-9. Схема метода адаптивной модели
Таким образом, задача идентификации свелась к опреде лению градиента и алгоритм настройки параметров модели при этом записывается:
а) |
при шаговой настройке С[*+ 1]=С5*]—I\Vc/(C[f]), |
|
* = 1,2,...; |
|
|
б) |
при непрерывной С = — r (V c/(C(f)), |
(3-63) |
где Г — матрица (Ny^N), коэффициенты которой могут за
висеть от времени, причем от их выбора зависит сходимость процесса настройки (более подробно о градиентных алго ритмах ем. § 4-8). В частном, практически часто встречаю щемся случае,
Г.=У (t )‘I, |
(3-64) |
где I — единичная матрица.
124
Рассмотрим выражение (3-62). Поскольку ни градиент
Vc/, ни вектор параметрической чувствительности ^
в явном виде не измеряются, то при реализации алгоритма
настройки (3-63) необходимо в первую очередь |
найти один |
|||
из этих векторов. Из существующих в настоящее |
время ме |
|||
тодов их определения можно отметить (3-17, 3-18]: |
|
|||
1) |
метод синхронного детектирования; |
|
||
2) |
метод двух моделей с параметрами С и С+ АС; |
|||
3) |
метод производной, когда по замеренной величине |
|||
|
dJ |
дС |
dJ |
(3-65) |
|
д С |
' dt |
' dt |
|
|
|
можно судить о величине V c/;
4) метод моделей чувствительности.
Последний метод получил наибольшее распространение. Получение функций чувствительности с помощью ее модели сильно упрощается, если ошибка линейно зависит от на страиваемых параметров, что предполагает представление (выхода модели в виде линейной комбинации коэффициен тов:
|
N |
|
|
|
|
|
yVi |
2 |
1 |
е» ■*»(*). |
|
|
|
|
п |
|
|
|
|
|
где {$„}—стандартные реакции. |
В этом |
случае |
функции |
|||
чувствительности равны |
|
|
|
|
|
|
J L = - s |
n(t), |
n « |
1......... |
А/, |
(3-66) |
|
дсп |
|
|
|
|
|
|
поэтому специально модель чувствительности строить не надо.
Отметим следующее обстоятельство. Использование кри терия (3-61) и алгоритмов (3-63) предполагает достаточно Медленную подстройку модели при выборе времени усредне ния Т, соизмеримом со временем переходных процессов
объекта. Если характеристики последнего за это время из меняются существенно, то возникающая ошибка слежения за объектом может быть недопустимо большой. Кроме того, Непрерывный характер алгоритмов подстройки (3-636) пло хо согласуется с периодическим характером определения критерия идентификации (3-61) или градиента (3-62). Вслед
125
ствие этого можно предложить в алго,ритмах (3-62) исполь зовать различные текущие «псевдоградиенты»:
(а)
(б) (з-67)
(в)
где (а) соответствует скользящему усреднению, (б) — экс поненциальному сглаживанию «мгновенного градиента» (в) и т. д.
Особое внимание привлекают алгоритмы с использова нием величины (3-67в), которая получается из (3-62) при T—dt и непосредственно связана с функцией чувствитель ности. Казалось бы, такое уменьшение величины Т приводит
к существенному увеличению «рысканья» |
при |
настройке |
||
из-за |
наличия помех в выходной переменной |
объекта |
||
(рис. |
3-9). Однако легко заметить, что настройка |
модели |
||
предполагает наличие некоторого времени |
,на |
ее осущест |
вление, в течение которого влияние помех может быть све дено к нулю за счет астатического характера алгоритмов (3-63) и подбора изменения Г( во времени. Необходимое ус
ловие к выбору Г( |
|
lim ||Г, ||as 0, |
(3-68) |
t-*00 |
|
очевидно, следует из требования, чтобы для |
настроенной |
модели при неизменной динамике объекта С—0 (очевидно,
что «мгновенный градиент» (3-67в) из-за помех не может быть тождественно равен нулю даже при настроенной мо дели). Однако необходимые и достаточные условия к выбо ру Г, в настоящее время найдены лишь для случая, когда матрица Г, имеет диагональный вид (3-64). Они получили название условий «стохастической аппроксимации»:
а) |
' 7 ( t ) > 0, |
осJt( t ) d t - a o , |
от j |
|
|
о |
и |
126
б) |
inf ((С— С*) у У} > |
0 |
(3-69) |
|
при 0 < |
8 < |С — С* |< 6 -1; |
|
в) |
М1;{утУ • v^} < ^ ( 1 + С ТС), |
d > О, |
где С* — вектор параметров настроенной модели, при этом
обеспечивается сходимость с вероятностью 1, т. е.
Р {lim ||С(/) — С* |=* 0} = 1 |
(3-70> |
•* |
|
(более подробно см. § 4-9). |
|
Алгоритмы стохастической аппрок^шации |
|
С[*+1] = С|/| |
|
де |
|
(а) |
(3-71) |
( б )
требуют лишь нахождения функций чувствительности
и легко реализуются в случае (З-бб). Однако наряду с ними с неменьшим успехом применяют также псевдогради-
Рис. 3-10. Блок-схема адаптивной модели
ентные алгоритмы со скользящим или экспоненциаль но сглаженным мгновенным градиентом, т. е. (3-67а, б). На наш взгляд, спор о том, какой алгоритм из указанных луч ше, является беспредметным, поскольку в конкретных слу чаях может быть безразличным, за счет чего и в каком месте
127
происходит фильтрация помех. Однако во всех случаях про исходит замедление настройки: в алгоритмах стохастической аппроксимации — за счет рысканья из-за зашумленной ин формации и малой скорости движения при малых у, а в алгоритмах со сглаживанием — за счет инерционности про цесса сглаживания.
П р и м е р 3-1 [3-19]. Рассмотрим настройку |
модели, если |
|
N |
|
|
F (е) = е2, у (1) = ^ сп s n (О- |
|
|
Применяя алгоритм (3-716) получаем |
|
|
сп = — 7(0 • [^ (О — У(>)] ■МО. |
п = 1,.... N . |
(3-72) |
Реализация адаптивной модели по (3-72) дана на рис. 3-10. Рассмотрим устойчивость процесса настройки с помощью второго ме
тода Ляпунова, выбрав в качестве функции Ляпунова квадратичную форму
N
v (С, 0 = 2 l c« - |
c«Wl*’ |
(3-73) |
п -1 |
|
|
где (с*) — коэффициенты настроенной модели, a с„ (1) — текущие |
коэф |
|
фициенты. Легко видеть, что |
|
|
N |
|
|
V = — 27(/) ■2 [с* s n (1) - |
с„ (1) s„ (1)1 • е (1), |
|
nj
•поэтому, если выполняется гипотеза гередстааимости
|
N |
|
1/(0 = |
< £•*„(*). |
(3-74) |
п1
то |
V <0 при 7( 0> 0, что свидетельствует о сходимости процесса настрой |
||
ки, |
причем с увеличением 7(1) |
скорость |
сходимости может быть сделана |
сколь угодно большой. Отметим, что для |
дискретного алгоритма (3-71а) |
||
при тех же условиях величина |
7 ограничена: |
||
|
|
N |
_ х |
|
тпР и + |
1] = |
• |
И- 1
Помимо алгоритмов с использованием «пеевдоградиентов» (3-67) возможно применение более простых в реализа ции, но более быстросходящмхся при малых ошибках алго-
^)итмов с использованием «знака псевдоградиента» SgV j
3-19].
128
Глава 4
СТАТИЧЕСКАЯ ОПТИМИЗАЦИЯ
В природе нет |
ничего |
такого, в чем |
не был бы виден |
смысл |
какого-нибудь |
максимума или минимума. |
(Л. Эйлер) |
|
|
|
Как указано во введении, к статической оптимизации от несен круг проблем, возникающих при экстремизации функ ций. Далее рассмотрены неклассические конечные задачи оп тимизации (см. § 1-3), среди которых особую важность имеют задачи линейного и выпуклого программирования. Такие задачи, как показано далее, являются одноэкстремаль ными, что существенно упрощает их решение.
Кроме того, в этой главе рассмотрены некоторые экспе риментальные методы оптимизации, связанные с оптимиза цией на самом объекте управления и нашедшие широкое применение при создании экстремальных систем для слож ных объектов управления, математическая модель которых неизвестна или нестационарна. Эти методы в основном яв ляются градиентными и поэтому надежно работают также в одноэкстремальных задачах.
I.ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ
§4-1. Особенности задач линейного программирования
Как мы видели на примерах задач о раскрое материала, транспортной и др., многие практические задачи сводятся к решению системы линейных уравнений или неравенств и нахождению среди них такого, при котором критерий опти мальности, представляющий линейную однородную форму из варьируемых переменных, принимает экстремальное зна чение. Методы решения и исследования таких задач назы ваются линейным программированием (АП).
Сформулируем сановную задачу АП.
Дана система m линейных уравнений |
с п неизвестными |
П |
(4-1) |
2atfu,=6,, i= l, .... m<n, |
|
/=i |
|
9-1303 |
129 |
где все 0 и неизвестные могут принимать толь ко неотрицательные значения:
■ 4 ^ 0 , |
/=1, |
п, |
(4-2) |
и дана линейная форма от тех же переменных |
|
||
|
П |
|
|
L(i/) = |
V CjUf-*-min. |
(4-3) |
|
|
j£i |
{«/) |
|
Требуется найти минимум Линейной формы (4-3) при вы полнении условий (4-1), (4-2).
Такую форму записи задачи ЛП Называют канонической.
Любое решение задачи ЛП, удовлетворяющее заданным условиям, называют допустимым (иногда соответствующий набор чисел и\, ..., ип называют планом), а то из допустимых решений, которое сообщает минимум L(U), называют опти мальным.
Может случиться, что форма записи конкретной задачи отличается от канонической. Возможны следующие случаи.
1. Ограничения (4-1) имеют форму неравенств.
В этом случае переход от неравенства к равенству осу ществляется прибавлением или вычитанием дополнительной неотрицательной переменной. Например, от ограничений
2щ—Зм2^4;
и\+ м2^ 5 ,
переходим к ограничениям—равенствам, вводя из и щ
2mi—Зн2+ Мз=4;
Щ + U2 — U\ = 5.
2. Некоторые переменные не имеют ограничений (4-2),-
т. е. могут принимать и отрицательные значения. В этом слу чае переход к канонической форме осуществляется путем замены такиЯ переменных разностью двух новых неотри цательных. Например, переменную ип заменяют при записи везде на разность ип— un+i —un+2, где w„+i^0, u„+2^ 0.
3.Требуется найти максимум линейной формы.
Вэтом случае переход к канонической форме с миними зацией линейной формы осуществляется изменением знака коэффициентов {С/| на противоположные. Очевидно, что
шах L(U) = —min(—L(U )).
130