Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Планирование и обработка эксперимента / Rakitskiy - Chislenniye metodi resheniya 1979

.pdf
Скачиваний:
84
Добавлен:
13.05.2017
Размер:
6.71 Mб
Скачать

J9:J

 

Г.~. 4. Оптшшзация

 

Предположим,

что

z*=Fy*,

тогда !1

(у*) >11(z*) или,

что эквпвалентно,

 

 

 

J(z~I>,.. " z~h-1),

L(z*), z~h),"., z~т-1>)<

<J(y~t>,".,

y;тi-l),

L(y*)' y;h>,

"., y~•z-t>)=J(x*),

а это противоречит предположению об экстремальности

точки х*. Теорема доказана.

Согласно первым двум утверждениям теоремы, вы­

полнение подобной процедуры перехода от функциона­

ла ! к функционалу 11 приводит к тому, что число больших собственных чисе.'I матрицы Гессе Ji'' умень­

шается на единицу («исключение большого собственно­ r·о чпс.1а»), при этом малые собственные числа по мо­

дулю пе убывают.

Повторяя описанный процесс исключения m-r раз,

прихо,:~д.'vt к эквивалентной (в смысле, указанном в пре­ дыдуще:м параграфе) задаче минимизации некоторого

функцпонала lm-r в r-мерном пространстве. После ис­

ключенпя m-r больших собственных чисел и незначи­ тельного возрастания модулей малых чисел минимиза­ ция нового функционала lm-r будет происходить в ус­ ловиях существенно более низкой степени овражности,

ияв.1ен11я некорректностп при применении квадратич­

ных ;:...1етодов возникать уже не будет.

Оп1ет11м, что пзложенная процедура приводит к по­ строенпю иерархии линейных связей типа (56) и иерар­

х1ш квадратичных функционалов J1, "., lm-r по числу

бо.т~ьших собственных чисел матрицы Гессе исходного функционала. При переходе от Ji к li+1 каждый раз осуществ.'Iяется независимое от Ji определение коэффи­

циентов в выражении для последующего квадратичного

функцпонала li+t·

Вычпсление значений функционала Ji (si) для опре­

деления коэффициентов в соответствующем квадратич· ном представлении осуществляется следующим обра­

зом.

По заданному подвектору Si вектора х с помощью по.т~ученной к i-му шагу иерархии линейных связей вос­ станав.1ивается полный вектор х. Далее полагаем

li (6;) = / (х).

§ 4.5. Иерархическа.ч оптимизация

191

Таким образом, вычисление значений функционалов fп; n= l, .. " m-r, п-роиЗJводится через .вычисление зна­ чений исходного функционала в соответствующих точ·

ках.

Возвращаясь к рис. 16, отметим, что значения /1 для рассматриваемого случая совпадают со значениями J (х) при ус.r~овии, что точки х расположены на прямой АВ.

Далее останов11\1ся на методах получения соотноше­

ний (56), вид которых в точности

совпадает с

форму­

лами (3.15). Для их построения также

 

может быть ис­

пользовано условие

квазистационарности

пропзво;111ых

по параме1'ру t от

некоторых

·КО~1шонент

вектора х (f).

определяемого уравнением спуска (49).

 

 

 

 

Действительно, дифференцируя

уравнение

спуска

s-l раз и обозначая

j-й

вектор-столбец

матрицы As,

гJ.е А =-D, через С18,

имеем

 

 

 

 

 

 

 

 

d8 хШ ( s

х

)

+

( s-1

, Ь

)

,

 

 

-- =

Ci,

 

Ci

 

 

 

dt5

 

 

 

 

 

 

 

 

 

 

 

r .1е

 

 

 

 

 

 

 

 

 

 

(92)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

ej= (0, ... ,

l,

... ,

0)= ~ (ej,

Ип)Ип

 

 

n=l

-j-й единичный орт. Отсюда

т

== l.f-I (А)~ u~i) Р·п (А)/1.1(A)]s-l х

n=I

Пренебрегая слагаемыми с номерами n=l+ 1,

.. "

т.

где l - r<ратность

маr<сима:rьного

собственного

числа

l.1 (D), получим

 

 

 

 

ds х<Л

Ч(А) [и1, х)+1.11

(А)(и1, Ь)],

 

(94)

' =

 

dt5

 

 

 

 

l

 

 

 

 

где Vj=~unmun -

собственный вектор матрицы D,

co-

1t=I

ответствующпй Л1(D).

192

Гл. 4. Опт~ишзация

Из (94) видно,

что условие квазистацпонарности

(s-1)-i"r произ1во,Jной от j-I'f·ко~лпоненты вектора x(t),

соответствующей ненулевому вектору VJ,

ds x<i>

(95)

--=О

dt5

эквива.'Iентно искомому уравнению связи (56) для i = 1.

1"\ожет оказаться, хотя это п маловероятно, что вы­

бранный номер j определяет нулевой вектор v.i·

Тогда

необходимо заменить номер j на другой.

Легко

пока­

зать. что такой нo:viep

j,

д:1я

которого

v_;*O,

всегда

найдется.

 

 

 

 

любом j= 1,

".,

 

Действите.11ьно, пусть

Vj=O при

т.

Тог.1а

 

(vj,

ид = О

 

 

 

 

 

ц~iJ =

 

 

 

 

 

прп .1юбых j= 1, ".. т;

i= 1,

".,

l, т.

е. u;=O, i= 1, .",

l,

а это противоречит тому, что ui -

собственные

векто­

ры, 11 потому ui*O при любом i.

 

 

 

 

 

 

Остановимся несколько подробнее

на

определении

номера j уравнения (95) для получения

соответствую­

щей тшейной связи.

 

 

 

 

 

 

 

 

 

Пре.Jположим для

простоты,

что

кратность

макси­

ма.1ьного собственного

чис.'!а l= 1.

Тогда

(94) перепи­

шется в виде

 

 

 

 

 

 

 

 

 

ds x<i>

 

 

 

 

(А) (и1,

 

 

 

-- = Лf (А) uji> [(и1, х) +Л(1

b)l.

 

 

dt5

Ясно, что если для некоторых j имеем u1<J>*O, то со­ ответствующее уравнение (95) доставляет искомую ли­ нейную связь. Однако еслп матрица D не имеет на диа­

гопа.111 независимых блоков вида

D = (_-0~--J-J~!_OJ_f___O_) '

(96)

, О 1N

 

то практически пригодно любое уравнение (95). Действительно, пусть, например, выделено первое

соотношение

ds х<1)

--=О

dt 5

§ -1.5. Иерархическая оrzт11.11изация

193

и при этом случайно оказалось и1<1>=0. Из-за ошибок

округления при каком-то s получим

С~= (А5 +П8) е1

вместо точного соотношения (92)

Cf=A5 e1•

Здесь Пs - матрица погрешности в задании матри­

цы As. Имее:\t

т

с~= ~ и}1) Л.j (А) щ +ss1·

j=2

 

 

т

 

t 1= П

s

е1=~ \..,

t(j)

':>s

~

':>st J•

i=I

и так ка1<

тт

сs+п = An с• = \..,

u\I) л~-:-s (А) и.+\, s<Л 1.~ (А) Uj

'

1

1

:_.

/

J

J

_

st

/

 

 

1=2

 

 

i=l

 

 

 

то

 

 

 

 

 

 

 

 

 

ds~n x(l)

 

х) + (с~+п-1, ь) =

 

 

 

 

dts+n

( с~+п'

 

 

 

 

 

т

 

 

 

 

 

 

b)J +

 

 

= \'u\1J 1.~+п-1 (А) P•j (А)(и;,

х)-;-- (uj,

 

 

..... 1

1

 

 

 

 

 

 

 

 

j=2

 

 

 

 

 

 

 

 

 

 

 

т

 

Л~-1 (А) p,j (А) (щ, х) + (щ. b)J.

 

 

+ \'s<

1i)

 

 

 

' - s

 

1

 

 

 

 

j=l

При да,1ьнейшем увеличении п слагае:-.1ое s~JI Л7 (А) [(и1, х) + Л11 (А) (и1, Ь)]

начнет быстро возрастать по сравнению с остальными

ив конце концов станет доминирующим, определяя ис­

комое уравнение связи.

Если матрица D имеет структуру типа (96), то ис­

ходная экстрема.11ьная задача распадается на несколько

независимых подзадач (сепарабельность) д.ТJя разных 1шадратичных функционалов, которые могут исследо­

ваться независимо.

194

Г,1. 4. Оnтu,иизация

Практическ11 це.1есообразно выбирать уравнение

(95)со сравнпте.1ьно большими коэффициентами г.ра

компонентах вектора х - это свидетельствует о нат1-

чии полезной ннформации о больших собственных Ч!~с­

.1ах (см. также § 3.1).

Порядок д11фференц11рования s может быть выбрз.н достаточно малым (обычно 2, 3) (C:vI. § 3.1). Необходи­

мо лишь, чтобы вектор, ана.1огичный VJ из выражения

(94), оказался в подпространстве, натянутом на собст­

венные векторы, соответствующие доминирующим соб­

ственным числам Л1, ••• , 1.m-r· Последнее условие выпол­

няется у;ке пр111 чалых s, 1160 предполагается, что i.m-r~ \t.;;1-1·.:-1 \. Теорема 4.3 при этом остается справед­

.111вой.

Особо отметим, что изложенный метод построения

.1инейных завпсимостей (56) никак не связан с пробле­ мой разде.1ения близких собственных чисел. Если, на­

пример, ~-1 существенно больше Л2, то такое разделение

при надлежащем выборе номера j уравнения (95) дей­ ствительно произойдет. Если ~Л12 - почти кратное

t:обственное чпс.10, то нет необходимости vвеличивать s до разде.1енпя /-.1 и ''i.2 • В качестве коэффиЦиентов при

компонентах вектора х в (95) в этом случае будет ис­

пользо·ваться не

собсТ'Венный

вектор

и 1, а

некоторая

комбинацпя

~·нп-г

а;и;,

бш1зкая

к а1и1

+ а2и2.

 

/, .

 

 

""-1•=1

 

 

 

 

 

Еще раз остановимся на точности

опреде.11ения ко­

::-ффициентов

линейных

связей

(95) на

основе

приб:ш­

женных объектов D и Ь.

В случае, рассмотренном в предыдуще:.11 параграфе, пск.ТJючаемое число ./.1 было существенно изолирован­

ным, п поэтому погрешностями в задашш /.1, и1 можно

было пренебречь, так как /, 1, и1 мало зависят от малых

варпацпй

D и Ь. В общем же случае задача

определе­

ш1я и 1 по

приближенной матрпце D может

оказаться

плохо обус.1овленной, т. е. малые деформацrш элемен­

тов матр11цы D при наличии близких к /ч собственных

чисе.1 могут прпвести к весьма

значительным вариа­

цням 11 1. Однако ..'1.-'IЯ излагаемого

подхода указанное

обстоятельство не имеет существенного значения, ибо,

как нетрудно убедиться, вариации и1 будут необходимо

происходить в подпространстве собственных векторов,

§

4.6.

Примеры

195

·лвечающих

G.1изким

к

/.j

собственны~~

чис:1аУI

(во

всяком

c1yt;ae

принадлежащим

блоку

доминирующих

собственных

чнсе.1), и поэтоУiу

мированных»

11 1 :--rожет

быть

юш (5G).

 

 

.1юбой из этих

испо.1ьзован

в

«дефор­ уравне­

§

4.6.

Примеры

Прп

значительном

удаленнп

пача.1ьной

точки

х J

0 от (х)

оптrвrа.'Iьной

х*

может не обладать

минимизируемый

функциона.1

свойством выпук.1ост11, п мат­

рица

Гессе

аппроксимирующего

квадратичного

функ­

циона.1а может

не быть

 

положите.1Jьно

определенной.

Это заставляет

обращаться

к

спстемны:.vr

алгорптма!'-1

оптимизашш,

пзложенным

в

§

4.3 и

сохраняющпм

вы­

е.окую эффективность при

 

овражном

п одновременно

не­

выпук.'Iо:.vr

харюпере J (х).

 

 

 

 

 

 

 

Однако

эффе,ктивность

 

системных

а:rгорнтмов,

ос­

нованных

па

построении

 

 

траекторип

напскорейшего

спуска аппрокспмирующего

квадратичного

функциона­

.1а, также

:'lюжет быть

повышена

при пспользованпп

вышеописанной процедуры собственных чпсе.1.

исключения

,J.о:<.шнпрующих

Действнте.'Iыю, .J.ИМ, что большп:w

обращаясь

к выражению (50),

(положнте.'IЬным) собственным

вп­ чис­

.1ам

матрпцы

Гессе

мпнп:-.шзпруемого

фунюшона.'Iа

со­

ответствуют

быстрозатухающпе

экс;юпенты,

п

поэто:.v1у

они

оказывают влияние

на

все решенпе в

на

некотором начальном

 

отрезке (О. тпс

це.1JО'.\1 :шшь

] IIЗ:'l1ененпя

nаТ)а.метра t, уже ма.'IЫ'.\Ш

а

при f>тrrc собственными

впд решения чис.1Jами.

определяется С:rедовательно,

при высоrшх

венные чпс.1а

степенях матрицы

овражности, !" (х) могут

ког.J.а быть

ма.'Iые собст­ пре..1Став.'Iены

со

значительнымп

траектория спуска

относите.'Iьныюr

погрешностями,

(50) может при бо.'Iьшпх значениях

параметра

t

существенно

отr<.'Iоняться

от

истпнной

траектории.

 

 

Такпм образом,

в

ряде случаев пере..1

ным обращением

к

системным методам

непосредствен­ целесообразно

провести

предварительную

асимптотическую

обработку

исходного

функционала

с

целью

иск.'Iюченпя

больших

собственных неравенства

чисел

(во всяком

S < 1/бJ, где бJ -

случае

до выпо.'Iнения

относительная

погреш-

196

Гл. 4. Оптимизация

ность rвычис.~ення функциона.ТJа J (х), а S - степень его

овражности).

Далее следует иметь в виду, что обращаться r< асим­

птотическим методам необходимо лишь после сущест­

венного замедления сходпмости применяемого марше­

вого алгоритма минимизации (например, системного),

что соответствует попаданию фазовой точю1 в обла.::ть

дна оврага. В противном случае существует опасность

выхода процедуры нз области, где минимизируемый

функционал достаточно точно описывается построенной

квадратичной аппроксимацией.

Действительно, из рис. 16 видно, что если исходное положение вектора Хо достаточно далеко от пря'Мой АВ,

то точность квадратичной аппроксимации, построенной

в окрестности Хо, может для функционала, отличного от

1<.вадратпчного,

теряться

при

переходе в окрестность

прямой АВ. Для строго

квадратичных

зависимостей

! (х) подобная ситуация, естественно, не вознwкает.

Кроме того,

при исключении доминирующих

собст­

венных ч11се.1

uелесообразпо

исключать

.1ишь

самые

( таршпе чис.1а

до получения

приемлемой

степени ов­

ражности в с~1ысле S < l/бJ. Далее процесс минимнза­

шш целесообразно строить на основе системных мето­ J.ОВ опт1ошзаuии, позволяющих эффективно проводить

оптнмнзашrю в Ус.ТJовиях достаточно высокой остаточ­

пой степени овр.ажности. При нарушении данного тре­

бованш1 п 11ск.1ючени11 «лишних» собственных чисе.'i ве­

.1пчпна пограннчного слоя т пс может существенно

возраст11, что опять-таю~ приводит к возможности вы­

хода пз об.1астп, описываемой рассматрпваемым KGa.:t- Г- атичным прпбт1женпем.

Ана.ТJоп1чно методам, пз.1оженным в § 3.1, метод

11ерарх11ческой оптимизащш, основанный на нсключеюш домпнирующ11х собственных чпсел, может быть реатr­ зован в так называемо:'v!: блочном варианте, когда сра­

зу опрсде.1яется система линейных соотношений (56)

11.111 ей экв11ва.1ентная и осуществляется переход от ис­

ходного функционала J(x) к функционалу lm-r, опре­

де.ТJенному в r-мерном пространстве векторов ~m-r·

Здесь ""ы не буде:'vl: останавливаться на .подобно~f под­

ходе, так как соответствующие вопросы достаточно под­

робно 11з.1ожены в § 3.1. Отметим только, что для опре-

§ 4.6. Примеры

197

де.'!ения уравнений, эквивалентных (56), также можег

быть 11спо,1ьзовано условие квазистационарности про­

из·водных ,:~:.1я m-r ко:.шонент вектора х (t), описывае­ мого уравнением спуска (49).

Приведем численные примеры, и.1.'!юстрирующие а.'1-

горитмпческпе возможности рассмотренных в предыду­

щем параграфе методов.

 

 

 

 

Пр им ер

l. Пусть задан выпуклый квадратичный

функционал впда

 

 

 

 

 

J (~, х) = ~о+ ~i (x<l>)2 +

 

 

 

 

 

 

+~2 x<I> х<2> + ~3 (х<2>)2-~4 x<I>-~s х<2>, (97)

rде ~=(~о, ~1, •.. , ~s)

-

вектор

неизвестных

коэффи­

циентов.

 

 

/\

 

 

 

 

 

 

 

 

 

Требуется

получить

оценки ~i

на

основе

измерений

значеннй J в

некоторых

точках

и

затем определить

экстрема.'lьную точку х* из условия

 

 

 

/\

/\

 

л

 

 

 

J (~,

х*) =--= min J ф,

х).

(98)

х

При этом предполагается, что измеряемые значения J

искажены шумом

где бJ - заданная относительная погрешность. Приведенная постановка задачп, в частностп, весь­

ма характерна для теорип планирования экстрема.1ьных

экспериментов, пмеющей де.'lо с алгоритмическп задан­ ными J\шнп~шзируемымп функциона.'Iами, пзмеренпя значеннй 1<0торых искажаются сравнптельно высон:ш.1

уровне~~ шума.

Как ниже показывается, Уже достаточно малая сте­

пень овражности J (х) не позволяет при:11енять традн­

ционные методы и вынуждает обращаться к специа.'lь­ ным методам, развитым в предыдущих параграфах.

Предположим, что истинные значенпя параметров ~i равны:

ifo = l 111, '31 = 989, /32 = 984, ~3°= 251,

~= l 978, jf5 = 984. f(99/·

.!98

Гл. 4.

Оптимизация

 

Пр11 этом .JJerкo проверить, что

 

 

x*=(l; О),

J(~, х*)= 122,0.

(100)

 

 

л

 

Используемые при получени11 оценок ~i эксперимен­

та.1ьные данные имитируются прп заданных значениях

параметров (99). Шум измерений моделируется округ­

,1ен11е~1 результата измерений до двух цифр мантиссы в '1.ре.:~:став.JJеюш числа в форме с П.'Iавающей запятой.

В табл. 7 приведен бт1зкпй к D-оптима.11ьному на-

л

сыщенный план эксперимента для определения ~i ме­

то.:~:о:-.1 наюrеньших квадратов; l; - ~истинные значения

!в точr{ах плана х;, Ji - измеренные значения, иска­

женные шумом.

Таблица 7

i

1

x/l>I

х/2>1

т:

 

т;

 

 

 

 

 

 

 

1

1

 

 

 

1

 

1

i

--1

-1

1

6300

1

6297

2

1

-1

+1

2400

!

2361

1

 

3

1

+1

-1

1

370

i

373

4

1

+1

-i--1

370

373

 

5

 

о

-1

 

2300

 

2346

6

1

о

о

1

1100

1

1111

 

i

1

 

 

1

1

Функционал

1 Ф> = I6 rJ (~. xi>-.r;12,

i=l

:-:хтроенный по методу напменьших квадратов, прнни­

:-.rает мпнимальное значение в точке

л

л

л

л

 

~0 = 1100,

~1 =.1035,

~2 =975,

~3 =225,

 

 

л

 

л

 

 

~4=

1990, ~5= 975. (101)

Сравнивая с (99), видим, что погрешность в опреде­

л

.1ен11и ~i лежит во 2-3 знаке мантиссы, что согласует­

ся с погрешностями экспериментальных данных.

Таким образом, можно считать, что задача 01'Iреде­

..1ения коэффициентов ~i решена вполне успешно. Одна-

§ 4.6. Примеры

199

ко попытка определить х* по полученным

значению:

( 1О1) нз системы

л

дJ (~. х) =0,

i= 1, 2,

дx(iJ

 

пр.иводнт к неверно:v1у резупьтату:

л

-

л

 

х*=(2,9;

-4,0), Jф, х*)=231,О

вместо точного (100). Причина

неудачи

заключаетсf::

в овражном характере J(x).

(97) с

 

Если представить

выражение

параметра:чп

(99) в виде

 

 

 

J= 1J2(Dx, х)-(Ь, х)+С,

(102)

получим

 

 

 

D=f 1978

984 )

\ 984

502 •

Ь=---=(1978;984), C=llll.

Собственные числа матрицы D равны

/,1 = 2470, Л2 = 1О.

Соответствующие собственные векторы имеют вид

2

 

,.,

U1= V5 (1; 0,5).

 

2

 

 

U2= V5 (0,5; -1).

 

 

Линии уровня функ-

 

 

ционала ( 102) изображе-

i

 

ны на рис. 17. Овраг на-

1

 

правлен параллельно век- ~

----;

-----,-+----

тору tt2. Кружками обоз-

начены точки плана экс-

перимента, использован­

ные п·ри .получении оце­

нок (101).

Полученная точ.ка х"

существенно смещена

· !

-'

".

.

1

1

L __ -~+- ___j

!

;

1

Рис. 17.

вдоль образующей дна ов-

рага по сравнению с истинным положен1Ием х*.

Применим для решения этой же задачи ·метод иерар-­ хической олтимизац:ии. С по•мощью оценок ( 1О1) не уда-