Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Планирование и обработка эксперимента / Rakitskiy - Chislenniye metodi resheniya 1979

.pdf
Скачиваний:
84
Добавлен:
13.05.2017
Размер:
6.71 Mб
Скачать

По

Гл.

4.

Оптимизация

погрешностей

достаточно

высок

смысле,

уточняемом

ннже),

то

подобная

точка

зрения

становится

неприемле­

:--юй.

Так,

при

минимизации

овражных

функционалов

в.111яние погрешностей на стро растет с уве.111чением

окончательный результат степени овражности S.

бы­

В ются

данном и некоторые

последующих параграфах рассматрива­

аспекты подобных

трудностей и пред­

,1агаются

пути

нх

преодоления.

Будем

предполагать

в

дальнейшем,

что

необходимые

аналитические

зав11симости

отсутствуют

и

объекты

(:--1атрицы,

векторы),

участвующие

в

вычислениях,

по­

.1учаются на основе

{х;}, определяемых

значений J ( Xi) в некоторых точках

конкретным

методом оптимизации.

Кроме

того,

будем

считать,

что

результатом

вычисления

(11.111

измерения)

функционала

J(x)

в

точке

Xi

являет­

ся

число

~

=

J

(xi)

+

б

J

J

(xi)

=

(

1

+

б

J)

J

(хд.

где бJ - рения),

относительная которая может

погрешность вычисления

(изме­

иметь как случайный, так

и де­

терминированный

характер.

Применение

квадратичных

методов

оптимизации

ос­

новано на

часто

по крайней

мере

оправдывае;.tом в окрестности

предположении, что,

оптимума,

минимизи­

руе:\1ый

функционал

с

достаточной

точностью

может

быть

аппроксимирован квадратичным

J (х)= +(Dx, х)-(Ь, х)+

const,

(41)

где

D

-

симметричная

положительно

определенная

:v1атр11ца

размерности

Далее

применение

т Х т, Ь-т-мерный вектор.

 

квадратичных методов по

суще­

ству сводится к опреде.!Jению элементов

вектора Ь

и

вычислению

х*

из решения

бранческой

 

системы

 

 

матрицы линейной

D

и

алге­

Dx=b.

(42)

п

Именно такая общая модель квадратичных

будет испо.1Jьзована в дальнейшем.

методов

Если функциона.!J (41) овражный,

ч11сло обусловленности k(D)~1 и уже

то спектральное

малые деформа­

шш

коэффициентов

системы

(

42)

могут

приводить

к

с11.1ьным

вариациям

компонент

искомого

вектора

х

•.

§ 4.4. Принцип повторных uз,11ерений

171

Прп k(D) > l/б, где б -

относительная погрешность

представления указанных коэффициентов (б=бJ), зада­

чу решения (42) следует

считать некорректной

из-за

ВОЗ;\IОЖного вырождения матрицы D и нарушения тре­

бованпя единственности решения (см. (46)).

 

С:\lысл отмеченного явления некорректности

можно

1юяс11пть следующим образом. Разложим векторы х*, Ь

по г.о.шой ортонормальной системе {щ} собственных

векторов матрицы D:

тт

х*= ~ aiui, b=~~tui.

i=I i=I

Подстановка :в (42) дает

т

 

т

~ aiлi (D) ui =

I ~i ui,

i=l

 

i=I

где i.;(D) - собственные

числа

матрицы D. Отсюда

ai =

~i/Лi (D).

дх* =

-Л-:--2 (D) А. И·,

дЛ.; (D)

'

1"'1 '

(dx*. ui) 1=Лi,

1 (х*, и;)

где ~;= 1d/,i/'Лi1 - относительная ошибка в представ­

ленпн i-го собственного числа матрицы D.

Из последних двух равенств следует, что решение

снсте:v1ы (42) сильно чувствительно к изменению мини­

ма.1ьных по модулю собственных чисел и даже неболь­

шое пх искажение может существенно повлиять на ве­

лнчпну х*.

Оказывается, чем больше величина k(D) спектраль­

ного ч11сла обуслов.'lенности, тем большие относитель­ ные 11скажения :v1и11ю1альных собственных чисел ·воз:.1ож-

11ы за счет погрешностей Лdij. Поясним последнее ут­

верждение.

Д.1я норм

т

11D111 = m_ax ~ 1du1.

'i=I

11D11=~ах1 'Ai (D) 1= _\D

'

172

Г.z. 4. Оптимизация

выполняется неравенство [36]:

11v 111 ~ vт11v11=Vтлv.

Так как, очевпдно, .\п~ llDIJ1, то

 

т

 

Лv ~max ~ ldul~Vmл.D.

(43)

1

j=I

 

 

 

Эти неравенства показывают, что:

1) на.111чпе бо.1ьшпх по модулю собственных чисе.11

приводит к на.111чпю больших по мо.:~:у.1ю эле:ментов

матрицы;

2)на.111чпе бо.1ьшпх э.11ементов прп заданной отно­

сительной ошпбке б пх представления прпво:щт к бо.1ь­

шим по :v~одулю э.1ементам матрицы ошпбок П=.D-D,

где .D - приближенно заданная матрица D;

3)на.111чпе бо.1ьшпх э.11ементов в П в.1ечет на.111чие

больших по ..\о!оду.1ю собственных чисе.1 у П (матрица П считается сю1·~1етр·ичной, так как ~при работе с с1н1::-.1ет­

ричнымп :11атрицюш вычпсляется .11ишь верхняя треу­ гольная часть матрпцы, а элементы по.:~: дпагона.1ью

по.11агаются равны:v~и соответствующим э.1е::v1ента~м над

диагона.~ью).

Сог.1асно известно:-.1у результату теорпп симметрпч­

ных возмущений [35], если

матрица П добавляется к

D, то все собственные чис.11а

могут изменяться на ве.1и­

чину, .11ежащую меж.:~:у наименьшим и на11бо.1ьшим соб­

ственным чис.1ом П.

Легко привестп прпмер, когда миюша.1ьное собст­

венное чис.110 матрицы D изменяется прп этом весьма сильно. Рассмотрим матрицу

D = ( L

L - е) J в\ « L, L > О

L-e

L

и диагона.11ьную матрицу ошибок

П=(~ ~).

Матрица D имеет спектр:

Л1 (D)= 2L-в ~ 2L,

Л2 (D)= в.

 

§ 4.4. Принцип повторных из.11еренttй

173

Собственные числа матрицы П одинаковы и

равны

h, по:;,тому сг.:ектр

D +П ра·вен

 

 

 

/,1 (D+ П) =Л1

(D) +h ~ 2L+ h,

 

 

/,2 (D+П) =Л2

(D)+lz = e+h.

 

В

результате

погрешность

h незначительно

изме­

нит

\1акси:-.1а.1ьное

число,

т. е.

}., (D+П) ~l-1 (D), если

h«L. и в то же время число i.2(D+П) может не иметь ничего общего с истинным значением l.2 (D). Например, ес.111 h=-e, то матрица из невырожденной превра­ щается в вырожденную (и, в частности, об пспользова­ шш :11етода Ньютона не может быть и речи).

После этих предварительных зю1ечан11й перейдем к

бо.1ее точному анализу.

И:1-1еем

 

т

 

 

 

max ~ \d0

\

~ mmax \du \.

 

.

,(...

 

..

 

i

j=I

 

1, J

 

Отсюда, учитывая (43), получи:~.1

 

- 1

Лv ~ n:ia?C \dij 1 ~ Лv

(44)

т

 

1,

/

 

и.111

 

 

 

 

n:ia~ J du \ ~ Лv ~ т m~x 1du J.

(45)

t' /

 

 

t' /

 

Допусти~м. что элемент матрицы D с максимальным модулем вычис.1ен с относите.1ьной ошибкой б и его

абсолютная ошибка равна макс11ма.1ьному по модулю

элементу матрицы П= (PiJ). У:1шожая (44) на б, полу­

ЧIЕ\1

-

б

Лv ~ ~:п~х 1Ри 1 ~ бЛv·

 

 

т

t,

1

Записывая неравенства

(45) примените.11ьно к мат­

рице П:

max / Pil \ ~ Лп ~ т тах IPii·I.

i' j

i t i

приходим к соотношению

б

-ЛD~Лп~mбЛv·

т

174

Гл.

4.

О11тu.лtuэация

Как

уже

указывалось,

на

величину

Лп

может

изме­

ниться

любое

6 rn

собственное

Лv

~

1/.; (D) 1

число матрицы

Лi ::;:;; m б

Лv

1А.; (D) 1

D,

при

этом

(

46

)

Сог.'Iасно

правому

неравенству

(

46),

чe:vt

меньше

ве­

личина

Лnf

/l•i

(D)

/,

те:\!

::v~еньше

вою1ожная

величина

Лi

относительного

искажения

числа

iiч(D)

за

счет

погреш­

ностей

Лd;j.

Согласно

левому

неравенству,

погрешность

может

быть

особенно

большой

для

собственных

чисел

с

минимальными модулями

в

случае

 

 

лп »

1лi (D) 1,

что и

наблюдается

пр11

минимизацrш

овражных

функ­

щюналов. Таким

образом,

искажения

элементов

матрицы

D

в

первую

очередь

прнводят

к

большим

относите.1ьным

ОШ!lбКаМ Лi собственных

В представ.'IеНИИ

чисе.1, которые, в

МИНИМЫIЫIЫХ свою очереJ.ь,

ПО Модулю оказывают

наиболее

существенное

влияние

на

вет1чину

компонент

вектора х*. Указанное

протнворечпе

и

лежнт

в

оснпве

ра·:::оrат­

риваемого яв.1е1111я

В данной книге

некорректности. пре.Jложе·н новый

под:'\ОJ.

к

решеншо

проб.'Iемы,

в

резу:1ьтате

которого

удается

существенно

уменьшить влиянне погрешности бJ

ний функционала J(x) на результат,

выч11с.1ен11я

значе­

получаемый

с по­

мощью

квадратичных

методов

опт11мизац1111.

Суть

изла­

гаемого

подхода

заключается

в

следующем.

На основе функционала

вычислений в некоторых

значений точках {х;}

:\.Шюсvшзпруемого вычпс.'Iяются не­

известные

коэффпцненты

.'Iинейной

снсте:-..rы

(

42).

Как

уже

указыва.'Iось,

решать

k(D)

бессмыс.1енно,

так как

систему (42) при больших х* существенно зависит от

малых

собственных

чнсел,

информация

о

которых

при

приближенно:-.1

вычислении

э.'Jементов

матрицы

D

уте­

ряна.

Однако

оказывается,

что

приближенно

найден­

ные

D

и

Ь

несут

впо.1не

определенную

информацию

об

х*,

заключающуюся

в

выполнении

определенных

связей

между

компонентами

х*,

а

не

в

точных

значениях

са­

мих

компонент.

Такая

точка

зрения

позволяет

по-ново-

§ 4.4. Принцип повторных измерений

Ji5

му использовать ньютоновскую технику второго поряд­

ка, сводя ее к некоторой многоэтапной процедуре пр11нятия решений. На первых этапах определяются .11пней­

ные 'связи :vreж..:i.y КО\11понента'\1И x*(i)• ·коэффициенты ко­ торых мало зависят от погрешностей задания D 11 Ь.

Затем с помощью найденных связей исключаются не1ю­

торые КО\шоненты вектора х, и задача '\Шни:vr;изации ис­

ходного функционала сводится к аналогичной задаче

для нового функционала, заданного в некотором под­

пространстве исходного пространства Rm. В результате от системы (42) переходим к решенпю т1нейной сп-

стемы

Bs=d

(47)

относительно некоторого подвектора 5 вектора х. Си­ стема (47) по построению оказывается эквпва.11ентной заданной с точностью до использованных уравнен11й

связи.

Основным в таком подходе является, во-первых, то, что матрица В пр11 надлежащем построеюш алгоритма

исключения оказывается уже хорошо обуслов.'lенной 11

вектор 5* может быть вычис.11ен относптельно точно.

Во-вторых, э.11ементы матрицы В и вектора d допуска­

ют независимое от D и Ь вычис.11ен11е по

значен11ю1

J (х;), вычисленньш ('из\1сренны:--1) в соо11ветствующих

найденным ранее связям точках,

например, на основе

метода напменьших I<вадратов нлп

метода

конечнораз-

1-юстных аппроксимаций пропзводных вдоль составляю­

щих вектора 5.

 

 

от D и Ь опре­

Принц11ппа.11ьно важно независимое

деление В п d. Вычисление В

и d непосредственно по

D и Ь форма.1ьно возможно

(соответствующие связн

между х и 5 найдены),

но не

приводит

к результату,

ибо в D, Ь информация

о точных значениях компонент

х* утеряна п восстановить ее можно .'!пшь при повтор­

ных вычислениях J(x) в специа.'lьно выбранных с уче­

том найденных связей точках {х;}.

Указанная идея носит название принципа повтор­

ных измерений [24, 25].

Проиллюстрируем рассматриваемый подход на при­ мере решения задачи минимизацип для (m-1)-овраж­ ного фун'кционала (41), !ПО.1агая, что собственные числа

176

Гл. 4.

Оптимизация

 

ыатрицы D удовле11воряют неравенства·м

 

 

Л1»IЛil•

i=2, · · .,т.

(48)

При этом будем рассматривать общий случай, не пред­ по.~агая положительной определенности матрицы D.

Поставим задачу построения по овражному квадра­ тпчному функционалу (41) нового квадратичного функ­

ционала, в некотором смысле эквива.1ентного заданно­

му, но матрица Гессе которого уже не имеет такого

различия в модулях собственных чисел.

Представим решение уравнения линии наискорей­ шего спуска для (41)

 

~; = -Dx+b,

х(О)=х0

(49)

 

 

 

В BIJ,.J.e

i [a1iexp(-Л1it)+~k .r ехр(-Лk1")dт]U1i. (50)

x(t) =

 

k=I

О

 

Здесь

постоянные a1i, ~1i

определяются соотноше-

тт

 

 

х

0

 

 

"-

 

 

Ь =

~ ~kuk,

 

 

 

 

 

 

= \'rxk U1i,

 

 

 

 

 

 

 

 

 

 

 

 

 

k=I

 

 

 

k=I

 

 

 

 

а {ин}, k= 1, ...,

т, есть

ортонормальный

базис собст­

венных векторов матрицы D.

 

 

 

 

k= 1 из-за

Из (50) видно, что слагаемое с номером

быстрозатухающей

экспоненты

ехр (-l"1t)

оказывает

в.1ияние на все решение

в

целом

 

лишь

на

некотором

начальном

отрезке

[О, тпс]

из·~1енения :параметра t, а

при t>т пс

вид

решения

определяется

уже

малыми

собственными числами.

 

слагаемых с k= 1 умножим

Для выделения

из

(50)

обе части

равенства

скалярно

на и1 и воспользуемся

свойством ортонормальности базиса {и1~}:

 

 

 

 

 

 

 

 

(

и

и)- { 1,

i=j

 

 

 

 

 

 

 

 

l•

J

-

о

._J_

 

 

 

 

 

 

 

 

 

 

 

 

'

t -r ].

 

 

 

Получаем

 

 

 

 

 

 

 

 

 

 

 

 

 

(х, и

)= r:x.1 ехр( -Л.

1

t)- Ь. (ехр(

1

t)-1) /t>1:

пс

~.!!. ,

1

 

 

 

 

 

~

 

 

 

 

~

 

§ 4.4. Принцип nовторных из,нерений

177

а. так 1<ак,

очевидно, ~1 = (Ь, и1), то

 

 

(х,

И1) ~ -1(Ь,

И1).

·(51)

 

 

Л1

 

 

Таким

образом,

при t>-тпс

компоненты

вектора

х (t) связаны JlИНейной за'В'ИСИМОСТЬЮ

 

u/l> x(I> (t) +uj2J х<2> (t) + . . .+u/m> х<т> (t) ~ у0,

 

Уо =

- 1 (Ь, и1) =

const.

 

 

 

Л1

 

 

Рис. 16 иллюстрирует поведение траектории х (t),

обоз·наченной пункт1ирной линией, в двумерном с.пучае

выпукJiого квадратичного функциона.1а ! (х). Э.ыипсы

являются линиями уровня ! (х) = const, а прямая АВ

есть график линейной зависимости (51), на которую

при t>-тпс -выходит траектория x(t). При это.\I

AB_l_ui. Из рисунка ясно,

что ю·1есто исходной зада- чн :-.южно бы.10 бы решать задачу одно.\1ерной .\ШНИ­ Ш!Зацш! в;:юль прююй АВ. В обще:-.! с.:1учае также приходю1 к новой уже

(m- l) -мерной

задаче

,,.-

ш1нн;-,шзацни.

Однако

\L-~!г

здесь важно не только и

не

столько

понпжен11с

.,

(.;

 

 

 

раз;-.1ерности пространства

 

понска, сколько уменьше­

Рис. 16.

нне

жесткости

(степени

 

овражности), так как при минимизации нового функ­

цаона.1а в подпространстве, ортогональном вектору и~,

'iо:iьшое собственное число

уже не оказывает

в.1ияния

i1i\ вычислительный процесс.

соотношения (51)

 

С помощью линейного

выразим

.\о:шюненту x<iJ вектора х, которой соответствует :-.1акси-

11альная по модулю компонента u1<i>

собственного век­

тора u1, через остальные:

[""!,

u<i> x<i>--

 

и)]

x<i> =--" L (z) = ---

 

 

1

1..J

 

1

 

 

'

 

 

(i)

1

л

 

 

1 '

 

U1

i=I

 

1

 

 

 

 

z= ( х0>, .

 

i=l=i

 

.

X

 

 

X (i-1) 'X(i+IJ ..

 

 

 

 

 

 

 

 

(m)\

~ Ю. В. Рак11тск11!1 и др.

178

Гл.

4.

Оптимизация

Рассмотрим

функционал

./

1

(z)=J(x(l>,

· · ·, x(i-1)'

L(z),

 

 

 

 

xu-;-i),

•..

,

х<т))=

=

1 - 2

(Гz 1

'

z)-(d

'

z)_j__C '

Д.1я венство

t>-rnc

будет выполняться

x<iJ~L(z)

и,

следовательно,

 

 

 

J (1)) ~ J1 (z (t)).

приближенное

ра­

Функционал

!

1

эквивалентен

заданному

в

следую­

ще~1 смысле. Во-первых, если те,'lьно определена (/">О), то

матрица матрица

!"=D положи­ !1" также поло­

жпте.1ьно

определена

и

точки

минимума

х*

и

z*

связа­

ны

соотношениями

x"=(zO>...

'1"

*

..

,

z{i-1) *

L(z)

'

*,

zU) * '

.

••

,

z<m-1)) *

,

(52)

т.

е.

найдя

минимум

одного

из

функционалов,

мы

тем

самым получаем

и

минимум для второго.

Во-вторых, по

 

линии наискорейшего

спуска

функ­

ционала

!

1

для

t>-rпc

можно

построить

траекторию

спуска исходного

Покажем, что

функционала и

наоборот.

если

матрицы

D>O, li">O,

то их

спектральные

числа

удовлетворяют k (J;) « k (D).

нера·венству

1

Предположим,

<

JI;;;;::::: \щ<iJ\,

i=2,

 

1

 

 

не ".,

ограничивая

общности,

что

т.

Непосредственным

диффе­

ренцированием риuы Jt'' через

получаем элементы

выражение dii матрицы

элементов D:

мат­

 

u 1i>

иШ

 

u<i)u(j)

gu-= d;1--~i)d11-~ dli +

(i о>}2

 

ltl

UI

 

UI

 

i,

j= 2,

т.

 

Учитывая

представление

 

 

 

 

т

 

 

 

dtJ

= ~ u~i)

u~n Л1t,

 

dн,

(53)

lt=I

 

 

 

 

§ ./..J. Принцип повторных из.1tерений

 

179

получим

 

для диагональных элементов матрицы Ji":

g .,

т

(

 

u(i>

 

)2

'Л1~ =

т (

 

u<iJ

)2

'Л1~.

= ~

 

u'i)__1_ u!l)

 

)..,

u!iJ __1_u10

 

'

L

·..

h.

(1>

k

 

 

-

h

11

(1) h.

 

 

 

k=l

 

Ul

 

 

 

k=2

 

1

 

 

 

 

i

=о2,

• · ·, т.

 

 

Су.ш..шруя по

i,

приходим к выражению для с.1еда

матрицы J,":

 

 

 

 

)2

 

т

т

 

т (

u<i>

 

Sp(J~)= L gii=

L J.k

~

u~/>-+,uko

=

 

i=2

1'=2

 

i=l

и,

 

 

 

=

\~ l.k

[ 1+ ( иJi'>')2] ' ( -uil> ) 2

~т.

 

 

-

 

U(I)

ищ

 

 

 

h=2

1 .

1

 

Следовательно, доказано, что при умеренных значе­

ниях т Sp(J1")~/..1, а значит, макси:v~а.'тьное собствен­

ное чис.10 :-.1атрицы J i" 1много :-.fеньше Л1.

Для завершения доказательства остается показать,

что минпмальное собственное число y=l.m-1(li'1) мат­ рицы Ji'' не меньше, чем µ='Лm(J")·

Заметш.1, что при выяснении соотношений спектраль­

ных хара·ктеристик матриц D и 11" достаточно рас­

смотреть функциона.11

(41) с Ь=О, ибо

вектор Ь не

влияет на матрицу 1111 По определению

 

J1 (z) о_- .1 (L (z), z).

 

т. е. для х= (L (z), z)

имее:--1

 

(Dx,

х) ,= ( г; z, z).

(54)

Существует вектор z такой, что

(J; z,z)

 

 

у-=

z)

.

 

 

 

 

 

 

(z,

 

 

 

 

Тог.:::.а ,:r.iя

вектора

х= (L (z),

z)

по.1учае:-.1

сог.~аснс

(54)

 

 

 

 

 

 

 

 

(Dx,

х)

=с' _(_~;~j_ ~ (J; z,

'i) 00-= у.

(х,

х)

(z,

z) + L (z)2

 

(z,

z)

 

..\ так J{3K

 

u = miп

 

 

 

 

 

 

 

(Dx,

х)

 

 

 

 

 

'

х*о (х,

х)

 

 

 

то, очевидно,

~t::::;;;y. J'тверждение

доказано

полностью.

i*