Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Планирование и обработка эксперимента / Rakitskiy - Chislenniye metodi resheniya 1979

.pdf
Скачиваний:
84
Добавлен:
13.05.2017
Размер:
6.71 Mб
Скачать

180

Гл.

4.

Оптимизация

В результате задача минимизации

щюна.1а 1 сведена к этой же задаче

овражного функ­

для неовражного

фующионала

1

1•

Как

уже

ранее

отмечалось,

существен­

ным

 

:'viоментом

мого

измерения

ное

вычнслени·е

здесь

является

возможность независн­

элементов

матрицы 11". Непосредствен­

элементов

gi; по

формулам (53) не по­

зво.1яет получить

.1ых спе1пральных

дополнительную составляющих

информацию о :-.1а­

матрицы D, опреде­

.1яющих

значения

компонент

искомого

вектора

х*.

В с.1едующем исс.1едование для

параграфе проведено более подробное общего случая r-овражного ( 1~r:::;;;;;

:::;;;;;т-1)

не

функционала.

тов уравнений

обязательно

 

выпуклого

квадратичного

Указан

метод

определения

коэффициен­

связи

типа

(51), основанный на условии

квазистационарности

производных

подобно

тому,

как

это

де.'Iалось

в

§ 3.1. Здесь же лишь

подчеркнем,

что

проблема

определения

изолированного

собственного

 

 

чис.1а

и

соответствующего

собственного

вектора

на­

шем

случае

это

:Л.

1,

и1

)

всегда

хорошо

обусловлена

для

сим:11етричных

матриц

независимо

от

величины

спект­

ра.1ьного

чис.1

а

обуслов.'Iенности,

и

коэффициенты

урав­

нения (51) определяются

достаточно

прпб.'Iиженно найденным

D и Ь.

точно,

даже

по

§

4.5.

Иерархическая

оптимизация

ричной

Пусть

собственные числа постоянной симмет­

матрицы

D

размерности mXm удовлетворяют

неравенствам Л~ ;;?:".;;?:

l'111-r))

\

Am.-r+i

\

;>".

> \t,m

\,

1

aJ{

что

квадратичный

функционал

J(x)=

1/2(Dx,

х)-(Ь,

x)+const

(55)

яв.'Iяется

r-овражным

в

смысле

опредеJiения

§

4.1.

Представляя

решение

функционала (55) в виде

равенства (50)

ска.1ярно

уравнения

спуска

 

(49) для

(50)

и

умножая

обе части

на и;,

i= 1,

..., m-r,

получю.1

систе:'viу

линейных

соотношений

(х,

и,)=

л11

(D)

(Ь,

и;),

i

=

1,.",

m-r,

(56)

ана.1огичных

(51).

§ 4.5. Иерархическая оптu,низация

181

Ес.ш матрица D положительно определена и, следо­

вате.1::.но, существует точка минимума х* функциона.ТJа

(55';.то .11егко видеть, что х* удовлетворяет уравненпям

(56 . .]ействительно,

(х*' иi)=(D-1 Ь, ид = (Ь, п-1 иi) = Лj1 (D) (Ь, Uj).

С.1е.J,овательно, каждое уравнение (56) представляет

.::обоi: уравнение гипершюскостн, ортогона.1ьной векто­

ру 11.· 11 проходящей через точку минимума х*.

Пусть дJIЯ некоторого i= 1, ..., m-r задано уравне­

нне (56). Для определенностп

будем

полагать i= 1.

То:-.:;а, ес.'lи и1Ui>=#=O,

то сог.ТJасно

(56)

можно

выразпть

R-ю Еомпоненту вектора х через

остальные

и, как это

бы::о сделано ранее, перейти к новому функционалу

J1 (z)= 1/2 (Grz,

z)-(d,

z) +const,

or = J; (z),

Z= (x!l>, ... , xck-IJ,

x(k+I), ... , x(m>).

 

Таким образом,

определен

оператор (D, k)-+G1iD,

ставящий в соответствие матрице D размерности т Х т и номеру k~m исключаемой переменной матрицу G1iD

размерности (т-1) Х (т-1).

Т е о р е м а 4.3. Пусть

Am-r (D)/ \ Лт.-r+1 (D) 1 )) т,

k=arg{maxlиfi>IJ· (57)

1

Тогда: 1) Для собственных чисел матрицы G1iD выпол­

няются неравенства

Л1 (Gf) >."> Лт-r-1 (Gr) ~ J Лт-r (Gp) J:;> ... ~, Лт-1 (Gf )J_

2) Для малых по 11юдулю собственных чисел мат-

1щц D u GkD выполняются неравенства

1Лt (D)I < 1Л~-1 (G~ )i « ),111-r (D), i = m-r + 1"." т.

(58)

3J Если D>O, то G1iD>O и точки минимума х*, z* Фu1-ищuоналов J и ! 1 связаны соотношениями (52), где

~=i-?.

.] о к аз ат ель ст в о. Предварительно докажем c.'le-

:ryю21.ee утверждение.

182

Гл. 4.

Оптимизация

 

 

 

 

 

Лемм а.

Пусть задано уравнение относительно ).:

 

k

 

 

 

 

k

 

 

 

 

 

Л+ ~ a1 bf

1-Л)-1 = ~ aibi,

 

 

(59)

 

i=I

 

 

 

i=I

 

 

 

 

ai >о. bt =1= О,

Ь1 > Ь2>".> bk.

 

 

7огда: 1) Корни .Л,i уравнения

(59)

различны,

их

число

µавно k+ 1

и они строго разделяются

числами

bi:

 

ь1< л.1;

ьi < л, < ьi_1,

i =

2"."

k; Лн1 < ьk.

(60)

(При это.11t один из корней 'Лi, очевидно, равен нулю.)

2) Если Ь1>0, bk<O, то

 

 

 

 

 

 

 

 

bk (1 +S) ~ 'Лi ~ Ь1 (1 +S),

i

= 1"."

k + 1.

(61)

Если Ь1>0, bk>O, то

 

 

 

 

 

 

 

 

 

bk < l.i ~ Ь1 (1 +S),

i =

1" .. ,

k,

'Лk+1=О.

(62)

Если Ь1 <0, Ь11.<О, то

 

 

 

 

 

 

 

 

 

Ь11. (1 + S) ~ 'Лi < Ь1,

i

=-~

2" ." lг--Т- 1,

Л1 = О,

(63)

е;де

11.

S='"' а1

' -

i=I

3) Ес.1и b1>lb;I, i=2, ... , k,

то корни

11.

11.

µ --1- '-'а· Ы (Ь· -µ)'- 1

=""а. ь.

·...,1, 1

...., ••

i=2

i=2

удовлетворяют неравенствам

µj уравнения

(64)

lµil > l'Лн1I,

i=' I,... ,

k.

 

До к аз ат ель ст в о леммы. l)

Числа bi

являют­

ся полюсами первого порядка функции

 

 

н

 

 

 

ер (Л) ~~ л+ \''ai ь~ (Ь1 -Л)-1,

 

i=I

 

 

 

nри переходе через которые

(при увеличении

~) она

меняет знак с плюса на :\Шнус. Поэто:\1у из монотонно­

сти

ер(/.)

на интервалах

( Ь;, bi+1),

i = 1, ..., k-l, а так­

же

1,

+оо), (-оо, Ь1<)

с.1е.:~:ует

утверждение (60).

§ 4.5. Иерархическая опти.1шзация

183

2) .Для доказательства (61)-(63) достаточно пока­

зать, что для t.i=FO

 

 

 

 

 

 

 

 

(66)

,

J Ь1,

Ь1 <О,

(67)

J.= J. Ь1(l 7S),

Ь1>О;

(68)

'bk,

bk >0.

(69)

Л-=(

 

 

(70)

 

!bk(I+S),

bk<O.

Пусть

 

 

 

 

/1

k

 

 

 

'i 1 (i.)-= 2:; ai Ь1-1.-~ а1

bi 1

- / . ) -1,

(71)

i=l

i=I

 

 

 

k

k

 

 

';2 Щ=Ь1 1 -Л.-Ьi L аi(Ь1-Л.)-1,

(72)

i=I

i=l

 

 

k

k

 

 

(iэ (}.) = bk ~ а,-Л.-Ь~ Lа1 (bk-}.)-1 ,

(73)

i=I

i=l

 

 

k

k

 

 

 

(f4 (Л.) = ~ ai ь, -Л-L at ь~ (bi -Л.)-1

(74)

i=2

i=2

 

 

 

.J:1я

l.>bi>O

ю.rее:\1 ср'2<О, ср'1<0. Поэтю1у <р1, ср2

~трого

монотонны

на интервале

1,

+оо) и согласно

выражениям (71), (72) меняются от -оо до

+оо. Сле­

довательно, в указанном интервале

существуют корни

1.q;,. Л.<Р.

функций <р1, <р2,

причем

из

неравенства

<p2-

-'f!>O получим

 

= Ь1 (1 +S).

 

 

 

 

 

ЛФ, < l.ip,

 

 

 

Соотношение (68) доказано. (67)

следует

из

(60),

"ак как в этом случае Л.1 =0.

 

 

 

 

184 Гл. 4. Опти.иизация

_ь_i'--)=

Л-Ьk

строго положительна на интервале :Ле (-оо, bk) и

/.(/). =bk(l+S)<Л(/J, =Лн1 <Лi, i=l,"., k.

Доказана справедливость утверждения (70). (69)

с.11едует из (60), так как Ak+1=0.

3)Докажем третье утверждение леммы. Вычитая

(71)из (74), пмеем

 

 

01ьr

G1 Ь1А

 

(75}

<JJ4-<JJ1= -а1Ь1+--=--·

 

 

 

Ь1

Ь1

 

 

На промежутках (Ь;, Ьн1)

для i= 1,

... , k-1,

(-ос, b1t),

1, +оо), qJ'1<0, qJ'4<0

и,

следовательно,

<р1, <р4

ку­

сочно-монотонны.

 

qJ4-<JJ1>0, и для

 

 

При /.Е (О, Ь1) разность

всех

кор­

ней ./.i>O выполняются неравенства

 

 

 

µ; >Лн1·

 

 

 

При 1.<0 разность (75)

отрицательна п

 

 

µt< Лн1·

Поэтому в общем случае

1µ; 1> 1'·н1

11 (65) доказано.

Переходим к доказате.11ьству теоремы.

Полагая, без ограничения общности, k=m, по.1vчим

следующее представление

элементов gц

матриuы · GmD

через э:тементы di.i матрицы D:

 

 

giJ= diJ-dm1Ui;>fu\m) _dnli ufЛ/ufm> +

 

 

+dmmUii>ufi) /(u\m>)2 ,

i, j= 1, ... ,

т-1.

(76)

§ 4.5. Иерархическая опти.11изация

185

Матрица GmD является блоком матрицы

G= {gi;},

i, j= l, ..., т, размерности mXm:

(77)

где нулевой диагональный элемент и нулевые (т-l )- мерные векторы обозначены одинаковым символом О.

Введем матрицу F с помощью преобразования по­

добия

 

 

 

F= ттат,

 

 

 

 

г;з:,е Т =

(и1, и2,

"., Иm)

 

-

ортогональная матрица,

со­

ставленная из

ортонормальных

собственных векторов

матрицы D.

 

 

 

 

 

 

 

 

 

Непосредственно проверяется, что F является окайм­

.11енной диагональной матрицей вида

 

 

 

-(а i

 

ат

 

\

._

 

 

 

F -

--~-;-di~i(i~-(Ь))-) '

i

- 2 ,"., т,

 

 

где а -

скаляр, а= (а<2>, ".,

а<т>)Т -

вектор.

 

 

Действительно, используя представление (76), полу­

чаем для элементов fii

матрицы F:

 

 

 

 

 

 

 

т

 

 

 

 

 

fo = Л, (D) б/J--1 - (U1

,

ид~ u(n) dтп-

 

 

 

 

и (m)

 

1,,J

1

 

 

 

 

 

 

1

 

n=I

 

 

 

 

 

---

 

т

 

 

 

 

 

и~т»-2 (и1,

ид (ul'

щ),

(и1, Uj) ~ u~k) dт11.+dmm (

1

 

l.J

 

 

 

 

 

 

 

 

ll1(m)

 

 

 

 

 

 

 

 

 

 

k=l

 

 

 

 

 

 

 

 

где

 

 

 

 

 

 

 

 

 

 

 

бо={~:

 

i=j,i:::/=j,

i,

i= l,"., т.

 

 

Отсюда: fi;=O при i> l,

i> l

и при i:::l=j;

fii=i'Лi(D)

при i=j>l.

 

 

 

 

 

 

 

 

 

Для i=2, "., т получаем:

 

 

 

 

 

т

a(iJ -

= fa = - - 1

u<m>

1

~ u~k) dmk = -

-

-

u~m> Л (D).

(78)

l.I

1

1

 

u(m)

 

k=l

1

 

 

 

186

Гл. 4.

Оптимизация

Из

(77) следует, что

матрица G, а, следовательно,

и F имеют те же собственные числа, что и GmD, и кро­ ме того, нулевое собственное число. Таким образом, исследование спектра GmD может быть сведено к азуче­ нию относительно более простой матрицы F.

Предположим, что лишь s компонент вектора а - не нули. Тогда, выполняя последовательность преобра­

зований подобия с помощью матриц перестановок [35],

затрагивающих последние (т-1) строк и столбцов

матрицы F, получим матрицу

Ф~(~1-~J;<E-!~J;~J

где компоненты вектора

h = (h 1,

••• , hs) т

являются

пе-

рестановкой ненулевых

величин

(78); diag(~i)

-

по­

рядка s; diag (')'i) -

порядка m-s-1; ~i

и 'Vi

яв.1яют­

ся перестановкой 'Лi(D), i=2, ..., т.

 

 

 

Следовательно,

k=m-s-1

собственных

чисел

!.; (F) совпадают с некоторыми собственными числами

'J.i(D), i=2, ... , т: Л;1 (Q), ... , 'J..;k(D); 2~iп~т; n=

= 1, ... , k; k~O, составляющи:'.1и матрицу diag(y;), а

остальные собственные числа Л; (F) яв.'Iяются собствен­

ными числами матрицы

z= (-~-1-di~~~)-).

(79)

 

 

 

Характеристическпй

по.11ином

матрицы Z равен

[35J

s

s

 

 

q> (Л)-= (а-Л) П фi -Л)-L h]П фi-1.).

(80)

i=I

i=I

i:/=/

 

Пусть t значений ~i различны (t~s). Переобозна­

чим их через Лm 1 (D), ... , Amt (D), а их I<ратности че-

рез q1, "., qt:

Q1+".+qt=S.

Тогда характеристическое уравнение

 

q> (/.)=о

(81)

 

§ 4.5. Иерархическая опти.11изация

 

187

будет иметь множитель

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

п [Лтi (D)-Л.]qГI.

 

 

(82)

 

 

i=I

 

 

 

 

 

Следовательно,

Лт1 (D) являются

собственными

чис­

лами матрицы Z, а значит,

и матрицы F

- кратности

Qi-l. Поделив (81) на

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

П [Лmi (D)-}.]q;,

 

 

(83)

 

 

i=I

 

 

 

 

 

приходим к уравнению

для

оставшихся

собственных

чисел матрицы Z

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

rх-Л-~ rii [Л.тi (D)-Л]-1 = О,

 

(84)

 

 

i=I

 

 

 

 

 

где f/i 2

есть сумма

qi величин h/, связанных с ~i·

Сог­

ласно

(78), имеем

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

Т/2 =-=

1

).2

(D) t1'(u~mJ)2;

 

 

 

i

(u<m>)2" т1

µ

I

 

 

 

 

1

 

/=2

 

 

 

штрих у знака суммы означает, что индекс j пробегает

значения, соответствующие номерам собственных

чисел

'Лi(D), кратных 1.rn 1 (D), включая номер т1.

 

Таким образом,

показано,

что m-t-l = (m-1-

-s) + (s-t) собственных

чисел

Ai (F)

совпадают

с не­

которыми

 

 

 

 

 

Л.t, (D), ... ,

Л.1m-t-i (D);

 

 

2 ~i1i ~т;

k= 1, ...• m-t-l;

 

остальные являются корнями уравнения

 

t

 

 

 

 

 

а-/,-~ ~1Л~i (D) Р·т1 (D)-Л]-1,

(85)

t=I

 

 

 

 

 

rде

 

 

 

 

 

 

 

т

 

 

 

с2 =

1

'1'(u(m))2

·

(86)

m1

( ufт>)2 ~

i

 

188 Гл. 4. Оптимизация

Известно, что матрица F имеет нулевое собственное

число, не вошедшее в группу {yi} и поэтому сохранив­

шееся у матрицы Z (деление на (83) убирает .1иш~

кратные собственные числа, и хотя бы одно ну.1евое

собственное число останется). Подставляя Л.=0 в (85).

получим

t

а= _I C~i Л.т1 (D),

 

 

i=I

 

и уравнение

(85)

примет вид

 

t

 

t

 

1.+ ~ c~I л;!i (D) [Лт; (D)-Л]-1= Lс~, Amz (D),

(87)

i=I

 

i=I

 

где m;=l=i11.

при

любых i= 1, ..., t; k= 1, ... , m-t-1.

Кроме того, Ат; (D) =l='Am i (D) при i=I= j.

В результате для доказательства пп. 1), 2) достаточ­

но показать, что число больших корней уравнения (87) равно числу больших собственных чисел в наборе

{Лm; (D)}, i = 1, ..., t, а число малых корней равно чис­

лу малых собственных чисел в том же наборе, причем

справедливы неравенства

(58).

t, присутствует

Пусть

среди

чисел Лт i

(D), i= 1, ...,

р чисел

/.; (D)

из

числа i= 1,

... , m-r;

O~p~m-r-1.

Тогда р корней /.;

уравнения

(87), согласно (60), будут

заведомо большими, причем максимальный корень, со­

гласно второму утверждению леммы, будет не бо.11ьше,

чем т тах

/..т; (D)

(см. (89)). Надо показать, что ос-

 

1=1 ... .. t

 

 

 

 

 

 

 

 

 

тавшиеся корни малы.

 

 

 

 

 

 

 

 

Исключим

из (87)

 

слагаемые,

соответствующие р

большим

(положительным)

собственным

числам

i.m i

(D). Получим уравнение

 

 

 

 

 

 

 

 

t-p

с2 'А2 (D)

 

t-p

 

 

 

 

 

 

µ + '1

11i

11i

µ

== ~с2 ~- (D),

(88)

 

 

 

l.J

 

(D) -

~

11;

'

 

 

 

 

i=I

 

l1;

 

 

i=l

 

 

 

где

1Л1Ji

(D) 1~1 'Аm-т+1 (D) 1-

При этом

t-p

ненулевых

корней уравнения (88), согласно третьему утверждению

леммы, будут, соответственно, не меньше, чем t-p не­ нулевых малых корней уравнения (87).

§ 4.5. Иерархическая опти,wизация

189

Следовательно, левая часть (58) доказана. Однако,

в силу второго утверждения леммы, эти t-p корней не

.:-.1огут быть большими.

ДействитеJ1ьно, согласно неравенствам (61)-(63)

имее~м

l~ч1~ i=l •. ~a~-p 1Л11i(D)I ( 1+ ~с~,) ~

 

 

 

 

 

~

 

max

1 Л.11. (D) 1 m. (89)

 

 

 

 

 

 

i=I, ... , t-p

'

 

Поясним

последнее

неравенство в

(89).

Согласно

(86) 1По.1учае:-.1

 

 

 

 

 

 

 

 

 

t-p

 

 

 

т

(и~т))2·

 

 

 

 

~с~,~ (и~т>г2 I

 

(90)

 

 

i=I

 

 

 

i=2

 

 

ибо если m(=/=mj,

то C2m. и

C2m.

не содержат одинако-

 

 

 

 

'

 

1

 

 

 

вых С.'Iагаемых. Следовательно,

 

 

 

 

t-p

 

 

 

т

 

 

 

 

 

1-L ," С2

& ( ulm))-2 ,.., ( ulm))2= (u(m))-2 & m

(91)

1 ,6'.

'Yli

-.-:::::

1

~

i

 

1

~

'

i~-1

 

 

 

i=I

 

 

 

 

 

так как д"1я ма1<симальной по модулю компоненты нор­

мированного

к едпнпце вектора

и 1 выполняется очевпд­

ное неравенство

 

 

 

 

 

J ujm> J ;;3: l ,'Vт.

 

 

I (91) с.1е.:~ует (89). ~'твержден·ия 1),

2) доказаны.

Д.1я доказательства третьего

утверждения теоремы

зю1ет11.:-.1, что х* удов.'Iетворяет уравнению

 

 

 

(х, и1) = 0

l'vl1 (D) (Ь, и1),

 

 

поэтому х* всегда имеет вид

 

 

 

х* =( y~I>,... , y~k-1),

L(y*),

y~k>,"., у~т-1) ),

 

где у* есть

подвектор

вектора

х* с исключенной

k-й

компонентой.

что y*=z*. Так как l 1(z) -

 

 

Покажем,

строго

вы­

пуклый функционал, то при ц=/=z. будет J(z1) >l(z*).