Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Башкирский Государственный Аграрный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

книги из ГПНТБ / Синдлер Ю.Б. Метод двухступенчатого статистического анализа и его приложения в технике

.pdf

Скачиваний:

Добавлен:

24.10.2023

Размер:

9.21 Mб

Скачать

☆

<<< < Предыдущая 1 23 / 203 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 > Следующая >>>

	z m ,	то опорную гиперплоскость	можно
рассматривать как касательную к поверхности.			[/, X],
Опорную гиперплоскость		будем кратко обозначать	[/, X],
где Х = (1, А,а,	Х Т ) — вектор, определяющий наклон		гипер
плоскости.

Приведем без доказательства две теоремы, касающиеся свойств выпуклых множеств, выпуклых функций и опорных гиперпло

скостей к ним. Доказательство читатель

может

найти

[ 1 ] .

Т е о р е м

а 1 (теорема

об отделяю

щей гиперплоскости). Если два точеч-

ных множества выпуклы и не имеют

общих

точек,

то

можно построить

та

кую гиперплоскость, что эти множества

будут

находиться в разных полупрост

ранствах, образуемых

этой

гиперпло

скостью.

на

(

a p ^ j [ *

Так,

в примере, изображенном

ArctgX'

рис.

множества точек,

принадлежа

Рпс. 3

щих кругу и полукругу, могут быть

отделены друг от друга прямой

АВ.

Прежде чем излагать вторую теорему, полезно привести

сле

дующий пример. На рис. 3 изображена

выпуклая

кривая

z0 =

/(zx )

и к ней построена опорная прямая [/,

X-J, уравнение

кото

рой z0

b — ^iZj_.

Если ХХ

изменяется, то опорная прямая «обка

тывает»

кривую. Допустим,

что

имеется

вертикальная

прямая

— bv

и пусть А и В — точки ее пересечения с кривой и опорной

прямой соответственно. Пусть Zo —ордината точки

В.

Будем

рас

сматривать величину

Zo как

функцию параметра Х^.

Zo = ср(?4).

Представляет интерес тот факт, что

функция

ц>(ХГ) является

вог

нутой и имеет максимум при таком

значении

ХГ

при кото

ром

касание происходит в точке А,

а точки

А и В

совпадают.

Теорема 2 представляет собой обобщение этого примера на

случай произвольного числа

измерений.

Т е о р е м а 2. Пусть в (т - j - 1)-мерном пространстве имеются:

— выпуклая поверхность z0 = f(z11

z m ) ;

— прямая zx = bi,

z m

bm,

параллельная оси

Ozx\

—

опорная

гиперплоскость [/, X], X =

(1, Xv

X m ) .

Пусть (zo і

bm)

— точка

пересечения

опорной

гипер

плоскости ипрямой, a (f(bv

bm),

bx,

bm)— точка пересече

ния поверхности и прямой. Первую точку обозначим В,

вторую

А.Тогда:

— функция		ZQ = ф(Я15	Х Т ) , выражающая зависимость ко
ординаты ZQ	от	величин Xlt	Х Т , является вогнутой;
— максимальное значение функции ф по переменным Х±1 . . . , Х Т
равно /(&!,	Ь Т ) ;

— в случае достижения функцией ф максимума точки А и В совпадают.

1.2. Вполне аддитивные вектор-функций

Понятие вполне аддитивной вектор-функции будет использо вано нами в главе 4 при доказательстве выпуклости некоторых множеств. Это доказательство будет играть существенную роль для обоснования вычислительных методов, приведенных далее в главе 5. Читатель, который в большей степени интересуется самими вычислительными методами, чем вопросами их обоснова

ния, может опустить данный раздел.
Пусть имеется область X в «-мерном евклидовом						пространстве
Еп переменных хх,		хп. Пусть		для каждого		подмножества
I ^ l j c l )	может	быть	однозначно	определен	(т + 1)-мерный
вектор z =	(z0 , zx,	z m ) .	Если подмножество Хх		будем изменять,

то будет изменяться и вектор z. Таким образом, получаем векторфункцию z = F ( Z 1 ) , ХхсХ. Эта вектор-функция называется вполне аддитивной, если для любых непересекающихся подмно

жеств Хх, Х2,

Xh,

... множества

сумма

вектор-функций

равна вектор-функции от объединения подмножеств:

(Хх)

...

F (Хк)

+ . . . =

(X,

+ ...

Хк

+ . . . ) .

(1.4)

Типичным примером вполне аддитивной вектор-функции явля

ется

определенный

интеграл

от

некоторой

вектор-функции

Цхх,

хп)

или

f(x),

где

х =

(хх,

хп).

Вектор-функцпя f(x)

имеет составляющие / „ , fx,

/ т ,

представляющие собой

ограни

ченные

по

абсолютной

величине

одномерные функции

величин

хп.

Вполне аддитивная

вектор-функция

равна в

данном

случае F(XX) =

(F0(XX),

F ^ X J ,

Fm(Xx)),

где

^0 (Xi)

/о (x) dx, ...,Fm

(X,)

]

(x)

ХЄХ,

ХЄА',

— ?г-кратные определенные

интегралы

по

области

Хх.

Для

дальнейшего

важное

значение

будет

иметь

теорема

А. А. Ляпунова

[2], которую приведем

без доказательства.

Т е о р е м а

3. Если Хх

пробегает все подмножества множества

X, то аддитивная вектор-функция z = F(XX) пробегает выпуклое множество в пространстве Ет+Х.

1.3. Метод множителей Лагранжа. Общие положения

Метод множителей Лагранжа известен в литературе в различ ных вариантах. В классической литературе по математике [3] его иногда применяют для решения следующей задачи. Задано

т	_j_ 1 функцийf0 (xx , . . ., хп),	fx(xv . . ., хп), . . .,fm(xx,	. . ., хп),	п>
^>	т + 1. Требуется найти	значения величии хх,	хп,	при

которых достигает минимума фуикция / 0 , при условии, что осталь ные функции равны заданным величинам fx = bx, fm = bm.

Кратко эту задачу запишем в виде
мин {/о (х) \| U (х) = Ъи . . ., U (х) = Ът},		(1.5)
х
где х = (xl	, хп).

Для того чтобы решить эту задачу, вводят т неопределенных величин . . ., X m (множителей Лагранжа). Составляют функцию Лагранжа

то

£ = /О(Х) +				2 М / І ( Х ) - Ь І ) -				(1-6)
Величина				L	зависит	от	п -\- т переменных xv	. . ., хп,
kv . . ., А,т . Далее					берут частные производные от L по всем этим
переменный!,			приравнивают			их нулю и получают систему		п + т
уравнений:
Я/о	,	V ,		dU	= о. / =		1, • •. ,п;
h	-	h	=	о,	i	=	l , . . . , т .	(1.7)

Система (1.7) представляет собой необходимые условия, ко торым дожио удовлетворять решение задачи (1.5). Решая эту систему, в некоторых случаях удается найти решение задачи.

Следует помнить, что при этом варианте метода множителей Лагранжа предполагается выполнение следующих условий: функ ции/о,/^ . . ., fm дифференцируемы, переменные xv . . ., хп не ограиичены.

Перейдем теперь к случаю, когда искомыми являются не пе ременные, а функции. В вариационном исчислении метод множи телей Лагранжа иногда применяется для решения задач поиска экстремума некоторого функционала при заданных условиях.

Напомним, что функционалом называется переменная вели чина, зависящая от функции. Например, определенный интеграл в заданном интервале 0 < ; t ^ Т вида

z = ^ ф (t) dt

зависит от функции ср(£) и поэтому является функционалом. До пустим, что задана функция двух переменных г|з(и, t), причем и можно рассматривать как функцию от t: и = u(t). Тогда интег рал

z =	^(u(t),t)dt
	о

является функционалом по отношению к функции u(t).

Рассмотрим	случай, когда заданы т +						1 функционалов				вида
х	т								т
zo = S	О	z	i =	$	(", t)dt,...,	z	m	=	J ч\|?	(г/., і) Л,	(1.8)
		z					m		т
0				0					о
где i\|>o("i <0> 1 l'i(u > *)> • • • > i\|'m ( М ) — заданные									функции двух пере
менных и и t.
Предполагается,		что		эти функции ограничены						и дифферен
цируемы по и. Требуется решить задачу
МИН { 2 0 \| Z X =	& ! , . . . , z m			=	bm}.						(1.9)
"(О

Эта задача может быть решена следующим образом. Составляют

функцию

Лагранжа

L = z 0

+ 2 *ч ( z i — & І)

i = l

и,

подставив

в нее

(1.8),

получают

L =

J U

(u, 0 + 2

М>І (и, *)1

* -

^ ^ i -

(1.10)

i = l

j = l

Затем находят функцию uPty,^,

. . ., А,т ),для которой выражение

в квадратной скобке

(1.10) достигает

экстремума. Для этого

его

дифференцируют

по

и и,

приравнивая

производную

нулю,

по

лучают

уравнение

^ + 2 U | r - o .

(i.ii)

i=l

Решение этого уравнения относительно и дает нам функцию

u°(t,Kv

. . .,

X m ) ,

зависящую от

неизвестных пока

множителей

. . ., %m. Для того чтобы получить окончательное решение зада

чи,

нужно вычислить значения этих множителей. Один из спосо

бов их вычисления состоит в

том,

что

подставляют

функцию

u°(t, Kv

. . .,

K m ) в условия

задачи (1.9)

и получают

систему

из

mуравнений

т.

l^i(u°,t)dt	= bu i = l , . . . , m .	(1.12)
о

Решая эту систему, получают искомые множители. Этот способ мы условно назовем способом уравнений. Другой способ вычисле ния множителей Лагранжа мы рассмотрим ниже.

Таким образом, мы описали для двух случаев «классическую» схему, по которой производят выкладки при решеиии задач

методом множителей Лагранжа. К сожалению, встречаются за дачи, для которых эта схема неприемлема. Дело в том, что указан ные выше требования о непрерывности н дифференцируемости функций не всегда выполняются. Существенно также и то, что уравнения (1.7), (1.11) и (1.12) дают необходимые условия для решения задачи, но эти условия могут оказаться недостаточными. Поэтому, получив некоторый ответ по этой схеме, мы не имеем еще уверенности в том, что нашли истинное решение задачп. Заметим также, что в обеих приведенных задачах условия были заданы в виде равенств. Это обстоятельство характерно для клас сического метода множителей Лагранжа; оно ограничивает об ласть его применимости.

В современном математическом программировании метод мно жителей Лагранжа получил значительное развитие. Разработапы новые схемы вычислений. Получен ряд теорем, с помощью ко торых во многих случаях еще до решения задачи имеется воз можность установить, что задача может быть решена методом множителей Лагранжа. В некоторых других случаях после про веденных вычислений имеется возможность проверить, является ли полученный ответ истинным решением. Требование непрерыв ности и дифференцируемости функций становится не столь су щественным. Кроме того, сам метод обобщен на случай, когда условия задачи или часть условий заданы в виде нестрогих не равенств.

Следует заметить, что каждая из известных в настоящее время схем вычислений, включая и классическую, имеет определенные преимущества и недостатки. Достоинство классической схемы состоит в том, что она позволяет получить решение в аналити ческом виде. В главе 5 мы используем эту схему наряду с другими.

В математическом программировании большой интерес пред

ставляет теорема Куна — Таккера		[1, 4].
Теорема Куна — Таккера.	Пусть	имеется т +	1	вы пуклых
ФУНКЦИЙ Z 0 = / 0 ( V ) , Z 1 = / і ( У ) ,	. . . , Z m	= / r a ( v ) , Г Д Є У =	(VV	. ... , Удг) —

./V-мерный вектор, составляющие которого vv . . . , VN неотри

цательны. При этом N ^> т +		1. Пусть требуется решить	задачу
мин {/„ (v) \| h (v) < Ъи . ..	, fm	(v) < bm},	(1.13)
V	величины. - Эти величины заданы так,
где Ь1г . . . , Ьт — заданные	величины. - Эти величины заданы так,

что существует хотя бы одно значение вектора v , при котором

условия задачи выполняются строго: / x (v) <С bv				. .. , /m(v) <С bm.
Пусть v° — решение задачи (1.13).
Теорема Куна — Таккера утверждает, что				существует такой
(т + 1)-мерный вектор Х°	с	составляющей	Х0	— 1 и	неотрица
тельными составляющими	Х1г	... , Хт, что	функция		Лагранжа
					(1.14)

имеет при v = v° и X = Х° минимум по v и максимум поХ,	т. е.
L(\°, %) < L ( y ° , X 0 ) < Z , ( v , X 0 )	(1.15)

для всех неотрицательных v и X. Точка (v°, Х°) называется седловой.

Заметим, что условия теоремы	Куна — Таккера не	требуют
дифференцируемое™ функций /о, fv	.. ., fm. На них наложено		лишь
условие выпуклости.
Соотношение (1.15) имеет фундаментальное значение		в	мате

матическом программировании. Известен целый ряд вычислитель ных методов для решения задачи (1.13), основанных па этом со отношении (см., например, [4]). Мы также используем его при раз работке вычислительных методов для решения задач двухступен чатого анализа. В этих задачах, как мы увидим в дальнейшем, функции fi не удовлетворяют условию выпуклости. К счастью, это условие не является обязательным. Как показали исследова ния (см., например, [5]), теорема Куна — Таккера может быть распространена на случай невыпуклых функций довольно общего вида.

Для того чтобы читателю было легче понять роль соотношения (1.15), в разд. 1.4 и 1.5 мы попытаемся максимально наглядно, не


стремясь к строгости изложения, пояснить сущность вопроса.
	1.4. Условно-экстремальные задачи со строго			выпуклыми
	множествами п их геометрическая интерпретация
	Пусть имеется некоторое множество 5 процедур и пусть каж
дой процедуре		s (s £ S)	могут быть поставлены в соответствие по
казатели z0 (s), % (s),			zm (s). Будем говорить, что процедура			s
отображается в		точку	z с координатами z0 (s), zx (s),		zm (s)	в
(m	+ 1)-мерном	евклидовом пространстве E m + 1 ,		а все	множество
S	отображается в некоторое точечное множество			Z.

Пусть множество Z строго выпукло.

Рассмотрим задачу на условный минимум, в которой все усло вия заданы в виде равенств

мин {z0 (s) I zx (s) = b1,...,zm	(s) = bm}.		(1.16
Примем допущение, что прямая z± = bx,		zm — bm	содер
жит в себе некоторую часть внутренних точек множества Z, т. е.
«пересекает» Z.
Прежде чем рассматривать задачу в общем виде, приведем при
мер задачи с одним ограничением. К этому		примеру мы	будем

неоднократно обращаться. На рис. 4 штриховкой изображено		стро
го выпуклое множество Z точек z = (z0 (s), zx	(s)), на которое	отоб
ражается некоторое множество процедур S.	Предположим, что
требуется решить задачу
мин {z0 (s) К (5) =Ъ1].		(1.17)

На оси	Oz1	отмечено значение лимитирующей величины Ъг
(z1 H <C^i <	Zya)-	Вертикальная прямая zx = b\ пересекает Z.

В задаче (1.17) допустимы все варианты s, которые отображают ся на отрезок АВ на рис. 4. В задаче (1.16) допустимы все варианты

процедур, которые	отображаются на прямую zx = b1,	z m =
= bm. Точки z, в	которые отображаются допустимые	варианты,
также будем называть допустимыми.

Рис. 4 Рис. 5

Из рис. 4 видно, что в задаче (1.17) точка А и соответствующая ей процедура являются оптимальными. В дальнейшем мы встре тимся с более сложными задачами, где такой наглядности уже не будет. В этом случае мы применим для решения задач метод мно жителей Лаграижа. Для того чтобы объяснить сущность метода, проиллюстрируем его на нашем простом примере.

Напомним одно из определений оптимального варианта s°, ко торое дано в конце введения. Согласно этому определению, 5° есть решение задачи на условный экстремум, в данном случае — зада чи (1.16). Это определение можно выразить и в другой форме. Для каждой допустимой точки г' = (z'0, b±, Ьт) из множества Z, удовлетворяющей условиям задачи (1.16), рассмотрим множество точек, лежащих на прямой zx = Ъх, zm = bm и имеющих коор динату z0 , строго меньшую, чем z'Q. Обозначим это множество через К (z'). Допустимая точка z° и соответствующий ей вариант s° на зываются оптимальными, если множество К (z°) не содержит ни одной точки из множества Z.

Поясним последнее определение на нашем					простом примере.
Для	допустимой точки, например для точки				Q с координатами
z0 =	ZQ , zx =	Ъх (см. рис. 4), роль множества К {Q) выполняет по
лупрямая z0		<	zo, zx = bx.	Подчеркнем, что	граничная точка Q
не принадлежит			множеству	К (Q). Отрезок AQ содержит точки

множества Z, и поэтому точка Q не является оптимальной. Точка же А является оптимальной, так как ее множество К не содержит ни одной точки множества Z.

Отметим важное обстоятельство: для любой допустимой точки множество К является выпуклым.

Таким образом мы видим, что множество К для оптимальной точки и множество Z выпуклы и не имеют общих точек. Следова тельно, согласно теореме 1 разд. 1.1 существует такая гиперпло скость, которая отделяет эти множества друг от друга. В нашем примере с одним ограничением роль отделяющей гиперплоскости играет прямая F E (рис. 4).

Для того чтобы решить задачу (1.16), необходимо найти такую гиперплоскость, которая отделила бы множество Z от множества К какой-либо допустимой точки.

Обратимся к нашему примеру с одним ограничением (рис. 4). Мы видим, что отделяющая прямая касается нижней границы множества Z в оптимальной точке А и имеет некоторый угол на клона к оси Ozx. Будем рассматривать прямые, проходящие через различные точки г £ Z под разными углами наклона к оси Ozx. Так, на рис. 5 через точку z проведена пряма DC, уравнение кото

рой	имеет вид
z0	= d-Xxzx,	(1.18)

где d — некоторая постоянная.

Пусть s — вариант, отображающийся в точку %. Это означает,

что координаты точки равны				z 0 = z„ (s),	zx	= zx (s) (см.	начало
разд.	1.4). При		значении аргумента zx =		zx	(s) ордината	прямой
равна	z„ =	z 0 (s), поскольку прямая проходит через точку					z. То
гда d — z0		(s) +	Xxzx is) и уравнение прямой примет вид
So	= z„ (s) +		Хх (zj. (s) — zx).
Ордината точки пересечения прямой DC и прямой zx = Ъх
равна
L	(s, Хх) = z0		(s) + Хх {zx (s) -	bx).			(1.19)

Мы видим, что эта величина представляет собой функцию Лагранжа. Таким образом, функцию Лагранжа можно интерпрети ровать как значение ординаты точки пересечения наклонной пря мой, проходящей через некоторую точку z (z б Z), и вертикаль

ной прямой zx	= Ъх.
В случае, когда имеется задача с произвольным числом огра
ничений (1.16), функция		Лагранжа
	m
L (s, %) = z0	(s) + 2	(*) - Ъ]	(1.20)

i=l

может быть интерпретирована следующим образом. Гиперпло скость

І=І

проходит через точку z =	(z0 (s), zx (s),	zm (s)), имея направ
ляющий вектор X = (1, Xx,	Хт), и	пересекает прямую zx =

=bx, zm = bm в точке, координата которой z0 и есть L (s, X).

Обратимся снова к примеру с одним ограничением. Произволь ная прямая, например DC (рис. 5), не отделяет множество Z ни от одного множества К (ни от одной вертикальной полупрямой, имеющей верхний конец на отрезке АВ). Нужно панти такую на клонную прямую, которая станет отделяющей. Поиск такой пря мой можно вести следующим образом.

Пусть вначале Хх выбрано произвольно. Варьируя s и, следова тельно, варьируя точки ъ (,s), будем стремиться достичь минимума функции Лагранжа. При этом наклонные прямые будут переме щаться, оставаясь параллельными друг другу. Минимум L (s, Хх) будет достигнут при некотором варианте sx,- При этом наклонная прямая касается нижней границы множества Z в точке отображе

ния варианта sx, (точка Т). На рис. 5 отмечено минимальное				зна
чение функции Лагранжа при данном Хх:			^
£ ш ш (К) =	мин L (s, Хх) = L (sX l , Хх).
	s
Касательная	является опорной прямой к множеству Z и			к его
нижней границе.
При произвольно взятом Хх мы еще не можем получить решение
задачи (1.17). Абсцисса точки касания		Т не равна	Ьх, и, следова
тельно, условие задачи не выполнено,		а вариант sX i	не является ее

решением. Из приведенных рисунков видно, что существует такое значение Хх, при котором касание опорной прямой и нижней гра ницы множества Z происходит в точке А, имеющей абсциссу zx —

— Ьх. Это значение Хх может быть найдено способом уравнений, ко торый был описан в разд. 1.3. Для этого задаются Хх, находят ва риант s\„ при котором L (s, Хх) достигает минимума, затем прове ряют, удовлетворяется ли равенство zx ($х,) = bx. Перебор по Хх продолжают до тех пор, пока это уравнение не будет удовлетворено с приемлемой точностью.

Поясним теперь, какое значение в этой задаче имеет выпук лость множества Z. Предположим, что от заштрихованной области на рис. 5 отторгнута выпуклая часть, расположенная ниже штрихпунктирной линии, а наше множество процедур S отображается на оставшуюся невыпуклую часть области. В этом случае для за дачи (1.17) оптимальной является уже не точка А, а точка А'. Однако не существует опорной прямой, которая соприкасалась бы

с нашим новым множеством Z в точке А'.	Поэтому задачу (1.17)
в данном случае нельзя решить методом	множителей Лагранжа
по описанной схеме.

Допустим теперь, что ограничивающая величипа имеет значе ние не Ьи' а Ъ'х (рис. 5). Тогда точка Т является оптимальной, а че рез эту точку можно провести опорную прямую, т. е. можно ре шить задачу, пользуясь нашей схемой.

Таким образом, когда множество Z не выпукло, возможность получить решение зависит от значения лимитирующей величины. Когда же Z выпукло, мы получаем решение независимо от лимити рующей величины (если только вертикальная прямая zx — bx пе ресекает Z).

Следует отметить, что способ уравнений становится слишком трудоемким, если число ограничений в задаче достаточно велико. В этом случае для построения эффективного алгоритма поиска

множителей Лагранжа можно использовать теорему 2 разд. 1.1. Покажем, как применить ее в нашем простом примере с одним огра ничением. В соответствии с теоремой нужно искать такую опорную прямую, которая пересечет вертикальную прямую zx = bx в мак симально высокой точке (т. е. в точке с максимальной ординатой z0). Этот способ назовем минимаксным." Опорная прямая, найденная минимаксным способом, будет касаться нижней границы множе ства Z в оптимальной точке А, как показано на рис. 6. Р1а этом ри сунке изображены три опорные прямые, касающиеся нижней гра ницы множества Z в точках А, Т, F , и кружками отмечены точки пересечения этих прямых с вертикальной прямой zx = Ьх. Из ри сунка видно, что опорная прямая, касающаяся нижней границы в точке А, пересекает вертикальную прямую в наиболее высокой точке. Значение множителя Лагранжа, при котором это происхо дит, назовем оптимальным и обозначим Я?.

Т а к т і образом, для решения задачи (1.17) нужно найти мак симум по %х минимального по s значения функции Лагранжа:

макс мин L (s,		=^макс L M i r a (кх).
Xi	s	Лі

Задача о нахождении максимума функции L m i n (^і) по Кх на зывается двойственной по отношению к задаче (1.17). Оптимальное значение множителя Лагранжа Х°х и оптимальный вариант s° об

разуют так называемую седловую точку, для которой справедливо

<<< < Предыдущая 1 23 / 203 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 > Следующая >>>

Соседние файлы в папке книги из ГПНТБ