Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Кобрунов А_Мат методы модел в прикл геоф 2

.pdf
Скачиваний:
54
Добавлен:
02.03.2016
Размер:
10.74 Mб
Скачать

множестве сильно выпуклая функция достигает единственного минимума. Здесь сразу два

нужных утверждения – «достигает» и «единственно».

 

 

 

 

Напомним в этой связи некоторые определения.

 

 

 

Выпуклой комбинацией

двух точек

m1 и

m2 называется совокупность

точек

x

представимых в виде x m1

1 m2

где

– некоторое число имеющее значение в

пределах интервала [0,1].

 

 

 

 

 

 

 

 

 

Множество называется выпуклым, если

m2

 

вместе с любыми двумя точками оно содержит и

 

их выпуклые комбинации.

 

 

 

 

 

 

m1

 

 

Выпуклый

функционал

обладает

m2

 

 

 

 

 

x m1 1

свойством

 

 

 

 

 

 

 

 

 

 

 

 

 

J F m1 1 m2 , y

 

 

 

 

 

 

 

 

.

 

 

 

J F m1 , y 1 J F m2 , y

Рисунок 1.3

 

 

 

 

 

 

 

 

 

Если в последнем выражении всегда

выполняется строгое неравенство, то функционал называется строго выпуклым.

 

 

В том случае, когда отображение F m является линейным,

 

 

а функционал J F m , y

– квадратичен – например, имеет вид (1.2.3), задача (1.2.2) называется задачей квадратичного программирования. Квадратичный функционал сильно выпуклый и, поэтому, задача квадратичного программирования одновременно есть и задача выпуклого программирования,

если M

выпуклое

множество.

За

счет такого

специального

вида функционала

J F m , y

 

F m y 2 к ней применимы более частные, узкоспециализированные

 

 

 

i

 

 

 

 

 

 

j

 

 

 

 

 

подходы.

 

 

 

 

 

 

 

Наконец, функционал J F m

 

может быть

линейным и

представлять собой

, y

некоторую линейную функцию параметров m

 

 

 

и входных данных y , Множество M образовано

внутренней стороной выпуклого многогранника в фазовом пространстве параметров m

образованного линейными уравнениями как уравнениями граней. Эти задачи называются задачами линейного программирования и допускают применение еще более специализированных алгоритмов. Последние основаны на том хорошо известном обстоятельстве,

что минимум (также как и максимум) линейной функции на выпуклом многограннике достигается

ввершинах многогранника.

Вформе (1.2.2) может быть записана и задача, в которой множество M образовано набором допустимых траекторий, каждая из которых характеризует параметрами образующими

91

элемент m . В этом случае задание множества M состоит в задании динамических уравнений для допустимых траекторий, а роль параметров y y j , j 1, L играют некоторые краевые или

начальные условия для этих траекторий. Такой класс задач называется задачами динамического программирования и весьма распространен при обработке геофизических данных – автоматизированная корреляция временных разрезов или корреляция разрезов скважин. Роль множества M , в частности играют всевозможные траектории осей синхфазности для временного разреза проходящих через заданные реперные точки. m – это конкретная траектория луча и y y j , j 1, L обязательные значения реперов для допустимой траектории.

Методы решения задач оптимизации подразделяются на аналитические и численные.

Аналитические методы основаны на изучении и решении уравнений, которым должен удовлетворять оптимальный элемент – решение задачи (1.2.5). Они в целом основаны на идее, в

соответствии с которой в точке минимума (экстремума), функция имеет обращающуюся в ноль производную. А также идеям родственным с этой, состоящей в свойствах проекций элемента на выпуклое множество. Развитие этих идеи на бесконечномерный случай и распространение на случаи задач с различными важными в приложениях особенностями компонент задачи

оптимизации – смысла множества M ; вида элементов m M ; характера отображения

F m и

типа функционала J собственно и составляет основное ядро аналитических

методов

оптимизации. Эти методы чрезвычайно важны даже не в связи с тем, что позволяют найти конкретный оптимальный элемент, а прежде всего тем, что позволяют построить уравнения для выполнения последующего моделирования.

Численные методы оптимизации это большое разнообразие процедур, позволяющих шаг за шагом приблизиться к решению задачи оптимизации. Они имеют различную степень обоснования. От строго обоснованных и, представляющих, по сути, приемы численного решения и реализации тех требований, которые вытекают из аналитических методов поиска оптимальных элементов, до эвристических, не имеющих строгого обоснования своей ходимости. К числу последних относятся, например, так называемые генетические алгоритмы оптимизации. В

настоящее время количество модификаций численных методов оптимизации огромно. Оно даже не поддается обзору, поскольку основано на весьма большом числе разнородных идей и принципов. В этой связи, касаясь численных методов, следует уяснить лишь некоторые из основополагающих принципов. Что же касается конкретных реализаций, приспособленных к большому числу разнообразных конкретных ситуаций то современные общедоступные пакеты программ, такие как MathCad, Matlab, Maple, Mathematica и др. содержат их программную реализацию с весьма подробным описанием в соответствующих “Help”ах. Настоятельно рекомендую познакомиться с некоторыми из этих пакетов. Затраченное время будет оправдано.

92

f x, y , fx x, y , f y x, y

1.2.2 Аналитические методы оптимизации

Рассмотрим один достаточно простой пример, демонстрирующий дух и принципы

получения уравнений, которым удовлетворяют оптимальные элементы.

Пусть в качестве множества M выступает множество функций f (x, y) двух переменных x и y , определенных в некоторой области S плоскости X 0Y и имеющие непрерывные частные

производные до второго порядка включительно. Элементами m M служат конкретные

 

 

функции, а в функционале J F m , y отсутствуют члены y и он имеет частный вид:

J F m L x, y, f x, y , fx x, y , f y x, y dxdy

 

S

.

Здесь fx (x, y), f y (x, y) обозначают, соответственно производные функции f (x, y) по х и у; L x, y, a,b,c – некоторая функция, в данном случае, пяти переменных x, y, a,b, c , в которую

вместо переменных a, b, c подставлены соответственно. Эта функция

в приложениях называется Лагранжевой плотностью. Задача оптимизации (1.2.5) состоит в нахождении такой функции f (x, y) , которая обеспечивает решение задачи:

L x, y, f x, y , fx x, y , f y x, y dxdy min .

(1.2.4)

S

 

Предположим, что решение задачи (1.2.4) существует и есть

f (x, y) , а функция

L(x, y, a,b, c) достаточное число раз дифференцируема по всем своим переменным. Это значить,

что она дифференцируема ровно столько раз, какого порядка производные будут встречаться далее. Если (x, y) – произвольная непрерывно-дифференцируемая функция, заданная в S и

равная нулю на границе ∂S области S , то для любого числа t , f (x, y) t (x, y) уже не есть оптимальный элемент, но становиться таковым при t 0 . Тогда

12

J (t) L(x, y, f (x, y) t (x, y); fx (x, y) t (x, y); f y (x, y) t (x, y))dxdy,

S

рассматриваемая как обычная функция переменной t имеет экстремум при. t=0. Следовательно,

производная от J (t) должна обращаться в нуль при t=0:

12 Далее для краткости письма будем, где это не ведет к недоразумениям, опускать перечень переменных

(x, y) при функциях.

93

I Lf x, y,

f , fx

, f y dxdy L f

x

x, y, f , fx

, f y

xdxdy L f

y

S

 

 

 

 

 

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Здесь L f

,L f

 

,L f

– производные от функции L(x, y, a,b, c) по

 

 

x

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

на место которых подставлены f , fx ,

f y . Далее

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L

 

x

 

 

 

L

 

 

 

 

 

L

fx

;

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

fx

 

 

 

 

x

fx

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L

 

 

 

 

 

 

 

L

 

 

L

 

.

 

 

 

 

 

f

y

 

 

 

 

 

f

y

f

 

 

 

 

 

 

y

 

 

 

 

y

y

 

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x, y, f , fx , f y y dxdy 0

a, b, c соответственно,

Тогда:

I L f S

 

 

 

 

 

 

 

 

 

 

L

 

 

L

 

L

 

dxdy

 

 

 

 

 

 

 

 

x fx

 

y

f y

 

 

 

fx

 

 

 

 

x

 

 

 

 

 

 

 

S

 

 

 

 

 

 

 

 

 

 

 

L

f y

dxdy.

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

Второй интеграл, после применения формулы Грина, равен:

L fx dx L f y dy,

иобращается в нуль, поскольку значения (x, y, ) равны нулю на ∂S по условию. Тогда равенство:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L

 

 

 

L

 

 

 

L

 

dxdy

0

 

 

 

f

 

 

f

 

y

f

 

 

 

S

x

 

x

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

выполняется для всех непрерывно дифференцируемых и обращающихся в ноль на границе S

области S . C S C2

S . С другой стороны, функциями из C S может быть как угодно

0

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

точно приближен любой элемент из

L S

 

 

( C S

плотно в

L

S ). Следовательно, можно

 

 

 

 

 

2

 

 

 

0

 

 

 

2

 

считать, что на самом деле тождественным нулем является выражение в квадратных скобках последнего интеграла:

L f

 

L fx

 

 

L f y

0 .

(1.2.5)

 

 

x

y

Это и есть искомое уравнение Эйлера, являющееся необходимым условием, которому удовлетворяет экстремаль (т.е. решение вариационной задачи) (1.2.4). Необходимые условия –

94

A f

это те условия, которым должен удовлетворять оптимальный элемент. Но не факт что элемент им удовлетворяющий есть оптимальный. Решения уравнения (1.2.5) это «подозреваемые» на свойство оптимальности элементы. Из круга подозреваемых надо выбрать требуемый и доказать его оптимальность.

В том случае, когда на искомую экстремаль наложены дополнительные ограничения вида:

Gi x, y, f , f x , f y dxdy ai ,

(1.2.6)

S

 

задача минимизации функционала (1.2.4) при условии (1.2.6) сводится к безусловной минимизации (т.е. минимизации рассмотренного выше вида) функционала:

 

n

 

L x, y, f , fx , f y dS i Gi x, y, f , fx , f y x, y, f , fx , f y dS min .

(1.2.7)

S

i 1 S

 

Здесь i – числа, которые называются множители Лагранжа. Это правило – замена задачи на условный экстремум (1.2.6) задачей на безусловный экстремум (1.2.7) называется

«правило Лагранжа». Правда для того, чтобы применять это правило надо проверить выполнение

некоторых иных условий для функций

Gi x, y, f , fx , f y . В

их числе непрерывная

дифференцируемость требуемое число

раз по всем своим

аргументам функций

Gi x, y, f , fx , f y и регулярность их производной в окрестности искомого элемента. На самом

деле эти условия проверяются после того, как решение найдено и входят в перечень тех действий,

которые обосновывают применяемое правило – уравнения Эйлера. Числа i – находятся из условия, чтобы экстремаль (1.2.7) удовлетворяла системе уравнений (1.2.6).

В приведенном примере мы столкнулись с тем обстоятельством, что отображение

L x, y, f , fx , f y следовало дифференцировать по функциям, как по переменным. Таковы

производные Lf , Lfx , Lf y . Это характерное обстоятельство в задачах поиска оптимальных

функций. Эти производные следует рассматривать как производные Фреше от оператора,

определенного правилом L x, y, f , fx , f y . Напомним соответствующее определение (см. 1.1).

Если Х, Y – банаховы пространства, и – отображение (оператор) окрестности Q(f)

точки f D(A) X в Y , то A( f ) дифференцируемым по Фреше (сильно-дифференцируемым)

в точке f , если существует такой линейный непрерывный оператор, A ( f ) : X Y , зависящий от f и отображающий элементы h X в Y , что

95

 

 

 

 

 

A f h A f A

f h r h ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

lim

 

 

 

 

r h

 

 

 

Y

 

0.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

h

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

h

 

 

 

X

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

Линейный (относительно

h X )

 

 

 

 

 

 

 

 

 

называется производной Фреше или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

оператор A ( f )

сильной производной оператора

A( f ) в точке f . Если

A( f ) – дифференцируем по Фреше в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

окрестности точки

f D(A) X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

, и Im A ( f ) Y , то A( f ) регулярен в окрестности f . Следует

помнить,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

что A ( f )h суть линейный оператор, действующий на элементы h X . Если для всех

точек из

Q

 

f

 

 

 

 

 

 

 

 

 

отображение f

 

 

 

 

A' f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

существует A ( f ) и

 

 

 

 

 

 

Y непрерывно, то A( f )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

называется непрерывно-дифференцируемым или отображением (оператором) класса C1 . Далее используется только сильная производная, поэтому термин «Фреше» зачастую опускается.

Благодаря понятию производной Фреше, оправдывается дифференцирование некоторого отображения по функции, как по переменной. Так собственно и вычисляются производные.

Рассмотрим в качестве примера оператора A f x :

 

 

 

 

A f x

 

 

dxdy

 

.

 

 

 

 

 

 

 

 

 

1 2

 

 

S x x0

2 y y0 2 f 2 x, y

 

 

 

Это отображение можно рассматривать из подмножества в

L2 S функций, таких что

f x, y 0 .

Для того, чтобы

вычислить

производную Фреше,

продифференцируем это

выражение по

f x, y , как по параметру. В результате получим:

 

 

 

 

 

 

 

 

h x, y f x, y dxdy

 

 

 

 

A' f x, y h x, y

 

 

 

 

 

 

 

 

 

 

x x0 2 y y0 2 f 2

3 2

 

 

 

 

S

x, y

Пусть

 

 

 

 

 

 

 

 

A( f x, y ) – линейный оператор: A( f x, y ) Af x, y . Тогда A f h Ah.

Производная

уже не зависит от

f x, y ,

оператор действует на

приращение h h x, y ,

следовательно, во всех «точках» f x, y производная одна и та же. Следует всегда помнить, что

производная – это линейный оператор, действующий из Х в Y.

Следующая теорема называется правилом (принципом) Лагранжа и является основной в вариационном исчислении. Она является обобщением того приема, который был введен под тем же названием выше – переход от задачи (1.2.4, 1.2.6) к задаче на безусловный экстремум (1.2.7).

96

1.2.2.1 Правило Лагранжа

 

 

 

 

 

 

Пусть функционал J( f x )

и отображение

A( f x ) : X Y произвольное

 

 

x , где –

 

 

x решение задачи:

дифференцируемое по Фреше в окрестности точки

f

 

f

J( f x ) min

 

 

 

 

 

 

 

 

 

 

 

A f x y,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

существование которого предполагается. Пусть Im A f Im A f . Тогда найдутся не равные

одновременно нулю элементы R1 и y* Y * , такие, что f x есть одновременно и решение задачи:

J f x A * f x y* h x 0

 

 

 

 

*

 

 

 

 

 

 

 

 

 

 

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для любого h x X . Здесь A f – сопряженный к

A

оператор. Если J f x

– функционально образующий

элемент

для

 

 

линейного

ограниченного

функционала

J f x J f x

 

h x то

отождествляя

 

J f x

 

с

J f x X *

приведенный

 

 

 

принцип Лагранжа переписывается в форме:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

 

 

 

 

*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f x y

0

 

 

(1.2.8)

 

 

J

f x A

 

 

 

Это соотношение между

элементами

сопряженного

к

X

пространства. Если A(x)

непрерывно-дифференцируемо и регулярно в точке f ( Im A f Y ), то 0 , и можно

считать, что 1.

Уравнение (1.2.8) называется уравнением Эйлера-Лагранжа. Это полный аналог и обобщение его частного случая (1.2.5), полученного для задачи (1.2.4). Более общепринято все уравнения, характеризующие необходимые условия экстремума, полученные вариационным путем называть уравнениями Эйлера.

Доказательство этого результата [см. А. Д. Иоффе, В. М. Тихомиров 34,, стр.87–88]. Здесь,

как и для уравнения (1.2.5), приведем лишь его упрощенную схему.

Пусть A( f ) y . Построим вариацию f (h,t) f x t h x r t такую, что

A( f (h,t)) y ,

lim r t 0.

t 0 t

97

Тогда:

A f (h,t) A f x t A' f x h x r 0 ,

где r – величина, связанная с r t и более высокого порядка малости, чем остальные члены.

Приходим

к

выводу,

что h KerA

 

 

 

 

. В условиях

теоремы, состоящих в предположении

f

 

 

 

 

 

 

и непрерывности отображения

x

 

A' f

 

 

 

 

 

 

 

замкнутости

 

 

в окрестности точки

 

f ,

Im A f

 

 

 

имеет место и обратное утверждение:

совокупность векторов h x

из KerA

 

таких,

что

f

 

 

 

t h r t обладает свойством:

 

 

 

 

 

 

 

 

 

 

 

f

(h,t)

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A(

f

(h,t)) y

 

 

 

 

 

 

 

 

 

 

 

 

Для некоторого r t и lim

 

 

 

 

r t

 

 

 

 

 

0.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Теперь рассмотрим функцию параметра t:

J f (h,t) min .

По условию ее минимум должен достигаться при t=0 и, следовательно, вычисляя

производную по t при t=0:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f x

h x 0

 

 

 

 

 

 

 

J

h x KerA f x .

J

 

 

 

x – есть линейный функционал над Х, поэтому для наглядности его записали его в

f

виде J

 

x

 

h x . Элемент

J

 

x ,

 

 

 

 

 

 

 

f

таким образом, отождествляется в смысле

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

изометрического изоморфизма с некоторым элементом из Х*. Из последнего условия, по теореме

 

 

 

 

*

 

 

 

 

 

 

 

 

 

 

 

*

 

 

 

 

 

 

 

 

f

f x , получаем

 

 

f

 

x , где –

о ядре Ker( A

x ) Im A

J

f x Im A

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

13

. Следовательно, в регулярном случае

 

 

 

 

f x , откуда

некоторое число

Im A f x Im A

13 Оно введено на тот случай, если оператор А не регулярен. Тогда возникают особенности с применением теоремы о ядре. Равенство нулю этого числа делает весь результат тривиальным и справедливым для любого случая. Впрочем, в этом последнем случае он не только тривиален, но и бессодержателен с конструктивной точки зрения.

98

 

 

*

 

 

 

 

*

 

 

 

 

 

 

 

 

*

 

*

 

 

 

 

f x . Таким образом, существует

элемент y

Y

и

следует, Im A

f x Im A

 

 

J

 

A *

 

y* 0 . Это и требовалось показать.

 

 

 

 

 

 

f

f

 

 

 

 

 

 

 

Требование регулярности оператора A

 

x в окрестности точки

 

x является весьма

 

 

f

 

f

жестким и во многих интересных случаях не выполнено. И хотя, фактически, результат теоремы

чаще всего

справедливым

остается и тогда, когда

Im A

 

x незамкнуто, строгое ее

f

применение

неправомерно.

Из замкнутости Im A

 

x следует корректная разрешимость

f

факторизованного уравнения:

A' f x h x u ,

которая называется нормальной разрешимостью.

Последнее означает корректную разрешимость уравнения относительно фактор пространства Х по ядру оператора, или корректность решения задачи

A' f x h x u Y , h x X min . ,

В обратных геофизических задачах нормальная разрешимость чаще всего не имеет места.

Причина этого состоит в том, что не для всякой правой части уравнение A' f x h x u

вообще разрешимо. Но если решение существует, то существует и нормальное решение. Так,

например, приведенный выше результат, строго говоря, нельзя применять к модели обратной задачи гравиметрии:

 

 

 

v zdv

 

 

u x0 , y0 ;

 

 

 

 

 

 

 

 

 

 

 

x x

2 y y

 

2

z2

3 2

V

 

 

(1.2.9)

 

 

0

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

v

 

 

 

 

min,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

V

 

 

 

 

 

 

 

L2

 

 

 

 

 

 

 

 

 

 

 

состоящей в нахождении распределения плотности v в области V нижнего

полупространства по заданной функции u x0 , y0 на плоскости z 0 . Эта функция с точностью до постоянной (обратной гравитационной постоянной) есть вертикальная составляющая градиента потенциала гравитационного потенциала. Однако его неприменимость сводится лишь к тому, что строгое решение уравнения в (1.2.9) для всех u x0 , y0 Y может не существовать.

99

Упрощенно – не всякая функция из функционального пространства, например L2 , может рассматриваться как гравитационное поле некоторого распределения источников. Хотя приближенно и с очень высоким уровнем приближения (сколь угодно высоким) – можно. По этой причине нормальное решение существует с любой наперед заданной точностью и в этом отношении, учитывая реальное положение дел с точностью входных данных и конечной точностью счета, приведенный результат, оказывается, не просто применим к обратным задачам в форме типа (1.2.9), но и весьма конструктивным.

Приведенный выше результат – теорема Лагранжа (принцип Лагранжа) – это необходимые условия экстремума. Для его корректного применения следует еще доказать, что соответствующая конкретная задача имеет решение и записанные условия достаточны. Доказать это удается, как правило, лишь в весьма жестких предположениях относительно функционала

J( f x ) и оператора A f (x) . Оказывается, что для специальных случаев, к которым могут быть сведены многие задачи моделирования в науках о земле и, в частности, обратные геофизические задачи, соответствующие результаты можно доказать, исходя из других принципов, не используя операции дифференцирования и производных.

В большинстве рассматриваемых в приложениях случаях, функционал J( f x ) имеет специальный вид или может быть сведен к специальному виду – нормы в банаховом пространстве.

Рассмотрим следующую задачу, называемую задачей о наилучшем приближении. Далее мы несколько изменим обозначения, поскольку они носят более общий характер с точки зрения типа элементов подбираемых как оптимальные и линейного характера используемых операторов.

Пусть Х – банахово пространство, M – его подмножество и х0 – элемент из Х, не принадлежащий М.

x0

M

X x

Рисунок 1.4 – Пояснение к обозначениям

Назовем элемент x наилучшим приближением к х0 (аппроксимацией х0) на множество М,

если

100