Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Южно-Уральский Государственный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Метод Ньютона.doc

Скачиваний:

Добавлен:

13.11.2019

Размер:

1.13 Mб

Скачать

☆

<<< < Предыдущая 12 / 52 3 4 5 > Следующая >>>

§ 2. Методы переменной метрики.

Зададим направление спуска в (1.1) по формуле:

=-D , (2.1)

где D - симметричная положительно определенная матрица (следовательно, представимая в виде D=G_kG_k′, где G_k - невырожденная матрица).

Рассмотрим сначала случай квадратичной функции

Q > 0, при (2.2)

Оценить скорость сходимости метода (2.1) для таких функций позволяет неравенство Л.В. Канторовича [8]:

, (2.3)

где A – положительно определенная симметричная матрица nxn с собственными значениями .

Справедливость данного неравенства (2.3) следует из свойств матрицы A и понятия выпуклого множества. В силу положительной определенности и симметричности A всегда ортогональная матрица B (B′=B^-1) такая, что

B′AB^-1= = C.

Обозначая =B , неравенство (2.3) при 0 можем представить в виде:

1≤ =( )( ) ≤ ,

где - квадрат отношения соответствующей координаты на норму вектора y, то есть:

≥ 0, i= ; . (2.4)

На плоскости рассмотрим n точек .

Все они расположены на одной ветви гиперболы . При этом для всех , удовлетворяющих (2.4), точка является выпуклой комбинацией точек и поэтому принадлежит выпуклому многоугольнику (рис.5).

Наибольшего r значения произведение будет достигаться в точке * касания гиперболы =r с многоугольником . Искомая точка . Причем, число является решением следующей задачи:

(2.5)

Упражнение 10. Решить задачу (2.5) и убедиться в справедливости неравенства (2.3)

Упражнение 11. Доказать, что если ≠0, то при выборе из одномерной минимизации (1.7) c для метода (1.1), (2.1) в случае квадратичной функции (2.2) будем иметь:

(2.6)

*Упражнение 12. Пусть - число обусловленности G_k′QG_k ( , где и - соответственно максимальное и минимальное значения матрицы),

где G_k′G_k= D_k.

Если определяется по формуле (2.6), то для квадратичной функции (2.2) на каждой итерации выполняется неравенство:

. (2.7)

Указание: Воспользоваться неравенством Л.В. Канторовича.

Если ≠ * для всех , то неравенство (2.7) можно представить в виде:

(2.8)

Обозначим правую часть неравенства (2.8) через l. Для положительно определенной симметричной матрицы G_k′QG_k l≤1. И если l<1 , то при достаточно больших последовательность { } можарируется геометрической прогрессией const∙q^k со знаменателем q (l,1). В этом случае последовательность { } будет сходиться не медленнее, чем геометрическая прогрессия со знаменателем l ( т.е. медленнее, чем линейно со знаменателем l).

Упражнение 13. Доказать, что последовательность { }, построенная по методу (1.1). (2.1) для квадратичной функции (2.2), сходится сверхлинейно (т.е. быстрее, чем любая геометрическая прогрессия со знаменателем q(0;1)) тогда и только тогда, когда сверхлинейно сходится последовательность { }.

Указание: Для выполнения упражнения 13 докажите, что если и - соответственно минимальное и максимальное собственные значения положительно определенной симметричной матрицы Q, то

, x Rⁿ. (2.9)

Из неравенства (2.7) (как и из (2.8)) следует, что для ускорения сходимости последовательности {f(x_k)} матрицы D_k = G_k′G_k не обходимо выбирать так, чтобы числа обусловленности матриц G_k′QG_k были близки к 1 (т.е. собственные значения каждой матрицы были близки между собой). И при D_k≈Q^-1 в силу (2.6) шаговый множитель, определяемый с помощью одномерной минимизации, будет близок к 1. В частности, выбирая D_k=Q^-1, получим G_k′QG_k= G_k′( G_k′G_k)^-1G_k= E и , , а l=0. Поэтому = – Q^-1 = *, и в данном случае для получения точки минимума * требуется всего одна итерация.

Для произвольной целевой функции из класса C² в окрестности точки локального минимума * будем иметь:

И так как =0, то

Поэтому, если для функции последовательность { } строится с помощью обобщенного градиентного метода (1.1), (1.7), (2.1) и сходится к точке невырожденного (матрица определена положительно) локального минимума *, то как и для квадратичной функции, выполняется неравенство:

, (2.10)

Где - число обусловленности матрицы G_k′ G_k, а G_k′G_k= D_k.

Соотношение (2.10), как и в случае квадратичной функции, свидетельствуют о том, что для быстро сходимости процесса (1.1), (2.1) матрицы D_k необходимо по возможности выбирать близкими к [ ]^-1 чтобы . Это относительно ко всем рассмотренным выше способам выбора шагового множителя .

Всякая симметричная положительно определенная матрица D_k^-1 задает скалярное произведение = D_k^-1 и связанную с ним метрику. Линейную часть разложения функции f(x) в окрестности точки x можно представить в виде:

= (D_k^-1D_k , ) = (D_k , )_k

Следовательно, вектор D_k можно рассматривать как градиент функции в точке в пространстве со скалярным произведением (∙ , ∙)_k, а метод (1.1), (2.1) – как градиентный метод в пространстве с переменной метрикой, определяемой матрицей D_k^-1 = [D( )]^-1. В частности, если в процессе перехода от одной точки к другой метрику не изменять, то во всем пространстве она будет определена постоянной положительно определенной симметричной матрицей D^-1, которую можно представить в виде:

D^-1 = (GG′)^-1

где G – невырожденная матрица размерности . В этом случае матрица G будет определять переход к новой системе координат, в которой алгоритм (1.1), (2.1) будет представлен как обычный градиентный метод (1.6) [9]. Действительно, имеем:

= D^-1 = (G^-1)′ G^-1 = (G^-1 , D^-1 ) = , где = D^-1 ,

то есть

= D , (2.11)

И осуществляя данное линейное преобразование, получим:

= G =g( ), g( ) = G = G′G G = G′ = G′ ,

= G^-1 = G^-1 - G^-1D = - G^-1 = - g( ).

Скорость сходимости процесса = - g( ) (или, что то же самое, процесса = - D ) будет определяться числами обусловленности матриц G_k′ G = g( ), где = G^-1 . Поэтому алгоритм будет эффективным, если D ≈ [ ]^-1, то есть g( ) ≈ G′(GG′)^-1G = E.

На рис.6 изображены линии уровня ( =const) в окрестности точки =0 локального невырожденного минимума “овражной” функции двух переменных.

Применение в этом случае обычного градиентного метода (1.6) будет неэффективно, так как векторы = всякий раз будут ортогональны линиям уровня (см.рис.1), что, вероятнее всего, приведет к колебаниям от одной стенки оврага к другой и медленному продвижению к точке минимума вдоль оси оврага l. В то же время удачное линейное преобразование координат =G (что равносильно выбору матриц D ≈ [ ]^-1) может существенно изменить характер линий уровня и тем самым ускорить сходимость процесса (рис.7).

Упражнение 14. Рассмотрим пример функции .

Сделайте несколько итераций из начальной точки = (2;2)′ по методу (1.6), (1.7) и с использованием (2.11). В соответствующих системах координат изобразите линии уровня и проделанные итерации.

В действительности, при поиске точки минимума функция , матрица неизвестна. Поэтому на практике обычно полагают D ≈ [ ]^-1 , что приводит к методу Ньютона.

<<< < Предыдущая 12 / 52 3 4 5 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
16.03.2016241.15 Кб39Мет.Зад.ч.2 Биг.Бел.doc
#
15.08.2019937.98 Кб84Мет.Зеленкин(Тгв).doc
#
15.08.201967.47 Кб4Мет.ук. Морозова С.В..docx
#
06.09.201994.21 Кб2Мет.указ.курс раб_ТУ_ГМУ2010.doc
#
28.08.2019183.3 Кб6метод ЛАБ № 1.doc
#
13.11.20191.13 Mб2Метод Ньютона.doc
#
28.04.2019107.01 Кб3метод рекоменд зар и русскФТКТ 2 озо.doc
#
04.11.2018102.4 Кб4метод рекоменд тексты ФТКТ 1с 2011.doc
#
25.08.20191.26 Mб0Метод рекомендации КР по БУ.doc
#
09.11.20195.16 Mб1метод руков к КР 2 курс.doc
#
11.11.2019860.67 Кб6Метод ТБУ (1 семестр).doc