
3. Метод Брауна
В отличие от пошаговой линеаризации векторной функции , приведшей к методу Ньютона (6), Брауном (1966 г.), предложено проводить на каждом итерационном шаге поочередную линеаризацию компонент вектор - функции , т.е. линеаризовать в системе (1) сначала функцию затем и т.д., и последовательно решать получаемые таким образом уравнения. Чтобы не затенять эту идею громоздкими выкладками и лишними индексами, рассмотрим вывод расчетных формул метода Брауна в двумерном случае.
Пусть требуется найти решение системы
, (17)
и
пусть уже получены приближения
,
.
Подменим первое уравнение системы (17) линейным, полученным по формуле Тейлора для функции двух переменных:
.
Отсюда
выражаем
(обозначим
этот результат через
):
. (18)
При
находим значение
переменной
:
,
которое
будем считать лишь промежуточным
приближением (т.е. не
),
поскольку оно
не учитывает второго уравнения системы
(17).
Подставив
в
вместо
переменную
,
придем к
некоторой функции
только одной переменной
.
Это позволяет
линеаризовать второе уравнение системы
(17) с помощью формулы Тейлора для функции
одной переменной:
. (19)
При
нахождении производной
нужно учесть,
что
есть сложная функция одной переменной
,
т.е. применить
формулу полной производной
.
Дифференцируя по равенство (18), получаем выражение
,
подстановка
которого в предыдущее равенство при
,
дает
.
При
известных значениях
и
теперь можно разрешить линейное уравнение
(19) относительно
(назовем
полученное значение
):
.
Заменяя в (18) переменную найденным значением приходим к значению :
.
Таким образом, реализация метода Брауна решения двумерных нелинейных систем вида (17) сводится к следующему.
При
выбранных начальных значениях
,
каждое последующее приближение по
методу
Брауна
находится при
с помощью совокупности формул
,
счет по которым должен выполнятся в той очередности, в которой они записаны.
Вычисления
в методе Брауна естественно заканчивать,
когда выполнится неравенство
с результатом
).
В ходе вычислений следует контролировать
немалость знаменателей расчетных
формул. Заметим, что функции
и
в этом методе
неравноправны, и перемена их ролями
может изменить ситуацию со сходимостью.
Указывая на наличие квадратичной сходимости метода Брауна, отмечают, что рассчитывать на его большую по сравнению с методом Ньютона эффективность в смысле вычислительных затрат можно лишь в случае, когда фигурирующие в нем частные производные заменяются разностными отношениями.
4. Метод секущих Бройдена
Чтобы приблизиться к пониманию идей, лежащих в основе предлагаемого вниманию метода рассмотрим одномерный случай
В процессе построения методов Ньютона и секущих решения нелинейного скалярного уравнения.
(20)
функция
в окрестности
текущей точки
подменяется
линейной функцией (аффинной
моделью)
(21)
Приравнивание к нулю последней, т.е. решение линейного уравнения
порождает итерационную формулу
(22)
для вычисления приближений к корню уравнения (20).
Если
потребовать, чтобы заменяющая функцию
вблизи точки
аффинная модель
имела в этой
точке одинаковую с ней производную, то,
дифференцируя (21), получаем значение
коэффициента
подстановка
которого в (22) приводит к известному
методу Ньютона. Если же исходить из
того, что наряду с равенством
должно иметь
место совпадение функций
и
в предшествующей
точке
т.е. из равенства
,
или, в соответствии с (21),
, (23)
то получаем коэффициент
,
превращающий (22) в известную формулу секущих.
Равенство (23), переписанное в виде
,
называют
соотношением
секущих в
.
Оно легко обобщается на
-мерный
случай и лежит в основе вывода метода
Бройдена. Опишем этот вывод.
В
-мерном
векторном пространстве
соотношение секущих представляется
равенством
, (24)
где
,
– известные
-мерные
векторы,
– данное нелинейное отображение, а
– некоторая
матрица линейного преобразования в
.
С обозначениями
,
, (25)
соотношение секущих в обретает более короткую запись:
. (24а)
Аналогично одномерному случаю, а именно, по аналогии с формулой (22), будем искать приближения к решению векторного уравнения (1а) по формуле
. (26)
Желая,
чтобы эта формула обобщала метод секущих,
обратимую
-матрицу
в ней нужно
подобрать так, чтобы она удовлетворяла
соотношению секущих (24).
Но это соотношение
не определяет однозначно матрицу
:
глядя на
равенство (24а), легко понять, что при
существует множество матриц
,
преобразующих
заданный
-мерный
вектор
в другой
заданный вектор
.
При формировании матрицы будем рассуждать следующим образом.
Переходя от имеющейся в точке аффинной модели функции
(27)
к такой же модели в точке
, (28)
мы
не имеем о матрице линейного преобразования
никаких
сведений, кроме соотношения секущих
(24). Поэтому исходим из того, что при этом
переходе изменения в модели должны быть
минимальными. Эти изменения характеризуют
разность
.
Вычтем из
равенства (28)
определяющее
равенство (27)
и преобразуем результат, привлекая
соотношение секущих (24). Имеем:
.
Представим
вектор
в виде линейной комбинации фиксированного
вектора
,
определенного
в (25), и некоторого вектора
,
ему ортогонального:
.
Подстановкой этого представления вектора в разность получаем другой ее вид
. (29)
Анализируя выражение (29), замечаем, что первое слагаемое в нем не может быть изменено, поскольку
– фиксированный вектор при фиксированном . Поэтому минимальному изменению аффинной модели будет отвечать случай, когда второе слагаемое в (29) будет нуль-вектором при всяких векторах , ортогональных векторам , т.е. следует находить из условия
. (30)
Непосредственной
проверкой убеждаемся, что условие (30)
будет выполнено, если матричную поправку
взять в виде
одноранговой
-матрицы
.
Таким образом, приходим к так называемой формуле пересчета С. Бройдена (1965 г.)
, (31)
которая
позволяет простыми вычислениями перейти
от старой матрицы
к новой
такой, чтобы
выполнялось соотношение секущих (24а) в
новой точке и при этом изменения в
аффинной модели (27) были минимальны
(строго доказано, что такое построение
отвечает минимальности поправки
по норме Фробениуса на множестве матриц
удовлетворяющих
соотношению секущих (24а)).
Совокупность формул (26), (31) вместе с обозначениями (25) называют методом секущих Бройдена или просто методом Бройдена решения систем нелинейных числовых уравнений.
Хотя
в методах секущих обычным является
задание двух начальных векторов
,
для метода Бройдена характерно другое
начало итерационного процесса. Здесь
нужно задать один начальный вектор
,
начальную матрицу
и далее в цикле по
последовательно выполнять следующие
операции:
решить линейную систему
(32)
относительно
вектора
(см. (26));
найти векторы
и
(см. (25)):
,
; (33)
сделать проверку на останов (например, с помощью проверки на малость величин
и/или
) и, если нужная точность не достигнута, вычислить новую матрицу по формуле (см. (31))
. (34)
В
качестве матрицы
,
требуемой равенством (32) для запуска
итерационного процесса Бройдена, чаще
всего берут матрицу Якоби
или какую-нибудь
ее аппроксимацию. При этом, как отмечается,
получаемые далее пересчетом (34) матрицы
,
,
... не всегда можно считать близкими к
соответствующим матрицам Якоби
,
,
... (что может
иногда сыграть полезную роль при
вырождении матриц
).
Но, в то же время, показывается, что при
определенных требованиях к матрицам
Якоби
матрицы
обладают «свойством ограниченного
ухудшения», означающим, что если и
происходит увеличение
с увеличением номера итерации
,
то достаточно
медленно. С помощью этого свойства
доказываются утверждения о линейной
сходимости
к
при достаточной близости
к
и
к
,
а в тех
предположениях, при которых можно
доказать квадратичную сходимость метода
Ньютона (6), –
о сверхлинейной
сходимости
последовательности приближений по
методу Бройдена.
Как и в случаях применения других методов решения нелинейных систем, проверка выполнимости каких-то условий сходимости итерационного процесса Бройдена весьма затруднительна и обычно заменяется проверками на выполнимость неравенств типа (16).
Формуле пересчета (34) в итерационном процессе Бройдена можно придать чуть более простой вид.
Так как, в силу (32) и (33),
,
а
,
то из формулы (34) получаем формально эквивалентную ей формулу пересчета
, (35)
которую можно использовать вместо (34) в совокупности с формулой (26) или с (32), (33) (без вычисления вектора ). Такое преобразование итерационного процесса Бройдена несколько сокращает объем вычислений (на одно матрично-векторное умножение на каждой итерации). Не следует, правда, забывать, что при замене формулы (34) формулой (35) может измениться ситуация с вычислительной устойчивостью метода; к счастью, это случается здесь крайне редко, а именно, в тех случаях, когда для получения решения с нужной точностью требуется много итераций по методу Бройдена, т.е. когда и применять его не стоит.