Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Численные методы Часть 1..pdf
Скачиваний:
11
Добавлен:
15.11.2022
Размер:
5.23 Mб
Скачать

2 . С И С Т Е М Ы Л И Н Е Й Н Ы Х

А Л Г Е Б Р А И Ч Е С К И Х У Р А В Н Е Н И Й

Система m линейных алгебраических уравнений представляется в виде

Ax = f,

 

(2.1)

где А - квадратная матрица ранга т ;

 

 

f,'

V

 

f2

х2

 

 

•- искомый вектор.

f= f, ►- правая часть системы уравнений;

х = - *3

 

хт

 

Система уравнений (2.1) имеет единственное решение, если определитель det(A) отличен от нуля. В развернутой (компонентной) записи эта система уравнений имеет вид

а ,,'* , + а 12-х2+ а1Я-х, + .. •+ a,m x„, = f,.

 

а2, х , + а22

х2 + а2Я•х3 + .

 

 

аэ>х. + а ,2-х2 + а „ •х ,+ . ••+ a )m'Xm= f>>

(2.2)

.а »Г*1 + а т 2

+ « „ > * » + ••• + а «ш

= L -

 

Прямые методы решения

Прямыми называют методы решения систем линейных алгебраических уравнений, для которых результат получается за конечное, заранее определенное, число арифметических операций. Наиболее популярным среди них является метод Гаусса1.

1 Гаусс Карл Фридрих [30.4.1777 23.2.1855]. С 1795 по 1798 юды учился в Геттингенском университете. В 1799 году получил доцентуру в Брауншвейге, а с 1807 года - кафедру математики и астрономии Геттингенского университета, а также должность директора Геттингенской астрономической обсерватории. С 1802 года являлся иностранным (с 1824 - иностранным почетным) членом Петербургской академии наук.

Метод Гаусса

Рассмотрим процедуру решения системы линейных алгебраических уравнений

методом Гаусса на следующем примере:

2х, +4х2 - 6 х3 = -8,

- 1х,

+4х2

+ 1х3 = 12,

2х,

+ 6х2

+0х3 = 14.

Главный определитель такой системы

 

 

2

4

-6

det(A) = 1

4

1 = 8 ,

2

6

О

что гарантирует единственность решения.

1 шаг. Первая строка системы уравнений делится на первый коэффициент:

1х, + 2х; - Зх3 = -4, 1х, +4х2 + 1х3 = 12, 2х, + 6х2 +0х3 = 14.

2 шаг. Первая строка вычитается из второго уравнения:

1х, +2х2 - З х3 = -4,

|Ох, + 2х2 + 4х3 = 16,

2х, +6х2 + 0х3 = 14.

3 шаг. Из третьего уравнения вычитается первая строка, умноженная на 2: 1х, + 2х2 - З х3 = -4,

-Ох, +2х2 +4х3 = 16,

Ох, +2х2 +6х3 = 22.

4 шаг. Второе уравнение делится на 2:

1х, +2х2 - З х3 = -4,

|Ох, +1х2 +2х3 = 8,

Ох, +2х: +6х, =22.

5 шаг. Из третьего уравнения вычитается второе ypaBHeHnet ум^оженное на 2:

lx, + 2x, - Эх, = -4. Ox, + lx2 + 2x3 =8, Ox, + 0x2 + 2x3 = 6.

6 шаг. Определяются искомые величины:

 

 

 

jlx ,+2х: -Зх, = -4,

fix, +2х2 - З х3 = -4,

Гх, = - 4 - 2х; + Зх, = 1.

<;

Ох, + 1х: + 2х, = 8,

\

х2 = 8 -

2 х 3 = 2,

\

х2 = 8 -2 х ,

=2.

[

х, = 3.

[

х3

= 3.

[

х, = 3.

 

Таким образом, получено решение исходной системы уравнений.

Теперь рассмотрим процедуру получения решения методом Гаусса в более общем

случае. Пусть а,, * 0 . Тогда первое уравнение системы (2.2) можно поделить на этот

коэффициент:

,

Г,

1 х | +С|2 х: +с,)

х ,+ ...+ с 1т-х „= у 1=-±-.

 

а п

С помощью этого уравнения можно преобразовать систему уравнений (2.2) к виду

1-х, + с,2*х2 + с,3-х3 + ... + С1г, Хп, =У,.

 

 

0-х,

+ а(22

х2 + а(23 -х3 +. •• + а,г1т Х т = ^ " = 1 ' : - а :|-Ур

Ох,

+ а 32

х: + а з'з -х, + .. • + а\ т Х „ =fl"

= f , - a )

1 y,.

Ох,

+ а'Л'2 -х: + а ^ - х ,

+ - +

a,: m-xm= c = f m--

у,

Здесь обозначено

= ч - а (|

с,г

i,j = 2,m. В

полученной системе можно

выделить подсистему (т-1) линейных уравнений с (т-1) неизвестными величинами:

a : i

у ; - х з + ..,. + а ' п

а й

• X . + ..

 

а -

х ; + аЦ\ х ; + .

X Е

• х т

Г‘_и и

= f mn

Пусть теперь а1,1! * 0. Поделим второе уравнение системы на этот коэффициенi:

 

f*'* f, - а,, у.

O x , + I - X , +C . J- X, + . . .

Xm = y , = Чтг = ^ — f;-------.

Зм

а ■*>

Г1

с, 2

с,э

с.«

0

1

с2з

С2т

и = 0

0

1

С3т

0

0

0

1

“верхняя” треугольная матрица1, у которой равны нулю все элементы, расположенные под главной диагональю. Процедура получения такой матрицы носит название ‘"прямого хода” метода Гаусса. Очевидным условием для успешною

выполнения “прямого хода” является

а**"0 * 0, j = l,m .

“Обратный ход” метода позволяет определить искомые величины:

’*«=У«-

 

^т-1 —Ут-1

"~^т-1т*т*

, ^т-2 —Ут-1 ” ^т-2т^т —^т-2т-1*т-1»

т

 

= у . - Е с1Л -

к*2

Таким образом, “прямой ход” метода Гаусса можно

трактовать как

преобразование системы уравнений вида Ах = f в эквивалентную

систему Ux = у,

причем

 

 

 

 

V - - L

V - f "‘ -

f» ~ a»y.

У," а „ ’

У,'а « Г

ай

Последнюю систему соотношений с учетом вышеприведенных выкладок можно

представить в иной форме

 

 

 

fi = а ,|У ,+ 0 у ,

+ 0 у , + ... + 0 у я ,

 

= а2|

У, + а<22 2 +0-У, + ...+ 0 у т ,

f,

= а „

у, +а','’

у, + а'Д>

у, + ... + 0 ут .

L

=а_

. • У! + ат 2 2 + a 'i) -у, + ... + а'";" • у„

1Обозначение матрицы U принято по первой букве английского слова upper - “верхний”.

и записать в виде Ly = f ,

где

L - нижняя треугольная матрица1с отличными от нуля

коэффициентами а*/"0 * 0,

j = 1,ш на главной диагонали.

Все вышесказанное позволяет

трактовать метод Гаусса как последовательное

решение двух систем уравнений:

Ly

= f и Ux = у .

Объединяя эти соотношения, получаем

LUx = f.

Сравнивая последнюю формулу с записью уравнения (2.1), можно сделать заключение, что процедура метода Гаусса эквивалентна разложению исходной

матрицы коэффициентов в произведение двух матриц специального вида:

L

нижняя треугольная матрица с ненулевыми коэффициентами на главной

диагонали;

 

 

 

U - верхняя треугольная матрица с единицами на главной диагонали.

Обозначим угловые миноры матрицы А символами Aj}

j = l,m :

A,

—a 11»

 

 

A:

а,,

а .2

 

 

321

а22

 

 

 

 

 

 

 

 

а п

 

Аз

 

а 22

а 2Э

 

 

 

3 32

а зз

 

Am= det(A).

 

 

Теорема

2.1.

Пусть все угловые миноры матрицы

А отличны от нуля.

А} * 0,

j = 1,ш . Тогда матрицу А можно представить единственным образом в виде

 

 

 

А = LU,

(2.3)

где L

нижняя треугольная матрица с ненулевыми диагональными элементами, U

верхняя треугольная матрица с единицами на главной диагонали. Доказательство теоремы проводится по индукции.

1Обозначение матрицы L принято по первой букве английского слова lower - “нижний”.

Рассмотрим разложение матрицы для простейшего случая т=2. Пусть в этом случае матрицы имеют вид

А,

’ а п

а 1 2 _

 

X ,

0 “

 

1

U . 2 _

 

 

,

Ь 2 =

 

,

и 2 =

 

 

_ а 2 .

а 2 2 .

 

^ ■ 2 1

^ 2 2

 

0

1

Предполагая разложимость для т=2, получаем систему уравнений относительно коэффициентов матриц L2 и U2 :

А, = L, • U2 =

О

м,а]

Г*..

 

*-1|“.2

 

 

^21 ^22_ о ij

[ к ,

^2lU12+*-22_

 

i 12 = а12; ,Х21- а2);

 

<< +

СО II

 

 

 

>-2.“l2

 

Решение этой системы уравнений дает значения коэффициентов:

Хп = а,, = А, ^ 0; Х21= а 21;

.

а1212

_ апаП “ 22„ - ав 2 1 а 12 _ А 2 ^ Q

^22 “ а22

а 21 а

Это означает, что возможность разложения (2.3), соответствующего условию теоремы, показана для простейшего случая т=2. Теперь предположим, что условия теоремы выполнены для случая (т-1), то есть имеет место разложение Am, = Lm_,Um,. Вводя обозначения

* (a m-l) (а т1 а го2 а т 3

a mn»-l)'

Ulu

U2n

* (^*т-|) (^“ml ^т2 ^inl

представим матрицы Am, Lm, Um в форме

Ащ-I {^m-l}

 

 

L n.

{0}

U n = <°)

1 J'

(®ml) ®mm

L

= {^ml)

^mm .

Здесь принято, что

 

 

 

 

 

 

 

О,

 

 

 

 

 

 

0:

,

<0) - (о,

0, 0,

0„_,).

 

м =

0,

 

 

.0-1

 

 

 

 

Покажем существование разложения для матрицы

Ат . Перемножая

Lm• Umи

сравнивая результат

со структурой матрицы

А т,

получаем

систему

(2m-1)

алгебраических уравнений относительно (2 т -1) неизвестного {um_,},

(Xm_,),

Xmm

^m-l ‘ {^m-1 }

 

 

 

 

 

(^m-l

~^mm *

 

 

 

 

В силу того, что

det(Lm_,) * 0, det(Um_,) * 0

(треугольные матрицы с ненулевыми

значениями на главных диагоналях), существуют единственные решения первых двух

систем уравнений: {um_,} = L^., • {am_,},

(Xm_,) = (a ^ ^ U ;1., . И, кроме того, может

быть вычислено последнее неизвестное

A.mm = атш -(Х т_,)*{ит_,}, значение которого

должно быть отлично от нуля. Для того, чтобы убедиться в этом, произведем следующие выкладки:

det(A) = d et(A J = det(LmU m) = d et(L J d et(U J = Хшт d e t ^ J

d e tO J ^ ).

В силу того, что det(A)*0,

det(Lm_,) *0,

det(Um4) = l,

имеет

место

равенство

det(A) =Xmmdet(Lm,), из которого

сразу следует,

что Xmm* 0 .

При выполнении

последних преобразований вновь учтено,

что

матрицы

Lm, Um

являются

диагональными, а их определители представлены разложениями соответственно по последнему столбцу и нижней строке.

Покажем единственность разложения (2.3). Предположим, что такое разложение возможно не единственным образом, то есть

А = LmU(1) = L(2)U(2).

Проводя простейшие преобразования, получаем

Цп _ L(2)U(2)U(1) «

I -• I

= IT TJ-1

*-(2)^(1)

и (2)и (1) •

Можно заметить, что поскольку исходные и обратные матрицы сохраняют свою “треугольную” форму, в левой части последнего выражения расположена нижняя

треугольная матрица, а в правой части - верхняя треугольная. Но равенство в этом

случае возможно лишь

тогда,

 

когда

матрицы

Ц^Ь(1)

и U(2)U(",,)

являются

диагональными. Более того, поскольку

U(2) и

содержат единицы на главной

диагонали, полученные

диагональные

матрицы

будут

единичными,

то есть

L;5,L(1) =U (2)U(",,) = Е. А отсюда следует,

что L(l) = Ц 2), U(I)=U (2), но это

и означает

единственность разложения (2.3).

 

 

 

 

 

 

 

Рассмотрим матрицу коэффициентов системы линейных алгебраических

уравнений следующего вида:

 

 

 

 

 

 

 

 

1

1

О

 

 

 

 

 

 

А = 1

1

1

 

det(A) = - l * 0 .

 

 

 

О

1

1

 

 

 

 

 

Первый шаг метода Гаусса приводит матрицу к виду

1 1 О"

А = О 0 1

О1 1

Нулевое значение на главной диагонали матрицы вызывает аварийную остановку вычислительного процесса. Нетрудно убедиться, что для исходной матрицы А один из

угловых миноров = 0, то есть имеется противоречие условиям теоремы 2.1. Для

успешного выполнения процедуры метода Гаусса следует поменять местами строки матрицы А (смена столбцов приведет к необходимости изменить порядок неизвестных), например:

1 1 О'

А* = 0 1 1

1 1 1

Приведение исходной матрицы к новому виду можно интерпретировать как некоторое преобразование вида А* = Р-А. Для рассматриваемого случая

1 0 0

Р = 0 0 1

0 1 0

Теорема 2.2. Если определитель матрицы коэффициентов det(A)*0, то существует матрица перестановок Р такая, что у матрицы А* = Р А все угловые миноры отличны от нуля.

Доказательство теоремы проводится по индукции.

Рассмотрим простейший случай - систему двух уравнений:

Если а,, *0, теорема справедлива при Р = Е , то есть в случае тождественного

преобразования.

 

 

 

 

 

 

 

Пусть

теперь а ,,= 0 . Поскольку

det(A) = а,,а22- а 12а21 = - а |2а21 * 0 , то

а2| *0

Преобразуем исходную матрицу к виду

 

 

 

 

 

 

 

 

а ; = р а 2 =

р=

0

1

 

 

 

 

 

1

о

*

 

 

 

 

 

 

 

 

 

Теперь

А, = а 2 |*0, А2= а21а12- а иа22 * 0 , то

есть

при

ш

2

теорема

справедлива.

 

 

 

 

 

 

 

Пусть утверждение теоремы также верно и для

Ат_,. Рассмотрим

матрицу Ат

(обозначения введены ранее):

 

 

 

 

 

 

 

Ат-|

А,

(^т-1) **тт

1.Рассмотрим случай det(Am_,) * 0 . Сформируем матрицу преобразования

Г?.-, («У

"(о)

м построим новую матрицу

A l = РтА_

^т-1Ащ-i Рт-|{ат-|}

(а т-|)

а т т

 

В силу сделанного предположения все угловые миноры матрицы Pm_,Am., отличны от нуля: последний угловой минор Am= det(Am) = det(A) *0 также отличен от нуля. В

рассмотренном частном случае теорема доказана. 2. Пусть теперь det(Aml) = 0.

Представим разложение определителя матрицы А в виде разложения по последнему столбцу:

det(A) = d et(A J = ±a,mdet(A ^,)±aJm det(A(m!’,)± ...± a mm det(A'ml,) .

В силу det(A)*0, существует хотя бы один det(A(J^,) * 0 . Поменяем местами

строки матрица А с номерами ш и k (m * k в силу принятого условия det(Am.,) = 0). В результате получаем преобразованную матрицу А^ = РтАга, у которой угловой минор

Д;., = det(А о т л и ч е н от нуля. Теперь, в соответствии

с доказательством

случая 1,

уже все угловые миноры матрицы А*т отличны от нуля.

 

 

 

Следствие. Если det(A)*0, то существует матрица перестановок Р

такая, что

справедливо разложение

 

 

 

 

РА = LU,

 

 

 

где L

нижняя треугольная матрица с ненулевами

коэффициентами

на

главной

диагонали: U - верхняя треугольная матрица с единицами на главной диагонали.

Определение числа операций алгоритма метода Гаусса

Подсчитаем число операций умножения и деления (наиболее длительные операции

при вычислениях на ЭВМ),

необходимое для реализации алгоритма метода Гаусса.

1.

Вычисление

коэффициентов

с , i = l,m, j = i + l,m

(сумма членов

арифметической прогрессии):

 

 

2.

Вычисление коэффициентов а‘,*\ k = 2,m, i = k,m, j = k,m (сумма слагаемы

арифметической прогрессии 2-го порядка [6]):

(m - l)-(m - l) + (ro-2)-(m -2) + ... + l-l = I+ 21 + ...+ ( т - 1 )2 = т '(т ~ 1) ( 2 т ~ 0

 

 

 

 

 

6

3. Вычисление значений f,‘k),

k = 2,m,

i = k,m

,

/

-.ч

,

m -(m -l)

(ш —1)+ (m —2) + ... +1

= — ^

4. Вычисление значений у,. i = l.m производится m раз.

5. Вычисление х(, i = l,m при “обратном ходе” метода Гаусса:

, _ . , гп• (m 1) 1+ 2+ ... + (т -1) = — *----- ' .

Общее количество операций умножения и деления определяется суммой всех определенных выше выражений:

 

_

,

m (m -l) ,

m (m -l) (2m -l)

m / _ 2 .

Л

 

ш + 3

------ ------+ -----------

------------= j

+Зш -1).

Иными словами,

количество

операций умножения

и

деления приблизительно

пропорционально

ПТз

 

 

 

 

 

^

 

. что и определяет затраты на выполнение метода Гаусса.

Вычисление определителя матрицы

Вычитание строк в методе Гаусса (образование линейных комбинаций уравнений) не изменяет значения определителя матрицы [7]. Знак определителя может измениться лишь при использовании процедуры выбора “главного” элемента, когда производится перестановка строк (столбцов) преобразуемой матрицы. В результате выполнения всех необходимых преобразований метода Гаусса определитель исходной матрицы может быть вычислен достаточно просто:

det(A) = det(LU) = det(L) det(U) = det(L) = П a ,j,■', j=>

Здесь учтено, что L и U треугольные матрицы и, кроме того, матрица U содержит только единицы на главной диагонали.

Таким образом, сохраняя значения коэффициентов, расположенных после преобразования уравнений (до операции деления коэффициентов строки на первый ненулевой элемент) на главной диагонали, можно вычислить определитель исходной матрицы.

Построение обратной матрицы

Пусть a pq, p,q = l,m коэффициенты обратной матрицы А"1 Согласно определению

1 > и “ к1=8„, 6 = { U = j

символ Кронекера1.

к=1

 

 

Теперь q-й столбец

обратной матрицы можно рассматривать как результат

решения системы линейных алгебраических уравнений вида

 

а ИЧ)

А »'

 

а 2(Ч)

 

 

. = •

 

ttp(q)

 

Ат>.

Таким образом, для нахождения обратной матрицы необходимо решить m систем линейных алгебраических уравнений с правыми частями, определенными специальным образом. При этом матрицу коэффициентов следует преобразовать лишь один раз, но одновременно преобразовывать m правых частей всех систем уравнений.

1Кронекер Леопольд [7.12.1823 - 29.12.1891] - немецкий математик. С 1861 года - член Берлинской академии наук; с 1872 года стал члеаом-корреспондентом Петербургской академии наук. В 1883 году занял должность профессора Берлинского университета.

Метод квадратного корня

Метод квадратного корня предназначен для решения систем линейных

алгебраических уравнений

вида

Ах =

f

с симметричной

матрицей

коэффициентов

„ = а„, i,j= 1,ш

 

 

 

 

 

 

 

 

 

 

 

 

Метод основан на разложении матрицы коэффициентов А в произведение

 

 

 

 

 

 

А = ST • D • S .

 

 

 

(2.4)

где S

верхняя треугольная

матрица с

положительными

значениями на

главной

диагонали;

D - диагональная матрица со значениями +1 или -1.

 

 

Согласно теореме 2.1

при неравенстве нулю всех угловых миноров матрицу Л

можно разложить в произведение А = LU.

 

 

 

 

 

 

 

Представим нижнюю треугольную матрицу L

с ненулевыми коэффициентами на

главной диагонали в виде произведения

N K ,

где

N - нижняя треугольная матрица с

единицами на главной диагонали, К - диагональная матрица, причем kn = Хм,

i = l,m :

'*п

0

0

0

 

"1

0

 

0

0'

 

0

0

0

* 2 .

>■2»

0

0

 

П2,

1

 

0

0

0

 

0

0

L = К

 

*22

0

=

 

 

 

1

0

0

0

* 3 3

0

Хт1

K z

К г

Кш

 

Пт ,

Пт2

П т З

1

0

0

0

Jt„BJ

После перемножения

матриц

N

и

К

получаем систему линейных уравнений

относительно величин n4j,

i = 2,m,

j = l,m -l:

 

 

 

 

 

 

 

 

 

= п 21Х п ;

 

 

 

 

 

 

 

 

 

 

Х 3 | = П 3 1 * 1 Р

* 3 2 - П 3 2 * 2 2 ’

 

 

 

 

 

 

 

*•4,

= П 4 1 * 1 Р

* 4 2

= П 4 2 * 2 2 ’

* 4 3 — П 4 3 * 3 3 *

 

 

Очевидно, что п2) = ^ - ,

п31 = —

,

п „

= —

,

 

 

 

 

 

 

*п

 

*п

 

 

*22

 

 

 

 

С учетом этого коэффициенты n(j, kSj матриц N и К можно представить в общем виде

к

j< i

 

к '

 

1,

j = *

 

0,

j> i

 

 

j= i

 

1«-

j* i

 

Теперь матрицу А можно представить разложением

 

А = NKU.

(2.5)

Благодаря симметрии матрицы А имеет место равенство Ат = А , что позволяет произвести следующие преобразования:

UTKTNT = N K U ,

UTKT = N K U (N t )''

N"'UTK T = KU(NT) '‘

IC- W K 1 = U (N t )~'

В силу того, что К '.К 1 являются диагональными матрицами, N4 , и 1 - нижние

треугольные, U,(NT)

верхние

треугольные,

в левой части

последнего равенства

находится нижняя треугольная

матрица, а в

правой части

верхняя треугольная.

Равенство возможно лишь при условии, что и в левой, и в правой частях этого тождества расположены диагональные матрицы.

Матрицы (N r) ' и U имеют единицы на главной диагонали; следовательно, их произведение также содержит единичную главную диагональ, то есть

U (N t ) '‘ = E , U = N T

Отсюда следует, что соотношение (2.5) можно переписать в виде

А = NKNT

Далее представим матрицу К в виде

где

|к Г =

 

K = |K T -D -|K f >

'

о

о

 

О

[г«Г ^

о

О

о

и

О О О

-------------------1

 

о

о

о

 

J x „ | .

 

sign(X,„)

 

о

0

0

 

0

sign(A.22)

0

0

D =

0

 

0

sign(X33)

0

 

0

 

0

0

sign(X,

Сравнивая

теперь

соотношение

A = | N |K|1/2J*D ||K|,/2 N

с формулой (2.4),

получаем для

матрицы

S выражение

S = |K|I/2-Nt , то есть

верхнюю треугольную

матрицу с положительными элементами на главной диагонали. Таким образом, конструктивно показано разложение (2.4).

Обозначим

y = Sx,

z=D Sx, тогда алгоритм

метода

квадратного

корн*

S1 (D [Sx]) = Г можно рассматривать как последовательность трех процессов:

 

1) S*z = f

то есть

вычисления решения z

системы

уравнений с

нижней

треугольной матрицей:

 

 

 

 

2)Dy = z , вычисления решения системы уравнений с диагональной матрицей;

3)Sx = у определения из системы уравнений с верхней треугольной матрицей искомого решения.

Построим разложение вида (2.4) для симметричной матрицы третьего ранга:

а11

а12

ai3

 

SN

Sl2

SI3

 

dii

0

0

"

a:i

a::

2J

, S =

0

S22

S2^

. D =

0

d22

0

 

a3i

 

азз

 

0

0

s33

0

0

d33_

ч .

0

o ’ 4 ,

0

0 ' 4 .

S.2

* . з '

ST D S = S l 2

S22

0

0

d 22

0

 

0

S 22

«23

_S .3

S 23

S 33

0

0

d 33_

0

0

S33

 

 

 

 

s lld ll

 

0

 

0

4 .

S,2

 

» . з “

 

 

 

 

 

 

 

= Sn d ll

S j 2d 2 2

 

0

0

S22

 

S 23

 

s l J d ll

S 2 ^ d 22

S33d 33_

0

0

 

S33_

 

SUd ll S| | S| 2d l 1 s „ s , 4d M

s n s i : d M

s i l s IJd

ll

S?jd i . + S b d 2j

Sl2Sl3d ll + S !3S 2 )d 12

Si : Sl3d M + S 32S : J d 2I

S?id ll + * » < * »

+ S 5 l d »

Положим dM=sign(aM), тогда из уравнения aM=sf,du получим sM= ^|ам| .

Далее, из уравнения а,2 = S||S(2d|, следует, что

В силу условия det(A)*0 и теоремы 2.2 можно ожидать, что а,, *0 . Аналогично можно вычислить

а —с с н

с -

°13

-

°13

“ 13 “ а 1Г 1Э и И*

а 13 “

,

С Г *

 

 

d , , s "

 

d l l ^ l a lll

a:j =sfjdn +s22d22,

sjjdjj =a,2-s,J,dn .

Полагая d,, = sign(a22 - s ’jd,,), получим

.

_ L

]

_

I a na n

—a i:

*0

 

 

 

r

a

=i l r ^ S r

- в силу упомянутого условия det(A) * 0.

а 23 S l2Sl3d ll

^IJ S

Ski^kkSk)

__

------ и

- --------- .

i < j = 2,m

Определение числа операций алгоритма метода квадратного корня

Подсчитаем число операций умножения и деления, необходимых для реализации

алгоритма метода квадратного корня.

1. Факторизация исходной матрицы, то есть вычисление матриц S и D:

m -(m -l)

 

m-(m2 -1)

2

+

6

*

2. Выполнение “обратного” хода:

 

 

 

m (т -1 ) .

,

------------+ т

3.Вычисление т раз значений квадратных корней.

 

 

-

m (m J + 9m + 2)

 

_

m3

Общее количество операции равно — ----------------, или приблизительно — , что

 

 

 

 

 

6

 

 

 

6

практически в два раза меньше, чем число операций в алгоритме метода Гаусса.

Пример 2.1. Рассмотрим решение системы двух линейных алгебраических

уравнений методом квадратного корня:

 

 

 

 

 

[0.780х + 0,717у = 0.063;

 

 

 

 

 

 

 

<

 

 

 

 

 

 

 

 

 

10.717х + 0.659у = 0,058:

 

 

 

 

 

 

 

s „ = J i[ 7 = 0.883176087;

dn = l;

s, 2

= 0.811842633;

 

 

 

 

 

 

«.А .

 

 

 

 

,, = ^|а,, -s ;,d n| = 0.00940537;

d ,,= - l:

 

 

 

 

0.883176087

0

 

 

0,063)

fz,|

[0,071333453)

 

1. STz = f,

 

 

 

 

 

0.058)

{z,[

{o,009405444|

 

0.811842633

0.00940537

z,

 

1

0

y' U 4

yiU

z ,

|0.071333453|

 

2. Dy = z.

-1

,

 

 

 

0

у, J

[z,j

[y,j

[-z .j

[-0,00940958)

 

либо определение [9]:

Пусть f -

“возмущенная” правая часть системы уравнений. Оценим изменение

решения бх = х - х как следствие изменения правой части

5f = 7 -

f .

 

Система

уравнений Ax=f называется устойчивой по

правой

части, если

V f,f ||бх|| < ||6f|| М, М > 0 - положительная константа.

 

 

 

Это, в частности, означает, что ||бх||->0 при

J6f|| —> 0, то

есть имеется

непрерывная зависимость решения от правой части.

 

 

 

Пусть определитель матрицы А отличен от нуля. В этом случае существует обратная матрица А-1. В силу линейности системы алгебраических уравнений имеем:

Абх = А(х - х) = Ах - Ах = f - f = 6f, 5х = A~‘6f,

И = | А - Ч Ф 1 « .

отсюда следует

(2.7)

и роль константы М может выполнять ||а -,||. Чем ближе значение det(A) к нулю, тем больше величина ||а _||, тем значительнее отклонение бх при возмущении 6 f.

Из уравнения Ах = f следует оценка

И = м * М - Н -

Перемножая два последних неравенства, получаем

М М ^ Ц а - Ц М И Н .

и

Ф 1 | - М ^ = Мл

и

н

 

И ’

где Мд = ||А"‘|| |(а || - число обусловленности матрицы А, характеризующее зависимость относительной погрешности решения системы уравнений от относительного “возмущения” правой части. Очевидно, что

1= INI= ||а •А '11 <;||а Ц■||а _‘1 = м * •

Пример 2.2. Рассмотрим систему уравнений Г0,780х + 0.563у = 0,217, [о,913х + 0,659у = 0,254.

Определитель этой системы уравнений Л = 0,780 - 0,659 - 0,563 • 0,913 = 0,000001 = 10 отличен от 0, хотя и мал. Матрица коэффициентов представляется в виде

0,780 0,563

А =

0,913 0,659 Вычисление обратной матрицы приводит к значению

659000 -563000

А"1

-913000 780000

Нетрудно убедиться, что определитель обратной матрицы принимает значение А = 659000-780000-563000-913000= 1000000= 106.

При использовании для вычисления нормы матрицы выражения

I m -1

M = J z 2 X

V•=* и

получаем для рассматриваемого случая:

||А|| = 1,480952059, |а.-' || = 1480952,059.

Теперь можно оценить число обусловленности матрицы А, то есть показатель устойчивости решения при возмущении правой части системы уравнений:

МА=2193219.

Рассмотрим случай одновременного возмущения и правой части 6f, и матрицы коэффициентов 5А:

Ах = 7, А = А +5А .

Для получения полной оценки погрешности решения системы алгебраических уравнений необходимо рассмотреть вспомогательное утверждение:

Лемма 2.1. Пусть С - квадратная матрица, ||С||<1; Е - единичная матрица. Тогда существует (Е + С) ', причем

Доказательство

Для любого х имеет место неравенство

||(Е+ С)х|| =IIх+CxflS||х|| - ||Сх|| 5 ||х||- ||С||||х|| =(l - SC|j)(|xJ =б|х|

(2.8)

где 6 = 1- ||С|| > 0 - по условию леммы.

Рассмотрим однородное уравнение (Е + С)х = 0. Из неравенства (2.8) следует

КЕ + с)4 = | о И Н -

что возможно лишь при ||х|| = 0, откуда следует, что х = 0 . Иными словами, однородное уравнение (Е + С)х = 0 имеет только тривиальное решение. Но это означает, что определитель det(E + С) не равен нулю, то есть существует обратная матрица (Е + С) 1

Теперь рассмотрим уравнение

(Е + С)х = у,

имеющее решением х = (Е + С) ' у • С помощью выражения (2.8) получаем

||(Е+С)х| йб||х|| =5|(Е+С)*'у| -

Е + С) = sup

^ SUpу IM

 

Е + С)-

И |у|,0

№»(1- № Г " и О - М ) " > - М

что и требовалось доказать.

Теорема 2.3. Пусть матрица А имеет обратную и выполнено условие

Тогда матрица А = А + 5А имеет обратную и справедлива оценка погрешности

н

<

М А

( М

, МП

 

 

н

 

M

L I H

+ iiriiJ-

 

 

 

АМ

 

 

 

 

Доказательство

 

 

 

 

 

 

А = А +5А = а (е + А ''6а ) = А(Е + С),

С = Д 'бА .

Оценим норму матрицы С с использованием условия теоремы

||С|| = ||А-,бА)|.||А-,||.|И < |1 А- ' | | р

|

= 1.

В силу того, что матрица С удовлетворяет условию леммы 2.1, существуй

матрица (Е + С) 1 Поскольку

 

 

 

 

 

 

 

A-' =(A (E + C ) ) ' = (E + C )‘V

'

то А ' существует в силу существования матриц А"1 и (Е + С )'1

Теперь определим отклонение возмущенного решения от исходНОГо:

бх = х - х = А '1? - A"'f = А -1? - A 'f + A*‘f - A " ‘f = А"'(? ^ f) + (A"‘ -A ~')f

Учитывая, что 7 - f = 6f,

f = А х, получаем

6x = A '5f + (А-' -A

l)Ax = A l6f + (A lA - A - |A)x = A '^ f + (A-1A -E )x .

откуда можно оценить норму

Цбх1 = Цл-'бг (X -А - Е)х| ^ |А-1 • |5fl|+||А-А - Е| - И .

Оценим порознь слагаемые в правой части этого неравенства:

| * - Н м - Л - 1 Ф * С ) ||А

|А-'А - е | = ||(А+ 6а )*'а - е| = | а (е + А-'бА))" а - е| = |(а (е + с))" а - е| =

=1е +с)"а "а - е11=|(е +с) " - е1=1е +с)"(е -(е +с) |= Н е +с)"с1^

< 1 Е I сУ'Д ДС|И

 

^ SAI ^ ^

- I С) I |С|- 1-М " 1-|А-аА|- 1-JA-|.|RA|*

Подставим Полученные оценки в исходную формулу:

w ■ i-| i^fl5^AjM +

=

+||бА|'^ '

Учитывая, что

 

 

М Н М ^ М ^ ^ Н - Н .

ы-

И fN|Hiу M5/J J ]

KIN ГМ,Mtj

м -

1 - ||А - ||.|м 1 ИИ H ™ J

1_|A-|.w ^ l II г и

Вспоминая, что МА = ||А',||-||А||, получаем доказываемое утверждение теоремы

 

Представим матрицу коэффициентов А в виде суммы

A = A ,+ D + A ; , где

[A,]

= a IJf

i> j

нижняя

треугольная

матрица

с

нулевой

диагональю:

[А2]

= a 1Jf

i< j

верхняя

треугольная

матрица

с

нулевой

диагональю:

[D ](J = a(J,

i = j

- диагональная матрица. Теперь систему уравнений Ах = Г можно

представить в виде:

 

 

 

 

 

 

 

 

Ах = (А, + D + А,)х = f.

 

 

 

 

 

 

Dx = f -(А , + A^)x,

 

 

 

и метод Якоби будет выглядеть следующим образом:

 

 

 

 

 

 

Dx(n+I) = f —(А, + А 2)х(п).

 

 

 

 

Учитывая, что А, +А 2 = А - D , последнее выражение можно также представить в

форме

 

 

 

 

 

 

 

 

 

 

D(x1,wl) - x ln)) + Ax(n) = f

 

 

( 2. 10)

Рис. 2.1. Схема выполнения метода Якоби

Преобразуем выражение (2.9) к виду

i = l,m

(2. 11)

где п - также номер итерации. В отличие от метода Якоби, теперь для вычисления очередной неизвестной используются найденные на этой же итерации значения всех предыдущих величин. Как и ранее, вычислительный процесс заканчивается, когда выполняется условие:

шах|х( п>,) - х (п,|< е ,

Isjsm I J

J I

6>0 - заданная точность вычисления результата.

Пример 2.4. Рассмотрим систему алгебраических уравнений, указанную в предыдущем примере:

[4х + 2у = 5, [Зх + 5у = 9.

Представим полученные выражения в виде итерационной схемы

S_9v,n' xt«i. = L _ d !_

4

(n+D

;5

Это означает, что для нахождения величины у на (п+1) итерации используется значение х. только что вычисленное на этой же итерации. В качестве начального приближения также примем х(0) =0, yl0) =0. Результаты расчетов сведены в табл. 2.2. На рис. 2.2 графически показан ход выполнения итерационной процедуры Зейделя.

Как и в предыдущем случае, представим матрицу коэффициентов А в виде суммы А = А, + D + A. с теми же обозначениями. Метод Зейделя можно представить в форме

(А, + D)x(n+,) = f - A 2x(n)

 

Учитывая, как и ранее, что A2= A - A ,- D , последнее

выражение можно

записать в виде итерационной схемы

 

(А, + D )(x(n+,) - x(n)) + Ax(n) = f .

(2.12)

1Зейдель Филипп Людвиг [24.10.1821 - 13.8.1896] - немецкий астроном и математик. С 1851 стал

членом Баварской академии наук; с 1854 - членом Геттингенской академии наук.

Таблица 2.

Результаты выполнения итерационной процедуры метода Зейделя

п

х<">

уОО

0

1,25

0

1

1,05

2

0,725

1,365

3

0,5675

1,4595

4

0,5203

1,4879

5

0,5061

1,4964

6

0,5018

1,4989

7

0,5005

1,4997

 

 

Рис. 2.2. Схема выполнения метода Зейдеяя

Сходимость итерационных методов

Сравнивая формулы (2.10) метода Якоби и (2.12) метода Зейделя, можно заметить,

что если методы сходятся, то есть в некотором смысле (х(п+1) - х(п)) 0, п -» х , то они

сходятся к решению исходных задач Ax(n) = f, п оо.

Пример 2.5. Рассмотрим еще одну систему алгебраических уравнений, несколько

отличающуюся от приведенных в предыдущих примерах:

( 4х + 2у = 5,

}-20х + 5у = -2,5.

Точное решение этой системы х = 0,5,

у = 1,5 .

Для решения воспользуемся методом Зейделя. Как и ранее, представим уравнения

в виде итерационной схемы

 

(

5-2У<я>

 

4 ’

-2.5 + 20Х1"*11

У5

Результаты расчетов сведены в табл. 2.3. На рис. 2.3 отражен ход выполнения процедуры Зейделя.

Таблица 2.3

Результаты выполнения итерационной процедуры метода Зейде;

п

х<“>

у(п)

0

 

0,0

1

1,25

4,5

2

-1,0

-4,5

3

3,5

13.5

4

-5,5

-22,5

5

12,5

49,5

6

 

 

 

Результаты расчетов показывают, что в последнем случае отсутствует сходимость последовательности результатов к точному решению. Это приводит к необходимости определения условий сходимости той или иной итерационной процедуры.

В общем случае итерационные методы решения систем линейных алгебраических уравнений можно записать в канонической форме

(п+1) _

Т (П)

+ Ax(nJ=f, П = 0,1,.

(2.13)

o(n+l) i

 

-(П+1)

 

 

где в (п+|).т (п } - итерационные параметры.

Рис. 2.3. Отсутствие сходимости при использовании метода Зейделя

В случае, если в{п+|), х(п+|) не зависят от номера итерации, метод называется

стационарным. В частности, для метода Якоби B(n+I) = D, т(п+,) = 1; для метода Зейделя B(n+,) = А, + D, т(п+|) = 1.

Если B(n+1) = Е . метод называется явным; в случае В(п+,) * Е - неявным.Примеры итерационных методов:

- явный стационарный метод простых итераций

т

неявный стационарный метод верхней релаксации

(D+©Ai) х"и,) -х«“’ +Axtn)=f. CD>0.

©

Введем пространство H c R mm - мерных векторов со скалярным произведением

ш

M=Zu.v,

1=1

и нормой

H=V (w'w) = j Z w?

Определим матричное неравенство: квадратная матрица С > 0 тогда и только тогда, когда

(Cx,x)>0 V x eH .х*0.

Иначе это определение может быть записано следующим образом: 35>0, (Сх.х)>б||х||\ х*0 .

Чтобы определить величину б, рассмотрим два случая:

1. Пусть симметричная матрица С > 0, тогда согласно первоначальному

определению

квадратичная форма1

(Сх,х)

> 0

Но

квадратичную форму

можно

привести к каноническому виду в главных осях:

 

 

 

 

 

(Сх,х) = ^ с ,,х )х1=

 

 

 

 

 

 

i.J=l

1=1

 

 

 

где X,

- собственные числа матрицы С;

- главные координаты.

 

В силу

С

m

вследствие

__

отсюда

> 0 имеем

чего X, >0, i = l.m, и

 

 

i^i

 

 

 

 

 

получаем

 

 

 

 

 

 

 

 

 

(с х .х )= |;я .д 1! > х п,1П| ; ^ = х ттн г

 

 

 

»=1

 

Г-1

 

 

 

то есть в качестве 5 может быть взято наименьшее собственное значение матрицы С. 2. Если С несимметричная матрица, поступают следующим образом для

определения 5:

(Сх.х) = 2 ]с1,х1х ,, '•] I

1Согласно [7], квадратичная форма определяется только для симметричных матриц.

Для установления условий сходимости определим величину погрешности метода формулой z (n) = х(п) - х, тогда из формулы (2.13) для стационарного итерационного метода можно получить

 

 

 

 

 

 

: + Аz(n*+ Ах = f .

 

 

 

 

 

 

_(n+l) _

(п)

 

 

 

 

 

 

 

 

 

В--------------+ Az(n) = 0,

п = 0,1,...

 

(2.14)

 

 

 

 

 

т

 

 

 

 

 

 

 

Теорема 2.4. Пусть А - симметричная положительно определенная матрица. А > 0:

итерационные параметры удовлетворяют соотношению

 

 

 

 

 

 

 

 

В-0,5тА>0.

т> 0 .

 

 

 

 

Тогда стационарный итерационный метод сходится.

 

 

 

Доказательство.

Для доказательства теоремы следует показать, что погрешность

метода z(n) —

>0 при любой начальной погрешности z°

 

 

Построим числовую последовательность вида

Jn =(Az(n),

(n)).

 

Из формулы (2.14) следует

 

 

 

 

 

 

 

 

 

 

 

 

Z‘“*n =z‘", -тВ 'Az'"’.

 

 

 

 

 

 

 

 

Az(n+" =Az,n' -тАВ

'Az,n

 

 

 

Теперь можно подсчитать

 

 

 

 

 

 

 

 

J„., =(AZ'“'",Zi“'") = (AZ("' - XAB'A Z"”

Z'"’- XB 'AZ'“') =

 

 

= (AZ'"',Z," ') - X(A B 'Az1"'

z'"’)-x(Az'"’

B 'A Z'^ + X^AB

'Az'"'

В 'Az" ).

Вследствие симметрии матрицы

А имеем

 

 

 

 

 

 

,

m

m

m

m

 

 

 

 

 

 

 

 

(AB-Az<">

z‘"') = 2

; i Z

I aiib-Lak,z<">z!"1:

 

 

 

 

 

 

1=1 ,=1 k=l

1 =1

 

 

 

 

 

 

 

 

 

in

in

m

in

p4z!> -'rar,z r

m

m

m

ni

 

 

(Az<"> B-'Az"") = I I X

I a

= I S

Z

I “i . ^ 4 ,z|'

 

 

p=l q=l

r=l

s=l

 

 

i=l

j=|

k=|

|=|

 

 

Иначе говоря, (AB"'Az(nl. z"”) = (Az(nl

B_,Az"") . Отсюда получаем

Jntl =(AZ'”I,Z'“1) - 2 X(AZ"" B'Az,n') + x:(A B 'A zn

B ’Az'") =

 

 

 

 

 

 

.

 

( f

 

x >

Аг"

B 'Az n | =

= Jn -(2xAz'“’- x :AB 'Az'"1 В ,AZ,"i) = J„ - 2 TU B --A :B

= J,

= B 'Az '‘

 

В силу условия теоремы ^ B - b A ju (n). u‘" 'j> 0 Vu<n). откуда следует, что

Jn., <,Jn, то есть построенная последовательность является монотонно убывающей и.

кроме того,

в силу

Jn+, = (Az(n+l),z(n+l))> 0 . ограничена

снизу. Отсюда

следует, что

существует предел этой последовательности J = UrnJn.

 

 

 

Из положительной

определенности (В

0.5тА)

> 0

следует существование

константы 5>0 такой, что имеет место

 

 

 

 

 

 

 

 

B_lAz<n)j

> б|в _|Az,nl|J

 

Теперь предыдущее соотношение может быть переписано в форме неравенства:

 

J„*i = J . - 2 г ^ В - |А ^ В ',Аг“ > B“'Az<n,j £ J„ -2 тб |в ч Аг""{2

 

При п

-> х

из

последнего выражения

получаем

J £ J - 2 T6 lim ||в_|Az,ni

 

 

 

 

 

 

 

П-»=СИ

Очевидно, что неравенство lim Цв-1Az(n)|| £0

может выполняться лишь

при условии,

что l - |B - 'A Z« "'||= lim |u -l = 0.

 

 

 

 

 

С другой стороны. z‘n) =A ",Bu(n), причем А ‘существует в силу положительной

определенности матрицы А по условию теоремы. Оценим норму погрешности:

 

 

|Z" i = |A"1Bu(n,|| < |A -,B||-;:u‘n,;|.

Теперь становится

очевидным,

что вследствие

lim и"” - О

||z(n)||—■--- ->0. что и требовалось доказать.

 

Следствие 1. Пусть

А - симметричная положительно определенная матрица. Тогда

метод верхней релаксации

 

 

 

 

 

х<п+1) _

(П)

 

 

(D

соА,):-------- 1----+ Ax(n)=f. ©>()

 

 

©

 

 

сходится при 0 < © < 2. В частности, метод Зейделя (© = 1) сходится.

В рассматриваемом случае, очевидно. В = D + ©А ,.

= ©

(Ах, х) = ((А, + D + А ,)х.х) = (А,х. х) + (Dx. х) + (А ,х. х) %(Dx. х) + 2(Ал. х).

Последнее соотношение справедливо в силу симметрии матрицы А:

 

in

m

m

 

(A .x .x ^ X a .n ./.x ,

= 2 a,;mx,x) = (A,s.x).

•J l

4 I

Условие сходимости итерационного метода В- 0,5хА > 0, т> 0 теоремы 2.4 принимает вид:

^ В - ~ A^x,xj = (Вх,х) - у(Ах,х) = (Dx,x)+ш(А,х,х) - ^[(D ^x) + 2(А,х,х)]

Очевидно,

что

последнее

неравенство

выполняется

при

условии

Следствие 2.

Пусть

А - симметричная положительно определенная

матрица с

диагональным преобладанием, то есть имеет место

 

 

 

 

 

» „ > 1 Ы

i.j=bm .

 

 

Тогда метод Якоби сходится.

 

 

 

 

 

Поскольку в рассматриваемом случае

В = D,

условие сходимости принимает вид

неравенства

 

 

 

 

 

 

 

2D > А .

Из неравенств

XX, < - ' J 2

следует

В силу симметричности и положительной определенности матрицы А имеем

Используя предположение следствия, запишем

2аи>Х М +а»> i=,’m-

Из двух последних неравенств получаем

(Ах,х) < 2^a„xJ = 2(Dx,x),

1=1

что и требовалось доказать.

Полиномы Чебышёва1

Для дальнейшего рассмотрения определим, согласно [8], норму

JfJ = max |f(x)|.

хЦа.Ь]

называемую чебышёвской.

Рассмотрим задачу: среди всех полиномов степени N со старшим коэффициентом, равным 1, найти такой многочлен TN(x), для которого величина |TN|| = njax|TN(x)| минимальна. Такой многочлен носит название полинома Чебышёва.

Расмотрим функцию

PN(x) = cos(N ■arccos(x)).

(2.15)

Произведем тригонометрические преобразования:

PN+,(х) = cos((N + l)arccos(x)) = cos(N • arccos(x) + arccos(x)) =

=cos(N • arccos(x))cos(arccos(x)) - sin(N arccos(x))sin(arccos(x)) =

=xPN(x) - sin(N • arccos(x))sin(arccos(x));

PN_,(x) = cos((N - l)arccos(x)) = cos(N • arccos(x) - arccos(x)) =

=cos(N • arccos(x))cos(arccos(x)) + sin(N • arccos(x))sin(arccos(x)) =

=xPK(x) + sin(N • arccos(x))sin(arccos(x)).

Складывая почленно два последних равенства,

PN*I + P\-i = - XPN*

PN.,= 2 XPN -P n1,

получаем рекуррентное соотношение для построения функции PN+1. В соответствии с формулой (2.15)

Р0(х) = cos(0- arccos(x)) = I; Р,(х) = cos(l ■arccos(x)) = x .

Чебышев Пафнутнй Львович [4.5.1821 26.11.1894]. В 1841 году закончил Московский университет и там же в 1846 году защипы магистерскую диссертацию. В 1847 году подготовил и защитил диссертацию на право чтения лекций и был утвержден в звании доцента Петербургского университета. В 1849 году защитил докторскую диссертацию; в 1850 году стал профессором Пегербургского университета. С 1856 года являлся икадемиком Петербургской академии наук.

И далее, в соответствии с полученной зависимостью Р2(х) = 2хР,(х)- Р0(х) = 2х2 -1; Р,(х) = 2xPj(x)- Р,(х) = 4х’ - Зх: Р4(х) = 2хР,(х) - Р,(х) = 8 х \-8 х 2 +1:

Р5(х) = 2хР4(х)- Р,(х) = 1бх* -20х5 +5х

На рис. 2.4 показаны некоторые полиномы построенной системы.

Рис. 2.4. Полиномы TN(X) при N= 2, 3, 4, 5, 6

Можно заметить, что в общем случае коэффициент при старшей степени

определяется следующим образом:

 

P„(x) = 2xPH,(x )-P s :(х) = 2N"'xN+...

(2.16)

Определим функцию TN(x) в виде

 

TN(x) = 2I N Рк(х) = 21Ncos(N • arccos(x)).

(2.17)

Очевидно, что TN(x) является полиномом степени N со старшим коэффициентом, равным I.

Определим корни этого полинома:

cos(N • arccos(x)) = 0,

/ \

(2k —1)- те

N ■arccos(x) =

-------— , к = 1,2,...

Поскольку TN(x) является полиномом степени N, он имеет не более N корней,

при 4ем все они различны и лежат на отрезке [-1, 1]:

(2k —1)- те

x ^ c o s-^ ——^— ,

к = 1,N.

с 'i

I

Ь - Ы

 

2-N

 

Таблица 2.4

Корни полинома TN(x) для N=1, 2. 3, 4, 5, 6 и 7

N=1

0

_

_

_

_

_

-

Z II

N=3

N=4

N=5

N=6

N=7

0,707106781

0,866025404

0,923879533

0,951056516

0,965925826

0,974927912

-0,70710678

0

0,382683432

0,587785252

0,707106781

0,781831482

_

-0,866025404

-0,382683432

0

0,258819045

0,433883739

_

_

-0,923879533

-0,587785252

-0,258819045

0

_

_

_

-0,951056516

-0,707106781

-0,433883739

_

_

_

_

-0,965925826

-0,781831482

-

-

-

-

-

-0,974927912

Вполне очевидно (рис. 2.4), что полиномы TN(x) принимают экстремальные значения в тех точках, где функция cos() принимает значения +1 или -1.

cos^N arccos(xp)) = ±1; Narccos(xp) = р я ;

х = co sP A p = 0,N.

рN

Вэтих точках полином TN(x) принимает чередующиеся по знаку значения

TN(xp) = (-l)P -2i_n, p = 0,N; при этом чебышёвская норма равна |Tn| = 21_N

Лемма 2.2. Пусть существует система точек - l< x N <xN_, < ...< х, < х0 < 1 такая,

что |QN(^p)| = ||QN||’

Р = О,N ,

причем

в указанных точках функция

QN(xp) имеет

чередующиеся знаки.

Тогда

среди

всех полиномов степени

N

со старшим

коэффициентом, равным I, многочлен QN(x) наименее уклоняется отО.

 

Доказательство. Пусть существует полином SN(x) степени N со старшим коэффициентом 1(рис. 2.5), причем

I|SN | | < | Q N | .

то есть |SN(x)| < ||Qn || V xe[-I,l].

Построим функцию R(X) = QN(X) -S N(X). отличную от нуля и являющуюся полиномом степени (N-1).

Рис. 2.5. Графики полиномов QsCx), Ss(x) и их разности R(x) = Q5(x)- S5(x)

В точках экстремумов хр имеем

QN(*PM -0P-|QN1- P=^N-

Тогда R(xp) = (—l)p • ||Qn || —SN(xp) . p = 0,N и в силу предположения функция R(x) на отрезке [-1, 1] меняет знак N раз, а значит имеет N корней, чего не может быть, поскольку R(x) является полиномом степени (Nrl).

Таким образом, утверждение леммы 2.2 доказано.

Поскольку построенный ранее полином Чебышёва TN(x) удовлетворяет всем требованиям леммы, он является наименее уклоняющимся от нуля на отрезке [-1, I].

В случае необходимости отыскания полинома, наименее уклоняющегося от нуля на произвольном отрезке [а, Ь], следует перейти к новой переменной

*

2

b+a

.

t = - — x —- — , a * x £ b ,

 

b - a

b - a

 

которая теперь принимает значение t е[-1, l].

В этом случае функция Рм(х) принимает вид

PN(x) = 21_ы cos^N • arccos

.

Формула (2.16) представляется в виде

PN(x) = 2xPN4 x ) - P N. 2(x) = 2N- ' [ ^ ^ p . . . = ^ x N+...

Теперь можно получить полином со старшим коэффициентом 1, то есть полином Чебышёва для отрезка [а, Ь]:

T NW =

cos^N • arccos

(2-18)

Корни этого многочлена определяются аналогично рассмотренному выше случаю:

cos^N • arccos ^

- о,

 

2x-(b+a)

(2 k - lk

1 —

arccos----- ------ - = ------ —,

k = 1,N,

 

b - a

2 N

 

b +а

b - а

(2к-1)тс

хк = —

+ —

c o s ^ ^ ,

к = 1,N.

 

 

2-N

 

Очевидно, что в этом случае |TN| = max TN(x)| = (b -a )N

Может рассматриваться еще одна задача: найти многочлен степени N, наименее уклоняющийся от нуля на отрезке [а, Ь] среди многочленов, удовлетворяющих условию

QN(0) = 1.

Перенормируем полином (2.18) так, чтобы TN(0) = 1,

(х)c ^ N - a r c c o s * ^ )

v—-

-----------------

- - -osl Narccos—

TN(x) =

PN(0)

f XI

a + b^i

-= PNC° S

 

NV 7

соя N arccos------

 

 

 

Л

a-by

 

где pN =-

 

 

 

 

Гхт

 

a + b Y

 

 

s^N • arccos---- -J

 

 

.

^— J.

Корни этого многочлена расположены в точках

b +а

Ь - а

(2к-1)тс

хк = —

+ —

cos

к = 1,N.

 

 

2N

Введем обозначения:

 

 

 

 

а

_ 1 - \

_ Ь - а

Ь’ Ро _ Г+Х~ Ь + а

Рассмотрим соотношения: у = arccos(z);

cos(y) = z - нечетная функция;

cos(2y) = 2cos2(y ) - 1 = 2z2 -1 - четная функция:

cos(3y) = cos(y) - (4cos2(y) - з) = 4z3 - 3z - нечетная функция;

cos(4y) = 2• (2cos2(y)- l)2 -1 = 2^2z2 - l)2 -1 - четная функция:

s(N • arccos(-z)) = (- l)Ncos(N • arccos(z)) = (- l)N^ ^|z + Vz: - 1J + |z -V z : - 1j

Положим z = — , тогда

Po

 

 

z +Vz - „ и

дт;,!±4 .

P .

Ы

1 --Д

Pc

VPil

1 + vr

Вводя обозначение p, = :—^ , представим

определенный выше коэффициент в

1+V£

 

 

виде

N J r f _

PN = ( - I) , . 2N

1+Pl

Теперь очевидно, что построенный полином принимает экстремальные значения, равные

ITNI= lejf?JTN(Х)1 = Г+Рр^

Пусть рассматривается система линейных алгебраических уравнений Ах = f с симметричной положительно определенной матрицей А. Решение будем искать с помощью явного нестационарного метода Ричардсона,

х(п+,)- х (п)

+ Ax(n) = f. п = 0,1,...

 

 

т (п+1)

 

 

Попытаемся так определить

набор т(1),т (2),...,x(N\

чтобы ||x(N)-x|| была

минимальной для заданного числа итераций N.

 

Теорема 2.6. Пусть А

симметричная положительно

определенная матрица,

Xmin > 0, Хтах >0 - наименьшее и наибольшее собственные значения. Пусть задано число

итераций N. Среди всех

наборов т(п),

n = l,N,

наименьшую погрешность ||x(N)-x||

имеет набор, для которого

 

 

 

т

(п ) ’ n = 1,N;

 

 

 

1+Pot'

 

 

 

 

 

Asa!-; t'nl =cosf o

*)*.

^ min

^ m

^

 

2N

Оценка погрешности в этом случае имеет вид

 

 

 

 

Pi = ь К

 

 

 

 

i+ V T

Доказательство. Введем, как и ранее, погрешность решения

z(n) = х(п) - х . Схема

Ричардсона позволяет записать систему уравнений относительно погрешностей:

 

z(D+,)- z (n) + Az(n) =0,

п = 0,N -1.

 

 

т(пИ)

 

 

 

Отсюда получаем

ztn+l) = 2<n) - х ^ А г '" ' = (E - X("*"A )Z<"1

В частности,

Z<I) = ( E - T",A )Z(0>,

z,2) = (Е - T<2,A )Z(1) = (е - х,2)аХе- t ("A)z,0,1

Z(N)

. п=1

T(N) = (е - t (N)а ) •(е - X(N-"A ) •... • (е - х(,)а ) = П(Е- Т<П>А)

п-1

Понятно, что T(N)- симметричная матрица. Теперь погрешность на N итерации можно представить выражением

Z(N) =X (N)Z(0\ ||Z(N)||=||T (N)Z(0)||.

Для симметричной положительно определенной матрицы в качестве нормы может быть выбран спектральный радиус v = Xme(T(N)). В самом деле, для собственного вектора р, соответствующего собственному значению Хшах,

T(NV = Xm„ n ,

||т Ы)и||= Цх^ цЦ= Ix^i-pl=v-|HI•

Сучетом свойств нормы получаем

v- H = |r (NV p lT (N1 -M .

 

 

 

V S ||T (n)|.

 

 

 

 

(2.19)

С другой стороны,

пусть

р к,

к = 1,ш

- ортонормированная

система векторов,

построенная на основе собственных векторов матрицы T(N),

 

 

 

 

 

(цк.й " )= Ё и !1ц Г = 8 к .-

 

 

 

 

 

 

 

 

i-1

 

 

 

 

 

 

Разложим вектор р

по этому базису:

 

 

 

 

 

 

 

 

 

k=l

 

 

 

 

 

 

Согласно определению нормы вектора

 

 

 

 

 

 

( m

Го

\

т f т

m

\

т f

m

N

Ь

IN2=(ц,ц)=

 

У

= 1

 

J

 

 

 

Ч к=1

n=l

.= lV k=i

n=1

tn = ,V

,=i

V

 

В компонентной записи вектор T<N)p

с использованием

собственных чисел и

векторов выглядит следующим образом:

 

 

{T‘NV}, = £ т Г и , = Е ( Ч М)

= Х л { t o ? }

= i > t Л и *

И

j=l 4

k=l

j

k=l

4 j=j

J

k=l

Здесь использовано определение собственных значений и векторов:

T(NV = X kpk.

Учитывая, что

|T 'N,H||: =(T‘NV .T,NV ) = t ( Z c kx k^

£ с пХпиг1 =

 

=

1=1 Vk=l

n=l

S k.n=n-

i=l

'

= t ( v . X kX.ek.) =

 

k=l

=

k.n=l

k=l

 

 

можно подсчитать норму оператора

1Г Ч 1.

JU

M|

= SUP

н и *

SUP НГн

v *

йсай*0

||p||

цеН.ц*0

щ

 

Сравнивая последнее неравенство с выражением (2.19), определяем точное значение нормы:

||T (N)|= V .

С учетом этого можно оценить величину погрешности: ||z(N,|= | r (N,z,0,|S v .|zW|.

Построение доказательства теоремы 2.6 основано на поиске такого набора

т(п), n = 1,N, который минимизирует спектральный радиус v матрицы T(N).

Предположим, что все собственные значения матрицы А упорядочены:

 

О Xj = Xmin < Я,2 <

< ^m-1 <

= ^-тшх*

Известно [7],

что если f(A) - матричная функция матричного аргумента А, то

f(X,), f(X2),...,

- полная система собственных значений матрицы f(A).

Поскольку

 

 

 

 

T1N)(A) = (е - X(N,A ) ■(е -

X(N‘"A )-... •(е - х(|,а )

является как раз матричной функцией матричного аргумента, то соответствующая скалярная функция

(l- x ,N,Xl) ( l - x ,N- '\ ) - . . . ( l - x ,llX1)

определяет собственные значения матрицы T(N). В этом случае ее спектральный радиус может быть определен как

v ^ a x l ( 1- x 'N'X1).(1- x ,- ,X1)....(l-x<"X 1)|.

f(X) = (l- x(N)x) (l - t <N_,,x)•... (l- T(I>X) .

( 2. 20)

Тогда спектральный радиус можно определить следующим образом:

max |f(X)|

и определение набора т(п), n = 1,N сводится к задаче поиска

min

max |f(X)| =

m inj|f|

Очевидно, что функция (2.20) является полиномом степени N, причем f(0) = 1.

Иначе говоря, поиск итерационных параметров

т(п\ n = l,N сводится к задаче об

отыскании полинома степени N, наименее уклоняющегося от нуля на отрезке [linin’А.та*]* которая может быть решена с использованием полинома Чебышёва.

Корни функции (2.20) принимают значения:

1- т,п)Х = 0, Х „ = - ^ , п =Т к

и должны совпадать с корнями полинома Чебышёва:

х „ = Хп,“ + ^ min + Хт" ~ X|nin cos^ ~

, П = Ш .

п

 

2

2

 

2N

 

Теперь очевидно, что итерационные параметры следует выбирать следующим

образом:

 

 

 

 

 

 

 

'

—^тах ^~kmm ^ k max

k m|n

О71 _

V

/

n

2

 

2

2N

_

k mux

k mln [ 1 . k mn ~ k m|n

(n) I _

1 . 1~~^3 t(n) I

 

 

 

l

J

т < 4

1+ E ) '

n = 1,N.

1+Pot(n) '

Обозначения соответствуют введенным при формулировке теоремы.

Для оценки нормы погрешности заметим, что

2РГ v £ ^ al J f(X)H fll= 1+р,

( N ) | b

" z

откуда получаем z’

1+РГ

что и требовалось доказать.

Рассмотрим неявную итерационную схему с положительно определенными матрицами А и В:

 

Х(А+‘) _ Y(n)

( 2.21)

 

В

 

I Лх(п) - f

 

°

-(n+l) +АХ _ I -

 

Эта система уравнений для погрешностей принимает вид

 

 

s Z(n+1) - z (n)

 

 

В-

 

-+Az(n) = 0.

 

 

 

r (a+D

 

Указанные свойства матрицы

В

позволяют представить ее в виде В=В,'2В1/2

Тогда предыдущее соотношение можно представить в форме

 

 

B,/2Z(n+l) - B,/2z(n)- + B"I/2Az(n) =0.

 

 

T (n+I)

 

 

Обозначим B,/2z(n) = v(n), z(n) = B',/2v(n) Тогда

 

 

v (n+l)

(n)

 

 

~ 5 ^ +Суи,=0*

 

где С = B”I/2AB”i/2

симметричная

положительно определенная

матрица, причем

минимальное (максимальное) собственное значение матрицы В-1А является одовременно и минимальным (максимальным) собственным значением для матрицы С.

Теорема 2.7. Пусть

А

и

 

В - симметричные и положительно определенные

матрицы.

Хтах - наименьшее и наибольшее собственные значения матрицы В_,А .

Для заданного

числа

N

итераций неявный

чебышёвский метод (2.21) имеет

минимальную

погрешность

при

наборе т(а),

n = l,N, определенном условиями

предыдущей теоремы, где

 

^

(

в-'а )

 

 

^

(

в-'а ) '

 

 

 

 

 

Удачным выбором матрицы

В можно приблизить значение параметра £ к 1, что

приведет к понижению погрешности |z(N)|.

 

Погрешность z(n) = х(п) - х решения системы линейных алгебраических уравнений вида1 Ах = f определить невозможно, поскольку точное решение х неизвестно. Однако можно оценить невязку

Г(П) = А2<">= А(х<">_ xj = Ах("> - Ах = Ах(п>- f ,

определяющую, насколько полученное решение не удовлетворяет исходному уравнению.

Рассмотрим явный итерационный метод:

- + Ax<n) = f .

-(п-Н)

Определим из этого соотношения величину х(п+|):

х'"*'1= х<») _ t C»')^Ax(-l _ f) = х<") _ т(-')г(п) .

При использовании итерационной схемы для (п+1) шага следует так подобрать итерационный параметр т(п+1), чтобы при известном х(п) значение невязки г(п+,) стало наименьшим.

Оценим невязку для следующего шага:

г(п-и) _ д х(п+1) _ f = Ax(n) —x(n+,)Аг(п) - f = г(п) —х(п+1)Аг(п) Определим, как и ранее, квадрат нормы невязки:

J r '- 'f =(г,п) - т '^ ’Аг'"'. г1"1-T (°*"Ar(ol) =

= (г("|,г(",) - ( т (“*,,Аг<",,г<*,) - (г 1”),т(п*1)Аг(“,)+ (т1п*,,Аг(“,)т|"*|)Аг1“’) =

= fr<-f - 2т(“*"(г("\ Аг(0|)+ (т<°*||)!}Аг(”)|!

При выводе последнего выражения учтено, что (Au, V ) = (u, ATv) = (u, A v),

AT = A - в силу симметрии матрицы.

Полученное соотношение между невязками на соседних шагах итерационной процедуры можно рассматривать как функциональную зависимость г(п+,)(т(п+,)). Для

1Здесь и далее предполагается, что А - симметричная, положительно определенная матрица.

66