Северин Методы БМ
.pdf2) y |
u1 u2 un |
, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
v v |
2 |
v |
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
ln y lnu1 lnu2 lnun lnv1 lnv2 ln vm , |
|
|
|||||||||||||||||||||
|
|
1 |
|
|
|
|
1 |
|
|
1 |
|
|
1 |
|
|
1 |
|
|
1 |
|
|
||
y y |
|
|
|
u |
|
|
|
u |
|
|
u |
|
|
v |
|
|
v |
|
|
v |
. |
||
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
1 |
|
|
u2 |
2 |
|
un |
n |
|
v1 |
1 |
|
v2 |
2 |
|
vm |
m |
|||
|
u1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
5.2. Элементы векторной алгебры
Вектором называется упорядоченное множество действительных чисел. Например, a (a1, a2 , , an ) , где a1 , a2 , …, an действительные числа, есть вектор, состоящий из n элементов. Количество элементов n называется размером вектора. Числа a1 , a2 , …, an называются проекциями вектора.
|
Два |
вектора a (a1, a2 , , an ) и b (b1, b2 , , bn ) называются |
||
равными, |
если равны все |
их соответствующие проекции: ai bi , |
||
|
|
|
a b . |
|
i 1, n . В этом случае пишут |
||||
|
Если a (a1, a2 , , an ) |
и b (b1, b2 , , bn ) то определены опера- |
||
ции сложения и вычитания векторов:
a b (a1 b1, a2 b2 , , an bn ) ,
a b (a1 b1, a2 b2 , , an bn ) .
Для любой скалярной величины определена операция умножения вектора на скаляр a (a1, a2 , , an ) .
Вектор 0 (0, 0, , 0) называется нулевым вектором.
Векторы a1 , a2 , …, am называют линейно зависимыми, если су-
ществуют скаляры 1 , 2 , …, m , не все равные нулю, что
1a1 2a2 mam 0 .
141
В этом случае хотя бы один из этих векторов можно представить линейной комбинацией остальных векторов, например, при m 0
am 1a1 2a2 m 1am 1 .
В противном случае векторы называют линейно независимыми. Множество всех n -мерных векторов называется n -мерным век-
торным пространством и обозначается Rn . |
Говорят, что векторное |
|||
пространство |
Rn |
натянуто на некоторую систему векторов, если |
||
каждый вектор из |
Rn можно представить в виде линейной комбина- |
|||
ции этой системы. |
Базис векторного пространства Rn определяется |
|||
как система |
n |
линейно |
независимых |
векторов. Элемент |
x (x , x , , x ) пространства |
Rn также называется точкой. В этом |
|||
1 2 |
n |
|
|
|
случае x1 , x2 , …, xn называются координатами точки. Скалярное произведение двух векторов есть число, равное
a b a1b1 a2b2 anbn .
Евклидова норма вектора a определяется равенством

a 


a a 
a12 a22 an2
и соответствует длине вектора. Ее также обозначают a и называют
модулем вектора.
Если векторы a и b рассматриваются как направленные отрезки, между которыми угол , то
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a b |
|
a |
|
b |
cos . |
|
||||||||||
Векторы называют ортогональными и пишут a b , если |
a b 0 . |
|||||||||||||||
Для векторов справедливо |
|
неравенство Коши – Буняковского – |
||||||||||||||
Шварца |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
a b |
|
|
|
a |
|
|
|
b |
|
. |
|
||||
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
142
Здесь равенство возможно только при a b .
|
|
|
|
|
Евклидова |
норма также называется l2 -нормой и обозначается |
||||||||||||||||||||||||||||||||||
|
a |
|
|
|
2 . В векторном анализе применяются l1 -норма и l -норма: |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|||||||||||||||||||||||||||||||||||||
|
|
|
||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
a |
|
1 |
|
ai |
|
, |
|
|
|
a |
|
|
|
max |
|
ai |
|
. |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i 1 |
|
|
|
|
|
|
|
|
1 i n |
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
Представленные нормы векторов – частные случаи l p -нормы |
||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
1 p |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
p |
|
|
|
|
|
|
|
p |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a |
|
|
|
|
|
ai |
|
|
. |
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i 1 |
|
|
|
|
|
|||||||
|
|
|
|
|
Любая норма вектора обладает свойствами: |
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
1) |
|
0 |
a Rn , |
|
|
|
a |
|
|
|
0 |
тогда и только тогда, когда a 0 ; |
|||||||||||||||||||||||
|
|
|
|
|
a |
|
|
|
|
|||||||||||||||||||||||||||||||
2)
a 



a 
a Rn , R ;
3)
a b 


a 


b 
, a, b Rn – неравенство треугольника.
Две нормы 


r и 


s называются эквивалентными, если суще-
ствуют , 0 такие, что
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a |
|
r |
|
|
|
a |
|
|
s |
|
|
|
|
a |
|
r |
|
|
|
|
|
|
|
|
|
a Rn . |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
В частности, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
a |
|
|
|
2 |
|
|
|
a |
|
|
|
1 n |
|
|
|
a |
|
|
|
2 , |
|
|
|
|
|
a |
|
|
|
|
|
|
|
a |
|
|
|
2 n |
|
|
|
|
|
a |
|
|
|
, |
|||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
a |
|
|
a |
|
1 n |
|
|
|
a |
|
|
|
|
, |
|
|
|
|
|
|
a |
|
|
|
|
|
|
|
a |
|
|
|
2 |
|
|
|
a |
|
|
|
1 . |
||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Таким образом, нормы |
|
a |
1 , |
|
|
|
a |
|
|
|
2 и |
|
|
|
a |
|
|
|
являются эквивалентными. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Расстоянием |
|
|
|
между |
двумя |
|
точками x (x1, x2, , xn ) и |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
y ( y , y , , y ) |
пространства Rn |
называется евклидова норма раз- |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1 2 |
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ностей их координат
143

x y 


(x1 y1)2 (x2 y2 )2 (xn yn )2 .
Расстояние обладает свойствами:
1) |
|
0 , |
|
x y |
|
0 |
тогда и только тогда, когда x y ; |
x y |
|
|
|||||
|
|
|
|
|
|
|
|
2)
x y 


y x 
;
3)
x z 


x y 


y z 
– неравенство треугольника.
Последовательность векторов {xk } называется сходящейся к век-
тору x , если
lim |
|
|
|
xk x |
|
|
0 . |
k |
|
|
|
|
|
|
|
|
|
|
|
Понятие сходимости последовательности векторов положено в основу исследования скорости сходимости методов многомерной оптимизации.
5.3. Матрицы и действия с ними
Матрица размера m n представляет собой прямоугольную таблицу действительных чисел, состоящую из m строк и n столбцов
|
a |
a |
a |
|
|
|||
|
11 |
12 |
|
1n |
|
|
||
a |
21 |
a |
22 |
a |
2n |
|
|
|
A |
|
|
|
|
, |
|||
|
|
|
|
|
|
|||
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
am2 |
|
|
|
|
|
am1 |
amn |
|
||||||
где aij – действительные числа, называемые элементами матрицы.
Элементы aij при i j называются диагональными элементами, если же i j , то aij называются недиагональными элементами. Диагональ-
ные элементы составляют главную диагональ матрицы.
Элементы каждого столбца матрицы составляют вектор, который
144
называется вектор-столбцом. Аналогично каждая строка матрицы определяет вектор-строку. Вектор можно рассматривать как матрицу специального вида, которая содержит либо только одну строку, либо лишь один столбец. Матрица с одинаковым количеством строк и столбцов называется квадратной матрицей.
Если заменить строки матрицы A столбцами, то получится транспонированная к A матрица, которая обозначается AT . В частности, если a – вектор-строка, то aT – вектор-столбец.
Квадратная матрица A называется симметрической, если для ее элементов aij a ji , то есть симметричные относительно главной диа-
гонали элементы одинаковы. Для симметрической матрицы AT A . Две матрицы называются равными, если они имеют одинаковые
размеры и их соответствующие элементы совпадают.
Квадратная матрица, все диагональные элементы которой равны 1, а внедиагональные элементы – нулю, называется единичной матрицей и обозначается через E . Матрица, которая содержит только равные нулю элементы, называется нулевой матрицей и обозначается O .
Рангом матрицы называется максимальное число ее линейно независимых строк или столбцов.
Сумма или разность двух матриц A и B одинакового размера есть матрица того же размера C , элементы которой вычисляются по формулам cij aij bij или cij aij bij . При этом пишут C A B или C A B .
Скалярное произведение двух вектор-столбцов a и b представимо в виде aT b a1b1 a2b2 anbn . При этом aT b bT a . Условие ортогональности векторов a b имеет вид aT b 0 . Неравенство Ко-
ши-Буняковского-Шварца можно представить в виде aT b 
a 


b 
.
Произведение AB двух матриц A и B определено тогда и только тогда, когда размеры матриц согласованы, то есть количество столбцов матрицы A равно количеству строк матрицы B . Если A –
145
матрица размера m n , а B – матрица размера n p , то произведение этих матриц AB C представляет собой матрицу размера m p . Элемент матрицы C , расположенный на пересечении i -той строки и j -того столбца, определяется по формуле
cij ai1b1 j ai2b2 j ainbnj .
Это означает, что необходимо найти скалярное произведение i -той строки матрицы A и j -того столбца матрицы B , то есть произведение матриц выполняется по правилу «строка на столбец». В частности, всегда можно перемножать квадратные матрицы одинакового размера. В общем случае AB BA .
Произведением матрицы A на некоторое число называется матрица A с элементами aij .
Определителем квадратной матрицы A называется число, обозначаемое det A и получаемое с помощью арифметических операций над элементами A . Если A – матрица размера 2 2 , то
|
det A |
a11 |
a12 |
a a |
a a . |
||
|
|
a21 |
a22 |
11 |
22 |
12 |
21 |
|
|
|
|
|
|
||
Если A – матрица размера n n , то |
|
|
|
||||
|
|
|
n |
|
|
|
|
|
det A ai1( 1)i 1Mi1 , |
|
|||||
|
|
|
i 1 |
|
|
|
|
где M i1 называется минором элемента ai1 |
и представляет собой опре- |
||||||
делитель |
подматрицы матрицы A , полученной путем исключения |
||||||
строки i |
и столбца 1. |
|
|
|
|
|
|
Матрица называется вырожденной или особенной, если ее определитель равен нулю. Если же определитель не равен нулю, то соответствующая ему матрица называется невырожденной или неособенной. При транспонировании матрицы ее определитель не изменяется.
146
Матрица, обратная к невырожденной квадратной матрице A , обозначается как A 1 и представляет собой невырожденную квадратную матрицу, обладающую свойством AA 1 A 1A E . Определитель обратной матрицы det A 1 1 det A .
Операции над матрицами обладают свойствами:
1)A B B A ;
2)(A B) C A (B C) ;
3)(A B) A B ;
4)( )A A A ;
5)AE A , EA A ;
6)(AB) (A)B A(B) ;
7)(A B)C AC BC , A(B C) AB AC ;
8)(AB)C A(BC) ;
9)(A B)T AT BT ;
10)(AB)T BT AT ;
11)det(AB) det Adet B ;
12)(AB) 1 B 1A 1 .
Если для квадратной матрицы A размера n и ненулевого вектор-
столбца x Rn , x 0 |
выполняется |
равенство |
|
Ax x , то число |
|
||||||||||||||||||||
называется собственным значением, |
а вектор x |
|
|
|
называется собствен- |
||||||||||||||||||||
ным вектором матрицы A . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
В соответствии с l p -нормой вектора вводится l p -норма матрицы |
|||||||||||||||||||||||||
|
A |
|
p |
sup |
|
|
Ax |
|
|
|
p |
max |
|
Ax |
|
|
|
p |
, |
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
x 0 |
|
p |
|
x |
|
p 1 |
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
о которой говорят, что она индуцирована векторной l p -нормой. |
В |
||||||||||||||||||||||||
частности, определены максимальная столбцевая норма, максимальная строчная норма и спектральная норма:
147
|
|
|
m |
|
|
|
|
n |
|
|
|
||||||||||
A |
|
max |
|
|
aij |
|
, |
|
A |
|
|
max |
|
|
aij |
|
, |
|
A |
|
2 [max (AT A)]1 2 . |
1 |
|
|
|
|
|
|
|
|
|||||||||||||
|
|
1 j n |
i 1 |
|
|
|
1 i n |
j 1 |
|
|
|
||||||||||
Спектральная норма матрицы A равна квадратному корню из максимального собственного значения матрицы AT A .
Последовательность матриц {Ak } называется сходящейся к матрице A , если
lim Ak A 0 .
k
5.4. Формула Шермана – Моррисона и ее применение
Пусть A – невырожденная квадратная матрица размера n , а a и b – произвольные n -мерные векторы столбцы. Если 1 bT A 1a 0 ,
то матрица A abT 0 невырожденная и имеет обратную матрицу
(A abT ) 1 A 1 |
A 1abT A 1 |
. |
(5.1) |
|
|||
|
1 bT A 1a |
|
|
Это равенство называется формулой Шермана – Моррисона. Для доказательства ее истинности умножим равенство (5.1) на матрицу
A abT :
(A abT ) 1(A abT ) E A 1abT |
A 1abT A 1A A 1abT A 1abT |
|
|||||||
|
1 bT A 1a |
||||||||
|
|
|
|
|
|
|
|||
E A 1abT |
A 1abT (bT A 1a)A 1abT |
|
|
||||||
|
|
|
|||||||
|
|
|
|
1 bT A 1a |
|
|
|
||
E A |
1 T |
A |
1 |
T 1 bT A 1a |
E . |
|
|
||
ab |
ab |
|
|
|
|
||||
1 bT A 1a |
|
|
|||||||
|
|
|
|
|
|
|
|
||
Применим формулу Шермана – Моррисона для вывода модифи-
148
цированной формулы Бройдена – Флетчера – Гольдфарба – Шанно (4.35) обращением матрицы (4.29)
H |
k 1 |
H |
|
|
pk pTk |
|
Hk sk (Hk sk )T |
, |
|
(5.2) |
|||||
k |
|
|
|
||||||||||||
|
|
|
|
pTk sk |
|
|
|
(Hk sk )T sk |
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
||||
Введем обозначения: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
G |
k 1 |
H 1 |
, |
G |
k |
H 1 , |
|
|
(5.3) |
||||
|
|
|
|
k 1 |
|
|
|
|
k |
|
|
|
|||
X Gk 1 , Y Hk 1 , |
H Hk , |
G Gk , p pk , |
s sk , |
(5.4) |
|||||||||||
u Gp , |
v Hs , (pT s) 1 , |
(vT s) 1 . |
|
(5.5) |
|||||||||||
Формула (5.2) примет вид: |
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
Y H ppT vvT . |
|
|
(5.6) |
||||||||||
Рассмотрим матрицу V H ppT . По формуле (5.1) имеем:
UV 1 (H ppT ) 1 H 1 H 1 ppT H 1 .
1pT H 1 p
Сучетом обозначений (5.3)–(5.5)
U G |
GppT G |
G |
uuT |
. |
|
|
|
|
|||
1 pT Gp |
pT s pT u |
|
|||
Обозначая |
|
|
|
||
|
(pT s pT u) 1 , |
(5.7) |
|||
получим: |
|
|
|
||
U V 1 G uuT . |
(5.8) |
||||
Рассмотрим матрицу (5.6) Y V vvT . По формуле (5.1) имеем:
X Y 1 (V vvT ) 1 V 1 V 1 vvT V 1 . 1 vT V 1 v
149
Учитывая (5.8), |
|
|
|
|
|
X U |
|
UvvT U |
. |
|
|
1 |
vT Uv |
|
|||
|
|
|
|||
Перепишем это равенство в виде: |
|
|
|
|
|
X U N D , |
|
(5.9) |
|||
где |
|
|
|
|
|
N UvvT U , |
D 1(1 vT Uv) . |
(5.10) |
|||
На основании (5.8) имеем: |
|
|
|
|
|
N (G uuT )vvT (G uuT ) , |
|
||||
N GvvT G GvvT uuT uuT vvT G 2uuT vvT uuT . |
(5.11) |
||||
Сучетом обозначений (5.4) и (5.5)
vHs G 1s , Gv GG 1s Es s .
Поскольку матрицы H и G симметрические, HT H , |
GT G , то |
||
vT G (Gv)T sT , |
vT u uT v sT HGp sT Ep sT p . |
||
Поэтому выражение (5.11) примет вид: |
|
|
|
N ssT sT p(suT usT ) 2 (sT p)2 uuT . |
(5.12) |
||
На основании (5.5) и (5.8) для D в (5.10) получим: |
|
||
D 1(1 vT Uv) vT s vT (G uuT )v vT (s Gv uuT v) , |
|||
D vT (s s usT p) , |
D (sT p)2 . |
|
|
Подставим последнее выражение, выражения (5.8) и (5.12) в (5.9):
X G uuT ssT sT p(suT usT ) 2 (sT p)2 uuT , (sT p)2
150
