Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
177
Добавлен:
14.05.2015
Размер:
1.85 Mб
Скачать

Е. Е. Тыртышников

47

 

 

7.8Теорема Кронекера Капелли

Рассмотрим систему линейных алгебраических уравнений Ax = b ñ m × n-матрицей

A = [a1, . . . , an]. Матрица [A, b] = [a1, . . . , an, b] называется расширенной матрицей

данной системы.

Теорема. Система Ax = b совместна тогда и только тогда, когда ранг матрицы коэффициентов совпадает с рангом расширенной матрицы:

rankA = rank[A, b].

Доказательство. Мы уже знаем (см. Лекцию 3), что совместность системы Ax = b равносильна равенству линейных оболочек L(a1, . . . , an) = L(a1, . . . , an, b). Остается

заметить, что rank A = dim L(a1, . . . , an) è rank [A, b] = dim L(a1, . . . , an, b). 2

7.9Общее решение системы линейных алгебраических уравнений

Åñëè U è V два множества векторов из Rn, то суммой U + V называется множество, составленное из всевозможных сумм векторов вида u + v, ãäå u U, v V .

Теорема. Предположим, что система Ax = b совместна, и зафиксируем произвольное частное решение u (Au = b). Тогда множество всех решений системы Ax = b имеет вид u + V , где V множество всех решений соответствующей однородной системы Ax = 0.

Доказательство.

Пусть x произвольное решение системы Ax = b. Тогда, очевидно,

A(x − u) = 0

x − u V x u + V . Далее, возьмем произвольный вектор

x u + V x = u + v, v V A(u + v) = Au + Av = b + 0 = b. 2

Следствие. Общее решение совместной системы Ax = b имеет вид x = u + c1v1 + . . . + cn−rvn−r,

где u произвольное частное решение данной системы, v1, . . . , vn−r линейно незави- симые решения соответствующей однородной системы, r = rank A, а коэффициенты c1, . . . , cn−r произвольные числа.

Задача. Что можно сказать о матрице и правой части системы Ax = b относительно вектора x Rn, если ее решением является любой вектор из Rn?

ДОПОЛНИТЕЛЬНАЯ ЧАСТЬ

7.10Неустойчивость ранга

Матрица называется матрицей полного ранга, если ее ранг совпадает с одним из ее размеров (то есть, имеет максимально возможное значение). В противном случае говорят

о матрице неполного ранга.

Можно доказать, что если A åñòü m×n-матрица полного ранга, то при всех достаточ- но малых ε > 0 матрица A + F , где все элементы матрицы-возмущения F по модулю меньше ε, будет также матрицей полного ранга. Для этого достаточно заметить, что

48

Лекция 7

 

 

любой минор можно рассматривать как функцию своих элементов и это будет непрерывная функция. Если при некоторых значениях переменных непрерывная функция отлична от нуля, то она будет отлична от нуля также в некоторой достаточно малой окрестности этих значений.

В то же время, если A имеет неполный ранг, то для любого сколь угодно малого ε существует матрица-возмущение F с элементами по модулю не больше ε, для которой A + F будет матрицей полного ранга. Например, матрица

A =

0

1

0

0

 

 

1

0

0

0

 

0

0

0

0

имеет ранг 2, но для любого ε 6= 0 матрица

A =

0

1

0

0

 

 

1

0

0

0

 

0

0

ε

0

имеет, очевидно, ранг 3.

Лекция 8

8.1Исключение неизвестных

Если задана система линейных алгебраических уравнений Ax = b и требуется найти

ее общее решение или установить несовместность, то это удобнее всего сделать путем последовательного исключения неизвестных: если в каком-то уравнении коэффициент

ïðè x1 отличен от нуля, то можно исключить x1 из всех других уравнений путем вычита- ния данного уравнения, предварительно умноженного на подходящим образом выбранные коэффициенты; если среди уравнений, уже не содержащих x1, имеется уравнение

с ненулевым коэффициентом при x2, òî x2 можно аналогичным образом исключить

из всех других уравнений, кроме данного и первого уравнения, содержащего x1, è òàê

далее.

На каждом шаге исключения получается новая система, которая, очевидно, равносильна исходной. Если возникло уравнение, в котором все коэффициенты при неизвестных равны нулю, а в правой части получилось отличное от нуля число, то система не имеет решений. В противном случае система совместна и описанный способ позволяет с легкостью выписать ее общее решение.

8.2Элементарные матрицы

Каждый шаг описанного выше исключения неизвестных преобразует систему Ax = b в равносильную систему вида (P A)x = P b, ãäå P некоторая обратимая матрица. Если потребовалось k шагов, то в итоге возникает последовательность равносильных систем

Ax = b, (P1A)x = P1b, (P2P1A)x = P2P1b, . . . , (Pk . . . P2P1A)x = Pk . . . P2P1b.

Матрица коэффициентов последней системы имеет настолько простой вид, что решение соответствующей системы осуществляется уже очевидным образом.

Цель каждого шага получение дополнительных нулей, или, как часто говорят, исключение элементов в матрице преобразованной системы. Чтобы пояснить, как это

делается, рассмотрим матрицу A размеров 4 × 6, заведомо нулевые элементы будем

обозначать ноликом , произвольные элементы крестиком , а заведомо ненулевые элементы крестиком в рамочке . Если a11 6= 0, то из каждой строки с номером i > 1

можно вычесть первую с коэффициентом, дающим нуль в позиции (i, 1):

× × × × × ×

 

0

× × × × × .

×2

× × × × ×

 

 

×2

× × × × ×

× × × × × ×

7→

0

× × × × ×

 

 

 

 

 

 

× × × × × ×

 

 

0

× × × × ×

 

 

49

50

Лекция 8

 

 

В дальнейшем первые строка и столбец остаются без изменений. Если во втором столбце имеется не нуль, делаем соответствующую строку второй и с ее помощью исключаем все остальные элементы второго столбца:

0

×2

× × × ×

 

0 ×2

× × × × .

 

×2

× × × × ×

 

 

×2 × × × × ×

0

× × × × ×

7→

0

0

× × × ×

 

 

 

 

 

 

 

 

 

 

0

× × × × ×

 

 

0

0

× × × ×

 

 

 

 

Первые два столбца и первые две строки меняться больше не будут. Может случиться так, что у нас получились внеплановые нулевые столбцы. Например, если оставшиесякрестики в третьем и четвертом столбцах оказались нулями, то следует проводить исключение с помощью ненулевого элемента в пятом столбце (если таковой есть):

0

×2 × × × ×

 

 

0

×2 × × × × .

 

×2

× × × × ×

 

 

×2

× × × × ×

 

0 0

0

0

 

7→

0

0

0

0

0

 

 

0

0

0

0

2

 

0

0

0

0

2

 

 

 

 

 

 

 

 

 

 

 

 

× ×

 

 

 

 

 

× ×

 

 

 

 

 

 

 

 

 

 

 

× ×

 

 

 

 

 

 

×

Кажый шаг, очевидно, сводится к умножению матрицы слева на некоторую матрицу Pl. При этом каждая из матриц Pl, 1 ≤ l ≤ k, может быть представлена как произведение двух матриц:

Pl = ZlΠl,

ãäå Zl отличается от I (единичной матрицы) только в позициях ниже главной диагонали какого-то одного (пусть j-го) столбца:

Zl =

 

1 ...

 

 

,

 

(Zl)j+1 j

 

 

 

 

 

 

 

 

 

 

1

...

 

 

 

 

. . .

1

 

 

 

 

(Zl)nj

 

 

 

 

 

 

 

 

 

 

 

 

 

 

à Πl получается из I перестановкой столбцов (или строк). Матрицы Πl è Zl указанного специального вида будем для краткости называть элементарными матрицами; матри-

öà Πl называется матрицей перестановки, à Zl матрицей модификации строк. Èõ

роль в процессе исключения объясняется следующими фактами:

матрица ΠlA отличается от A перестановкой строк;

åñëè Zl отличается от единичной матрицы j-м столбцом, то матрица ZlA имеет первые j строк те же, что и в матрице A, а i-я строка при i > j есть сумма i-й строки и взятой с некоторым коэффициентом j-й строки матрицы A.

Утверждение 1. Любая матрица перестановки Π обратима и при этом

Π−1 = Π>.

0 · s1 i2

Е. Е. Тыртышников

51

 

 

Утверждение 2. Любая матрица модификации строк Z = Zl обратима и при этом обратная матрица получается из Z изменением знаков поддиагональных элементов:

Z−1 =

 

1 ...

 

 

 

 

 

 

 

 

(Zl)j+1 j

 

 

 

,

 

 

 

1

 

 

 

 

 

 

 

 

 

...

 

 

 

 

 

 

 

. . .

 

1

 

 

 

 

 

 

(Zl)nj

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Доказательство сводится к непосредственной проверке равенств ΠΠ−1 = I, ZZ−1 = I.

8.3Ступенчатые матрицы

Будем говорить, что матрица S = [sij] размеров m Ч n является верхней ступенчатой с числом ступеней k, если существуют номера 1 ≤ j1 < . . . < jk ≤ m, для которых:

åñëè 1 ≤ i ≤ k, òî sij 6= 0 ïðè j = ji è sij = 0 ïðè âñåõ 1 ≤ j ≤ ji − 1;

åñëè k + 1 ≤ i ≤ m, òî sij = 0 ïðè âñåõ 1 ≤ j ≤ n.

Матрица S называется нижней ступенчатой с числом ступеней k, если S> является верхней ступенчатой с числом ступеней k.

Утверждение. Ранг ступенчатой матрицы с числом ступеней k равен k.

Доказательство. Рассмотрим верхнюю ступенчатую матрицу S и докажем, что ее строчный ранг (размерность линейной оболочки строк) равен числу ступеней k. Ясно, что S имеет ровно k ненулевых строк. Докажем, что эти строки линейно независимы. Приравняем нулю их линейную комбинацию с коэффициентами α1, . . . , αk:

1, . . . , αk]S = [0, . . . , 0].

Отсюда

α1 s1i1 = 0 α1 = 0.

Далее,

+ α2s2 i2 = 0 α2 = 0.

Продолжая подобным образом, находим α1 = . . . = αk = 0. В случае нижней ступенча- той матрицы S ее столбцовый ранг, очевидно, совпадает со строчным рангом верхней ступенчатой матрицы S>. 2

8.4Приведение к ступенчатой форме

Теорема 1. Для любой mЧn-матрицы A ранга r существует обратимая матрица P ,

представимая в виде произведения конечного числа элементарных матриц и такая, что матрица S = P A является верхней ступенчатой с числом ступеней r.

Доказательство. Обозначим через j1 номер первого столбца матрицы A, в котором есть хотя бы один ненулевой элемент. (Если таковой столбец отсутствует, то A = 0 и теорема уже доказана.) С помощью умножения слева на некоторую матрицу перестановки

Z1 можно получить матрицу
(1, j1). Далее с помощью умно-
Лекция 8

52

Π1 ненулевой элемент можно переместить в позицию жения слева на некоторую матрицу модификации строк

с нулями в поддиагональных позициях j1-ãî столбца и сохранением нулей в предыдущих столбцах. Очевидно, преобразованная матрица имеет блочный вид (через 0p×q ìû обозначаем нулевой блок размеров p × q)

Z1Π1A =

0(m−1)×(i1−1)

B

,

u R

 

 

 

×

.

 

01×(i1−1)

u>

 

 

(n

 

i1

+1)

1

 

Сделаем индуктивное предположение о существовании матрицы Q, являющейся про-

изведением элементарных матриц порядка m − 1 и такой, что QB имеет верхнюю ступенчатую форму. Рассмотрим матрицу

P =

0

Q Z1Π1.

 

1

0

Легко видеть, что P есть произведение элементарных матриц и при этом S = P A имеет верхнюю ступенчатую форму. Пусть число ступеней равно k. Значит, строчный ранг матрицы S равен k k = rank S = rank A = r. 2

Теорема 2. Для любой mЧn-матрицы A ранга r существует обратимая матрица Q,

представимая в виде произведения конечного числа элементарных матриц и такая, что матрица AQ> является нижней ступенчатой с числом ступеней r.

Доказательство. Достаточно применить теорему 1 к матрице A> и заметить, что если матрица QA> верхняя ступенчатая, то матрица (QA>) = AQ> будет нижней ступенчатой.

8.5Приведение к диагональной форме

Теорема. Для любой m Ч n-матрицы A ранга r существуют обратимые матрицы P и Q, представимые в виде произведения конечного числа элементарных матриц и такие, что матрица B = P AQ> имеет ненулевые элементы b11, . . . , brr, а все остальные ее элементы равны нулю.

Доказательство. Сначала приведем A к верхней ступенчатой форме S = P A, а затем заметим, что нижняя ступенчатая форма SQ>, получаемая согласно построениям

теоремы 2, будет иметь требуемую диагональную форму. 2

8.6Эквивалентные матрицы

Матрицы A è B называются эквивалентными, если существуют обратимые матрицы P è Q такие, что B = P AQ.

Теорема. Матрицы A и B эквивалентны тогда и только тогда, когда они имеют одинаковые размеры и одинаковые ранги.

Доказательство. В силу теоремы о приведении к диагональной форме, каждая из матриц A è B эквивалентна прямоугольной диагональной матрице обозначим их че-

ðåç DA è DB. При этом очевидно, что DA è DB эквивалентны тогда и только тогда, когда они имеют одинаковое число ненулевых диагональных элементов. Последнее означает,

÷òî rank DA = rank DB. Остается учесть, что rank A = rank DA è rank B = rank DB. 2

получении одного нуля в i столбце равно

Е. Е. Тыртышников

53

 

 

8.7Метод Гаусса и LU-разложение

Рассмотренный выше метод исключения неизвестных обычно называют методом Гаусса. Пусть он применяется к системе Ax = b с невырожденной матрицей A. В данном

случае верхняя ступенчатая матрица, к которой приводится матрица A, оказывается верхней треугольной матрицей.

Метод исключения неизвестных можно трактовать как метод исключения элементов матрицы с целью приведения ее к более простому виду. Если можно обойтись без пере-

становки уравнений (строк матрицы), то метод Гаусса для матрицы порядка n состоит

в последовательном исключении элементов в столбцах от 1-го до n − 1-го и приводит к равносильной системе

(Zn−1 . . . Z2Z1A)x = Zn−1 . . . Z2Z1b,

( )

ãäå Z1, . . . , Zn−1 матрицы модификации строк, причем Zi отличается от I в точности

i-м столбцом. Каждая из матриц Z1, . . . , Zn−1 является нижней треугольной, поэтому их произведение

Lb = Zn−1 . . . Z1

является также нижней треугольной матрицей. Матрица коэффициентов системы ( )

U = Zn−1 . . . Z1A = Lb A

является верхней треугольной. Матрица L = Lb−1 является также нижней треугольной.

Следовательно, метод Гаусса порождает разложение матрицы A в произведение нижней

и верхней треугольной матриц

A = LU.

Ïðè ýòîì L имеет на главной диагонали единицы, а U является невырожденной матрицей (в силу невырожденности A). Такое разложение называется LU-разложением.

Подсчитаем число арифметических операций при приведении A к верхней треугольной матрице U. Íà i-м шаге требуется получить n − i нулей ниже диагонали в i-м столбце. При получении нуля на пересечении i-го столбца и l-й строки при l > i èç l

строки вычитается i-я строка, предварительно умноженная на коэффициент, выбор ко-

торого и обеспечивает получение данного нуля. Поскольку в рассматриваемых строках может быть только n − i ненулевых элементов, число умножений (и вычитаний) при

(n − i)2. Всего потребуется

(n − 1)2 + (n − 2)2 + . . . + 12 = 13n3 + O(n2)

умножений и столько же вычитаний; через O(n2) обозначен многочлен от n степени 2.

Чтобы найти решение системы Ax = b, требуется выполнить еще два действия:

вычислить вектор Zn−1 . . . Z1b;

найти решение системы с верхней треугольной матрицей U.

Каждое из этих действий требует лишь O(n2) арифметических операций на порядок меньше, чем приведение к верхнему треугольному виду.

Задача. Невырожденная матрица и обратная к ней разбиты на блоки одинаковых размеров:

A =

A21

A22

, A−1

=

B21

B22 .

 

A11

A12

 

 

B11

B12

54

Лекция 8

 

 

Доказать, что блок A11 невырожден тогда и только тогда, когда невырожден блок

B22.

ДОПОЛНИТЕЛЬНАЯ ЧАСТЬ

8.8LU-разложение и строго регулярные матрицы

Допустим, что невырожденная матрица A имеет LU-разложение: A = LU. Обозначим через Ak, Lk, Uk подматрицы порядка k, расположенные в левом верхнем углу матриц A, L, U, соответственно, и рассмотрим равенство блочных матриц

A ≡

Qk

Ak

 

=

Vk

Lk

 

0k

Uk

.

 

A

P

 

 

L

0

 

U

W

 

Отсюда вытекает, что

e

e

e

 

Ak = LkUk,

k = 1, . . . , n.

 

Очевидно, что матрицы Lk è UK невырожденные (как треугольные матрицы с ненулевой диагональю). Поэтому подматрица Ak должна быть невырожденной. Матрица A, â которой все подматрицы Ak невырожденные, называется строго регулярной.

Таким образом, для существования LU-разложения невырожденной матрицы A

необходимо, чтобы она была строго регулярной.

Можно доказать, что это условие является также и достаточным. В самом деле, пусть уже построено LU-разложение для подматрицы Ak = LkUk. Тогда

 

 

Lk−1

0

Ak P

=

Uk Lk−1P

 

,

 

 

 

1

P.

(#)

QAk−1

I

Q

Ak

0

W

 

W = Ak − QAk

 

 

 

 

 

 

 

 

 

 

 

 

 

e

 

 

 

 

Áëîê W называется

дополнением по Шуру

блока Ak в матрице A. Из равенства (#)

 

 

e

 

 

 

 

и строгой регулярности A можно вывести, что W является также строго регулярной

матрицей. Предположим, что для

 

уже построено

 

-разложение

W = LekUek. Тогда

положим

 

L =

 

Lk

0 W

 

I

0

,

 

LU

 

Uk Lk−1P

 

 

−QAk−1Lk I

 

0 Lk

U =

0 Uk

.

 

 

 

Полученная таким образом матрица L

верхняя треугольная. Равенство

LU = A

ïðî-

e

 

 

 

 

e

 

 

веряется прямым вычислением.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача.

Пусть A невырожденная матрица порядка n è A(I, J) ее невырожденная подмат-

рица на строках и столбцах, определенных системами номеров I

= (i1, . . . , ik) è J = (j1, . . . , jk),

соответственно. Пусть k < n, à I0 è J0 дополнительные системы номеров. Доказать, что

 

 

 

det A−1(I0, J0)

=

(−1)i1+...+ik+j1+...+jk

det A(I, J)/ det A.

 

 

 

 

Лекция 9

9.1Метод координат

Нашим исследованиям линейной зависимости и линейных оболочек векторов (матрицстолбцов) можно дать наглядную геометрическую интерпретацию. Как скоро выяснится, определитель также имеет замечательный геометрический смысл. Особенно важно то, что алгебраизация геометрических понятий дает мощный алгебраический инструмент для решения задач геометрии.

К основным объектам геометрии относятся точки, прямые и плоскости в геометри- ческом пространстве. Если A è B точки прямой, то пусть [AB] обозначает отрезок

прямой множество точек данной прямой, расположенных между точками A è B; |AB|длина отрезка [AB].

Будем опираться на то, что между вещественными числами и точками прямой существует взаимно-однозначное соответствие x ↔ P (x), которое полностью определяется

заданием двух точек P (0), P (1) и обладает следующими свойствами:

åñëè x 6= 0 и точки P (x) è P (1) находятся по одну сторону от точки P (0), òî x > 0;

в противном случае x < 0;

|P (0)P (x)| = |x| |P (0)P (1)|.

Прямую, для которой установлено указанное соответствие, будем называть числовой

îñüþ, а число x координатой точки P (x).

Заметим, что при выборе произвольного вещественного числа a соответствие x ↔

P (x + a) будет также взаимно-однозначным. Это позволяет переносить точку P (0) в любую заданную точку данной прямой.

Рассмотрим прямые l1, l2, l3, проходящие через общую точку O и не лежащие в одной плоскости. Пусть каждая из этих прямых является числовой осью с соответствиями

x ↔ P1(x), y ↔ P2(y), z ↔ P3(z),

дающими общую точку P1(0) = P2(0) = P3(0) = O. Пусть (x, y, z) система трех вещественных чисел, определяющих точки X = P1(x), Y = P2(y), Z = P3(z) на прямых l1, l2, lz, соответственно. Рассмотрим три плоскости:

π1 плоскость, проходящая через точку X параллельно прямым l2 è l3;

π2 плоскость, проходящая через точку Y параллельно прямым l1 è l3;

π3 плоскость, проходящая через точку Z параллельно прямым l1 è l2.

55

56 Лекция 9

Легко видеть, что плоскости π1, π2, π3 пересекаются в одной точке M = M(x, y, z). Таким образом устанавливается взаимно-однозначное соответствие

(x, y, z) ↔ M(x, y, z).

Точки X, Y, Z называются проекциями точки M на прямые l1, l2, l3 параллельно плос- костям, соответственно, π1, π2, π3. Числа x, y, z называются координатами точки M = M(x, y, z), а система числовых осей l1, l2, l3 аффинной системой координат. Точка O называется началом (èëè центром) системы координат.

Эпитет аффинная по отношению к системе координат означает только то, что углы между осями могут не быть прямыми, а длины отрезков [OP1(1)], [OP2(1)], [OP3(1)] не обязательно равные. Если углы между осями прямые, а длины указанных отрезков равны 1, то система координат называется декартовой.

9.2Направленные отрезки

Любую упорядоченную пару точек A, B будем называть направленным отрезком ñ íà-

−→

чалом в точке A è концом в точке B. Обозначение: AB.

Если имеется система координат с началом в точке O, то направленный отрезок

−→

âèäà OA называется радиус-вектором точки A. Координаты точки A называются также

−→

координатами радиус-вектора OA.

Точка A 6= B разбивает прямую AB íà äâà ëó÷à: ëó÷ [AB), состоящий из точек данной прямой, лежащих вместе с B по одну сторону от A и дополнительный луч,

состоящий из точек, лежащих по другую сторону (точка A для двух лучей являет-

ся общей). Два луча на одной прямой называются одинаково направленными, если их пересечение является лучом (и противоположно направленными, если их пересечение

является отрезком). Если прямые AB è CD не совпадают, то лучи [AB) è [CD) называются одинаково направленными, если эти прямые параллельны и точки B è D лежат

по одну сторону от прямой AC.

−→

Предположим, что A 6= B, рассмотрим отрезок AB, и пусть C произвольная точка. Проведем через C прямую, параллельную прямой AB или совпадающую с ней в случае C AB. На этой прямой можно найти ровно две точки D1 è D2 такие, что

|CD1| = |CD2| = |AB|. Выберем из них такую точку D {D1, D2}, для которой лучи

−→

[AB) è [CD) одинаково направлены. Направленный отрезок CD будем считать равным

−→

 

−→

−→

 

AB. (Часто говорят также, что CD получается из AB параллельным переносом.)

−→

 

 

 

−→

Данным построением не охвачен случай A = B. Направленные отрезки AA è CC

будем считать равными по определению и называть их нулевыми.

−→

 

 

 

−→

Отметим формальную несимметричность в данном определении: CD равен AB,

−→

−→

 

 

 

но будет ли AB равен CD?

Ответ, к счастью, положительный в силу того, что

направленный отрезок

−→

 

−→

 

AB получается из CD с помощью точно такой же конструкции.

Заметим, что все случаи при определении равенства направленных отрезков можно свести к одному случаю, если принять формально другое (и притом симметрич-

−→ −→

ное ) определение: назовем направленные отрезки AB è CD равными, если середины отрезков [AD] è [BC] совпадают. Эквивалентность нового определения предыдущему

Соседние файлы в папке лИТЕРАТУРА