все лекции по линалу
.pdfПусть ϕ и ψ – линейные операторы в векторном пространстве Rn. Напомним, что суммой этих линейных операторов называется отображение ϕ + ψ, действующее (по определению) сле-
дующим образом:
x → (ϕ + ψ)(x) = ϕ(x) + ψ(x).
Вфиксированном базисе u1, …, un каждый оператор описывается своей матрицей. Пусть А
–матрица оператора ϕ, В – оператора ψ и С – оператора ϕ + ψ.
Столбцы этих матриц – |
образы базисных векторов u1, …, |
un в координатной записи: |
||||||||||
|
|
K |
|
|
|
K |
|
|
|
|
K |
|
A = |
|
ϕ(u ) |
|
; B = |
|
ψ(u ) |
|
; C = |
|
ϕ(u ) + ψ(u ) |
. |
|
|
|
i |
|
|
|
i |
|
|
|
i |
i |
|
|
|
K |
|
|
|
K |
|
|
|
|
K |
|
|
|
|
|
|
|
|
|
|
|
Следовательно, С = А + В, т.е. cij = aij + bij. Мы видим, что при сложении операторов их матрицы складываются. Аналогично при умножении оператора на скаляр (определение: (λϕ)(x) = λϕ(x)) его матрица умножается на этот скаляр (докажите!).
§8.3. Переход к другому базису
8.3.1.Матрица перехода
Пусть u1, …, un и v1, …, vn − различные базисы пространства Rn (будем называть их соответственно старым базисом и новым базисом). Векторы v1, …, vn, как и все остальные векторы пространства Rn, имеют свои координаты в базисе u1, …, un и записываются как линейные комбинации базисных векторов:
v1 = p11u1 + p21u2 + … + |
pn1un; |
v2 = p12u1 + p22u2 + … + |
pn2un; |
…
|
|
|
|
|
vn = p1nu1 + p2nu2 + … + pnnun. |
|
|
p |
K |
p |
|
|
|
||
|
11 |
|
1n |
называется матрицей перехода от базиса u1, …, |
un к базису v1, |
||
Матрица P = |
K |
K |
K |
|
|||
p |
K |
p |
|
|
|
|
|
|
n1 |
|
|
nn |
|
|
…, vn. Это матрица, в столбцах которой стоят координаты векторов нового базиса в старом базисе, т. е. столбцы матрицы P − это изображения векторов v1, …, vn нового базиса в старом базисе. (Обратите внимание, что матрица P является транспонированной по отношению к матрице коэффициентов написанных выше разложений.)
8.3.2. Изменение координат вектора при переходе к другому базису
Рассмотрим произвольный вектор x пространства Rn и разложим его по базисам u1, …, un и v1, …, vn:
n |
n |
x = ∑ xiui = ∑ x/j vj. |
|
i=1 |
j =1 |
P = ( p ji ) − матрица перехода от старого базиса к новому, и
|
|
n |
|
|
|
|
vj = ∑ pij ui; |
|
|
|
|
i=1 |
|
|
n |
n |
n |
n |
n |
x = ∑ xiui = ∑ |
x/j ∑ pij ui = |
∑ |
∑ x/j pij ui = |
|
i=1 |
j =1 |
i=1 |
j =1 |
i=1 |
n |
n |
n |
n |
= ∑ |
∑ |
x/j pij ui = ∑ |
( ∑ x/j pij ) ui. |
i=1 |
j =1 |
i=1 |
j =1 |
Так как координаты вектора в данном базисе определены однозначно, то xi =
n
= ∑ x/j pij , т. е.
j =1
x1 |
= p11 x / |
+ p12 x / |
+ … + p1n x / |
; |
|
1 |
2 |
n |
|
x2 |
= p21 x / |
+ p22 x / |
+ … + p2n x / |
; |
|
1 |
2 |
n |
|
|
|
… |
|
|
xn = pn1 x / |
+ pn2 x / |
+ … + pnn x / . |
||
|
1 |
2 |
n |
|
В матричном виде эти соотношения записываются как
x |
|
x / |
|
|
|
||
|
1 |
|
|
1 |
|
X = P X ′ . |
(4) |
|
Κ |
|
= P |
Κ |
, |
||
|
|
|
|
/ |
|
|
|
xn |
xn |
|
|
Здесь X и X ′ − матрицы-столбцы, являющиеся изображениями вектора x в старом и новом базисах соответственно.
Формула (4) называется формулой преобразования координат вектора при переходе от одного базиса к другому.
8.3.3. Невырожденность матрицы перехода
Пусть P − матрица перехода от старого базиса u1, …, un к новому v1, …, vn, а P1 − матрица перехода от нового базиса к старому. Как только что было доказано, X = P X ′ , где X и X ′ − мат- рицы-столбцы, являющиеся изображениями произвольного вектора x в старом и новом базисах соответственно. Но из тех же соображений имеет место формула X ′ = P1X. Продолжая равенство, имеем:
|
|
|
E X ′ = X ′ = P1X = P1(P X ′ ) = (P1P) X ′ . |
||||
Так как столбец X ′ произволен, |
по лемме 2 имеем P1P = |
E. Аналогично доказывается |
|||||
равенство PP1 = E. Таким образом, матрицы P и P1 взаимно обратны и, следовательно, невырож- |
|||||||
денны (det P ≠ 0). Значит, P1 = P−1 , и из формулы (4) легко получаем: |
|
||||||
x / |
|
x |
|
|
|
||
|
1 |
|
|
1 |
|
X ′ = P−1 X. |
(5) |
|
Κ |
|
= P−1 |
Κ |
, |
||
|
/ |
|
|
|
|
|
|
xn |
|
xn |
|
|
Лекция № 20 (14.05.10)
8.3.4. Изменение матрицы линейного оператора при переходе к другому базису
− матрицы этого оператора в первом и
во втором базисах. Пусть x − произвольный вектор пространства V и y = ϕ(x); тогда в первом и во втором базисах можно записать:
y |
|
x |
|
y / |
|
x / |
|
||||
|
1 |
|
|
1 |
|
|
1 |
|
|
1 |
|
|
Κ |
= Aϕ |
Κ |
|
; |
Κ |
= |
Aϕ/ |
Κ |
. |
|
|
|
|
|
|
|
|
/ |
|
|
/ |
|
yn |
xn |
yn |
xn |
Используя формулу (4), первое из равенств запишем в виде:
|
|
y / |
|
|
|
x / |
|
|
|||
|
|
|
1 |
|
|
|
|
1 |
|
|
|
|
P |
Κ |
= AϕP Κ |
, |
|
||||||
|
|
|
/ |
|
|
|
|
/ |
|
|
|
|
|
yn |
|
|
xn |
|
|
||||
или, так как матрица P обратима, в виде: |
|
|
|
|
|
|
|
|
|
||
|
y / |
|
|
|
|
|
x / |
|
|
||
|
|
1 |
|
|
|
|
|
|
1 |
|
|
|
|
Κ |
= P−1 |
AϕP |
Κ |
. |
|||||
|
|
/ |
|
|
|
|
|
|
/ |
|
|
|
yn |
|
|
|
|
|
xn |
|
|||
Отсюда получаем: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x / |
|
|
|
x / |
|
||
|
|
|
|
|
1 |
|
|
|
|
1 |
|
|
P−1 A P |
Κ |
|
= |
/ |
Κ |
. |
||||
|
|
ϕ |
|
|
/ |
|
|
Aϕ |
|
/ |
|
|
|
|
|
xn |
|
|
xn |
|
|||
Следовательно, P−1 A P = |
/ . |
|
|
|
|
|
|
|
|
|
|
ϕ |
Aϕ |
|
|
|
|
|
|
|
|
|
|
§8.4. Обратный оператор
8.4.1.Ядро линейного оператора
Пусть в пространстве Kn действует линейный оператор φ. Ядром оператора φ (обозначается Ker φ) называется множество всех тех и только тех векторов пространства, которые под действием данного оператора переходят в нуль:
Ker φ = {x Kn: φ(x) =0}.
Легко проверить, что ядро всегда является линейным подпространством в Kn (проверьте!).
Пусть A − матрица данного оператора в каком-нибудь базисе, X − изображение вектора x в том же базисе. Тогда для нахождения ядра получаем матричное уравнение (см. п. 8.2.5):
AX = 0.
Мы видим, что это есть однородная линейная система уравнений, матрица которой есть A. Это один из возможных способов нахождения ядра. Если в качестве базиса взять стандартный, то изображение вектора x – это сам вектор x. Следовательно, решения написанной выше системы уравнений – это в точности векторы ядра. Поскольку размерность подпространства решений равна числу свободных неизвестных в соответствующей приведённой к ступенчатому виду системе, по-
лучаем, что dim Ker φ = n – rk A.
8.4.2. Понятие обратного оператора
Пусть φ − линейный оператор в Kn, который является биективным отображением (и, следовательно, для него существует обратное отображение ψ).
Теорема. Отображение, обратное к линейному оператору, само является линейным опера-
тором.
Для доказательства равенства ψ(x + y) = ψ(x) + ψ(y) применим к нему оператор φ:
φ(ψ(x + y)) = φ(ψ(x) + ψ(y)).
Если мы докажем это новое равенство, то в силу инъективности отображения φ из него будет следовать и предыдущее (доказываемое) равенство. Но
φ(ψ(x + y)) = (φψ)(x + y) = ε(x + y) = x + y;
φ(ψ(x) + ψ(y)) = φ(ψ(x)) + φ(ψ(y)) = (φψ)(x) + (φψ)(y) = ε(x) + ε(y) = x + y.
Вторая часть определения линейности (умножение на скаляр) доказывается аналогично.
Определение. Линейный оператор ψ, являющийся обратным отображением к данному биективному линейному оператору φ, называется оператором, обратным к φ, и обозначается φ−1 .
Теорема. Матрицы взаимно обратных линейных операторов в каком-нибудь одном базисе взаимно обратны.
Доказательство. Пусть φ и ψ − данные взаимно обратные линейные операторы. Тогда
AφAψ = Aφψ = Aε = E; AψAϕ = Aψϕ = Aε = E, QED.
8.4.3. Базис и размерность образа линейного оператора
Пусть в пространстве Kn даны базис u1, u2, …, un и какой-либо линейный оператор ϕ.
Предложение. Im ϕ = ‹ ϕ(u1), ϕ(u2), …, ϕ(un)›.
Доказательство. Каждый ϕ(ui) Im ϕ; следовательно, по минимальному свойству линейной оболочки Im ϕ ‹ ϕ(u1), ϕ(u2), …, ϕ(un)›. Обратно, пусть y Im ϕ; тогда y = ϕ(x) для некоторого подходящего x Kn. Пусть
x = x1u1 + x2u2 + … + xnun;
тогда
y = ϕ(x) = x1ϕ(u1) + x2ϕ(u2) + … + xnϕ(un) ‹ϕ(u1), ϕ(u2), …, ϕ(un)›.
Предложение. Размерность образа линейного оператора равна рангу матрицы этого оператора в произвольном базисе.
Доказательство. В самом деле, dim Im ϕ = rk (ϕ(u1), ϕ(u2), …, ϕ(un)) (по предыдущему предложению и по следствию предыдущего пункта). Последнее же число равно рангу матрицы
этого оператора в базисе u1, u2, …, un (по определению ранга матрицы и по определению матрицы оператора).
Следствие. Ранг матрицы линейного оператора не зависит от выбора базиса.
Доказательство. Это очевидным образом вытекает из предыдущего предложения, поскольку ранг матрицы оператора в любом базисе равен размерности образа, которая (да и сам образ!) от выбора базиса не зависит.
8.4.4. Связь между размерностями ядра и образа |
|
Теорема. Эта связь выражается формулою: |
|
dim Ker ϕ + dim Im ϕ = n. |
(1) |
Здесь n − размерность всего пространства (Kn). |
|
Доказательство. Возьмем произвольный базис u1, u2, …, |
un всего пространства. Пусть A − |
матрица данного оператора в этом базисе. Тогда |
|
dim Im ϕ = rk A |
(2) |
(предложение предыдущего пункта); с другой стороны, |
|
dim Ker ϕ = n − rk A |
(3) |
(см. п. 8.4.1). Складывая (2) и (3), получаем (1), QED. |
|
§8.5. Собственные значения и собственные векторы
8.5.1.Определения собственного значения и собственного вектора
Определение. Пусть в пространстве Kn дан линейный оператор ϕ. Вектор x называется
собственным вектором оператора ϕ, если
1)x ≠ 0;
2)существует такое число λ из основного поля K, что
ϕ(x) = λx.
Число λ называется при этом собственным значением оператора.
Предложение. Для данного собственного вектора его собственное значение определяется единственным образом.
Доказательство. В самом деле, пусть ϕ(x) = λx = µx; тогда (λ − µ)x = λx − µx = 0, откуда,
т. к. x ≠ 0, λ − µ = 0, т. е. λ = µ, QED.
Заметим, что над полем действительных чисел линейный оператор может и не иметь собственных значений. Пример: в двумерном пространстве поворот всех векторов плоскости вокруг начала координат на угол 90°. Ни один вектор (кроме нулевого) не переходит в коллинеарный. Над полем же комплексных чисел любой оператор имеет собственное значение (об этом см. ниже).
8.5.2. Нахождение собственных значений и собственных векторов
Рассмотрим базис u1, u2, …, un пространства Kn и запишем вектор x и матрицу оператора ϕ в этом базисе:
x = x1u1 + … + xnun.
x1
Матрица-столбец X = Κ является изображением вектора x в этом базисе.xn
|
a |
K |
a |
|
(u) |
11 |
|
1n |
|
А = Aϕ |
= K |
K K |
. |
|
|
|
K |
|
|
|
an1 |
ann |
Так как действие оператора ϕ на вектор x описывается с помощью матрицы A следующим образом:
Y = AX,
где Y − матрица-столбец, изображающая вектор ϕ(x) в нашем базисе (см. п. 8.2.5), то для собст-
x1
венного вектора x = Κ оператора ϕ, соответствующего собственному значению λ, имеем:xn
X ≠ 0, AX = λX.
Переписываем это иначе:
AX = λ(EX);
AX = (λE)X;
AX − ( λE)X = 0;
(A − λE)X = 0.
Последнее равенство можно рассматривать как однородную линейную систему уравнений с параметром λ:
(a11 − λ)x1 + K |
+a1n xn |
= 0; |
||
|
K |
K |
K |
K |
|
||||
|
an1 x1 + |
K |
+(ann − λ)xn = 0. |
|
|
Это система линейных уравнений для нахождения собственных векторов оператора ϕ, соответствующих собственному значению λ. Матрица этой системы есть A − λE. Поскольку мы интересуемся существованием ненулевых (нетривиальных) решений этой системы (собственные векторы не могут быть нулевыми), необходимым и достаточным условием для этого является равенство det (A − λE) = 0. В самом деле, при выполнении этого равенства r = rk (A − λE) < n и размерность подпространства решений нашей системы равна n − r > 0, т.е. имеются ненулевые решения системы − собственные векторы, соответствующие собственному значению λ. Обратно, если det (A − λE) ≠ 0, то по теореме Kramer’ а наша система имеет единственное, т. е. нулевое, решение.
Итак, условие det (A − λE) = 0 можно рассматривать как уравнение для определения собственных значений λ. В развёрнутом виде оно выглядит так:
a11 − λ |
K |
a1n |
|
|
|
||||
K |
K |
K |
|
= 0. |
an1 |
K |
ann − λ |
|
|
Это уравнение называется характеристическим уравнением. Рассмотрим теперь левую часть этого уравнения, т. е. определитель матрицы A − λE. Это число, которое зависит от λ, т.е. det (A − − λE) является функцией от λ. Используя определение определителя матрицы, легко понять, что det (A − λE) является многочленом степени n, называемым характеристическим многочленом оператора.
Предложение. Левая часть характеристического уравнения представляет собою многочлен, старший член которого равен (−1) nλn.
Доказательство. В самом деле, вспомним, что определитель по определению есть сумма своих членов, каждый из которых есть взятое с определённым знаком произведение n элементов матрицы такое, что в каждой строке и в каждом столбце стоит по одному из выбранных элементов.
Поскольку каждый элемент нашей матрицы есть многочлен степени не выше 1 (либо число, либо выражение aii − λ), то каждый член определителя есть многочлен степени не выше n. При этом многочлен степени ровно n получится только если взять все элементы на главной диагонали. В этом случае старший член произведения и есть (−1) nλn. Предложение доказано.
Лекция № 21 (21.05.10)
8.5.3. Инвариантность характеристического многочлена относительно выбора базиса
Лемма. Определители двух взаимно обратных квадратных матриц суть взаимно обратные
числа:
det C−1 = (det C)−1 .
Доказательство.
1 = det E = det (CC−1 ) = det C × det C−1 ,
откуда получаем требуемое.
Теорема. Характеристический многочлен линейного оператора не зависит от выбора базиса (одинаков для всех базисов).
Доказательство. Пусть в пространстве Kn дан линейный оператор j и даны два базиса (u) и (v). Пусть также C − матрица перехода от первого базиса ко второму. Соответственно матрицы нашего линейного оператора в этих двух базисах обозначим A = Aϕ(u) и B = Aϕ(v) . Тогда
det (B − λE) = det (C−1 AC − C−1 (λE)C) = det (C−1 (A − λE)C) = det C−1 ×det (A − λE)×det C =
=det (A − λE), QED.
§8.6. Кое-что о многочленах
8.6.1.Простейшие свойства
Мы предполагаем известными из курса средней школы действия над многочленами (сложение, вычитание, умножение), понятия старшего члена, степени многочлена, умение делить многочлен на многочлен с остатком («уголком»). Вот два утверждения, которые будут использоваться.
Старший член произведения двух многочленов равен произведению их старших членов. Степень произведения двух многочленов равна сумме их степеней. (Степень многочлена f будем обозначать deg f.)
8.6.2. Деление с остатком. Теорема Bezout
Теорема (без доказательства, известна из курса средней школы). Если даны два многочлена f и g, причем многочлен g не равен нулю, то f можно разделить на g с остатком, что означает существование таких многочленов q и r, что выполняется тождество:
f(x) ≡ g(x)q(x) + r(x),
причём deg r < deg g либо r = 0. Многочлены q и r с указанными свойствами определяются единственным образом и называются соответственно частным и остатком.
Говорят, что многочлен f делится (без остатка) на многочлен g ≠ 0, если r(x) = 0, т. е. если существует такой многочлен q, что выполняется соотношение f(x) ≡ g(x)q(x).
Теорема (E. Bezout). Число α является корнем многочлена f(x) тогда и только тогда, когда f(x) делится на x − α.
Доказательство. Разделим f(x) на g(x) = x − α с остатком:
f(x) ≡ (x − α)q(x) + r(x),
где deg r < deg g либо r = 0. Поскольку deg g(x) = deg (x − α) = 1, то deg r(x) = 0 либо r = 0. В обоих случаях r(x) есть константа: r(x) = c, где c есть число (действительное или комплексное). Таким образом, имеем:
f(x) ≡ (x − α)q(x) + c. |
(1) |
Подставляя α вместо x в тождество (1), имеем: f(α) = c, откуда
f(x) ≡ (x − α)q(x) + f(α). |
(2) |
Пусть теперь α является корнем многочлена f(x); тогда f(α) = 0 и из тождества (2) получаем: f(x) ≡ ≡ (x − α)q(x), т. е. f(x) делится на x − α. Обратно, пусть f(x) делится на x − α; тогда в тождестве (2) f(α) = 0 (остаток определяется однозначно), что означает, что α − корень f(x), QED.
8.6.3. Разложение многочлена
Напомним формулировку основной теоремы алгебры.
Теорема. Над полем комплексных чисел любой многочлен, степень которого ≥ 1 (т. е. не константа), имеет хотя бы один корень.
Следствие 1. Над полем комплексных чисел любой многочлен, степень которого ≥ 1, разлагается на линейные множители:
f(x) = anxn + … + a0 = an(x − α1)(x − α2)…( x − αn).
Доказательство поведём по индукции (по n). Если n = 1, то доказывать нечего. Пусть n > 1. По основной теореме алгебры наш многочлен имеет корень α1; по теореме Bezout f(x) делится на x − α1: f(x) = (x − α1) q(x), где q(x) − многочлен степени n − 1 со старшим коэффициентом an (из тех соображений, что старший член произведения двух многочленов равен произведению их старших членов). По предположению индукции q(x) = an(x − α2)…( x − αn), откуда получаем требуемое.
Следствие 2. В пространстве Cn любой линейный оператор обладает собственным значением и собственным вектором.
Доказательство. В самом деле, характеристический многочлен имеет степень по меньшей мере 1 и, следовательно, по основной теореме алгебры имеет корень, который и будет собственным значением.
8.6.4. Понятие кратности корня
В разложении f(x) = an(x − α1)(x − α2)…( x − αn) все αi являются корнями многочлена, и других корней нет. В самом деле, если α − корень f(x), то an(α − α1)(α − α2)…( α − αn) = 0, откуда α =
= αi. С другой стороны, некоторые сомножители в вышеприведённом разложении могут повторяться. Соберём одинакие сомножители:
f(x) = an(x − β1) r1 (x − β2) r2 …( x − βs) rs .
В этом разложении все βi уже попарно различны.
Определение. В написанном выше разложении показатель ri называется кратностью корня βi многочлена f(x).
Очевидно, что сумма кратностей всех корней равна степени многочлена.
§8.7. Диагонализуемость линейного оператора
8.7.1.Основные понятия
Определение. Пусть в пространстве Kn дан линейный оператор ϕ. Оператор называется диагонализуемым (диагонализируемым), если существует базис (ξ), в котором матрица оператора диагональна (это означает, что вне главной диагонали стоят одни нули):
λ1 |
0 |
K |
||
|
0 |
λ |
|
K |
A(ξ) = |
|
|
2 |
K |
ϕ K |
K |
|||
|
0 |
0 |
K |
|
|
0
0 . K λn
Теорема. В данном базисе (ξ) матрица оператора диагональна тогда и только тогда, когда этот базис состоит из собственных векторов данного оператора. При этом λi есть собственное значение собственного вектора ξi.
Диагональ матрицы представляет собою в этом случае спектр оператора, т. е. она состоит из собственных чисел, каждое из которых повторяется на диагонали столько раз, какова его кратность в характеристическом многочлене.
Доказательство. Первая часть утверждения теоремы очевидным образом вытекает из определения матрицы оператора. Вторую часть докажем даже в более общем виде: если матрица оператора треугольна, то её главная диагональ представляет собою спектр оператора. Для доказательства воспользуемся инвариантностью характеристического многочлена и вычислим его именно в том базисе, в котором его матрица треугольна (скажем, верхняя треугольная). Пусть
λ1 |
* |
K |
||
|
0 |
λ |
|
K |
A(ξ) = |
|
|
2 |
K |
ϕ K |
K |
|||
|
0 |
0 |
K |
|
|
Тогда характеристический многочлен равен:
*. K
λn
λ1 − λ |
* |
K |
* |
|
|
||||
0 |
λ2 − λ |
K |
* |
= (−1) n(λ − λ1)(λ − λ2)…( λ − λn), QED. |
K |
K |
K |
K |
|
0 |
0 |
K |
λn − λ |
|
Заметим, что из нашей теоремы вытекает, что оператор диагонализуем тогда и только тогда, когда существует базис, состоящий из собственных векторов данного оператора.