Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

все лекции по линалу

.pdf
Скачиваний:
15
Добавлен:
08.02.2015
Размер:
2.08 Mб
Скачать

Пусть ϕ и ψ – линейные операторы в векторном пространстве Rn. Напомним, что суммой этих линейных операторов называется отображение ϕ + ψ, действующее (по определению) сле-

дующим образом:

x → (ϕ + ψ)(x) = ϕ(x) + ψ(x).

Вфиксированном базисе u1, …, un каждый оператор описывается своей матрицей. Пусть А

матрица оператора ϕ, В – оператора ψ и С – оператора ϕ + ψ.

Столбцы этих матриц –

образы базисных векторов u1, …,

un в координатной записи:

 

 

K

 

 

 

K

 

 

 

 

K

 

A =

 

ϕ(u )

 

; B =

 

ψ(u )

 

; C =

 

ϕ(u ) + ψ(u )

.

 

 

i

 

 

 

i

 

 

 

i

i

 

 

 

K

 

 

 

K

 

 

 

 

K

 

 

 

 

 

 

 

 

 

 

 

Следовательно, С = А + В, т.е. cij = aij + bij. Мы видим, что при сложении операторов их матрицы складываются. Аналогично при умножении оператора на скаляр (определение: (λϕ)(x) = λϕ(x)) его матрица умножается на этот скаляр (докажите!).

§8.3. Переход к другому базису

8.3.1.Матрица перехода

Пусть u1, …, un и v1, …, vn − различные базисы пространства Rn (будем называть их соответственно старым базисом и новым базисом). Векторы v1, …, vn, как и все остальные векторы пространства Rn, имеют свои координаты в базисе u1, …, un и записываются как линейные комбинации базисных векторов:

v1 = p11u1 + p21u2 + … +

pn1un;

v2 = p12u1 + p22u2 + … +

pn2un;

 

 

 

 

 

vn = p1nu1 + p2nu2 + … + pnnun.

 

p

K

p

 

 

 

 

11

 

1n

называется матрицей перехода от базиса u1, …,

un к базису v1,

Матрица P =

K

K

K

 

p

K

p

 

 

 

 

 

n1

 

 

nn

 

 

…, vn. Это матрица, в столбцах которой стоят координаты векторов нового базиса в старом базисе, т. е. столбцы матрицы P − это изображения векторов v1, …, vn нового базиса в старом базисе. (Обратите внимание, что матрица P является транспонированной по отношению к матрице коэффициентов написанных выше разложений.)

8.3.2. Изменение координат вектора при переходе к другому базису

Рассмотрим произвольный вектор x пространства Rn и разложим его по базисам u1, …, un и v1, …, vn:

n

n

x = xiui = x/j vj.

i=1

j =1

P = ( p ji ) − матрица перехода от старого базиса к новому, и

 

 

n

 

 

 

 

vj = pij ui;

 

 

 

 

i=1

 

 

n

n

n

n

n

x = xiui =

x/j pij ui =

x/j pij ui =

i=1

j =1

i=1

j =1

i=1

n

n

n

n

=

x/j pij ui =

( x/j pij ) ui.

i=1

j =1

i=1

j =1

Так как координаты вектора в данном базисе определены однозначно, то xi =

n

= x/j pij , т. е.

j =1

x1

= p11 x /

+ p12 x /

+ … + p1n x /

;

 

1

2

n

 

x2

= p21 x /

+ p22 x /

+ … + p2n x /

;

 

1

2

n

 

 

 

 

 

xn = pn1 x /

+ pn2 x /

+ … + pnn x / .

 

1

2

n

 

В матричном виде эти соотношения записываются как

x

 

x /

 

 

 

 

1

 

 

1

 

X = P X .

(4)

 

Κ

 

= P

Κ

,

 

 

 

 

/

 

 

 

xn

xn

 

 

Здесь X и X − матрицы-столбцы, являющиеся изображениями вектора x в старом и новом базисах соответственно.

Формула (4) называется формулой преобразования координат вектора при переходе от одного базиса к другому.

8.3.3. Невырожденность матрицы перехода

Пусть P − матрица перехода от старого базиса u1, …, un к новому v1, …, vn, а P1 − матрица перехода от нового базиса к старому. Как только что было доказано, X = P X , где X и X − мат- рицы-столбцы, являющиеся изображениями произвольного вектора x в старом и новом базисах соответственно. Но из тех же соображений имеет место формула X = P1X. Продолжая равенство, имеем:

 

 

 

E X = X = P1X = P1(P X ) = (P1P) X .

Так как столбец X произволен,

по лемме 2 имеем P1P =

E. Аналогично доказывается

равенство PP1 = E. Таким образом, матрицы P и P1 взаимно обратны и, следовательно, невырож-

денны (det P ≠ 0). Значит, P1 = P−1 , и из формулы (4) легко получаем:

 

x /

 

x

 

 

 

 

1

 

 

1

 

X = P−1 X.

(5)

 

Κ

 

= P−1

Κ

,

 

/

 

 

 

 

 

 

xn

 

xn

 

 

Рассмотрим линейный оператор ϕ, и пусть Aϕ и A/
ϕ

Лекция № 20 (14.05.10)

8.3.4. Изменение матрицы линейного оператора при переходе к другому базису

− матрицы этого оператора в первом и

во втором базисах. Пусть x − произвольный вектор пространства V и y = ϕ(x); тогда в первом и во втором базисах можно записать:

y

 

x

 

y /

 

x /

 

 

1

 

 

1

 

 

1

 

 

1

 

 

Κ

= Aϕ

Κ

 

;

Κ

=

Aϕ/

Κ

.

 

 

 

 

 

 

 

/

 

 

/

 

yn

xn

yn

xn

Используя формулу (4), первое из равенств запишем в виде:

 

 

y /

 

 

 

x /

 

 

 

 

 

1

 

 

 

 

1

 

 

 

P

Κ

= AϕP Κ

,

 

 

 

 

/

 

 

 

 

/

 

 

 

 

yn

 

 

xn

 

 

или, так как матрица P обратима, в виде:

 

 

 

 

 

 

 

 

 

 

y /

 

 

 

 

 

x /

 

 

 

 

1

 

 

 

 

 

 

1

 

 

 

 

Κ

= P−1

AϕP

Κ

.

 

 

/

 

 

 

 

 

 

/

 

 

 

yn

 

 

 

 

 

xn

 

Отсюда получаем:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x /

 

 

 

x /

 

 

 

 

 

 

1

 

 

 

 

1

 

 

P−1 A P

Κ

 

=

/

Κ

.

 

 

ϕ

 

 

/

 

 

Aϕ

 

/

 

 

 

 

 

xn

 

 

xn

 

Следовательно, P−1 A P =

/ .

 

 

 

 

 

 

 

 

 

 

ϕ

Aϕ

 

 

 

 

 

 

 

 

 

 

§8.4. Обратный оператор

8.4.1.Ядро линейного оператора

Пусть в пространстве Kn действует линейный оператор φ. Ядром оператора φ (обозначается Ker φ) называется множество всех тех и только тех векторов пространства, которые под действием данного оператора переходят в нуль:

Ker φ = {x Kn: φ(x) =0}.

Легко проверить, что ядро всегда является линейным подпространством в Kn (проверьте!).

Пусть A − матрица данного оператора в каком-нибудь базисе, X − изображение вектора x в том же базисе. Тогда для нахождения ядра получаем матричное уравнение (см. п. 8.2.5):

AX = 0.

Мы видим, что это есть однородная линейная система уравнений, матрица которой есть A. Это один из возможных способов нахождения ядра. Если в качестве базиса взять стандартный, то изображение вектора x – это сам вектор x. Следовательно, решения написанной выше системы уравнений – это в точности векторы ядра. Поскольку размерность подпространства решений равна числу свободных неизвестных в соответствующей приведённой к ступенчатому виду системе, по-

лучаем, что dim Ker φ = n – rk A.

8.4.2. Понятие обратного оператора

Пусть φ − линейный оператор в Kn, который является биективным отображением (и, следовательно, для него существует обратное отображение ψ).

Теорема. Отображение, обратное к линейному оператору, само является линейным опера-

тором.

Для доказательства равенства ψ(x + y) = ψ(x) + ψ(y) применим к нему оператор φ:

φ(ψ(x + y)) = φ(ψ(x) + ψ(y)).

Если мы докажем это новое равенство, то в силу инъективности отображения φ из него будет следовать и предыдущее (доказываемое) равенство. Но

φ(ψ(x + y)) = (φψ)(x + y) = ε(x + y) = x + y;

φ(ψ(x) + ψ(y)) = φ(ψ(x)) + φ(ψ(y)) = (φψ)(x) + (φψ)(y) = ε(x) + ε(y) = x + y.

Вторая часть определения линейности (умножение на скаляр) доказывается аналогично.

Определение. Линейный оператор ψ, являющийся обратным отображением к данному биективному линейному оператору φ, называется оператором, обратным к φ, и обозначается φ−1 .

Теорема. Матрицы взаимно обратных линейных операторов в каком-нибудь одном базисе взаимно обратны.

Доказательство. Пусть φ и ψ − данные взаимно обратные линейные операторы. Тогда

AφAψ = Aφψ = Aε = E; AψAϕ = Aψϕ = Aε = E, QED.

8.4.3. Базис и размерность образа линейного оператора

Пусть в пространстве Kn даны базис u1, u2, …, un и какой-либо линейный оператор ϕ.

Предложение. Im ϕ = ‹ ϕ(u1), ϕ(u2), …, ϕ(un)›.

Доказательство. Каждый ϕ(ui) Im ϕ; следовательно, по минимальному свойству линейной оболочки Im ϕ ‹ ϕ(u1), ϕ(u2), …, ϕ(un)›. Обратно, пусть y Im ϕ; тогда y = ϕ(x) для некоторого подходящего x Kn. Пусть

x = x1u1 + x2u2 + … + xnun;

тогда

y = ϕ(x) = x1ϕ(u1) + x2ϕ(u2) + … + xnϕ(un) ‹ϕ(u1), ϕ(u2), …, ϕ(un)›.

Предложение. Размерность образа линейного оператора равна рангу матрицы этого оператора в произвольном базисе.

Доказательство. В самом деле, dim Im ϕ = rk (ϕ(u1), ϕ(u2), …, ϕ(un)) (по предыдущему предложению и по следствию предыдущего пункта). Последнее же число равно рангу матрицы

этого оператора в базисе u1, u2, …, un (по определению ранга матрицы и по определению матрицы оператора).

Следствие. Ранг матрицы линейного оператора не зависит от выбора базиса.

Доказательство. Это очевидным образом вытекает из предыдущего предложения, поскольку ранг матрицы оператора в любом базисе равен размерности образа, которая (да и сам образ!) от выбора базиса не зависит.

8.4.4. Связь между размерностями ядра и образа

 

Теорема. Эта связь выражается формулою:

 

dim Ker ϕ + dim Im ϕ = n.

(1)

Здесь n − размерность всего пространства (Kn).

 

Доказательство. Возьмем произвольный базис u1, u2, …,

un всего пространства. Пусть A

матрица данного оператора в этом базисе. Тогда

 

dim Im ϕ = rk A

(2)

(предложение предыдущего пункта); с другой стороны,

 

dim Ker ϕ = n − rk A

(3)

(см. п. 8.4.1). Складывая (2) и (3), получаем (1), QED.

 

§8.5. Собственные значения и собственные векторы

8.5.1.Определения собственного значения и собственного вектора

Определение. Пусть в пространстве Kn дан линейный оператор ϕ. Вектор x называется

собственным вектором оператора ϕ, если

1)x 0;

2)существует такое число λ из основного поля K, что

ϕ(x) = λx.

Число λ называется при этом собственным значением оператора.

Предложение. Для данного собственного вектора его собственное значение определяется единственным образом.

Доказательство. В самом деле, пусть ϕ(x) = λx = µx; тогда (λ − µ)x = λx − µx = 0, откуда,

т. к. x 0, λ − µ = 0, т. е. λ = µ, QED.

Заметим, что над полем действительных чисел линейный оператор может и не иметь собственных значений. Пример: в двумерном пространстве поворот всех векторов плоскости вокруг начала координат на угол 90°. Ни один вектор (кроме нулевого) не переходит в коллинеарный. Над полем же комплексных чисел любой оператор имеет собственное значение (об этом см. ниже).

8.5.2. Нахождение собственных значений и собственных векторов

Рассмотрим базис u1, u2, …, un пространства Kn и запишем вектор x и матрицу оператора ϕ в этом базисе:

x = x1u1 + … + xnun.

x1

Матрица-столбец X = Κ является изображением вектора x в этом базисе.xn

 

a

K

a

 

(u)

11

 

1n

 

А = Aϕ

= K

K K

.

 

 

K

 

 

 

an1

ann

Так как действие оператора ϕ на вектор x описывается с помощью матрицы A следующим образом:

Y = AX,

где Y − матрица-столбец, изображающая вектор ϕ(x) в нашем базисе (см. п. 8.2.5), то для собст-

x1

венного вектора x = Κ оператора ϕ, соответствующего собственному значению λ, имеем:xn

X ≠ 0, AX = λX.

Переписываем это иначе:

AX = λ(EX);

AX = (λE)X;

AX − ( λE)X = 0;

(A − λE)X = 0.

Последнее равенство можно рассматривать как однородную линейную систему уравнений с параметром λ:

(a11 − λ)x1 + K

+a1n xn

= 0;

 

K

K

K

K

 

 

an1 x1 +

K

+(ann − λ)xn = 0.

 

Это система линейных уравнений для нахождения собственных векторов оператора ϕ, соответствующих собственному значению λ. Матрица этой системы есть A − λE. Поскольку мы интересуемся существованием ненулевых (нетривиальных) решений этой системы (собственные векторы не могут быть нулевыми), необходимым и достаточным условием для этого является равенство det (A − λE) = 0. В самом деле, при выполнении этого равенства r = rk (A − λE) < n и размерность подпространства решений нашей системы равна n r > 0, т.е. имеются ненулевые решения системы − собственные векторы, соответствующие собственному значению λ. Обратно, если det (A − λE) ≠ 0, то по теореме Kramer’ а наша система имеет единственное, т. е. нулевое, решение.

Итак, условие det (A − λE) = 0 можно рассматривать как уравнение для определения собственных значений λ. В развёрнутом виде оно выглядит так:

a11 − λ

K

a1n

 

 

 

K

K

K

 

= 0.

an1

K

ann − λ

 

 

Это уравнение называется характеристическим уравнением. Рассмотрим теперь левую часть этого уравнения, т. е. определитель матрицы A − λE. Это число, которое зависит от λ, т.е. det (A − − λE) является функцией от λ. Используя определение определителя матрицы, легко понять, что det (A − λE) является многочленом степени n, называемым характеристическим многочленом оператора.

Предложение. Левая часть характеристического уравнения представляет собою многочлен, старший член которого равен (−1) nλn.

Доказательство. В самом деле, вспомним, что определитель по определению есть сумма своих членов, каждый из которых есть взятое с определённым знаком произведение n элементов матрицы такое, что в каждой строке и в каждом столбце стоит по одному из выбранных элементов.

Поскольку каждый элемент нашей матрицы есть многочлен степени не выше 1 (либо число, либо выражение aii − λ), то каждый член определителя есть многочлен степени не выше n. При этом многочлен степени ровно n получится только если взять все элементы на главной диагонали. В этом случае старший член произведения и есть (−1) nλn. Предложение доказано.

Лекция № 21 (21.05.10)

8.5.3. Инвариантность характеристического многочлена относительно выбора базиса

Лемма. Определители двух взаимно обратных квадратных матриц суть взаимно обратные

числа:

det C−1 = (det C)−1 .

Доказательство.

1 = det E = det (CC−1 ) = det C × det C−1 ,

откуда получаем требуемое.

Теорема. Характеристический многочлен линейного оператора не зависит от выбора базиса (одинаков для всех базисов).

Доказательство. Пусть в пространстве Kn дан линейный оператор j и даны два базиса (u) и (v). Пусть также C − матрица перехода от первого базиса ко второму. Соответственно матрицы нашего линейного оператора в этих двух базисах обозначим A = Aϕ(u) и B = Aϕ(v) . Тогда

det (B − λE) = det (C−1 AC C−1 E)C) = det (C−1 (A − λE)C) = det C−1 ×det (A − λE)×det C =

=det (A − λE), QED.

§8.6. Кое-что о многочленах

8.6.1.Простейшие свойства

Мы предполагаем известными из курса средней школы действия над многочленами (сложение, вычитание, умножение), понятия старшего члена, степени многочлена, умение делить многочлен на многочлен с остатком («уголком»). Вот два утверждения, которые будут использоваться.

Старший член произведения двух многочленов равен произведению их старших членов. Степень произведения двух многочленов равна сумме их степеней. (Степень многочлена f будем обозначать deg f.)

8.6.2. Деление с остатком. Теорема Bezout

Теорема (без доказательства, известна из курса средней школы). Если даны два многочлена f и g, причем многочлен g не равен нулю, то f можно разделить на g с остатком, что означает существование таких многочленов q и r, что выполняется тождество:

f(x) ≡ g(x)q(x) + r(x),

причём deg r < deg g либо r = 0. Многочлены q и r с указанными свойствами определяются единственным образом и называются соответственно частным и остатком.

Говорят, что многочлен f делится (без остатка) на многочлен g ≠ 0, если r(x) = 0, т. е. если существует такой многочлен q, что выполняется соотношение f(x) ≡ g(x)q(x).

Теорема (E. Bezout). Число α является корнем многочлена f(x) тогда и только тогда, когда f(x) делится на x − α.

Доказательство. Разделим f(x) на g(x) = x − α с остатком:

f(x) ≡ (x − α)q(x) + r(x),

где deg r < deg g либо r = 0. Поскольку deg g(x) = deg (x − α) = 1, то deg r(x) = 0 либо r = 0. В обоих случаях r(x) есть константа: r(x) = c, где c есть число (действительное или комплексное). Таким образом, имеем:

f(x) ≡ (x − α)q(x) + c.

(1)

Подставляя α вместо x в тождество (1), имеем: f(α) = c, откуда

f(x) ≡ (x − α)q(x) + f(α).

(2)

Пусть теперь α является корнем многочлена f(x); тогда f(α) = 0 и из тождества (2) получаем: f(x) ≡ ≡ (x − α)q(x), т. е. f(x) делится на x − α. Обратно, пусть f(x) делится на x − α; тогда в тождестве (2) f(α) = 0 (остаток определяется однозначно), что означает, что α − корень f(x), QED.

8.6.3. Разложение многочлена

Напомним формулировку основной теоремы алгебры.

Теорема. Над полем комплексных чисел любой многочлен, степень которого ≥ 1 (т. е. не константа), имеет хотя бы один корень.

Следствие 1. Над полем комплексных чисел любой многочлен, степень которого ≥ 1, разлагается на линейные множители:

f(x) = anxn + … + a0 = an(x − α1)(x − α2)…( x − αn).

Доказательство поведём по индукции (по n). Если n = 1, то доказывать нечего. Пусть n > 1. По основной теореме алгебры наш многочлен имеет корень α1; по теореме Bezout f(x) делится на x − α1: f(x) = (x − α1) q(x), где q(x) − многочлен степени n − 1 со старшим коэффициентом an (из тех соображений, что старший член произведения двух многочленов равен произведению их старших членов). По предположению индукции q(x) = an(x − α2)…( x − αn), откуда получаем требуемое.

Следствие 2. В пространстве Cn любой линейный оператор обладает собственным значением и собственным вектором.

Доказательство. В самом деле, характеристический многочлен имеет степень по меньшей мере 1 и, следовательно, по основной теореме алгебры имеет корень, который и будет собственным значением.

8.6.4. Понятие кратности корня

В разложении f(x) = an(x − α1)(x − α2)…( x − αn) все αi являются корнями многочлена, и других корней нет. В самом деле, если α − корень f(x), то an(α − α1)(α − α2)…( α − αn) = 0, откуда α =

= αi. С другой стороны, некоторые сомножители в вышеприведённом разложении могут повторяться. Соберём одинакие сомножители:

f(x) = an(x − β1) r1 (x − β2) r2 …( x − βs) rs .

В этом разложении все βi уже попарно различны.

Определение. В написанном выше разложении показатель ri называется кратностью корня βi многочлена f(x).

Очевидно, что сумма кратностей всех корней равна степени многочлена.

§8.7. Диагонализуемость линейного оператора

8.7.1.Основные понятия

Определение. Пусть в пространстве Kn дан линейный оператор ϕ. Оператор называется диагонализуемым (диагонализируемым), если существует базис (ξ), в котором матрица оператора диагональна (это означает, что вне главной диагонали стоят одни нули):

λ1

0

K

 

0

λ

 

K

A(ξ) =

 

 

2

K

ϕ K

K

 

0

0

K

 

0

0 . K λn

Теорема. В данном базисе (ξ) матрица оператора диагональна тогда и только тогда, когда этот базис состоит из собственных векторов данного оператора. При этом λi есть собственное значение собственного вектора ξi.

Диагональ матрицы представляет собою в этом случае спектр оператора, т. е. она состоит из собственных чисел, каждое из которых повторяется на диагонали столько раз, какова его кратность в характеристическом многочлене.

Доказательство. Первая часть утверждения теоремы очевидным образом вытекает из определения матрицы оператора. Вторую часть докажем даже в более общем виде: если матрица оператора треугольна, то её главная диагональ представляет собою спектр оператора. Для доказательства воспользуемся инвариантностью характеристического многочлена и вычислим его именно в том базисе, в котором его матрица треугольна (скажем, верхняя треугольная). Пусть

λ1

*

K

 

0

λ

 

K

A(ξ) =

 

 

2

K

ϕ K

K

 

0

0

K

 

Тогда характеристический многочлен равен:

*. K

λn

λ1 − λ

*

K

*

 

 

0

λ2 − λ

K

*

= (−1) n(λ − λ1)(λ − λ2)…( λ − λn), QED.

K

K

K

K

 

0

0

K

λn − λ

 

Заметим, что из нашей теоремы вытекает, что оператор диагонализуем тогда и только тогда, когда существует базис, состоящий из собственных векторов данного оператора.