Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
177
Добавлен:
14.05.2015
Размер:
1.85 Mб
Скачать

Е. Е. Тыртышников

187

 

 

Напомним определение эквивалентных матриц: A è B называются эквивалентными, åñëè B = P AQ для каких-то невырожденных P è Q.

Утверждение 1. Матрицы эквивалентны в том и только том случае, когда они являются матрицами одного и того же линейного оператора в каких-то парах базисов.

Доказательство. Очевидно, ( ) означает эквивалентность матриц Agh è Aef . Åñëè B = P AQ, òî P è Q можно рассматривать как матрицы перехода для разных пар базисов. 2

Следствие. Для того чтобы матрицы одинаковых размеров были матрицами одного и того же линейного оператора в каких-то парах базисов, необходимо и достаточно, чтобы они имели одинаковый ранг.

Пусть A матрица линейного оператора A в какой-то паре базисов. Если r = rankA,

òî A эквивалентна матрице B = [bij], в которой b11 = . . . = brr = 1, а все остальные элементы равны 0. Следовательно, имеется пара канонических базисов, в которой A

определяется матрицей B.

Таким образом, за счет выбора пары базисов матрица линейного оператора может приобрести вид настолько простой, чтобы оказаться почти бесполезной для изучения индивидуальных свойств данного оператора. Поэтому изучение оператора, вообще говоря, нельзя свести к изучению его матрицы.

Åñëè Vn = Vm, то появляется возможность взять e = f. Вследствие того, что образы

и прообразы рассматриваются в одном и том же базисе, теперь в матрице оператора есть все, что нужно для любого подробного его изучения. То же верно для любой другой

пары базисов f è g, если только f = g. В этом случае, конечно, T = S

 

Agg = S−1AeeS.

( )

Матрицы A è B называются подобными, åñëè B = S−1AS для какой-то невырожденной матрицы S. Очевидно, справедливо следующее

Утверждение 2. Матрицы подобны в том и только том случае, когда они являются матрицами одного и того же линейного оператора в каких-то базисах при условии выбора одинаковых базисов в общем пространстве образов и прообразов.

Задача. Даны произвольные числа β1, . . . , βn−1. Доказать, что любая двухдиагональная n × n- матрица A âèäà

 

α1

α2

1

 

 

 

 

 

 

 

1

 

 

 

 

 

 

A =

 

... ...

 

 

 

 

 

 

α

n−1

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

α

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

подобна некоторой n × n-матрице B = [bij], в которой b11 = β1,

 

. . . , bn−1 n−1 = βn−1.

Задача. Доказать, что любая вещественная трехдиагональная матрица с элементами aij 6= 0 ïðè |i − j| = 1 подобна вещественной симметричной трехдиагональной матрице.

28.4Преобразование подобия

Пусть A : Vn → Vn линейный оператор в n-мерном пространстве Vn, è A его матрица при выборе одного и того же базиса в пространстве образов и прообразов. В этом случае изучение оператора A полностью сводится к изучению его матрицы A.

188

Лекция 28

 

 

Естественно попытаться выбрать базис таким образом, чтобы матрица A получиланаиболее простой вид. Если оператор A задан своей матрицей A в каком-то базисе, то выбор нового базиса дает для того же оператора другую матрицу B, которая будет подобна заданной матрице. Переход от A к подобной ей матрице B = S−1AS называется

преобразованием подобия.

Возникает такой вопрос: к какому наиболее простому виду можно привести заданную матрицу с помощью преобразования подобия? Фактически мы сейчас начинаем не очень простой путь к полному ответу на данный вопрос.

28.5Инвариантные подпространства

Проблем нет, если n = 1. Кажется также, что проще изучать оператор в пространстве

малой размерности. Поэтому давайте для начала поизучаем действие оператора A íà

подпространствах малой размерности.

Пусть L подпространство в Vn. Чтобы изучать A, используя только векторы из L, нужно потребовать, чтобы Ax L äëÿ âñåõ x L. Любое подпространство с таким свойством называется инвариантным относительно A.

Пусть v1, . . . , vk базис в подпространстве L. Тогда его можно дополнить какими-то векторами vk+1, . . . , vn до базиса в Vn.

Утверждение. Пусть v1, . . . , vn базис в Vn è L = L(v1, . . . , vk). Тогда L инвариантно относительно линейного оператора A : Vn → Vn тогда и только тогда, когда матрица оператора A в базисе v1, . . . , vn имеет блочно треугольный вид

 

 

 

 

 

A =

A11

A12

,

( )

0

A22

ãäå A11 подматрица порядка k.

Доказательство. При изоморфизме x = [x1, . . . , xn]> ↔ x1v1 + . . . + xnvn векторам

из L соответствуют те и только те столбцы x, для которых xk+1 = . . . = xn = 0. Если A имеет вид ( ), то, очевидно, для y = [y1, . . . , yn]> = Ax получаем yk+1 = . . . = yk = 0.

Значит, L инвариантно относительно умножения на матрицу A L инвариантно относительно оператора A.

Пусть известно, что L инвариантно относительно умножения на матрицу A = [aij], и пусть y = Ax, где xk+1 = . . . = xn = 0. Тогда yk+1 = . . . = yn = 0 aij = 0 ïðè

1 ≤ j ≤ k, i ≥ k + 1. 2

Задача. Найти все инвариантные подпространства оператора дифференцирования в пространстве вещественных многочленов.

28.6Ядро и образ линейного оператора

Множество kerA ≡ {x Vn : Ax = 0} называется ядром линейного оператора A, а множество imA ≡ {y Vn : y = Ax, x Vn} его образом. Размерность образа называется рангом оператора A, а размерность ядра его дефектом. Обозначение:

defA = dim kerA.

Утверждение 1. Ядро линейного оператора A : V → W является подпространством в V , а его образ подпространством в W .

Доказательство. Пусть x, y kerA. Тогда A(αx + βy) = αAx + βAy = α · 0 + β · 0 = 0

Теорема о размерности ядра и образа.
Е. Е. Тыртышников
αx + βy ker. Пусть x, y imA. Тогда x
αx + βy = A(αu + βv) αx + βy imA.

189

Доказательство. Пусть какими-то векторами vk+1

= Au è y = Av äëÿ каких-то u, v V

2

Пусть V конечномерно. Тогда dim kerA + dim imA = dim V.

dim kerA = k è v1, . . . , vk базис в kerA. Достроим его

. . . , vn до базиса в V . Очевидно,

imA = L(Avk+1, . . . , Avn).

Остается доказать, что векторы Avk+1, . . . , Avn линейно независимы.

Пусть αk+1Avk+1 + . . . + αnAvn = 0

 

A(αk+1vk+1 + . . .

+ αnvn) = 0

αk+1vk+1 + . . . + αnvn kerA

αk+1vk+1 + . . .

+ αnvn = β1v1 + . .

. + βkvk для каких-то

чисел β1, . . . , βk αk+1 =

. . . = αn = 0.

2

 

 

Замечание. Данную теорему можно было бы и не доказывать, поскольку она есть следствие уже известного нам факта: для любой матрицы A сумма ее ранга и размерности ее ядра (линейного прост-

ранства решений однородной системы Ax = 0) равна числу ее столбцов. Мы знаем, что ранг совпадает

с размерностью линейной оболочки столбцов матрицы, а последняя, очевидно, есть ее образ (как оператора умножения на данную матрицу).

Утверждение 2. Пусть линейный оператор A действует из V в V . Тогда его ядро и образ инвариантны относительно A.

Доказательство. Инвариантность ядра очевидна, поскольку любой его вектор отображается в 0.

Пусть x imA. Тогда x = Au Ax = A(Au) Ax imA. 2

Задача. Для двух линейных операторов, действующих из V â W , сумма ядер совпадает с V .

Докажите, что образ суммы этих операторов равен сумме образов. Верно ли это в случае трех операторов?

28.7Обратный оператор

Оператор A : V → W называется обратимым, если существует оператор B : W → V такой, что A(B(y)) = y y W è B(A(x)) = x x V . Ïðè ýòîì B называется

обратным оператором äëÿ A.

Утверждение. Если линейный оператор обратим, то обратный оператор также является линейным.

Доказательство. Любые векторы y1, y2 W можно представить в виде y1 = Ax1, y2 = Ax2. Поэтому

B(αy1 + βy2) = B(αAy1 + βBy2) = B(A(αx1 + βx2)) = αx1 + βx2.

Остается учесть, что

x1 = By1, x2 = By2. 2

Теорема. Пусть A : V → W линейный оператор, а V и W конечномерные пространства одинаковой размерности. Тогда A является обратимым оператором тогда и только тогда, когда kerA = {0}.

Доказательство. Пусть dim V = dim W = n. Согласно теореме о размерности ядра и образа, если dim kerA = 0, òî dim imA = n. Это означает, что для каждого вектора

Альтернатива Фредгольма.

190

Лекция 28

 

 

y W существует x V такой, что Ax = y. Более того, такой вектор x единствен (иначе ядро содержало бы ненулевой вектор). Определим оператор B : W → V правилом B(y) = x. Тогда A(B(y)) = y è B(A(x)) = x B является обратным оператором для

A.

Если же известно, что A обратимый оператор, то его ядро может быть только нулевым (если для каких-то x1 6= x2 выполнялось бы равенство Ax1 = Ax2, òî ýòî противоречило бы обратимости оператора A). 2

Замечание. Если линейный оператор A : V → W обратим, то непременно W = imA. В то же время, условие W = imA недостаточно для обратимости A.

Задача. Линейные операторы A è B таковы, что оператор A + B обратимый. Докажите, что операторы P = (A + B)−1A è Q = (A + B)−1B коммутируют.

Задача. Линейный оператор A : Rn×n → Rn×n сохраняет определитель матрицы. Докажите, что любой такой оператор является обратимым.

28.8Ортогональные дополнения ядра и образа

Дадим еще одно доказательство теоремы о размерности ядра и образа. Пусть A Cm×n. Åñëè x kerA, то для любого y Cm находим

0 = y Ax = (A y) x = (x, A y) x imA kerA (imA ) .

Пусть теперь x (imA ) . Тогда (x, A y) = y Ax = 0 y Cm. Âçÿâ y = Ax, получаем

y Ax = (Ax) (Ax) = |Ax|2 = 0 Ax = 0 x kerA (imA ) kerA.

Èòàê, kerA = (imA ) . Мы уже знаем, что размерность ортогогонального дополне-

íèÿ ê imA равна n − dim imA = n − rankA = n − dim imA. 2

В действительности нами обнаружено интересное общее свойство ядра матрицы и образа сопряженной матрицы.

Теорема. Пусть A Cm×n. Тогда Cn è Cm представляются ортогональными сумма-

ìè âèäà

Cn = kerA imA , Cm = kerA imA.

Отметим два очевидных следствия. Они интересны, прежде всего, тем, что в тех же формулировках переносятся на важные классы операторных уравнений в гильбертовых пространствах и помогают получать там факты о существовании и единственности решений.

Теорема Фредгольма. Для совместности системы Ax = b необходимо и достаточ- но, чтобы правая часть b была ортогональна ко всем решениям y однородной сопряженной системы A y = 0.

Либо система Ax = b имеет единственное решение для любой правой части b, либо однородная сопряженная система A y = 0 имеет ненулевое решение.

Задача. Пусть вещественная функция a(t, τ) непрерывна при 0 ≤ t, τ ≤ 1, à V

пространст-

 

 

1

во вещественных непрерывных на [0, 1] функций со скалярным произведением (f, g)

=

R f(t)g(t)dt.

0

Е. Е. Тыртышников

 

 

191

 

 

 

Докажите, что каждый из операторов

 

 

1

 

1

 

A : f(t) 7→f(t) − Z0

a(t, τ)f(τ)dτ,

A0 : f(τ) 7→f(τ) − Z0

f(t)a(t, τ)dt

является линейным и (Af, g) = (f, A0g) для любых функций f, g V . Докажите также, что kerA imA0.

Задача. Функция a(t, τ) непрерывна и удовлетворяет неравенству −1 < a(t, τ) < 1 ïðè 0 ≤ t, τ ≤ 1. Докажите, что интегральное уравнение

1

 

x(t) − Z0

a(t, τ)x(τ)dτ = 0, 0 ≤ t ≤ 1,

имеет единственное решение в пространстве функций x(t) C[0, 1].

192

Лекция 28

 

 

Лекция 29

29.1Диагонализуемые матрицы

Матрицы, подобные диагональным матрицам, называют диагонализуемыми èëè ìàò-

рицами простой структуры.

Рассмотрим задачу о диагонализации 3 × 3-матрицы:

AP = P Λ

a21

a12

a23

p21

p22

p23

=

p21

p22

p23

λ2

.

 

a11

a12

a13

p11

p12

p13

 

p11

p12

p13

λ1

λ3

 

a31

a32

a33 p31

p32

p33 p31

p32

p33

 

Данное равенство эквивалентно трем равенствам

a11

a12

a23

p2j

= λj

p2j

,

j = 1, 2, 3.

a11

a12

a13

p1j

 

p1j

 

 

a31

a32

a33 p3j

 

p3j

 

 

Предположим, что значение λj

известно. Тогда элементы j-го столбца матрицы P удов-

летворяют однородной системе

 

 

 

 

 

 

 

 

 

a11 − λj

a12

a13

p1j

 

0

 

 

 

a11

a12 − λj

a23

p2j

= 0 .

(

 

)

 

a31

a32

a33 − λj

p3j

0

 

 

Данная система должна иметь нетривиальное решение

определитель матрицы

коэффициентов равен нулю. Таким образом, λj удовлетворяет следующему уравнению относительно λ:

 

det

a11

 

a12 − λ

a23

=

0.

 

 

(#)

 

 

a11 − λ

a12

a13

 

 

 

 

 

 

 

 

a31

 

a32

a33 − λ

 

 

 

 

Это кубическое уравнение вида λ3 − s2λ2 + s1λ − s0

= 0, где, как легко видеть,

 

 

a21

s2 = a11 + a22 + a33,

a32

 

 

 

s1

= det

a22

 

+ det a31

a33

 

+ det

a33

,

 

 

a11

a12

 

a11

a13

 

 

a22

a23

 

 

a11 a12 a13 s0 = det a11 a12 a23 .

a31 a32 a33

193

194

Лекция 29

 

 

Можно вспомнить, что вопросом о диагонализации матриц порядка 3 мы занимались при изучении линий и поверхностей второго порядка при поиске такой системы координат, в которой матрица квадратичной части (вещественная симметричная матрица порядка 3) становится диагональной. 1

29.2Собственные значения и собственные векторы

Пусть A матрица порядка n è P обратимая матрица со столбцами p1, . . . , pn. Легко видеть, что равенство AP = P Λ эквивалентно системе равенств

Apj = λj pj, j = 1, . . . , n.

Эти равенства подводят нас к важным понятиям собственного значения матрицы и собственного вектора.

Определение. Пусть A матрица порядка n. Число λ C и ненулевой столбец x Cn, связанные соотношением Ax = λx, называются собственным значением è

собственным вектором матрицы A. Ïàðà λ, x иногда называется собственной парой

матрицы A.

Теорема. Матрица A порядка n диагонализуема тогда и только тогда, когда она обладает линейно независимой системой n собственных векторов.

Доказательство. Пусть p1, . . . , pn линейно независимая система собственных веткоров матрицы A, соответствующих собственным значениям λ1, . . . , λn:

Apj = λjpj, j = 1, . . . , n.

 

AP = P λ1

...

, P = [p1, . . . , pn].

 

 

 

 

 

 

 

 

 

 

λn

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Матрица A обратима как матрица с линейно независимыми столбцами. 2

 

 

Пример недиагонализуемой матрицы: A = h0

0i. Допустим, что

 

 

 

 

 

 

 

 

 

 

 

0

1

 

 

 

 

p11 p12

−1

0 1 p11 p12

=

λ1

0

 

 

 

0 1 p11 p12

p11 p12

λ1 0

.

p21 p22

 

0 0 p21 p22

0 λ2

0 0 p21 p22

= p21 p22

0 λ2

Отсюда

 

 

0 0 =

p21

λ1

p22

λ2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p21

p22

 

p11

λ1

p12

λ2

 

 

 

 

Хотя бы одно из чисел λ1,

λ2 должно отличаться от нуля. Пусть для определенности

λ1 6= 0 p21 = 0 p11 = 0. Получаем противоречие, поскольку матрица с нулевым столбцом не может быть обратимой. 2

1В Лекции 20 было доказано, что любая вещественная симметричная матрица A ортогонально подобна диагональной матрице D это означает, что A = P DP −1, ãäå P ортогональная матрица. Это же утверждение скоро появится как следствие более общих результатов.

Е. Е. Тыртышников

195

 

 

29.3Собственные векторы для различных собственных значений

Теорема. Собственные векторы, соответствующие попарно различным собственным значениям матрицы, являются линейно независимыми.

Пусть x1, . . . , xm собственные векторы для попарно различных собственных значе- ний λ1, . . . , λm матрицы A. Пусть α1x1 + . . . + αmxm = 0. Умножим обе части слева на матрицу A:

α1λ1x1 + . . . + αmλmxm = 0.

Из данного равенства вычтем предыдущее, умноженное на λm:

α11 − λm)x1 + . . . + αm−1m−1 − λm)xm−1 = 0.

Отсюда ясно, что из линейной независимости векторов x1, . . . , xm−1 вытекала бы ли- нейная независимость векторов x1, . . . , xm. Доказательство завершается применением индукции. 2

Следствие. Если матрица порядка n имеет n различных собственных значений, то она диагонализуема.

29.4Характеристическое уравнение

Пусть λ произвольное собственное значение матрицы A. При фиксированном λ âñå

соответствующие ему собственные векторы x удовлетворяют однородной системе линейных алгебраических уравнений

(A − λI)x

= 0.

Число λ является собственным значением матрицы A данная система имеет

нетривиальное решение det(A − λI) =

0.

Определение. Уравнение det(A − λI) = 0 относительно λ называется характеристи- ческим уравнением матрицы A. Левая часть этого уравнения есть многочлен степени

n îò λ, называемый характеристическим многочленом матрицы A.

Утверждение. Характеристический многочлен f(λ) = det(A−λI) матрицы A имеет

âèä

f(λ) = (−1)nn − sn−1λn−1 + sn−2λn−2 − . . . + (−1)ns0),

ãäå sk есть сумма всех миноров матрицы A порядка n − k, расположенных на пересе- чении столбцов и строк с одинаковыми номерами.

Доказательство. Чтобы получить коэффициент sk, нужно среди n! членов опреде-

лителя

X

det(A − λI) =

dσ

σ Sn

выбрать те и только те члены dσ, которые содержат произведение ровно k диагональных членов вида aii − λ (они и только они являются многочленами степени k îò λ), в каждом из них выделить слагаемое старшей степени вида (−λ)k cσ и просуммировать полученные коэффициенты cσ. Очевидно, что сумма всех cσ, отвечающих k диагональным элементам в фиксированных позициях i1 < . . . < ik, будет равна минору матрицы

196 Лекция 29

A, расположенному на строках и столбцах, дополнительных к строкам и столбцам с номерами i1, . . . , ik. 2

В частности, sn−1 = a11 + . . . + ann величина, называемая следом матрицы A. Обозначение: tr A. В силу формул Виета, след равен сумме всех собственных значений с учетом кратностей. Заметим также, что s0 = det A.

Ïðè n ≤ 4 собственные значения (как корни многочлена степени n ≤ 4) могут

быть выражены в радикалах через коэффициенты характеристического многочлена и, следовательно, через элементы матрицы. При n ≥ 5 таких формул уже не существует

(знаменитый результат Абеля, Руффини и Галуа).

29.5Алгебраическая кратность собственного значения

Кратность собственного значения как корня характеристического многочлена называется его алгебраической кратностью. Из основной теоремы алгебры сразу же вытекает следующая

Теорема. Любая комплексная матрица A порядка n имеет n комплексных собственных значений с учетом алгебраических кратностей.

29.6Характеристический многочлен и подобие

Теорема. Характеристические многочлены подобных матриц совпадают.

Доказательство. Пусть B = P −1AP , ãäå P обратимая матрица. Тогда

det(B − λI) =

det(P −1AP − λP −1P ) =

det(P −1(A − λI)P )

=

det P −1 det P det(A − λI)

= det(P −1P ) det(A − λI)

=

det(A − λI). 2

 

Следствие. Собственные значения и их алгебраические кратности для подобных матриц совпадают.

Задача. Найти характеристический многочлен матрицы A =

 

... 1 .

 

1

n×n

Задача. Пусть A è B квадратные матрицы одного и того же порядка. Докажите, что AB è BA имеют одинаковые характеристические многочлены.

29.7 Приведение к почти треугольной матрице

Таким образом, при вычислении собственных значений матрицы A можно использовать

преобразования подобия для перехода к матрице более простого вида, имеющей те же собственные значения.

Например, от A можно перейти к подобной ей верхней почти треугольной матрице.

Так называется матрица H = [hij], в которой hij = 0 ïðè i ≥ j + 2. Такая матрица

называется также верхней хессенберговой.

Утверждение. Для произвольной матрицы A порядка n существует невырожденная матрица P такая, что матрица B = P AP −1 является верхней почти треугольной.

Соседние файлы в папке лИТЕРАТУРА