Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

AlgAndGeom-2

.pdf
Скачиваний:
15
Добавлен:
27.03.2015
Размер:
311.57 Кб
Скачать

=

a12

a22

. . . an2

x2

.

 

 

a11

a21

. . . an1

 

x1

 

 

a1n a2n . . . ann

xn

 

 

 

 

 

 

 

 

 

 

 

... ... ... ...

 

...

 

 

 

 

 

Отсюда получаем Y = A X и по теореме 21.17 имеем y = xA.

§36. Собственные векторы

Определение 36.1. Пусть a : Rn Rn — линейный оператор и L Rn

— линейное подпространство. Если из того, что x L, следует, что a(x) L, то подпространство L называется инвариантным относительно оператора a.

Примеры. 1) Любой оператор a : Rn Rn имеет два тривиальных инвариантных подпространства — нулевое и всё пространство, которые в дальнейшем мы будем иметь в виду, но без необходимости упоминать не будем.

2)Все одномерные и двумерные подпространства в R3 являются инвариантными относительно нулевого оператора o : R3 R3.

3)Все одномерные и двумерные подпространства в R3 являются инвариантными относительно тождественного оператора 1 : R3 R3, 1(x) = x.

4)Пусть L R3 — прямая, проходящая через начало координат, Π R3 — плоскость, проходящая через начало координат перпендикулярно прямой L. Пусть a : R3 R3 — поворот пространства R3 вокруг оси L на угол

α(−π, π) и α ≠ 0. Такой поворот реализует линейный оператор, инвариантными подпространствами которого являются L и Π.

5)Линейный оператор из примера 34.6.4), т.е. проекция p пространства R3 на ось L(e), определённая по формуле p(x) = (x, e)e, имеет в качестве инвариантных подпространств L(e) и плоскость Π.

6)Линейный оператор q из примера 34.6.5) имеет в качестве инвариантных подпространств L(e) и плоскость Π.

7)Зеркальное отражение r из примера 34.6.6) имеет в качестве инвариантных подпространств L(e) и плоскость Π.

Особую роль играют одномерные инвариантные подпространства. Определение 36.2. Пусть a : Rn Rn — линейный оператор. Ненуле-

вой вектор x Rn, такой что a(x) x, называется собственным вектором оператора a.

Замечание 36.3. По 1-му критерию коллинеарности 1.14, векторы a(x) и x коллинеарны, согда существует λ, такое что a(x) = λx. Это уравнение можно записать в координатной форме AX = λX, где через A обозначена матрица линейного оператора (в таких обозначениях A есть матрица преобразования базиса, см. опред. 35.3 и теор. 35.4).

61

Определение 36.4. Число λ называется собственным значением и оператора a, и матрицы A.

Примеры. В тех случаях, когда операторы являются проекциями или зеркальными отражениями (т.е. геометрически наглядными), их собственные векторы и значения можно угадать, не решая уравнения AX = λX.

1)Каждый ненулевой вектор является собственным вектором нулевого оператора o : R3 R3, o(x) = o, с собственным значением 0.

2)Каждый ненулевой вектор является собственным вектором тождественного оператора 1 : R3 R3, 1(x) = x, с собственным значением 1.

3)Проекция p : R3 R3 на подпространство L(e), определённая в примере 34.6.4) по формуле p(x) = (x, e)e, имеет два вида собственных векторов. Во-первых, при этой проекции каждый ненулевой вектор подпространства L(e) проектируются сам на себя и является собственным вектором с собственным значением 1. Во-вторых, каждый ненулевой вектор подпространства Π проектируются в начало координат и является собственным вектором

ссобственным значением 0.

4)Проекция q : R3 R3 на подпространство Π, определённая в примере 34.6.5) по формуле q(x) = x (x, e)e, имеет два вида собственных векторов. Во-первых, при этой проекции каждый ненулевой вектор подпространства L(e) проектируются в начало координат и является собственным вектором с собственным значением 0. Во-вторых, каждый ненулевой вектор подпространства Π проектируются сам на себя (остаётся на месте) и является собственным вектором с собственным значением 1.

5)Зеркальное отражение q : R3 R3 относительно плоскости Π, определённая в примере 34.6.6) по формуле q(x) = x 2(x, e)e, имеет два вида собственных векторов. Во-первых, при этой проекции каждый ненулевой вектор x L(e) отражается на противоположный вектор x L(e) и является собственным вектором с собственным значением 1. Во-вторых, каждый ненулевой вектор, лежащий на зеркале, т.е. x Π, остаётся на месте и является собственным вектором с собственным значением 1.

Замечание 36.5. Собственные векторы линейного оператора с ненулевыми собственными значениями лежат в образе этого оператора, а собственные векторы с нулевым собственным значением и вектор o образуют ядро этого оператора.

Теперь решим уравнение AX = λX в общем случае. Другими словами, найдём собственные векторы (ненулевые решения) и собственные значения матрицы A (оператора a). Приведём его к стандартному виду с помощью эквивалентных преобразований.

AX = λX, AX = λEX, AX − λEX = O, (A − λE)X = O.

62

Последнее уравнение запишем в координатной форме

 

 

 

(a11

λ)x1 + a12x1 + + a1nxn = 0

 

 

a21x1+ (a22 − λ)x2 + ··

·· ·· + a2nxn = 0 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.............................................

 

 

 

 

 

 

 

 

 

 

 

 

 

an1x1 + an2x2 + · · · + (ann − λ)xn = 0

 

Это

линейная однородная система.

 

 

 

 

 

 

 

 

 

 

 

 

 

Определение 36.6. Матрица

 

 

 

 

 

 

 

 

λE =

a11 − λ

a12 . . .

a1n

 

 

 

A

a21

a22

λ . . .

a2n

 

 

 

 

.a.n.1

.a.n.2 .. .. ..

ann. . . λ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

системы называется характеристической матрицей для оператора a и для матрицы A, а главный определитель

 

 

 

a11 − λ

a12

 

. . .

a1n

 

∆(λ) = det(A

 

λE) =

 

a21

a22

λ

. . .

a2n

 

 

 

 

. . .

. ..

. . . . . .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

an1

an2

 

. . . ann

 

 

 

 

 

 

 

 

λ

системы называется характеристическим многочленом оператора a и матрицы A.

Нетрудно видеть, что если матрица A имеет порядок n, то характеристический многочлен имеет степень n относительно λ.

Заметим, что если ∆(λ) ≠ 0, то по правилу Крамера (см. теор. 26.6) система имеет только нулевое решение

0

0

X = . ,

..

0

которое по опред. 36.2 не является собственным вектором. Поэтому рассматриваемая система может иметь ненулевые решения только в случае, когда

∆(λ) = 0.

( )

Определение 36.7. Уравнение ( ) называется характеристическим уравнением оператора.

Характеристическое уравнение является алгебраическим уравнением степени n и по теореме Безу имеет n комплексных корней с учётом кратности.

63

Мы не будем здесь вдаваться в детали этого предмета и предположим, что мы решили это уравнение ( ) и нашли все его вещественные корни λ1, λ2, . . . , λk, где k ≤ n.

Пусть λ = λi — любой из этих вещественных корней. Если поставить его в рассматриваемую систему, то получим систему

 

(a11

λi)x1 + a12x1 +

· · ·

+ a1nxn = 0

a21x1+ (a22

λi)x2 +

+ a2nxn = 0

 

 

 

 

 

 

 

 

 

· · ·

 

 

 

 

 

.............................................

an1x1 + an2x2 + · · · + (ann − λi)xn = 0

спостоянными коэффициентами, которую можно решить методом Гаусса,

описанном в §28. Обозначим матрицу этой системы

Ai =

 

a11 − λi

a12 . . .

a1n

 

 

a21

a22 − λi . . .

a2n

 

 

 

 

 

 

 

 

 

 

.a.n.1

.a.n.2 .. .. ..

 

 

 

ann. . .

λi

 

По замечанию 28.11.1) пространство L всех решений однородной системы AiX = O является линейной оболочкой, натянутой на векторы фундаментальной системой решений, и в данном случае подпространство L является множеством всех собственных векторов, отвечающих собственному значению λi. По замечанию 28.11.3) имеем

dim L = n − rank A.

Если λi = 0, то под действием оператора a пространство L сжимается в нуль-вектор o.

Если rank Ai = n − 1, то пространство решений системы одномерно, и, следовательно, множество собственных векторов, отвечающих собственному значению λi ≠ 0, является прямой L. Любой вектор x L под действием оператора a переходит в параллельный вектор λix L. Прямая L является инвариантным относительно оператора a.

Если rank Ai = n − 2, то пространство решений системы двумерно, и, следовательно, множество собственных векторов, отвечающих собственному значению λi ≠ 0, является плоскостью Π. Любой вектор x Π под действием оператора a переходит в параллельный вектор λix Π. Если λi > 0, то под действием оператора a плоскость "вдыхает" в λi раз. Если λi < 0, то под действием оператора a плоскость "вдыхает" в i| раз и поворачивается на 180. Плоскостью Π является инвариантным относительно оператора a.

64

Таким же образом можно интерпретировать действие операторов, имеющих матрицы с rank Ai < n − 2.

§37. Линейные, билинейные и квадратичные формы

Линейные формы

Определение 37.1. Линейное отображение a : Rn R называется линейной формой, или линейной функцией, или линейным функционалом.

Пример. Пусть x = x1e1 + x2e2 + x3e3 + x4e4 Rn — произвольный вектор, то a(x) = 2x1 + 7x2 + πx3 + ex4 — линейная форма на Rn.

Замечание 37.2. По опред. 34.1 (и 34.4) линейная форма как частный случай линейного отображения удовлетворяет свойствам линейности, т.е. для любых векторов x, z Rn и любого числа k R

(i) a(x + z) = a(x) + a(z); (ii) a(kx) = k a(x).

Теорема 37.3. Если e1, e2, . . . , en — базис в пространстве Rn, то любая линейная форма a : Rn R определяется по формуле

a(x) = a1x1 + a2x2 + . . . + anxn,

где a1 = a(e1), a2 = a(e2), . . ., an = a(en).

Доказательство. Пусть x = x1e1 + x2e2 + . . . + xnen Rn — произвольный вектор. По свойству линейности имеем

a(x) = a(x1e1 + x2e2 + . . . + xnen) =

=a(x1e1) + a(x2e2) + . . . + a(xnen) =

=x1a(e1) + x2a(e2) + . . . + xna(en).

Обозначим a(e1) = a1, a(e2) = a2, . . ., a(en) = an, получим требуемый результат.

Замечание 37.4. Чтобы задать линейную форму

a(x) = a1x1 + a2x2 + . . . + anxn

надо задать её значения на векторах базиса.

65

Замечание 37.5. Ядро линейной формы a : Rn R (т.е. полный прообраз нуля 0) ker a = a1(0) задаётся уравнением

a1x1 + a2x2 + . . . + anxn = 0

( )

Определение 37.6. Всякое (n − 1)-мерное линейное подпространство, заданное уравнением ( ), называется гиперплоскостью пространства Rn. Обозначим эту гиперплоскость через Π.

Замечание 37.7. Если Rn — евклидово пространство со скалярным произведением

(x, y) = x1y1 + x2y2 + . . . + xnyn,

то уравнение гиперплоскости ( ) можно записать в виде

(a, x) = 0,

где через a обозначен вектор a1e1 + a2e2 + . . . + anen = (a1, a2, . . . , an) Rn, который по критерию ортогональности перпендикулярен гиперплоскости Π.

Справедлива школьная

Теорема 37.8. Если вектор перпендикулярен гиперплоскости Π, то он перпендикулярен

1)каждой прямой, лежащей в Π;

2)каждой плоскости, лежащей в Π;

3)каждому 3-мерному линейному многообразию, лежащему в Π;

..............................................

n−2) каждому (n-2)-мерному линейному многообразию, лежащему в Π.

Билинейные формы

Определение 37.9. Отображение b : Rn × Rn R называется билинейной формой на Rn, если оно линейно по каждому аргументу. Иными словами, b(x, y) — билинейная форма, если для любых x, y, z Rn и k R

b(x + y, z) = b(x, z) + b(y, z);

b(kx, y) = kb(x, y);

b(x, y + z) = b(x, y) + b(x, z);

b(x, ky) = kb(x, y).

Первые два равенства означают линейность отображения b по первому аргументу, последние два — по второму.

66

Примеры. 1) Пусть x = x1e1 + x2e2 + x3e3, y = y1e1 + y2e2 + y3e3, Rn

и — два произвольных вектора, тогда

b(x, y) = 2x1y1 +x1y2 +7x1y3− −3x2y1 +5x2y2 3x2y3+ +2x3y1 +x3y2 −x3y3

билинейная форма. (Она записана так для наглядности её структуры.)

2)Если a1(x) и a2(x) — линейные формы, то b(x, y) = a1(x)a2(y) — билинейная форма.

Теорема 37.10. Если e1, e2, . . . , en — базис в пространстве Rn, то любая билинейная форма b : Rn × Rn R определяется по формуле

b(x, y) = b11x1y1 +b12x1y2

+b21x2y1 +b22x2y2

. . . . . .

+bn1xny1 +bn2xny2

+. . . +b1nx1yn+

+. . . +b2nx2yn+

. . . . . .

+. . . +bnnxnyn

где bij = b(ei, ej), i = 1, 2, . . . , n и j = 1, 2, . . . , n.

Доказательство. x = x1e1 +x2e2 +. . .+xnen, y = y1e1 +y2e2 +. . .+ynen Rn

два произвольных вектора. По свойству линейности по обоим аргументам имеем

b(x, y) = x1b(e1, y) + x2b(e2, y) + . . . + xnb(en, y) =

=x1[y1b(e1, e1) +y2b(e1, e2) + . . . +ynb(e1, en)]+

+x2[y1b(e2, e1)

+y2b(e2, e2)

+ . . .

+ynb(e2, en)]+

. . .

. . .

. . .

. . .

+xn[y1b(en, e1) +y2b(en, e2) + . . .

+ynb(en, en)] =

= x1y1b(e1, e1) +x1y2b(e1, e2)

+ . . .

+x1ynb(e1, en)+

+x2y1b(e2, e1) +x2y2b(e2, e2)

+ . . .

+x2ynb(e2, en)+

. . .

. . .

. . .

. . .

+xny1b(en, e1) +xny2b(en, e2)

+ . . . +xnynb(en, en).

Обозначим bij = b(ei, ej), для всех i = 1, 2, . . . , n и j = 1, 2, . . . , n, получим требуемый результат.

Замечание 37.11. Чтобы задать билинейную форму b(x, y) надо задать её значения на векторах базиса, т.е. задать bij = b(ei, ej).

Определение 37.12. Матрица B = (bij) называется матрицей билинейной формы.

67

Замечание 37.13. Легко видеть, что билинейную форму можно записать в матричном виде:

 

b(x, y) = b11x1y1

+b12x1y2 + . . . +b1nx1yn+

 

 

+b21x2y1 +b22x2y2 + . . . +b2nx2yn+

 

 

. . .

 

 

. . .

. . .

. . .

 

 

 

 

+bn1xny1 +bn2xny2 + . . . +bnnxnyn =

 

 

 

 

b11y1 + b12y2 +

+ b1nyn

 

 

 

= (x1, x2, . . . , xn) b21y1 + b22y2 +

· · ·

+ b2nyn

=

 

 

 

bn1y1 + bn2y2. .+.

· · ·

+ bnnyn

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

· · ·

 

 

 

= (x1

, x2, . . . , xn)

b11 b12 . . . b1n

 

y1

= xBY

= X BY.

b21

b22

. . .

b2n

y2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.b.n.2

.. .. ..

 

 

 

 

 

 

 

 

.b.n.1

b.nn. . .y.n.

 

 

 

Т.е. b(x, y) = X BY .

Определение 37.14. Если матрица билинейной формы симметрична (B = B или bij = bji), то билинейная форма называется симметричной.

Квадратичные формы

Определение 37.15. Пусть b(x, y) — произвольная билинейная форма, тогда a(x) = b(x, x) называется квадратичной формой.

Замечание 37.16. Если b(x, y) — билинейная форма общего вида как в теор. 37.9, то соответствующая ей квадратичная форма в координатном виде есть

a(x) = b(x, x) =

b11x21 +(b12 + b21)x1x2 +(b13 + b31)x1x3 +b22x22 +(b23 + b32)x2x3

+b33x23

+. . . +(b1n + bn1)x1xn+

+. . . +(b2n + bn2)x2xn+

+. . . +(b3n + bn3)x3xn+

. . .

+bnnx2n,

а в матричном виде a(x) = X BX.

Замечание 37.17. Если b(x, y) — симметричная билинейная форма, т.е. bij = bji, то соответствующая ей квадратичная форма есть

a(x) = b(x, x) =

68

= b11x12 +2b12x1x2 +2b13x1x3

+ . . . +2b1nx1xn+

+b22x22 +2b23x2x3

+ . . .

+2b2nx2xn+

+b33x32

+ . . .

+2b3nx3xn+

. . .

+bnnx2n,

Определение 37.18. Симметричная матрица B = bij = bji называется матрицей квадратичной формы.

Замечание 37.19. 1) Билинейная форма определяется по квадратичной форме неоднозначно.

Однако:

2) По квадратичной форме a(x), можно восстановить единственную симметричную билинейную форму b(x, y), такую что a(x) = b(x, x). Эта билинейная форма определяется следующим образом:

b(x, y) = 12[a(x + y) − a(x) − a(y)].

Без доказательства.

§38. Приведение квадратичной формы к каноническому виду

Замечание 38.1. В этом параграфе мы обозначим матрицу квадратичной формы a(x) через A = (aij) = (aji). По 37.17 квадратичная форма имеет общий вид:

a(x) = a11x21 +2a12x1x2 +2a13x1x3 +a22x22 +2a23x2x3

+a33x23

+. . . +2a1nx1xn+

+. . . +2a2nx2xn+

+ . . . +2a3nx3xn+ (Q)

. . .

+annx2n.

Замечание 38.2. Оказывается, любую квадратичную форму (Q) можно представить в виде алгебраической суммы квадратов линейных форм y1(x), y2(x), . . ., yr(x), т.е.

a(x) = b1y12(x) + b2y22(x) + . . . + bryr2(x),

( )

где bi фиксированные числа, не равные нулю, и yi(x) = ci1x1+ci2x2+. . .+cinxn

— линейные формы, а число r равно рангу матрицы квадратичной формы, т.е. r = rank A.

69

Определение 38.3. Выражение квадратичной формы в виде ( ) называется каноническим видом.

Пример. Нетрудно проверить, что квадратичную форму a(x) = x21 + 2x1x2 + 2x22 + 4x2x3 + 3x23 можно представить в каноническом виде:

a(x) = (x1 + x2)2 + (x2 + 2x3)2 − x23 = y12 + y22 − y32,

где обозначены

 

 

 

 

 

y1

= x1

+x2

 

 

y2

=

x2

+2x3 .

 

y3

=

 

x3

Нетрудно проверить, что ту же самую квадратичную форму a(x) можно

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

представить в другом каноническом виде:

 

 

 

 

 

 

 

 

1

 

2

 

3

 

 

 

 

2

 

 

2

 

 

2

 

1

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a(x) =

 

x12 +

 

(

 

x1 + x2)

 

+ 3 (

 

x2

+ x3)

 

=

 

z12 +

 

z22 + 3z32,

2

3

2

 

3

 

2

3

где обозначены

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

z1

=

 

x1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

z

2

=

 

3 x

1

+x

2

.

 

 

 

 

 

 

 

 

 

 

 

z3

=

 

 

 

3 x2

+x3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Этот пример показывает, что канонический вид квадратичной формы определён неоднозначно. Однако справедлива следующая

Теорема 38.4. (Закон инерции квадратичных форм) Число квадратов с положительными коэффициентами и число квадратов с отрицательными коэффициентами в любом каноническом виде квадратичной формы не зависит от способа приведения квадратичной формы к каноническому виду . (Без доказательства.)

В оставшейся части параграфа будут описаны два метода приведения квадратичной формы к каноническому виду: метод Лагранжа и метод Якоби.

Метод Лагранжа (метод выделения полных квадратов)

Лемма 38.5. Если в квадратичной форме (Q) коэффициент при x21 равен нулю (a11 = 0) и хотя бы один из мономов x1xi, где i = 2, 3, . . . , xn, отличен от нуля, (без потери общности пусть это будет a12 ≠ 0), тогда преобразование координат

 

x1 = y1

+ y2

 

 

= y1

− y2

 

 

x2

 

 

x3 = y3

 

 

...

 

 

 

 

 

xn = yn

 

70

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]