AlgAndGeom-2
.pdf= |
a12 |
a22 |
. . . an2 |
x2 |
. |
||
|
|
a11 |
a21 |
. . . an1 |
|
x1 |
|
|
a1n a2n . . . ann |
xn |
|
||||
|
|
|
|
|
|
|
|
|
|
... ... ... ... |
|
... |
|
||
|
|
|
|
Отсюда получаем Y = A X и по теореме 21.17 имеем y = xA.
§36. Собственные векторы
Определение 36.1. Пусть a : Rn → Rn — линейный оператор и L Rn
— линейное подпространство. Если из того, что x L, следует, что a(x) L, то подпространство L называется инвариантным относительно оператора a.
Примеры. 1) Любой оператор a : Rn → Rn имеет два тривиальных инвариантных подпространства — нулевое и всё пространство, которые в дальнейшем мы будем иметь в виду, но без необходимости упоминать не будем.
2)Все одномерные и двумерные подпространства в R3 являются инвариантными относительно нулевого оператора o : R3 → R3.
3)Все одномерные и двумерные подпространства в R3 являются инвариантными относительно тождественного оператора 1 : R3 → R3, 1(x) = x.
4)Пусть L R3 — прямая, проходящая через начало координат, Π R3 — плоскость, проходящая через начало координат перпендикулярно прямой L. Пусть a : R3 → R3 — поворот пространства R3 вокруг оси L на угол
α(−π, π) и α ≠ 0. Такой поворот реализует линейный оператор, инвариантными подпространствами которого являются L и Π.
5)Линейный оператор из примера 34.6.4), т.е. проекция p пространства R3 на ось L(e), определённая по формуле p(x) = (x, e)e, имеет в качестве инвариантных подпространств L(e) и плоскость Π.
6)Линейный оператор q из примера 34.6.5) имеет в качестве инвариантных подпространств L(e) и плоскость Π.
7)Зеркальное отражение r из примера 34.6.6) имеет в качестве инвариантных подпространств L(e) и плоскость Π.
Особую роль играют одномерные инвариантные подпространства. Определение 36.2. Пусть a : Rn → Rn — линейный оператор. Ненуле-
вой вектор x Rn, такой что a(x) x, называется собственным вектором оператора a.
Замечание 36.3. По 1-му критерию коллинеарности 1.14, векторы a(x) и x коллинеарны, согда существует λ, такое что a(x) = λx. Это уравнение можно записать в координатной форме AX = λX, где через A обозначена матрица линейного оператора (в таких обозначениях A есть матрица преобразования базиса, см. опред. 35.3 и теор. 35.4).
61
Определение 36.4. Число λ называется собственным значением и оператора a, и матрицы A.
Примеры. В тех случаях, когда операторы являются проекциями или зеркальными отражениями (т.е. геометрически наглядными), их собственные векторы и значения можно угадать, не решая уравнения AX = λX.
1)Каждый ненулевой вектор является собственным вектором нулевого оператора o : R3 → R3, o(x) = o, с собственным значением 0.
2)Каждый ненулевой вектор является собственным вектором тождественного оператора 1 : R3 → R3, 1(x) = x, с собственным значением 1.
3)Проекция p : R3 → R3 на подпространство L(e), определённая в примере 34.6.4) по формуле p(x) = (x, e)e, имеет два вида собственных векторов. Во-первых, при этой проекции каждый ненулевой вектор подпространства L(e) проектируются сам на себя и является собственным вектором с собственным значением 1. Во-вторых, каждый ненулевой вектор подпространства Π проектируются в начало координат и является собственным вектором
ссобственным значением 0.
4)Проекция q : R3 → R3 на подпространство Π, определённая в примере 34.6.5) по формуле q(x) = x − (x, e)e, имеет два вида собственных векторов. Во-первых, при этой проекции каждый ненулевой вектор подпространства L(e) проектируются в начало координат и является собственным вектором с собственным значением 0. Во-вторых, каждый ненулевой вектор подпространства Π проектируются сам на себя (остаётся на месте) и является собственным вектором с собственным значением 1.
5)Зеркальное отражение q : R3 → R3 относительно плоскости Π, определённая в примере 34.6.6) по формуле q(x) = x − 2(x, e)e, имеет два вида собственных векторов. Во-первых, при этой проекции каждый ненулевой вектор x L(e) отражается на противоположный вектор −x L(e) и является собственным вектором с собственным значением −1. Во-вторых, каждый ненулевой вектор, лежащий на зеркале, т.е. x Π, остаётся на месте и является собственным вектором с собственным значением 1.
Замечание 36.5. Собственные векторы линейного оператора с ненулевыми собственными значениями лежат в образе этого оператора, а собственные векторы с нулевым собственным значением и вектор o образуют ядро этого оператора.
Теперь решим уравнение AX = λX в общем случае. Другими словами, найдём собственные векторы (ненулевые решения) и собственные значения матрицы A (оператора a). Приведём его к стандартному виду с помощью эквивалентных преобразований.
AX = λX, AX = λEX, AX − λEX = O, (A − λE)X = O.
62
Последнее уравнение запишем в координатной форме |
|
||||||||
|
|
(a11 |
λ)x1 + a12x1 + + a1nxn = 0 |
|
|||||
|
a21x1−+ (a22 − λ)x2 + ·· |
·· ·· + a2nxn = 0 . |
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
............................................. |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
an1x1 + an2x2 + · · · + (ann − λ)xn = 0 |
|
|||||||
Это |
линейная однородная система. |
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
Определение 36.6. Матрица |
|
|
|
|
|||||
|
|
|
|
λE = |
a11 − λ |
a12 . . . |
a1n |
|
|
|
|
A |
− |
a21 |
a22 |
λ . . . |
a2n |
||
|
|
|
|
.a.n.1 |
.a.n−.2 .. .. .. |
ann. . . λ |
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
− |
|
системы называется характеристической матрицей для оператора a и для матрицы A, а главный определитель
|
− |
|
|
a11 − λ |
a12 |
|
. . . |
a1n |
|
|
∆(λ) = det(A |
|
λE) = |
|
a21 |
a22 |
λ |
. . . |
a2n |
|
|
|
|
|
. . . |
. .−. |
. . . . . . |
|
||||
|
|
|
|
|
|
|
|
|
− |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
an1 |
an2 |
|
. . . ann |
|
|
|
|
|
|
|
|
|
λ |
системы называется характеристическим многочленом оператора a и матрицы A.
Нетрудно видеть, что если матрица A имеет порядок n, то характеристический многочлен имеет степень n относительно λ.
Заметим, что если ∆(λ) ≠ 0, то по правилу Крамера (см. теор. 26.6) система имеет только нулевое решение
0
0
X = . ,
..
0
которое по опред. 36.2 не является собственным вектором. Поэтому рассматриваемая система может иметь ненулевые решения только в случае, когда
∆(λ) = 0. |
( ) |
Определение 36.7. Уравнение ( ) называется характеристическим уравнением оператора.
Характеристическое уравнение является алгебраическим уравнением степени n и по теореме Безу имеет n комплексных корней с учётом кратности.
63
Мы не будем здесь вдаваться в детали этого предмета и предположим, что мы решили это уравнение ( ) и нашли все его вещественные корни λ1, λ2, . . . , λk, где k ≤ n.
Пусть λ = λi — любой из этих вещественных корней. Если поставить его в рассматриваемую систему, то получим систему
|
(a11 |
λi)x1 + a12x1 + |
· · · |
+ a1nxn = 0 |
|
a21x1−+ (a22 |
λi)x2 + |
+ a2nxn = 0 |
|||
|
|
|
|
|
|
|
|
− |
|
· · · |
|
|
|
|
|
.............................................
an1x1 + an2x2 + · · · + (ann − λi)xn = 0
спостоянными коэффициентами, которую можно решить методом Гаусса,
описанном в §28. Обозначим матрицу этой системы
Ai = |
|
a11 − λi |
a12 . . . |
a1n |
|
|
a21 |
a22 − λi . . . |
a2n |
|
|||
|
|
|
|
|
|
|
|
|
.a.n.1 |
.a.n.2 .. .. .. |
− |
|
|
|
|
ann. . . |
λi |
|
По замечанию 28.11.1) пространство L всех решений однородной системы AiX = O является линейной оболочкой, натянутой на векторы фундаментальной системой решений, и в данном случае подпространство L является множеством всех собственных векторов, отвечающих собственному значению λi. По замечанию 28.11.3) имеем
dim L = n − rank A.
Если λi = 0, то под действием оператора a пространство L сжимается в нуль-вектор o.
Если rank Ai = n − 1, то пространство решений системы одномерно, и, следовательно, множество собственных векторов, отвечающих собственному значению λi ≠ 0, является прямой L. Любой вектор x L под действием оператора a переходит в параллельный вектор λix L. Прямая L является инвариантным относительно оператора a.
Если rank Ai = n − 2, то пространство решений системы двумерно, и, следовательно, множество собственных векторов, отвечающих собственному значению λi ≠ 0, является плоскостью Π. Любой вектор x Π под действием оператора a переходит в параллельный вектор λix Π. Если λi > 0, то под действием оператора a плоскость "вдыхает" в λi раз. Если λi < 0, то под действием оператора a плоскость "вдыхает" в |λi| раз и поворачивается на 180◦. Плоскостью Π является инвариантным относительно оператора a.
64
Таким же образом можно интерпретировать действие операторов, имеющих матрицы с rank Ai < n − 2.
§37. Линейные, билинейные и квадратичные формы
Линейные формы
Определение 37.1. Линейное отображение a : Rn → R называется линейной формой, или линейной функцией, или линейным функционалом.
Пример. Пусть x = x1e1 + x2e√2 + x3e3 + x4e4 Rn — произвольный вектор, то a(x) = 2x1 + 7x2 + πx3 + ex4 — линейная форма на Rn.
Замечание 37.2. По опред. 34.1 (и 34.4) линейная форма как частный случай линейного отображения удовлетворяет свойствам линейности, т.е. для любых векторов x, z Rn и любого числа k R
(i) a(x + z) = a(x) + a(z); (ii) a(kx) = k a(x).
Теорема 37.3. Если e1, e2, . . . , en — базис в пространстве Rn, то любая линейная форма a : Rn → R определяется по формуле
a(x) = a1x1 + a2x2 + . . . + anxn,
где a1 = a(e1), a2 = a(e2), . . ., an = a(en).
Доказательство. Пусть x = x1e1 + x2e2 + . . . + xnen Rn — произвольный вектор. По свойству линейности имеем
a(x) = a(x1e1 + x2e2 + . . . + xnen) =
=a(x1e1) + a(x2e2) + . . . + a(xnen) =
=x1a(e1) + x2a(e2) + . . . + xna(en).
Обозначим a(e1) = a1, a(e2) = a2, . . ., a(en) = an, получим требуемый результат.
Замечание 37.4. Чтобы задать линейную форму
a(x) = a1x1 + a2x2 + . . . + anxn
надо задать её значения на векторах базиса.
65
Замечание 37.5. Ядро линейной формы a : Rn → R (т.е. полный прообраз нуля 0) ker a = a−1(0) задаётся уравнением
a1x1 + a2x2 + . . . + anxn = 0 |
( ) |
Определение 37.6. Всякое (n − 1)-мерное линейное подпространство, заданное уравнением ( ), называется гиперплоскостью пространства Rn. Обозначим эту гиперплоскость через Π.
Замечание 37.7. Если Rn — евклидово пространство со скалярным произведением
(x, y) = x1y1 + x2y2 + . . . + xnyn,
то уравнение гиперплоскости ( ) можно записать в виде
(a, x) = 0,
где через a обозначен вектор a1e1 + a2e2 + . . . + anen = (a1, a2, . . . , an) Rn, который по критерию ортогональности перпендикулярен гиперплоскости Π.
Справедлива школьная
Теорема 37.8. Если вектор перпендикулярен гиперплоскости Π, то он перпендикулярен
1)каждой прямой, лежащей в Π;
2)каждой плоскости, лежащей в Π;
3)каждому 3-мерному линейному многообразию, лежащему в Π;
..............................................
n−2) каждому (n-2)-мерному линейному многообразию, лежащему в Π.
Билинейные формы
Определение 37.9. Отображение b : Rn × Rn → R называется билинейной формой на Rn, если оно линейно по каждому аргументу. Иными словами, b(x, y) — билинейная форма, если для любых x, y, z Rn и k R
b(x + y, z) = b(x, z) + b(y, z);
b(kx, y) = kb(x, y);
b(x, y + z) = b(x, y) + b(x, z);
b(x, ky) = kb(x, y).
Первые два равенства означают линейность отображения b по первому аргументу, последние два — по второму.
66
Примеры. 1) Пусть x = x1e1 + x2e2 + x3e3, y = y1e1 + y2e2 + y3e3, Rn
и — два произвольных вектора, тогда
b(x, y) = 2x1y1 +x1y2 +7x1y3− −3x2y1 +5x2y2 −3x2y3+ +2x3y1 +x3y2 −x3y3
—билинейная форма. (Она записана так для наглядности её структуры.)
2)Если a1(x) и a2(x) — линейные формы, то b(x, y) = a1(x)a2(y) — билинейная форма.
Теорема 37.10. Если e1, e2, . . . , en — базис в пространстве Rn, то любая билинейная форма b : Rn × Rn → R определяется по формуле
b(x, y) = b11x1y1 +b12x1y2
+b21x2y1 +b22x2y2
. . . . . .
+bn1xny1 +bn2xny2
+. . . +b1nx1yn+
+. . . +b2nx2yn+
. . . . . .
+. . . +bnnxnyn
где bij = b(ei, ej), i = 1, 2, . . . , n и j = 1, 2, . . . , n.
Доказательство. x = x1e1 +x2e2 +. . .+xnen, y = y1e1 +y2e2 +. . .+ynen Rn
два произвольных вектора. По свойству линейности по обоим аргументам имеем
b(x, y) = x1b(e1, y) + x2b(e2, y) + . . . + xnb(en, y) =
=x1[y1b(e1, e1) +y2b(e1, e2) + . . . +ynb(e1, en)]+
+x2[y1b(e2, e1) |
+y2b(e2, e2) |
+ . . . |
+ynb(e2, en)]+ |
. . . |
. . . |
. . . |
. . . |
+xn[y1b(en, e1) +y2b(en, e2) + . . . |
+ynb(en, en)] = |
||
= x1y1b(e1, e1) +x1y2b(e1, e2) |
+ . . . |
+x1ynb(e1, en)+ |
|
+x2y1b(e2, e1) +x2y2b(e2, e2) |
+ . . . |
+x2ynb(e2, en)+ |
|
. . . |
. . . |
. . . |
. . . |
+xny1b(en, e1) +xny2b(en, e2) |
+ . . . +xnynb(en, en). |
Обозначим bij = b(ei, ej), для всех i = 1, 2, . . . , n и j = 1, 2, . . . , n, получим требуемый результат.
Замечание 37.11. Чтобы задать билинейную форму b(x, y) надо задать её значения на векторах базиса, т.е. задать bij = b(ei, ej).
Определение 37.12. Матрица B = (bij) называется матрицей билинейной формы.
67
Замечание 37.13. Легко видеть, что билинейную форму можно записать в матричном виде:
|
b(x, y) = b11x1y1 |
+b12x1y2 + . . . +b1nx1yn+ |
||||||||
|
|
+b21x2y1 +b22x2y2 + . . . +b2nx2yn+ |
||||||||
|
|
. . . |
|
|
. . . |
. . . |
. . . |
|
|
|
|
|
+bn1xny1 +bn2xny2 + . . . +bnnxnyn = |
||||||||
|
|
|
|
b11y1 + b12y2 + |
+ b1nyn |
|
|
|||
|
= (x1, x2, . . . , xn) b21y1 + b22y2 + |
· · · |
+ b2nyn |
= |
||||||
|
|
|
bn1y1 + bn2y2. .+. |
· · · |
+ bnnyn |
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
· · · |
|
|
|
= (x1 |
, x2, . . . , xn) |
b11 b12 . . . b1n |
|
y1 |
= xBY |
= X BY. |
||||
b21 |
b22 |
. . . |
b2n |
y2 |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
.b.n.2 |
.. .. .. |
|
|
|
|
|
|
|
|
.b.n.1 |
b.nn. . .y.n. |
|
|
|
Т.е. b(x, y) = X BY .
Определение 37.14. Если матрица билинейной формы симметрична (B = B или bij = bji), то билинейная форма называется симметричной.
Квадратичные формы
Определение 37.15. Пусть b(x, y) — произвольная билинейная форма, тогда a(x) = b(x, x) называется квадратичной формой.
Замечание 37.16. Если b(x, y) — билинейная форма общего вида как в теор. 37.9, то соответствующая ей квадратичная форма в координатном виде есть
a(x) = b(x, x) =
b11x21 +(b12 + b21)x1x2 +(b13 + b31)x1x3 +b22x22 +(b23 + b32)x2x3
+b33x23
+. . . +(b1n + bn1)x1xn+
+. . . +(b2n + bn2)x2xn+
+. . . +(b3n + bn3)x3xn+
. . .
+bnnx2n,
а в матричном виде a(x) = X BX.
Замечание 37.17. Если b(x, y) — симметричная билинейная форма, т.е. bij = bji, то соответствующая ей квадратичная форма есть
a(x) = b(x, x) =
68
= b11x12 +2b12x1x2 +2b13x1x3 |
+ . . . +2b1nx1xn+ |
|
+b22x22 +2b23x2x3 |
+ . . . |
+2b2nx2xn+ |
+b33x32 |
+ . . . |
+2b3nx3xn+ |
. . .
+bnnx2n,
Определение 37.18. Симметричная матрица B = bij = bji называется матрицей квадратичной формы.
Замечание 37.19. 1) Билинейная форма определяется по квадратичной форме неоднозначно.
Однако:
2) По квадратичной форме a(x), можно восстановить единственную симметричную билинейную форму b(x, y), такую что a(x) = b(x, x). Эта билинейная форма определяется следующим образом:
b(x, y) = 12[a(x + y) − a(x) − a(y)].
Без доказательства.
§38. Приведение квадратичной формы к каноническому виду
Замечание 38.1. В этом параграфе мы обозначим матрицу квадратичной формы a(x) через A = (aij) = (aji). По 37.17 квадратичная форма имеет общий вид:
a(x) = a11x21 +2a12x1x2 +2a13x1x3 +a22x22 +2a23x2x3
+a33x23
+. . . +2a1nx1xn+
+. . . +2a2nx2xn+
+ . . . +2a3nx3xn+ (Q)
. . .
+annx2n.
Замечание 38.2. Оказывается, любую квадратичную форму (Q) можно представить в виде алгебраической суммы квадратов линейных форм y1(x), y2(x), . . ., yr(x), т.е.
a(x) = b1y12(x) + b2y22(x) + . . . + bryr2(x), |
( ) |
где bi фиксированные числа, не равные нулю, и yi(x) = ci1x1+ci2x2+. . .+cinxn
— линейные формы, а число r равно рангу матрицы квадратичной формы, т.е. r = rank A.
69
Определение 38.3. Выражение квадратичной формы в виде ( ) называется каноническим видом.
Пример. Нетрудно проверить, что квадратичную форму a(x) = x21 + 2x1x2 + 2x22 + 4x2x3 + 3x23 можно представить в каноническом виде:
a(x) = (x1 + x2)2 + (x2 + 2x3)2 − x23 = y12 + y22 − y32,
где обозначены |
|
|
|
|
|
y1 |
= x1 |
+x2 |
|
|
y2 |
= |
x2 |
+2x3 . |
|
y3 |
= |
|
x3 |
Нетрудно проверить, что ту же самую квадратичную форму a(x) можно |
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
представить в другом каноническом виде: |
|
|
|
|
|
|
|
|
|||||||||||||||
1 |
|
2 |
|
3 |
|
|
|
|
2 |
|
|
2 |
|
|
2 |
|
1 |
|
2 |
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
a(x) = − |
|
x12 + |
|
( |
|
x1 + x2) |
|
+ 3 ( |
|
x2 |
+ x3) |
|
= − |
|
z12 + |
|
z22 + 3z32, |
||||||
2 |
3 |
2 |
|
3 |
|
2 |
3 |
||||||||||||||||
где обозначены |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
z1 |
= |
|
x1 |
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
z |
2 |
= |
|
3 x |
1 |
+x |
2 |
. |
|
|
|
|
|
||||
|
|
|
|
|
|
z3 |
= |
|
|
|
3 x2 |
+x3 |
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Этот пример показывает, что канонический вид квадратичной формы определён неоднозначно. Однако справедлива следующая
Теорема 38.4. (Закон инерции квадратичных форм) Число квадратов с положительными коэффициентами и число квадратов с отрицательными коэффициентами в любом каноническом виде квадратичной формы не зависит от способа приведения квадратичной формы к каноническому виду . (Без доказательства.)
В оставшейся части параграфа будут описаны два метода приведения квадратичной формы к каноническому виду: метод Лагранжа и метод Якоби.
Метод Лагранжа (метод выделения полных квадратов)
Лемма 38.5. Если в квадратичной форме (Q) коэффициент при x21 равен нулю (a11 = 0) и хотя бы один из мономов x1xi, где i = 2, 3, . . . , xn, отличен от нуля, (без потери общности пусть это будет a12 ≠ 0), тогда преобразование координат
|
x1 = y1 |
+ y2 |
|
|
|
= y1 |
− y2 |
|
|
||
x2 |
|||
|
|
x3 = y3 |
|
|
... |
|
|
|
|
|
|
xn = yn |
|
70