Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

algebra1

.pdf
Скачиваний:
21
Добавлен:
21.03.2016
Размер:
1.92 Mб
Скачать

 

a3 a1

(a3 a1)a3

: : : (a3 a1)a3

 

 

 

a2

a1

(a2 a1)a2

: : : (a2

a1)a2n 2

 

 

=

 

 

.

..

 

.

:

 

.

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 2

 

 

 

an

a1

(an a1)an

: : : (an

a1)an 2

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В этом определителе для любого j 2 все элементы (j 1)-й строки имеют общий множитель aj a1; поэтому

 

 

 

 

1 a3

: : : a3

 

 

 

 

 

 

1 a2

: : : a2n 2

 

 

V (a1; a2; a3; : : : ; an) =

(aj

 

a1)

 

.

..

.

:

 

n

 

. .

 

 

 

 

 

 

 

 

 

 

n 2

 

 

 

j=2

 

 

 

 

 

 

 

 

Y

 

 

1 an

: : : an 2

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Но последний определитель не что иное как определитель Вандермонда V (a2; a3; : : : ; an). Итак, мы получили для определителя Вандермонда рекуррентное соотношение

n

Y

V (a1; a2; a3; : : : ; an) = (aj a1) V (a2; a3; : : : ; an):

j=2

Пользуясь этим рекуррентным соотношением, легко найти явную формулу для определителя Вандермонда.

Теорема 3. Пусть R коммутативное ассоциативное кольцо с единицей, n 2, a1; a2; : : : ; an 2 R. Тогда

 

1

a2

a22

: : :

 

 

1

a1

a12

: : :

V (a1; a2; a3; : : : ; an) =

 

 

2

: : :

1 a3

a3

 

 

 

 

 

.

..

 

. . .

 

 

 

 

 

 

 

 

 

1

an

a2

: : :

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

an 1

1

an 1

2 n 1

a3 =

.

an 1

n

Y

(aj ai):

1 i<j n

Доказательство. Индукция по n; при n = 2 утверждение верно:

 

 

 

 

V (a1; a2) =

1 a1

 

= a2 a1:

1 a2

 

 

 

 

 

 

 

 

Пусть n > 2 и пусть уже доказано, что

V (a1; a2; : : : ; an 1) =

 

Y

 

(aj ai)

1

 

i<j n 1

для любых a1; a2; : : : ; an 1 2 R; в частности,

2 Y

(aj ai):

V (a2; : : : ; an) =

i<j

n

231

Тогда

 

 

 

n

 

 

 

 

 

Yj

(aj a1) V (a2

 

 

V (a1; a2; : : : ; an) =

=2

; : : : ; an) =

 

 

 

 

 

 

n

 

Y

 

1 Y

 

Y

(aj a1)

 

(aj ai):

=

 

(aj ai) =

 

j=2

2 i<j

n

i<j

 

n

Следствие 1. Если R область целостности (в частности, поле), и a1; a2; : : : ; an попарно различные элементы из R, то

 

 

V (a1; a2; : : : ; an) 6= 0:

 

(aj ai) в этом произведении Q

Действительно, V (a1

; a2; : : : ; an) =

1 i<j n(aj ai), и все сомно-

жители

 

 

отличны от 0.

Используя определитель Вандермонда, мы можем дать ещ¼ одно доказательство существования и единственности интерполяционного многочлена. Пусть k поле, и пусть a1; a2; : : : ; an; b1; b2; : : : ; bn 2 k,

причем элементы a1; a2; : : : ; an попарно различны. Покажем, что существует, и притом только один, многочлен f(x) 2 k[x], степень ко-

торого меньше n, такой что f(ai) = bi для всех i, 1 i n. В самом деле, пусть f(x) = 0+ 1x+ 2x2+: : :+ n 1xn 1, ãäå 0; 1; : : : ; n 1

элементы поля k; тогда условия f(a1) = b1, f(a2) = b2, . . . , f(an) = bn принимают вид

0 + a1 1 + a21 2 + : : : + an1 1 n 1 = b1;0 + a2 1 + a22 2 + : : : + an2 1 n 1 = b2;

0 + an 1 + a2n 2 + : : : + ann 1 n 1 = bn;

а это система линейных уравнений для коэффициентов 0; 1; : : : ; n 1 многочлена f(x), матрица которой равна

01

a2

a22

: : : a2n 11

 

1

a1

a12

: : : a1n 1

C

 

B. .

.

... .

:

B1 an

a2

: : : an 1C

 

B

 

n

n

C

 

@

 

 

 

A

 

Определитель этой матрицы является определителем Вандермонда, и по следствию теоремы 3 он отличен от 0. Следовательно, матрица системы обратима, а значит, по теореме Крамера, система имеет единственное решение. Итак, существует один и только один много- член f(x) вида

f(x) = 0 + 1x + 2x2 + : : : + n 1xn 1;

такой что f(ai) = bi äëÿ âñåõ i, 1 i n.

232

x 7: Теорема Кэли-Гамильтона

1 Значения многочлена в алгебрах

Ранее для многочленов над некоторым кольцом R мы рассматривали их значения в кольцах, содержащих R. Но часто возникает необходимость рассматривать значения многочленов в кольцах , не со-

держащих R, например, в кольце матриц Rn. Поэтому нам придется модифицировать определение значения многочлена, так чтобы оно работало в подобных ситуациях.

Пусть R коммутативное ассоциативное кольцо с единицей 1R, è пусть ассоциативное кольцо с единицей 1 , не обязательно ком- мутативное. Пусть на кольце имеется дополнительная структураумножение на элементы из R, причем для всех a; b 2 R, A; B 2 выполняются следующие соотношения

1R A = A;

(a + b)A = aA + bA;

a(A + B) = aA + aB;

(ab)A = a(bA) = b(aA):

Тогда называется ассоциативной алгеброй с единицей над кольцом R, или ассоциативной R-алгеброй с единицей.

Кольцо матриц Rn порядка n над кольцом R типичный пример алгебры над R: ведь мы умеем не только складывать и умножать матрицы, но и умножать их на элементы из R, и все перечисленные

свойства, как мы знаем, в кольце матриц выполняются. Отметим еще, что произвольное ассоциативное кольцо с единицей можно

рассматривать как алгебру над кольцом целых чисел Z, если для любого целого числа n и и любого элемента a 2 положить

 

 

8 a + a +n + a;

 

åñëè

n > 0,

 

 

> a a a;

åñëè

 

,

 

na =

 

n < 0

 

 

|

{z }

 

 

 

 

 

 

>

 

 

 

 

 

 

 

 

 

 

 

>

 

 

 

n

 

 

 

 

 

 

<

 

 

 

 

}

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

|

 

 

{z

 

 

 

 

 

 

>

 

 

 

 

 

 

 

 

 

 

 

>

 

 

 

 

 

 

 

 

 

Пусть

ассоциативная>

алгебра с единицей

1 над коммутатив-

 

:

 

 

 

 

 

 

 

 

 

 

0;

 

 

 

 

 

åñëè n = 0.

ным ассоциативным кольцом с единицей R. Как и в любом кольце,

мы полагаем произведение 0 сомножителей из равным 1 ; â ÷àñò- ности, A0 = 1 для любого A 2 (даже если A = 0 ). Пусть теперь

f(t) = a0 + a1t + : : : + antn 2 R[t]

многочлен с коэффициентами ai 2 R, и пусть A элемент из R-алгебры . Определим значение многочлена f(t) при t = A следующим образом:

f(A) = a0A0 + a1A + : : : + anAn = a0 1 + a1A + : : : + anAn:

233

Аналогично определяется значение многочлена от нескольких переменных

i1

N

 

 

 

 

Xn

;:::;in t1i1

: : : tnin

(ai1;:::;in 2 R)

f(t1; : : : ; tn) =

 

ai1

 

;:::;i

=0

 

 

 

ïðè ts = As 2 (1 s n):

N

X

f(A1; : : : ; An) = ai1;:::;in Ai11 : : : Ainn :

i1;:::;in=0

Как обычно, значения суммы многочленов f(t1; : : : ; tn), g(t1; : : : ; tn) ïðè ts = As 2 (1 s n) равно сумме соответствующих значений слагаемых, а если элементы A1; : : : ; An R-алгебры попарно перестановочны, то и значение произведения этих многочленов равно произведению соответствующих значений сомножителей. Мы опускаем тривиальные доказательства этих фактов.

2 Характеристический многочлен матрицы

Пусть A квадратная матрица порядка n с компонентами из некоторого коммутативного ассоциативного кольца с единицей R. Элемент, лежащий в i-й строки и j-м столбце этой матрицы, будем обозначать

aij. Вложим кольцо R в кольцо многочленов от одной переменной R[t]. Все элементы матрицы A tE являются многочленами из R[t], причем диагональные элементы aii t имеют степень 1, а недиагональные элементы aij (i 6= j) степень 0. Определитель det(A tE) этой матрицы является многочленом от е¼ компонент и потому сам является многочленом от t с коэффициентами из R; он называется

характеристическим многочленом матрицы A и обозначается A(t).

Предложение 16. Степень характеристического многочлена квадратной матрицы порядка n 1 равна n.

Доказательство. Старший член произведения

(a11 t)(a22 t) : : : (ann t)

диагональных элементов матрицы A tE равен произведению ( t)n = ( 1)ntn старших членов сомножителей; следовательно, произведение диагональных элементов матрицы A tE является многочленом степени n. Все остальные произведения, входящие в определитель det(A tE) = A(t), имеют меньшую степень, так как степени всех n сомножителей, составлющих это произведение, не больше 1, при-

чем хотя бы один из сомножителей не лежит на диагонали матрицы A tE и потому его степень равна 0.

234

3 Теорема Кэли -Гамильтона

Пусть A матрица с компонентами из коммутативного ассоциативного кольца с единицей R. Е¼ характеристический многочлен A(t) принадлежит кольцу R[t], и мы можем считать его значения в любой R-алгебре. В частности, для любой матрицы B из R-алгебры Rn определено значение A(B). многочлена A(t) ïðè t = B.

Теорема 4 (теорема Кэли - Гамильтона). Пусть A квадрат-

ная матрица с компонентами из коммутативного ассоциативного кольца R. Тогда A(A) нулевая матрица.

Доказательство. Сначала докажем одну почти очевидную лемму.

Лемма 6. Пусть A; C 2 Rn, D(t) 2 (R[t])n такие матрицы, что C = (A tE)D(t). Тогда C и D(t) нулевые матрицы.

Доказательство. Все компоненты матрицы D(t) многочлены от t; если D(t) 6= 0, то не все они равны 0, и потому максимум r степеней компонент матрицы D(t) не меньше 0. Среди компонент матрицы tD(t) есть многочлены степени r + 1, а все компоненты матрицы AD(t) C являются многочленами степени не больше r, поэтому AD(t) C 6= tB(t), то есть C 6= (A tE)D(t) в противоречие с условием леммы. Следовательно, D(t) = 0, а значит, и C = (A tE)D(t) = 0.

Вернемся к доказательству теоремы Кэли - Гамильтона. Обозна- чим через B(t) 2 (R[t])n матрицу, взаимную к матрице A tE; тогда по основному свойству взаимной матрицы

(A tE)B(t) = jA tEj E = A(t) E:

Погрузим кольцо R в кольцо многочленов R[x] от ещ¼ одной переменной x. По теореме Безу (теорема III.13) в кольце (R[x])[t] = R[x; t] выполняется сравнение

A(t) A(x) (mod (t x));

то есть существует такой многочлен q(x; t) 2 R[x; t], что

A(x) = A(t) (t x)q(x; t) = A(t) + (x t)q(x; t):

Рассмотрим обе части этого равенства как многочлены от x над кольцом R[t]. Кольцо (R[t])n матриц порядка n над кольцом R[t] является R[t]-алгеброй, поэтому определены значения этих многочленов при x = A 2 Rn (R[t])n; поскольку слагаемые t, A(t) имеют относительно x степень 0, при взятии значений их надо умножить на единицу R[t]-алгебры (R[t])n, то есть на единичную матрицу E. Пользуясь

235

тем, что значения суммы и произведения многочленов равны соответственно сумме и произведению значений слагаемых (сомножителей),

èучитывая соотношение A(t) E = (A tE)B(t), мы получим:

A(A) = A(t)E + (A tE)q(A; t) =

= (A tE)B(t) + (A tE)q(A; t) = (A tE) B(t) + q(A; t) :

По лемме 6 отсюда следует, что A(A) = 0.

236

Глава IX

Квадратичные формы

x 1: Квадратичные формы над произвольным полем

1 Матрица квадратичной формы

Напомним (см. x 6:4 главы III), что формой (или однородным много-

членом) степени r над полем k от переменных x1; : : : ; xn называется такой многочлен f(x1; : : : ; xn) 2 k[x1; : : : ; xn], который является суммой (быть может, пустой) одночленов полной степени r. Формы сте-

пени 2 называются квадратичными формами. Пусть A квадратная матрица порядка n с компонентами из k, а X столбец переменных:

0a21

a22

: : : a2n1

 

0x21

 

a11

a12

: : : a1n

C

 

X = B

x1

C

 

A = B .

.

... .

;

.

;

Ban1

an2

: : : annC

 

BxnC

 

B

 

 

C

 

B

 

C

 

@

 

 

A

 

@

 

A

 

тогда

 

 

0a21

a22

: : :

 

x1; x2

a11

a12

: : :

X>AX =

; : : : ; xn B . . ...

 

 

Ban1

an2

: : :

 

 

B

 

 

@

10 1 a1n x1

a2nCBx2C CB C=

.CB . C A@ A

ann xn

n

X

xiaijxj

i;j=1

одноэлементная матрица, единственным элементом которой является квадратичная форма

nn

X

X

1 X

 

f(x1; : : : ; xn) =

xiaijxj = aiixi2 +

 

(aij + aji)xixj:

i;j=1

i=1

i<j n

В дальнейшем мы всегда будем отождествлять такие матрицы с единственным составляющим их элементом и опускать ограничивающие

237

их скобки. При таком соглашении предыдущее равенство примет вид

f(x1; : : : ; xn) = X>AX:

Матрица A называется симметричной, если она равна транспонированной к ней матрице A>.

Предложение 1. Для всякой квадратичной формы f(x1; : : : ; xn) над полем k, характеристика которого отлична от 2, существует единственная симметричная матрица A 2 kn, такая что

f(x1; : : : ; xn) = X>AX:

Доказательство. Пусть

n

X

 

X

(ai; bij 2 k)

f(x1; : : : ; xn) = cixi2 +

bijxixj

i=1

1 i<j n

 

квадратичная форма над полем k, и пусть A 2 kn; элемент, стоя- щий в i-й строке и j-м столбце этой матрицы будем обозначать aij. Для того, чтобы матрица A была симметричной и чтобы выполнялось соотношение f(x1; : : : ; xn) = X>AX, необходимо и достаточно, чтобы элементы aij 2 k удовлетворяли следующей системе уравнений:

aii = ci (1 i n);

aij = aji; aij + aji = bij (1 i < j n):

Ясно, что элементы aii = ci, aij = aji = bij=2 (1 i < j n) составляют единственное решение этой системы.

Единственная симметричная матрица A 2 kn, такая что

f(x1; : : : ; xn) = X>AX;

называется матрицей квадратичной формы f(x1; : : : ; xn).

Замечание. Для полей характеристики 2 предложение перестает

быть верным, и матрица квадратичной формы над таким полем не может быть определена. Формы вида X>AX над такими полями

в случае, когда матрица A симметрична, всегда будут иметь вид

1x21 + : : : + nx2n, и поэтому, например, форма x1x2 не может быть представлена таким образом.

238

2 Нулевые формы и формы с нулевыми коэффициентами

В дальнейшем нам придется рассматривать квадратичные формы от 0 переменных. Это будет полезно, например, в ситуации, когда мы раскладываем форму f(x1; : : : ; xn) в сумму форм g(x1; : : : ; xm) è

h(xm+1; : : : ; xn), и одно из слагаемых оказывается тривиальным. Если f форма от пустого множества переменных, то мы называем ее нулевой формой и пишем f = 0. Чтобы избежать недоразумений, мы всегда будем называть форму от n 1 переменных, матрица которой является нулевой матрицей, формой с нулевыми коэффициентами.

3 Ранг формы, невырожденные формы, ортогональная сумма форм

До конца параграфа через k обозначается некоторое фиксированное поле, характеристика которого не равна 2. Пусть f(x1; : : : ; xn)квадратичная форма над k; ее рангом r(f) называется ранг ее

матрицы. Форма называется невырожденной, если ее матрица невырождена, то есть если ее ранг равен числу переменных.

Пусть f = f(x1; : : : ; xn) è g = g(y1; : : : ; ym) квадратичные формы над полем k, причем множества переменных, от которых зависят формы, не пересекаются; тогда форма

h = h(x1; : : : ; xn; y1; : : : ; ym) = f(x1; : : : ; xn) + g(y1; : : : ; ym)

называется ортогональной суммой форм f и g. Для ортогональной суммы квадратичных форм f и g применяется обозначение f ? g. Еще раз подчеркнем: если h = f ? g, то множества переменных форм f и g не пересекаются, а многочлен h равен сумме многочленов f и g. Если A, B матрицы форм f и g, то матрица ортогональной суммы f ? g имеет вид

A 0n m 0m n B

(напомним, что через 0s t мы обозначаем нулевую матрицу из s строк и t столбцов).

n

P

Åñëè f(x1; : : : ; xn) = aijxixj любая квадратичная форма, то

i;j=1

f(0; : : : ; 0) = 0. Форма f называется анизотропной, если все осталь-

ные ее значения отличны от 0, то есть если для любых элементов a1; : : : ; an из поля k, из которых хотя бы один не равен 0, будет f(a1; : : : ; an) 6= 0. Легко видеть, что всякая анизотропная форма невырождена. Действительно, если матрица A формы f вырождена,

239

то однородная система линейных уравнений AX = 0 имеет нетривиальное решение (a1; : : : ; an)>, и тогда

f(a1; : : : ; an) = (a1; : : : ; an) A

0a.11

= (a1; : : : ; an)

00.

1

= 0;

 

BanC

 

B

0 C

 

 

@ A

 

@

 

A

 

значит, форма f не анизотропна.

Напротив, форма f(x1; : : : ; xn) называется изотропной, если она невырождена и существуют такие элементы a1; : : : ; an 2 k, не все равные 0, что f(a1; : : : ; an) = 0. Например, форма f(x; y) = x2 y2 изотропна, а форма g(x; y) = x2 + y2 в случае, когда основное поле k

является полем вещественных чисел, анизотропна. Заметим, однако, что формы от трех переменных

f1(x; y; z) = x2 y2; g1(x; y; z) = x2 + y2

не являются ни изотропными (потому что они вырождены), ни анизотропными.

x 2: Линейное преобразование переменных в квадратичной форме

1 Определение линейного преобразования переменных

Пусть f(x1; : : : ; xn) произвольный многочлен с коэффициентами из k; как мы знаем, можно сосчитать его значения при любых значениях переменных, принадлежащих какому угодно кольцу , содержащему k. В частности, пусть = k[y1; : : : ; ym] кольцо многочленов от переменных y1; : : : ; ym; мы не требуем, чтобы все переменные yj áûëè отличны от переменных xi. Придавая каждой переменной xi значение ci1y1 + + cimym 2 k[y1; : : : ; ym] (все коэффициенты cij элементы поля k), мы получим многочлен

mm

XX

g(y1; : : : ; ym) = f(

c1jyj; : : : ;

cnjyj) 2 k[y1; : : : ; ym]:

 

j=1

j=1

Будем говорить, что он получен из f(x1; : : : ; xn) линейным преобразованием переменных

0x2

1

0c21

x1

C

c11

B

B

BC = B

B. C B .

@ A @

xn cn1

c12 : : :

c22 : : :

. ...

cn2 : : :

10 1 c1m y1

c2mCBy2 C CB C;

.CB . C A@ A

cnm ym

240

Тут вы можете оставить комментарий к выбранному абзацу или сообщить об ошибке.

Оставленные комментарии видны всем.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]