Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шевченко (2 семестр).doc
Скачиваний:
9
Добавлен:
08.11.2018
Размер:
2.14 Mб
Скачать

Билинейные функции.

О. Пусть есть линейное пространство V над полем F подполем С и пусть есть отображение f: VxV→F, тогда это f наз билинейной функцией, если выполняются следующие условия:

f(αx,y)=αf(x,y)

f(x+x’,y)=f(x,y)+f(x’,y)

f(x,βy)=f(x,y)

f(x,y+y’)=f(x,y)+f(x,y’)

Примеры.

  1. Скалярное произведение.

  2. f(x,y)=0.

  3. dimV=3. Смешанное произведение f(x,y)=(a,x,y)

  4. V=C f(x,y)=det()

  5. f(x,y)=

x= y= => f(x,y)=f(,)=

Если - базис, то x= y= => f(x,y)=

О. Матрица А={a}, где a=f(e,e), наз. матрицой билинейной функии в базисе

Т.о. имеем f(x,y)=

D(V) – множество всех билинейных функций на линейном пространстве V

Билинейной функции поставили в соответствие матрицу в данном базисе. Легко доказать, что отображение D(V)→F является биекцией.

Можно показать, что D(V) –линейное пространство, изоморфное F, и его размерность n².

(αf)(x,y)=αf(x,y)D(V)

f(x,y)+g(x,y)=(f+g)(x,y)D(V)

О. Если x=y,то значения f(x,x) наз. квадратичной функцией от x.

В комплексном случае квадратичная функция однозначно определяет билинейную функцию.

f(x+y,x+y)=f(x,x)+f(x,y)+f(y,x)+f(y,y) |1

f(x-y,x-y)=f(x,x)-f(x,y)-f(y,x)+f(y,y) |-1

f(x+iy,x+iy)=f(x,x)-if(x,y)+if(y,x)+f(y,y) |i

f(x-iy,x-iy)=f(x,x)+if(x,y)-if(y,x)+f(y,y) |-i

4f(x,y)=f(x+y,x+y)-f(x-y,x-y)+if(x+iy,x+iy)-if(x-iy,x-iy)

В вещественном случае билинейная функция восстанавливается неоднозначно, поэтому ограничимся симметричными билинейными функциями.

Любая симметричная билинейная функция однозначно определяется своей квадратичной функцией.

f(x+y,x+y)=f(x,x)+2f(x,y)+f(y,y)

f(x-y,x-y)=f(x,x)-2(f,x,y)+f(y,y).

4f(x,y)=f(x+y,x+y)-f(x-y,x-y)

4f(y,x)=f(y+x,y+x)-f(y-x,y-x)=f(x+y,x+y)-f(x-y,x-y)

Лемма. Если в каком-нибудь базисе матрица билинейной функции симмтеричная, то билинейная функция симметричная.

Д-во: f(y,x)= [y]A[x]

Т.к. f(x,y) число, то f(x,y)=(f(x,y))

f(x,y)=(f(x,y))=([x]A[y])=[y]A[x]=f(y,x)

f(x,x)=[x]A[x]= - квадратичная форма.

В вещественном случае квадратичная функция есть квадратичная форма.

В комплексном случае это не так: f(x,x)=

О. Билинейная функция f(x,y) наз. эрмитовой, если

О. Матрица А наз. эрмитовой, если

Теорема. Эквивалентны следующие 4 утверждения:

  1. f(x,y) – эрмитовая билинейная функция

  2. Для любого базиса матрица билинейной функции эрмитовая

  3. Существует базис, для которого матрица билинейной функции эрмитовая

  4. Для любого x f(x,x) –вещественное

Д-во:

1→2 =>

2→3 очевидно

3→4 Если , то f(x,x)R

4→1 4f(x,y)=φ(x+y)-φ(x-y)+iφ(x+iy)-iφ(x-iy)

4f(y,x)=φ(y+x)-φ(y-x)+iφ(y+ix)-φ(y-ix)=φ(x+y)-φ(x-y)+iφ(x-iy)-iφ(x+iy)

Т.о. , т.е. f(x,y) эрмитовая билинейная функция

Следствие. Любой главный минор эрмитовой матрицы А вещественный.

Д-во:

Изменение матрицы б.ф. при замене базиса.

f(x,y)= для базиса и матрицы А б.ф. в этом базисе

Пусть дан другой базис и Q – матрица перехода.

Тогда f(x,y)== => A’=

О. А’ конгруэнтна А, если существует не вырожденная матрица Q, что A’=QAQ (для вещественных).

Если А эрмитовая матрица, то А’ тоже эрмитовая. Т.о. имеем отношение эквивалентности на множестве эрмитовых матриц. Также имеем отношение конгруэтности на множестве симметричных матриц.

О. Базис наз. каноническим для эрмитовой билинейной функции, если ее матрица в этом базисе диагональна.

Т. Лагранжа. Для любой эрмитовой билинейной функции существует канонический базис.

Д-во: индукция по рангу матрицы r

r=0 для нулевой матрицы верно.

Допустим, что теорема верна для r-1. Докажем ее истинность для r.

Рассмотрим три случая

а) a0, тогда В данном случае матрица перехода S будет выглядеть следующим образом:

S= S[x]=[x’] Q[x’]=[x] Q=S=

=

r(A)=r(A)-1 => A по предположению индукции можно привести к диагональному виду. В данному случае матрица перехода для А’ будет

б) a=0 и сущ. k, что a0

e’=e e’=e f(e’,e’)=a, а далбше как в пункте а)

в) a=0 и сущ. a0 (kl)

Возможны два случая:

  1. a=α+iβ α0. Тогда e’=e+e e’=e-e

f(e’,e’)=f(e,e)+f(e,e)+f(e,e)+f(e,e)=2α0

  1. α=0, β0

e’=e+ie e’=e-ie

f(e’, e’)= f(e,e)-if(e,e)+if(e,e)+f(e,e)=2β0

Следствие 1.

О. Базис эрмитовой билинейной функции f(x,y) наз. нормальным, если матрица билинейной функции в этом базисе имеет вид [f]=diag(1,..,1,-1,..,-1,0..,0)=E (s- кол-во 1, t – коли-во –1, n - всего)

Замечание (от меня). Число s+t равно рангу матрицы б.ф. Поскольку матрица преобразования, приводящего квадратичную форму к каноническому виду, является невырожденной (это видно из доказательства), то ранг матрицы б.ф. не изменится, а он будет равен числу ненулевых элементов на диагонали, т.е. s+t.

Следствие 2. Для любой эрмитовой билинейной функции существует нормальный базис, если поле вещественное или комплексное.

Следствие 3. Если ∆(А)0 (k=1,2,..,r), то существует верхнетреугольная матрица Q, которая приводит А к диагональному виду.

Д-во: индукция по r.

По теореме Лагранжа существует матрица Q, приводящая А к диагональному виду. Докажем, что она верхнетреугольная.

(A)=a0 => выполняется пункт а) теоремы Лагранжа. В данном пункте матрица перехода Q получается верхнетреугольной. Далее мы получаем матрицу А, для которой выполняется предположение индукции теоремы. Но ее ранг r-1 и следовательно существует верхнетреугольная матрица Q’, приводящая матрицу А к диагональному виду. Но тогда Q=Q - верхнетреугольная, как произведение 2-х верхнетреугольных матриц.

Т. Якоби. Пусть ∆0 (k=1,2,..,r). Существует канонический базис , для которого:

Д-во: Угловые миноры не меняются (по следствию из теоремы Бине-Коши) при умножении на невырожденную верхнетреугольную матрицу.

По теореме Лагранжа

D=diag(d,..,d,0,..,0) (ранги равны)

Q – невырожденная и по следствию 3 она верхнетреугольная => ∆(A)=∆(D) (k=1,..,r)

(A)=∆(D)=d…d=d(D)= d(A) => d= (k=2,..,r) d=∆(A)

Закон инерции квадратичных форм.

Для любой эрмитовой билинейной функции нормальный вид определяется единственным образом.

Д-во: f(x,x)=

Необходимо доказать, что s=s’

Рассмотрим соответствующие базисы и .

Пусть ss’. Достаточно рассмотреть случай s>s’.

Рассмотрим L() и L().

L+L - подпространство в n-мерном пространстве, отсюда dim(L+L)n

Но dim(L+L)=dim(L)+dim(L)-dim(LL). Отсюда следует, что dim(LL)0, т.к. dim(L)+dim(L)=s+n-s’>n

Т.о. LL не пустое, т.е. существует x0 и xLL

xL => x’=0 j>s => f(x,x)=>0

xL => x’=0 j<s’+1 => f(x,x)=0

Но такого быть не может.

Т.о. s=s’

Конгруэнтность есть отношение эквивалентности, следовательно есть классы эквивалентности. E- показатель (идентификатор) класса эквивалентности.

Следствие. Число классов эквивалентности эримтовых матриц в вещественном случае равно .

Д-во: Матрицы из одного класса эвкивалентности обладают одинаковым рангом (умножение на невырожденную матрицу не меняет ранга матрицы) и каждому классу соответствует единственная матрица нормального вида. Т.о. достаточно рассмотреть все различные E. А их .

О. Эрмитовая б.ф. f(x,y) наз. положительно определенной, если для любого x0 f(x,x)>0

Критерий Сильвестра положительной определенности.

Эквивалентны следующие 3 утверждения:

  1. Э.б.ф. f(x,y) положительно определена.

  2. Для любого базиса (A=[f]) ∆(A)>0 (k=1,..,n)

  3. Существует базис (A=[f]) ∆(A)>0 (k=1,..,n)

Д-во: 2→3 очевидно

3→1 Т.к. ∆(A)>0 (k=1,..,n), то по теореме Якоби f(x,x)= Т.к. x0, то f(x,x)>0

1→2 Пусть существует k такое, что ∆(A)=0

(A)==0

Система линейно зависима, т.е. существуют такие α,…,α, среди которых есть не 0, что αf(e,e)+…+αf(e,e)=0 (v=1,..,k)

Следовательно

Пусть x= . Заметим, что x0 т.к. какое-то α0 и вектора - базисные.

Т.о. для x0 f(x,x)=0. Противоречие.

Объем параллепипеда.

Рассмотрим n-мерное пространство.

О. m-мерным параллепипедом, построенным на линейно независмых векторах , наз. P()={b / b=, 0α1}

V() – объем P()

О. V()=

Теорема. V()==|b|V()V()|a||a|…|a| (равно, когда ортогональны). a=b+c, где сL(), bL()

Д-во: индукция по m

m=2

|a|²=|b|²+|c|² => |a||b|

b= a-

Г(,b)=QГ()

detГ(,b)=detГ()(detQ)²

Но detQ=1, т.к. она треугольная и по диагонали 1

detГ(,b)=|b|detГ()

Следствие 1. |b|=

Следствие 2. Если φ – линейное преобразование, то =C – зависит от φ

Д-во: Пусть Q –матрица φ

Если φ – вырожденное, то ==0=C

Иначе => C=|detQ|

Оценка Адамара для детерминанта.

Следствие 3. Если AC (mn) и max|a|=α, то det()

Д-во: есть матрица Грамма от строк матрицы А. Рассмотрим параллелипипед, построенный на векторах, соответстющих строкам матрицы А.

Его объем V=detГ()

|(a,a)|= => | a|

V

Следствие 4. Если AC и |a|α, то |detA| -формула Адамара.

Пусть АR. Рассмотрим случай α=1. Тогда |detA|

Лемма 1. Докажем, что достаточно рассматривать матрицы, элементы которой либо 1, либо –1.

Д-во: Допустим есть такой элемент, что –1<a<1. Разложим тогда detA по k-ой строке:

detA=a+ Если >0, тогда a=1 и определитель увеличиться, в противном случае a=-1.

Лемма 2. Теперь покажем, что если n≡1(2), то оценка недостижима.

Д-во: Пусть существует такая матрица А, что достигается данная оценка.

Оценка Адамара при α=1 достигается на специальных матрицах Адамара

H=1 H= (2х2)

Свойство 1. Строчки H ортогональны между собой.

Д-во: индукция по i. Рассмотрим матрицу H, докажем, что ее строчки ортогональны. Если мы возьмем две строчки их первых 2 и из последних 2, то они будут ортогональны между собой, так строчки с этими же номерами ортогональны в матрице H. А если выбрана строчка из первой половины, а другая из другой половины, то из-за знака “–“ они тоже будут ортогональны.

Свойтсво 2. Длина вектора, соответствующего любой строке матрицы Адамара, равна .

Д-во: Строчки ортогональны, поэтому |a|…|a|=V()=.

Решение” несовместных систем линейных уравнений

  1. Ax=b – несовместна

  2. δ=|Ax-b|=|Ax-b|

Метод наименьших квадратов.

О. Вектор x наз. псевдорешением системы (1), если в нем достигается |Ax-b|

M – множество всех песвдорешений системы (1)

Рассмотрим b=b’+b”, где b’L(), b”L()

|Ax-b’-b”|=|b”|←min Перпендикуляр наименьший из всех наклонных

(3) Ax=b’. Обозначим через M множество решений этой системы. Оно не пустое, т.к. система совместна.

Лемма. M=M

Д-во: Любое псевдорешение системы (1) можно представить как прямую сумму. И соответственно полученное b’ будет решением системы (3).

Для любого решения системы (3) можно найти b” . Будет существовать псевдорешение системы (1).

Расстояние между множествами.

M, M - множество точек в F

О. Расстоянием между M и M наз. величина ρ(M, M)=inf(||y- y||, yM, yM)

Рассмотрим M=x+L, M=x+L. Тогда ρ(M, M)=inf(||y- y||, yM, yM)= =min(ρ(x- x+L,L))=||||

Рассмотрим линейное пространство V над полем F подполем R

О. Говорят, что на данном V задана норма, если для aV задано в соответствие |a|F так, что

  1. |λa|=|λ||α|

  2. |a|>0, если a0

  3. |a+b||a|+|b|

Т.о. мы имеем отображение V²→F. В таком случае V наз. нормированным пространством. Тогда можем ввести ρ(x,y)=|x-y|

1’ ρ(x,y)=ρ(y,x)

2’ ρ(x,y)

3’ ρ(x,y)ρ(x,z)+ρ(z,y) (неравенство треугольника)

4’ ρ(x+z,y+z)=ρ(x,y)

5’ ρ(λx,λy)=|λ|ρ(x,y)

О. Если задано V²→F и выполняются условия 1’-3’, то ρ наз. метрикой, а пространство V – метрическим.

Если V – метрическое и выполняются 4’-5’, то можно V сделать нормированным, положив ρ(x,y)=|x-y|

Пример. Возьмем pN V=F a= => |a|=

p=1 |a|= - манхэттенская метрика

|a|=