Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Дроздов Н.Д. Линейная алгебра в теории уравнивания измерений

.pdf
Скачиваний:
2
Добавлен:
24.10.2023
Размер:
9.33 Mб
Скачать

 

Теперь

рассмотрим

произвольный

вектор

У

многообразия

v

= Вх +

d. Для него по неравенству треугольника справедливо

 

| v + Д | = | (v — v) + (v + Д ) | =ё | у —у | + |У + Д|.

 

Так как векторы (у +

Д),

(у —

у) и (у + Д ) все

принадлежат

подпространству L [В], то можно

указать такое Д , для

которого

в

нем осуществится равенство. Так что

 

 

 

 

us (у) = max | У - f А |

| + Гу + Д | =

| у - у | +

а 5 .

 

Отсюда и из неравенства | у — у) ^

0 получаем, что ors

^ crs (У)-

Это и означает, что при любом s перпендикуляр

у имеет наимень­

шую максимальную ошибку as

среди всех векторов

у.

v

Теорема 26 дает алгебраическое обоснование принципа наи­ меньших квадратов. Но она же выявляет и всю неполноту этого

обоснования.

Ведь

и определение

(113) максимальной ошибки,

и условие (у,

у) =

m i n зависят от способа метризации

простран­

ства і?„, в котором

рассматривается

многообразие v

=

Вх - j - d,

т. е. от

выбора матрицы G в определении скалярного

 

произведе­

ния (a,

b) =

a*Gb.

Алгебраическое

обоснование не

дает ответа

на вопрос: какую матрицу следует взять в качестве G?

Позже будет показано, что при некоторых условиях матрица G может быть однозначно определена на основании вероятностных сведений о векторе Д.

§38*. РЕШЕНИЕ УРАВНЕНИЙ ПОПРАВОК

ИУСЛОВНЫХ УРАВНЕНИЙ МЕТОДОМ ОРТОГОНАЛИЗАЦИИ

Метод ортогонализации, изложенный в § 32, можно применить для решения уравнений поправок или условных уравнений по методу наименьших квадратов, т. е. под условием

 

 

 

 

(у, у) = y*Gy = m i n .

 

 

Начнем с уравнений поправок

у = Вх

+

d, которые запишем

в более подробном

виде

 

 

 

 

 

 

v = b1x1+b2xz-\-.

. . +

b,zr

+

d,

где b1,

 

і

— столбцы матрицы В. Проделаем следующую

b2,

. . ., br

замену

переменных:

 

 

 

 

 

 

х1

 

(Ьі,

ь,)

( b i .

br)

 

 

 

 

(Ьі,

b i )

( b i .

b i )

 

 

 

 

 

 

 

X =

х?

=

1

 

о

 

 

(*,-!)

 

 

 

о

1

 

 

(х,.1)

где выражения вида (р, q)

обозначения из § 6*.

110

 

Получим уравнение

і; = h (х, • 1) + ( Ь2 ~ ^ M - b x ) (x2 1) + . . . +

или, если ввести обозначения (bt-l)

bt

 

bt,

v = b1(x1.l)

+

(b2.l)(x2-l)

+ . .

. +

(brl)(xr.l)

+ d

(в матричном виде v =

(В • 1) {х-1) +

d).

При этом, как известно

из § 32, все столбцы

ортогональны

столбцу

Ьх.

На втором этапе

решения делается

замена

 

1)

(а;2 1)

(*•!) =

1)

1

0

 

0

0

1

((Ь2

• 1). (Ьз D)

((Ьа -1). (Ь2 1))

 

 

0

0

 

0

Получаются уравнения

 

0

 

((ба • 1), г D)

"

( ( V I ) . (&а D)

• •

1

= Я 2 (а; . 2) .

(^•2)

& - 2 )

(*,-2)

» =

b1

-2) +

8 .1) (х2 - 2) +

3 -2) (х3 .2) + . . . +

(6Г -2) («,• 2) + d,

где

введены обозначения

 

 

о>2)

 

 

 

 

<*/-ii)-»ri)-fcya:i|}ft-D

 

(матрично

v

=

(В-2) (х-2)

+ d). При

этом, согласно § 3 2 ,

все

столбцы (Ьу--2) ортогональны столбцам Ьг

и ( Ь 2 - 1 ) , а два последних

ортогональны

между

собой.

 

 

 

 

 

Ясно,

что

после

г — 1 действия получатся

уравнения

 

 

v =

Ь11 • [г-1])

+ (6, • 1) (х.2 [г-1])

+ (Ь3

• 2) 3

• [г-1])

+

 

 

 

 

+ . . .

+ (bf.[r-l])(x,-lr-l])

+

d,

 

(114)

или

матрично

у

=

(В • [г — 1 ]) (х • [г

— 1 ])

+ d,

все столбцы

которых попарно ортогональны. Поэтому для них система нор­ мальных уравнений (см. § 6*)

(В • [г — 1] * G (В • - 1 ]) (х • [г — 1 ]) + (В • [г 1])* Gd = О

принимает вид

Фі, &]) (*1 [ Г - U ) =

- ( & ! , d

) .

 

 

 

(Фг-І),

(bi-i))(xt.[r-l])

 

= -((bi-i),

d),

 

((68 . 2), (Ьа • 2)) (х3

. [г— 1]) = -((fea • 2), d),

 

((Ьг • lr-D),

Фг -[г-і ])) («г • [ ' — ! ] ) = -

(Фг -[г-і]),

d).

Отсюда сразу

находится

столбец

(х- [г — 1]), подстановка

которого в (114) приводит к искомому столбцу

v. Если нас интере­

суют исходные неизвестные а, то следует еще проделать обратный ход по схеме

 

x =

ff1Ha...Hr_1(x.[r-\]}.

о

Стоит заметить

[10 ], что матрицы

II . . . о

о

. . .

. . . 1

. . . 0

0 . . . 0

получаемые с матрицами

((bi- І*-і]),

(bui-l « - Ш

((Ьг lt-И).

(br [i-l]))

(Фі [<-1]).

{br[i - і ] ) )

Wi­ [i-i]).

(bi [ ' - ! ] ) )

1

 

 

0

0

 

 

1

в процессе

ортогонализации,

целиком

совпадают

 

. . .

0

0

 

0

 

 

 

л

• [ * - ! ] )

№ • [ ' - 1 ] )

<?г =

 

 

 

 

(btbi-[t-l])

 

. . .

0

1

 

0

 

 

 

 

 

. . .

0

0

 

1

 

получаемыми при решении по "методу Гаусса нормальных

уравне­

ний, составленных по исходным уравнениям

поправок. Иначе

говоря,

1

 

 

 

 

 

при всех

І.

И), ( V [ * - l ] ) )

=

 

(И5)

 

 

 

 

 

При і

= 1 это видно непосредственно. Предположим, что (115)

верно при і = к,

т. е.

 

 

 

 

 

 

 

& • [ * - ! ] ) )

= (&*&/•№-!])•

(US')

Покажем, что тогда

(115) верно

и для і =

/с -}- 1 (а

следова­

тельно, и для всех г).

По определению

 

 

<vч - і * - ї ї ) - Ш ^ М ^ т <ь'1 4 " »п.' >*•

Так что, учитывая (115'),

(&, • к

) .

[к- I D -

(bk+l-k)

=

(bk+1.[k~l])-

 

 

(uftbfc-[A—І])

Отсюда получаем

- • т е т й і г « * * ; [ * - і ] ) . ( й і - [ * - і ї ) ) -

(bkbr[k-i])

(****•[*—і])

или, опять учитывая (115'),

((Ьк+1-к),

(brk)) =

(bk,1br[k-l])-

(6*6*+i •[&-!])

(6*6*

• [ * - ! ] )

 

 

 

 

Но по

определению

(bk+1bfk)

(см. §8*) это

и означает, что

( ( W * ) , (br*)) = ( W > r * ) -

Это равенство устанавливает тесную связь метода Гаусса решения нормальных уравнений с методом ортогонализации урав­

нений

поправок. Но

с

точки зрения вычислительного процесса

эти методы имеют существенное различие. Вычисление

матриц

Q, в методе Гаусса производится по коэффициентам нормальных

уравнений, вычисление

же матриц Hh

численно совпадающих

с Q*,

производится

по

коэффициентам

непосредственно

урав­

нений поправок. Так что метод Гаусса — это метод решения именно нормальных уравнений, тогда как метод ортогонализации яв­ ляется методом решения непосредственно уравнений попра­ вок.

Позже будет видно, что это различие существенно с точки зре­ ния накопления ошибок округлений при вычислениях элементов

матриц Н,- и Qj.

 

 

Система условных уравнений А У +

 

w = О или

« 1

 

 

Щ

=

0,

V +

8 заказ 2041

113

где at — строки' матрицы А, ортогонализуется умножением ее слева на матрицы

1

0 . . . 0||

где

<„,.к )

(аъ

о.а)

.

О

( « 1 .

a l )

 

 

 

м 1 =

 

 

 

( а 1 .

ат)

Q

 

0

1

Mo

((ga

• 1),

(«з • 1))

и т. д.,

( ( « 2

- І ) ,

( e a - D )

 

( ( o a - l ) .

(вш - D)

 

 

( ( « 2 - 1 ) .

(вз-1))

• " "

_ (0J. _ и)-;;:;:^;»;';::'!:;;;; « . •і*- 1 » . « >*».

Дальнейшие рассуждения могут

быть проведены по аналогии

с рассуждениями, рассмотренными

для уравнений поправок.

§39*. ГРУППОВАЯ (БЛОЧНАЯ) ОРТОГОНАЛИЗАЦИЯ

ПРИ У Р А В Н И В А Н И И ИЗМЕРЕНИЙ

Метод ортогонализации можно рассматривать как крайний случай более общей процедуры — блочной или групповой ортого­ нализации. Рассмотрим ее для условных уравнений Аи + w = 0, которые представим, например, в виде

 

 

">1

(116)

А 2

V +

= 0,

A s

 

w3

 

где А, — произвольные горизонтальные блоки матрицы A, a wl соответствующие блоки столбца w.

Умножим обе части (116) слева на блочную матрицу

 

 

Е

 

0

0

 

 

- ( А 2 К А * ) ( А 1 К А * ) - 1

Е

0

,

(117)

- ( А 3 К А * ) ( А 1 К А ^ ) - 1

0 Е

 

 

где К = G"1 — ковариационная

матрица. В

результате

придем

к равносильной системе

 

 

 

 

 

 

 

А х

 

 

И>1

 

 

 

 

I V И

V +

 

=

0,

 

(118)

I V

1]

 

[ U V U

 

 

 

 

 

 

 

 

 

 

где

 

 

 

 

 

 

 

[ A r 1] = А, -

г КА*) (AjKA*)"1

Ах >

 

 

 

[w, • 1] = w t — (A,KAJ) ( А Д А * ) - 1

WX .

 

 

Для (118) нормальные уравнения примут блочный вид

 

АХ КА*

0

0

II К

W1

 

0

[ А 2 - 1 ] К [ А 2 - 1 ] *

[ А 2 - 1 ] К [ А 3

1]*

+ [w2

11

= 0,

0

[ А 2 - 1 ] К [ А 2 - Ц *

[ А 3 - 1 ] К [ А 3

1]* II

к3

1]

 

(120)

где ]q — блоки столбца к коррелат. Здесь в первой строке и пер­ вом столбце на недиагональных местах стоят нулевые матрицы, так как

[А, • 1] КАЇ = [А, - (АДА*) ( А Д А * ) - 1 А х ] КА*. =

 

= А І КА! - (А £ КА*)(А 1 КА*) - 1 1 КА1[) = 0

(*>1) .

(121)

Как видим, после умножения систем (116) слева на (117) полу­

чается система (118), в которой все строки блоков

[А*-1]

орто­

гональны линейной оболочке L [Ах] строк блока

А х .

Тем

самым

произведено первое действие блочной ортогонализации.

Такое же обобщение процесса ортогонализации может быть рассмотрено и для решения уравнений поправок.

Применение метода групповой ортогонализации в общем слу­ чае достаточно громоздко. Но в геодезии часто возникают особен­ ности в структуре матриц условных уравнений или уравнений поправок, которые могут сделать применение блочной ортогона­ лизации как раз эффективным. Часто, например, условные урав­

нения

(116)

можно записать

так, что уже выполнено условие

A 2 K A J

=

0.

В таком случае

блочная ортогонализации

приводит

к одной

из

модификаций

группового уравнивания

по методу

И. Ю. Пранис-Праневича [27].

 

Г л а в а

6

 

 

 

 

КВАДРАТИЧНЫЕ

ФОРМЫ

 

 

 

§ /ІО. Л И Н Е Й Н Ы Е , Б И Л И Н Е Й Н Ы Е

И К В А Д Р А Т И Ч Н Ы Е

Ф О Р М Ы

 

Здесь будут рассмотрены некоторые классы вещественных

функций, определенных на линейных

векторных

пространствах

L n

[7, 6, 19, 24, 33, 34]. Каждая такая

функция

задается указа­

нием правила /, сопоставляющего

с

тем или

иным

вектором

х

6 L n число а. При этом пишут: а

= / (х). В отличие от функций

вещественных аргументов, числовые функции векторных аргу­

ментов называют

формами.

 

 

 

Функция / (х) называется линейной

формой,

если она

удовле­

творяет условиям:

 

 

 

1)

/ ( х 1 + х 2 ) = / ( х 1 ) + / ( х 2 ) ,

 

 

 

2)

/(Хх1 ) =

Я,/(Хі).

 

 

 

Например,

пусть

правило / с каждым вектором x£Ln

сопоставляет его г-ю

координату

в

базпсе

21, т. е. х; = / (х). По

пзвестпым

свойствам

координат

эта функция

линейная.

 

 

 

Существует общее аналитическое правило задания любых линейных форм. Действительно, пусть / (х) — такая форма.

Пусть

21 = (а х , а 2 ,

. . ., а„}

базис L n

, так

что

 

 

 

х =

 

+

ж2 а2 + . . . +

ж„а„.

 

 

Тогда

по

свойствам

1 и

2

 

 

 

 

 

 

 

/ (х) =

xj

( a j +

x2f

2 ) + ...+XJ

п ).

(122')

Если обозначать

aL

=

f г ), то

 

 

 

 

 

/ (х) = аххг

+ а2х2

+ . . . +

апхп =

ах,

(122)

где а

=

|| й^, а2, . . .,

ап

|| — фиксированная для данной формы

строка (коэффициенты формы),

а х — столбец

координат

произ­

вольного вектора х (переменные, или аргументы формы). Так что всякая линейная форма имеет вид (122). Строка а называется

строкой коэффициентов этой формы в данном базисе 21.

По свойствам матричных действий легко проверить обратное: всякая функция / (х), заданная в виде / (х) = ах, где х — столбец координат вектора х в некотором базисе, является линейной формой.

При изменении базиса строка данной линейной формы должна

измениться. Пусть х — столбец координат вектора

х в базисе 21

и х'

— в базисе 21'. Пусть М — матрица перехода от 31' к 21, так:

что

х = Мх'.

Тогда

 

 

 

 

 

/ (х) = ах = а (Мх') = (аМ) х' = а"х'.

 

 

Так как это верно при всех х, то по теореме 1 а'

=

аМ.

Билинейной

формой

называется вещественная

функция двух

векторных аргументов а

= / (х, у) такая, что при

фиксированном

у она является линейной формой от х, а при фиксированном х — линейной формой от у.

Примером билинейных форм служит скалярное произведение-

векторов евклидова пространства.

 

 

 

Пусть/ (х,у) — билинейная форма в L „ H ? I

= {at,

а 2 , . . ., а„} —

базис этого пространства. Если зафиксировать у,

то

по (122'),.

/(х, у) = г 1 / ( а 1 1

у)Ч-z.2 /(a2 ,

у) + . . . +

s n / ( a „ , у)

=

 

л

 

 

 

 

=

2 *,/(*!,

У) =

 

 

(123>

 

1=1

 

 

 

 

где х — столбец координат вектора х в 91, a d — столбец ||/ (аг , у) |[. Но раз а, фиксированы, то по (122')

di = H&i, У) = /(*«•»

 

+

/ ( » ! .

as )02 +

- • • + / ( » ! .

ап)Уп,

 

или, если

обозначить Сц

/

г а,), т. е.

ввести матрицу

С =

 

 

 

 

 

d = Cy.

 

 

 

(124)-

Сопоставляя (123) и (124), получим общее представление

билинейной формы в данном

базисе в матричном виде

 

 

 

 

 

/(х,

y) = z*Q/

 

 

 

(125)

и в координатном

виде

 

 

п

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

/ ( * .

У ) =

2

CiFiVi-

 

 

 

(125').

 

 

 

 

 

 

і /=-1

 

 

 

 

Здесь х ж у — столбцы координат xt и у/ векторов х и у в ба­

зисе 21, а С =

|| Сц || = ||/ (а£-, а/)

|| — матрица, которую называют

матрицей

заданной

билинейной

формы.

 

 

 

 

Наоборот, рассмотрим произвольную п X

тг-матрицу С и опре­

делим функцию / (х, у) векторов х

и у 6 L n (со

столбцами

ж и г /

координат

в

условленном

базисе)

правилом

/ (х, у)

=

х*Су.

Эта функция является билинейной формой, так как она линейна,

относительно

у

 

 

 

/ (х, а У і . + р У г ) = х*С (аУі

+ ру,)

=

=

а(г*Су1 )+Р(а;*Су! ! ) = о/(х,

У і ) +

Р/(х, у2 ).

Аналогично проверяется ее линейность относительно X .

И Т

Форму

/* (х, у)

=

/ (у, х) 1 назовем сопряженной с /

(х, у).

По (125) /

(х, у) =

х*Су

и, следовательно, с учетом свойств

транс­

понирования и того, что число при транспонировании не меняется

/ (у, х) = у*Сх

=

(у*Сх)* =

х*С*у.

 

 

Поэтому /* (х, у) = х*С*у.

Итак, если С — матрица билиней­

ной формы в данном базисе, то С* — матрица сопряженной

били­

нейной формы в том же базисе.

 

 

 

 

Билинейная форма / (х, у) называется

симметричной,

если

f (х, у) = /* (х, у). Отсюда х*Су

= х*С*у

для всех х

и у. Тогда

по теореме 1 С = С*, т. е. матрица симметричной

билинейной

формы симметрична в любом базисе. Обратно, если матрица С билинейной формы / (х, у) симметрична в каком-нибудь одном базисе, то эта форма симметрична, так как

/(х, y) = :e*Cy = s*C*p = / * ( x , у)

и ее матрица симметрична и во всех других базисах.

Скалярные произведения векторов евклидова пространства дают пример симметричных билинейных форм в L„. Но не всякая симметричная билинейная форма / (х, у) в L n может определять скалярное произведение в нем. Согласно определению скалярного произведения, для этого необходимо еще, чтобы выполнялось

условие

/ (х, х) i s 0 при всех х £ L n ,

причем

/ (х, х)

=

О лишь

при х

=

0.

При выполнении

этого

условия

билинейная

форма

в L n

удовлетворяет

условиям

скалярного

произведения.

 

Как видим, для выяснения положительной определенности

любой билинейной формы / (х, у) нужно

рассмотреть ее при усло­

вии у =

х,

т. е. образовать функцию / (х, х)

одного

векторного

аргумента х. Ее называют квадратичной

формой

в L n .

В соответ­

ствии

с

(125')

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

л

 

 

 

 

 

 

 

 

 

 

 

 

 

/ ( X , Х ) =

2

ЪцХр^Ъ-цЗ?!

+

blzx1x2

 

+

.. .+Ь1пх1хп

+

 

 

 

 

і, 7-1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ъо^Х-^Х^ -f- Ь2гХ\

- { - . . . - ( -

b2l^t^Xn -\-

 

 

 

 

 

+

ЬщХ-^Хп + Ъп2х2хп

+

. . . - ) - Ъппх\ —

 

 

=

bllX\

+

2 (Щї^)

хгхг

+ .

. . +

2 ( - ^ ± ^ 1 ) X l

x a +

 

 

 

 

 

+

b22x\

+ .

• • +

2

( ^±Ь*

) x,xn

+

1 Символ «=» означает тождественное равенство, т. е. равенство при лю­ бых значениях х и у.

і 18

Как видим,

/ ( х , х) = / * ( х , х ) = ^ х - * > + / * ( Х "

По (125), в данном базисе

f(x, х) = х*Вх = х*В*х = х* ( Л ± 5 1 ) а ; .

Однако теперь теорема 1 неприменима, так как при фиксирован­ ном х нельзя взять произвольное х*, и потому отсюда не следует, что В = В* = (В + В*)/2. Кроме того, для данной матрицы В = II Ьц || можно подобрать сколько угодно таких матриц D =

=что выполняется условие

 

 

 

 

В +

В *

D + D *

 

_

Г

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 ~ ~ L -

 

 

 

 

 

 

 

 

Для этого нужно лишь, чтобы выполнялись условия

 

Ъи

=

d

и btj +

bji = dij +

djt, так

что х*Вх

=

х* Вх и при этом В Ф

D .

Итак, существует

множество

билинейных

форм,

приводящих

к одной квадратичной форме. Среди них имеется одна

симметрич­

ная билинейная форма, так как для любой

квадратной

матрицы

В сумма В + В* симметрична. Эту билинейную форму

назы­

вают полярной

к данной

квадратичной

форме / (х, х).

Матрицей

квадратичной

формы в данном базисе называют матрицу С поляр­

ной ей билинейной

формы. Поэтому

в матричной

форме

 

 

 

 

 

 

 

 

/ ( х ,

х)=х*Сх

 

 

 

 

 

 

 

 

 

(126)

и в координатной форме

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

п

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f ( x i х ) =

cijxixj

с 1 \ х \

%cizxix2

 

Н~ • • • ~Ь

21пх1хп~^~

 

 

 

 

г, /=1

 

 

 

 

—|— С2^рС2

I

. . .

—J

QCvflXftX™j (126 ):

 

 

 

 

 

 

 

Из (126) при х =

0 получаем / (х, х)

=

0. Если

/

(х, х)

>

0

(/ (х, х)

0) при всех

х Ф 0, то эта форма

называется

положи­

тельно

(неотрицательно)

определенной.

При /

(х, х)

<С 0 (/

(х, х)

^

=5 0) для всех

х Ф

0

она

называется

отрицательно

 

(неположи­

тельно)

определенной.

Наконец,

форма

/

(х, х) называется

знако-

неопределенной,

если

существует

вектор

х1

£ L n

, для

 

которого

/ (хц, х-,) > 0 ,

и вектор х 2

 

£ L n , для которого

/ (х 2 , х 2 )

< ; 0 . Соот­

ветственно любую симметричную матрицу С называют положи­

тельно

(неотрицательно)

определенной, отрицательно

(неположи­

тельно)

определенной

или

знаконеопределенной.

 

 

 

 

 

 

Основная задача данной главы будет заключаться в исследова­ нии знакоопределенности квадратичных форм или симметричных матриц.

Соседние файлы в папке книги из ГПНТБ