Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Дроздов Н.Д. Линейная алгебра в теории уравнивания измерений

.pdf
Скачиваний:
2
Добавлен:
24.10.2023
Размер:
9.33 Mб
Скачать

Равенства (12) выражают соотношения поправок в данной сети г . Выражение (12') — их матричное представление. При этом стол­ бец Д называют столбцом поправок в измерения, так как со­ гласно (11) его прибавление к столбцу I измеренных величин привело бы к столбцу I искомых значений. Таким образом, соот­ ношения (12) или (12') связывают поправки в измерения с поправ­ ками в приближенные значения определяемых величин.

С любой сетью можно связать не только соотношения поправок, но и еще одну систему соотношений. Функции (8), число которых т — п — г, можно записать в неявном виде как

 

Фі

h, •

lr) — lr+l

= ^ 1

h,

••;

Q = О,

 

 

<Pm

h,

• • ., lr)~ln

= Fm

{llt

I,,....

ln) = 0.

(13)

Их

можно

разложить в ряд Тейлора в

окрестности

точки

12,

. . ., 1п),

где lt

— измеренные значения величин Ц. При этом

обычно достаточно ограничиться линейными членами этих разло­

жений. В результате получается система

 

 

 

йцАі +

а 1 2 А 2

+ . .. + а 1

п Д „ =

ы>ь

(14)

а,П\ Лі +

«та А2

- f • • • + атп Ап =

wm,

 

где aki — Щ~ — коэффициенты системы; Д,- =

Zt lt — неизвест­

ные ошибки измерений;

wk = Fk(lx,

l2,

. . . , Z„)

невязки 2 ,

или

свободные члены уравнений системы (14). Система (14) равно­

сильна матричному

выражению

АД — w или

 

 

 

 

А ( —Д) +

и; =

0.

 

(14*)

Равенства

(14) выражают

условные

соотношения

данной

сети,

а (14') их матричное

представление. Эти равенства

задают

систему

условий,

которым должны удовлетворять поправки

визмерения.

§6*. УРАВНЕНИЯ ПОПРАВОК И ИХ РЕШЕНИЕ ПО МЕТОДУ НАИМЕНЬШИХ КВАДРАТОВ

Рассмотрим начальные задачи теории уравнивания измерений. При этом стоит иметь в виду, что изложенные сведения о матрицах еще слишком скромны, чтобы уже теперь дать строгое решение или даже просто четкое изложение этих задач. Поэтому многое

1Соотношения поправок и появляющиеся далее условные соотношения

всетях нужно отличать от уравнений иоправок и условных уравнений, ко­

торые будут рассмотрены в § 6* и § 7*.

2 Wk и aki значения соответственно функпий Fk{l%, 1-і,---, In) и их частных производных dFk/dli при изморенных значениях переменных.

придется пока излагать догматически, часто ссылаясь на факты, которые будут изучены только в последующих главах. Но не будем считать это недостатком изложения, так как выяснение недостаточ­ ности уже развитой теории для решения поставленных задач стимулирует дальнейшее ее развитие.

Итак, рассмотрим соотношения поправок (12):

A = B8k + d.

Вних столбцы А и дк неизвестны. Система (12) содержит п + г неизвестных чисел. Всего же равенств в этой системе п. Позже будет доказано, что по этой причине система (12), если ее рассма­ тривать как систему уравнений с неизвестными — А и 8к, не имеет единственного решения. Поэтому вместо равенств (12) будем рассматривать неопределенную систему уравнений

v = Bx + d,

(15)

называемых уравнениями поправок1. Чтобы получить все возмож­ ные ее решения, нужно придавать все возможные значения столбцу х. При этом согласно (12') только, когда х = дк, будем иметь v = —А. При всех же других значениях х нам неиз­ вестно) элементы столбца v могут быть лишь менее или более близки к элементам столбца —А.

Основная задача теории уравнивания измерений состоит в вы­ боре такого столбца х, при котором столбец

u = Bx+d,

(16)

взятый в качестве оценки столбца—Д, приводит к наименьшему риску сильно ошибиться по сравнению с любым другим столбцом (15). Разумеется, такая постановка задачи пока расплывчата, так как не определено еще, что следует понимать под «риском

сильно ошибиться». Общий принцип наименьших

квадратов

[38,

44,

9,

21, 12]

предписывает

измерять этот

риск

величиной

 

 

п

 

г Д е G =

 

 

 

 

v*Gv

=

2

gijvivji

Ни/11 — некоторая

заданная сим-

метричная матрица (назовем ее весовой матрицей)

, и потому

исходит из

условия

 

п

 

 

 

 

 

 

 

 

 

 

(17)

 

 

 

 

v*Gv=

2

gi,vpj = mm.

 

 

 

 

 

 

і, І=Х

 

 

1Эти уравнения называют также уравнениями ошибок (погрешностей).

2Здесь терминология пока не установилась. В других работах весовой называют матрицу весовых коэффициентов, а это не то же, что G . Здесь мат­ рица G называется весовой потому, что она всюду в дальнейшем играет в точ­ ности ту же роль, что и матрица весов независимых измерений, хотя в случае зависимых измерений на диагонали матрицы G стоят не веса.

В частности, при G = Е имеем v*Gv

= v*Ev

=

v*v =

2 vh

п при этом условие (17) выражает элементарный

принцип

 

1=1

наимень­

ших квадратов. Если же G — диагональная матрица

 

 

 

 

 

P i

 

 

 

 

 

 

 

 

G = P =

Pi

-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2п Pivl,

 

 

...

рп

 

 

 

 

то v*Gv

и тогда условие

(17) составляет принцип

наи-

 

i=i

 

 

 

 

 

[16, 32, 35] *.

меньших

квадратов

для неравноточных

измерений

Позже мы сможем критически осмыслить это предписание.

Сейчас же задача сужается до отыскания столбца х в

(15) под

условием (17). Эта задача на отыскание точки минимума

решается

обычным методом дифференциального исчисления: в выражение

v*Gv подставляется (15), получается

 

 

v*Gv = xB*GBx+2d*GBx

+ d*Gd;

(18)

б е р у Т С Я ЧаСТНЫе ПрОИЗВОДНЫе ЭТОЙ фуНКЦШІ ПО

П е р е м е Н Н Ы М Х{

(элементам столбца х) и приравниваются нулю. В результате с уче­ том обозначений

C = B*GB

и H = GB,

 

(19)

получается система г уравнений

с г неизвестными х

 

C x - f H * d = 0.

 

(20)

Она называется системой

нормальных

уравнений.

Позже

(см. § 37*) будет доказано, что

уравнение

(20) имеет

решение

и притом единственное. Оно и служит искомым X.

А Легко видеть, что формально систему (20) можно получить, умножив обе части системы (15) слева на Н* = B*G

B * G y = B * G B x + B * G d

и приняв B*Gy = 0. V

Этот результат принято выражать в виде теоремы.

Теорема 2. Принцип решения уравнения ошибок (16) под

условием

v*Gv = m i n равносилен принципу

его решения под

условием

 

 

 

B*Gy = 0.

(21)

1 Исторически первым появился элементарный принцип наименьших квадратов (Лежандр, 1806), затем он был расширен на перавноточные измере­ ния (Гаусс, 1809) и значительно позже был обоснован общий принцип на­ именьших квадратов (Эйткен, 1935), учитывающий зависимость между ошиб­ ками измерений.

В

заключение

 

расшифруем

систему (20)

поэлементно. Если

 

 

 

 

 

 

 

аг

Ьх ...

 

 

 

 

 

 

 

 

 

В = а2 62 . . . тпг

 

 

то по

(19)

 

 

 

 

 

anbn.

..тп

 

 

 

 

 

 

a*Ga

a*Gb

 

a*Gm

 

 

 

 

 

 

 

 

 

С = B * G B

= b*Ga

b*Gb

 

b*Gm

 

 

 

 

 

 

m*Ga

m*Gb ...

m*Gm

где a,

b . . . m — столбцовые блоки матрицы

В.

Удобно

принять

обозначения

 

 

 

 

в которых

 

 

 

 

P*Gq=(p,

q),

 

 

 

(с, а)

(а,

Ъ) ...

(а,

т)

 

 

(a, d)

 

 

 

 

 

 

с =

(а, 6)

(6,6) . . .

(6,

т)

, H*d =

(6, d)

 

 

 

 

 

 

 

 

 

 

 

 

(а, т)

(Ь, т)

. . . (т,

т)

 

 

(т, d)

потому

(20) примет

вид

 

 

 

 

 

 

 

 

(а, а)хх

 

(а,

6) ж2

+ . .. +

(«, т) хт

=

-- (a, d),

 

 

(а,

Ъ) хх

- f (b,

Ь)х2 + .• - +

(Ь, т)хт=

 

-(b,d),

 

 

(а, т) хх

-f- (6, пг) я.

+ ( т , т.)

х„

(т, d).

 

 

§ 7*. УСЛОВНЫЕ УРАВНЕНИЯ И ИХ РЕШЕНИЕ

 

 

 

ПО МЕТОДУ НАИМЕНЬШИХ КВАДРАТОВ

Рассмотрим теперь

условные соотношения

(14')

 

 

 

 

 

 

А ( — Д ) +

И7 = 0.

 

 

Эти т =

п — г соотношений содержат п неизвестных поправок

—Д(-. По этой причине, если их рассматривать как уравнения с не­

известными

—Д, мы

не получим

единственного решения, т. е.

существует

множество

столбцов

v, удовлетворяющих

условию

 

 

Ay - j - U? = 0.

(22)

Систему уравнений (22) называют условными уравнениями сети. Задача теории уравнивания измерений и в этом случае состоит в выборе такого столбца v, для которого риск сильно ошибиться,

приняв его в качестве оценки для Д, наименьший. Не имея

пока обоснованного понятия такого риска, мы снова встанем на позицию догматического применения общего принципа наимень­ ших квадратов (17). При этом задача математически полностью определяется как задача отыскания минимума функции v*Gv —

 

п

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

— 2

gtjvivj

=

 

тІП ПрИ УСЛОВИИ (22) 1 (Задача НаХОЖДеНИЯ УСЛОВ-

U-I

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ного минимума).

 

 

 

 

 

 

 

 

 

 

 

 

По

правилам

анализа

для отыскания такого решения соста­

вляется функция Лагранжа

 

 

 

 

 

 

 

 

 

 

 

 

L{v)=

2

gtjvivt

2*! ( 2 «і/У/ + w\)

-

 

 

 

 

 

— 2кг

^ 2

а-грі +

u>2j — • • • — 2km

^ 2

amjvf

+

w„

 

здесь

atj — элементы

матрицы

A ;

wt — элементы

столбца

w

(невязки);

—2kt

— неопределенные

множители

Лагранжа.

 

 

Далее необходимо найти

 

и приравнять

их

нулю

 

 

 

 

 

 

 

 

71

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

2

2

 

2 2

а*Л = 0-

 

 

 

 

 

 

 

 

 

 

 

1=1

 

 

г=1

 

 

 

 

 

 

 

По сокращении на 2 этот результат можно записать в матрич­

ном виде

 

 

 

 

 

 

Gy = A*A.

 

 

 

(23)

 

 

 

 

 

 

 

 

 

 

 

 

 

Весовая матрица G всегда назначается так, что для нее имеется

симметричная

матрица

К

{ковариационная

матрица)

такая,

что

K G

=

G K =

Е.

Отсюда,

умножая

обе части

(23)

слева на

К,

получим

 

 

 

 

 

 

v = KA*k.

 

 

 

(23")

 

 

 

 

 

 

 

 

 

 

 

 

 

Элементы

столбца

к

называют

коррелатами,

а

уравнение

(23') в матричном виде выражает поправки vt через

коррелаты.

 

Если подставить

(23') в

(22),

получим

уравнение

 

 

 

 

 

 

 

 

 

 

АКА*А + ы7=.0

 

 

 

 

 

относительно

столбца к коррелат, или, если обозначить АКА*

=

=

D, то

 

 

 

 

 

 

D& +

w = 0.

 

 

 

(24)

 

 

 

 

 

 

 

 

 

 

 

 

Это матричное выражение системи нормальных уравнений коррелат. В последующих главах (см. § 37*) будет доказано,

1 Позже (§ 37*) будет видно, что это v равно и из условия (10), но, пока

это не доказано, сохраним для них рааные обозначения.

что эта

система

имеет

единственное решение

к.

Подстановка его

в (23')

приведет

к искомым поправкам ~й.

 

 

 

 

Если

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

аг

а2

 

 

 

 

 

 

 

 

 

 

 

А

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

тг тг . .. тп

 

 

 

 

то матрицы

D можно

представить в виде

 

 

 

 

 

 

 

 

 

 

(а, а)

(а, Ь)

...

(а,

т)

 

 

 

 

 

 

 

D

=

(а,

Ъ)

(Ъ, Ъ)

...

(6, т)

 

 

 

 

 

 

 

 

 

(а,

т)

(Ь, т)

. . . (т, т)

 

 

 

где (р,

д)

=

p*Kq,

 

и система (24) примет вид

 

 

 

 

 

(a,

a)kt

+

(а, Ь)к2 +

...-f

(а, т)km-\-wx

 

=

О,

 

 

(а, 6)^-1-(6,

&)/c2 -t".. . +

(b, т)кт

+

ю2

=

0,

 

 

(а, т)к1

+

(Ъ, т)кг+

. .. +

(т, m)km

+

wn

=

0.

 

§

8*. РЕШЕНИЕ СИСТЕМ НОРМАЛЬНЫХ УРАВНЕНИЙ,

 

 

 

 

 

 

АЛГОРИФМ

ГАУССА

 

 

 

 

Широко известен метод решения систем нормальных уравнений

заключающийся

в

последовательном

исключении неизвестных

и называемый методом Гаусса

[5. 32,

35]. Его

легко изложить

в матричном виде. Рассмотрим, например, систему нормальных уравнений коррелат (24):

Bk + w = 0.

Обе части умножим слева на матрицу

1

 

о

(а. Ь)

1 . . . О

(а,

а)

 

(Д, ™)

 

(а,

о)

 

(предполагается, что (а, а) Ф 0), после чего получается новая система QjD/c + Qi"> — 0. Смысл этого преобразования заклю­ чается в том, что в первом столбце матрицы

 

 

(D-1) = Q1 D =

 

 

 

1

0

. .

0

(а,

а)

(а, 6)

(а,

/я)

(а,

Ь)

 

 

 

 

(а,

Ь)

(Ь, Ь)

(Ь,

т )

(а,

а)

 

 

(а,

 

 

 

(а,

/?г) (Ь, га) . ..

(т, т)

(а,

а)

 

 

 

 

 

 

 

 

(а, а)

(а,

6)

 

 

(а, т)

 

 

 

о

(Ь,

 

 

 

(Ъ, т • 1)

 

 

 

0

(Ь.пг.1)

 

 

(то, то- J)

 

 

все элементы, кроме первого, получаются нулевыми. При этом

введены обозначения

вида

 

 

 

 

 

 

 

 

 

 

 

 

(а. ') К

Л

 

 

 

 

 

 

 

(а, а)

 

 

Точно так

же

 

 

 

 

 

 

 

 

 

1

 

0 .

 

 

» 1

И>1

 

 

{а,

Ь)

,

 

 

 

 

 

 

 

( " V 1)

(^•l) =

Q1 u; =

(а.

а)

 

 

 

=

 

 

(а,

т)

0 . . .

1

 

(wm-\)

где

 

(а,

а)

 

 

 

 

 

 

 

 

(а,

£) • u>i

 

 

 

 

(wrl)

=

 

 

 

 

wt

(а, а)

 

 

 

 

 

 

 

 

 

Если (Ь, 6-І)

0, то

эту идею можно проводить дальше,

умножив обе

части уравнения

 

 

 

 

слева на матрицу

 

 

о

 

0 .. .

0

 

 

 

 

 

 

 

 

 

 

 

1

 

0 .. .

0

 

 

Q2

=

 

(6. с-1)

1 .. .

0

 

 

 

(b,b-i)

 

 

 

 

• а

(Ь. • 1) 0.... . 1

После т — 1 таких действий получается уравнение

где

(D-{m~i])k+(w[m~i])

= 0,

(24)

(а, Ъ) . . .

(а, р)

(а, т)

 

(а, а)

 

О

(Ь, 6-І) . . .

(b,p-l)

(Ь,т-1)

 

( D . [ m - 1 ] ) =

0

. . .

(р,р-[р-Ц)

(р,т-[р-Ц)

 

О

 

О

О

...

О

(то, та-[то — 1])

(25)

 

 

 

 

 

(матрицы, в которых ниже, левее диагонали, стоят нули, называют

верхнє- или правотреуголънымщ

если же нули занимают в матрице

все места выше, правее диагонали,

 

то

матрицу называют

нижне-

или левотреуголъной;

правотреугольные

и левотреугольные

мат­

рицы объединяют

общим названием

треугольные

матрицы), а

(p-[m-l])*

=

lwlt

( a v l ) , . . .,

(wp.[p-l]),

 

(wm-[m-l])\\.

Символы

вида,

(I,

g-k)

и

(wk

+

1-k)]

расшифровываются

по

индуктивному

правилу

 

 

 

 

 

 

 

 

 

 

 

 

(i,g.k)={i,g-[k-i])-

 

 

 

( * ;

t

: I ^ l l ) [ ( * i g

i i ) * " 1

1 )

>

 

<2 6 >

• А) =

 

• ^ - 1 ] ) - ( M

f

c

+ 1

^ U - S ' (

f e

" 1

] )

 

называемому

алгорифмом

Гаусса.

 

 

 

 

 

 

 

 

 

 

Процесс получения

системы

(24')

из

(24)

называют

прямым

ходом решения

системы

уравнений

(24).

 

 

 

 

 

 

 

Искомые элементы столбца

к отыскиваются

в

обратном

ходе

решения уравнений (24). Для этого из последнего уравнения си­ стемы (24') с учетом (25)

(то, то-1 ] ) к т + (wm• [т 1 ]) = О

получают последний элемент

т. _ _

(%•

[m — 1])

 

(#»,

*

Подставляя его в предпоследнее уравнение системы (24')

{Р, P-lP — i]) hi-i + {р,т-[р — 1]) km + (wp • [р - 1 ] ) = О,

получают

г.

_

K v l P — l ] )

(Р, »t•[?-!])

; .

Т

' 1 ~

( Р , Р - [ Р - Ц )

( Р , Р - І Р - U )

m

и т. д.

Обратный ход тоже можно выразить в матричном виде. Он заключается в умножении обеих частей уравнения (24') слева па матрицу

і

о

 

(а,

т)

т • [т- И )

 

 

О

1

 

(Ь,

т • 1)

 

 

т

—11)

о

о

 

 

1

 

т • [т - 1 ] )

 

 

 

При этом в последнем столбце

произведения матрицы (25)

на R j все элементы станут нулевыми, кроме последнего, который будет равен 1.

Затем производится умножение слева на матрицу

1 О

О1

(а,

р)

(/>,

Р-ІР-і])

(Ь,

Р-І)

(р,

Р-ІР-1])

 

О

О

1

 

 

 

(р,р-[р-1])

 

 

О

О

О

 

и так далее. Так

как

в результате

получается, что

 

R m R m . j . . . R 2 R 1 ( D - [ f » - l ] ) = E ,

 

то

& = - R m R m . x . . . RgRxfa-Dre — 1]).

(27)

Е/с =

Так как из А

= В следует СА =

СВ, то любое решение урав­

нения (24) является также решением уравнения (27). А так как из СА = СВ, вообще, не следует А = В, то уравнение (27) могло бы иметь и другие решения, не являющиеся решениями уравнения (24). Однако в нашем случае уравнение (27), очевидно, имеет только одно решение. Поэтому оно является решением исход­ ного уравнения (24) в предположении, что (24) непротиворе­ чиво.

На этом матричное описание метода Гаусса можно бы закон­ чить. Но здесь есть одна деталь, которая может убедительно под­ черкнуть плодотворность матричного подхода даже на уровне, достигнутом в этой главе. Дело в том, что в обратном ходе приве­ дение треугольной матрицы (25) к диагональному виду возможно не только умножением слева на R , . Если в (24') произвести замену к = Qt&i, т. е. записать ее в виде ( D - — 1]) Qlkx - f {w-[m

— 1]) = 0, то в матрице получившегося уравнения с неизвестным столбцом кх

 

 

(а, а)

(а, Ь)

• • •

(а, т)

 

( D - H - I J ) Q? =

О

(Ь,Ъ-1)

•••

{Ъ,тЛ)

X

 

 

О

о

 

(т, т- [т — 1])

 

 

1

(а, Ъ)

(о,

т)

 

 

(а,

а)

(а,

о)

 

 

 

 

X

0

1

 

О

 

 

 

0

О

 

1

 

 

,

а)

о

 

 

о

 

0

 

( М - 1 )

 

 

 

0

 

о

 

(т, т • [т —1[)

 

все элементы первой строки, кроме первого, становятся нулевыми. Далее можно сделать замену к± — Qlk2. При этом все элементы (кроме второго) второй строки становятся нулевыми. Так что

после — 1)-го действия

получится

уравнение

 

 

FA;m .1

+ ( u ; . [ m - l ] ) = 0

 

с диагональной матрицей

 

 

 

 

\(а,а)

 

 

 

 

Ф,ЪЛ)

 

 

 

 

• • •

(т, т • [т — 1]) |

 

Нахождение его решения кт_г элементарно, а так как

 

к =

= C&Qlh

= • • . = Q1Q2 • • • Q£-ifc«-i,

 

то получаем

 

 

 

(28)

 

A — Q1Q2 • • • Qm-l&m-l-

Сравнение (27) с (28) показывает, что во втором случае в обрат­ ном ходе используются уже вычисленные в прямом ходе матрицы Qt, тогда как в первом — вновь вычисляемые элиминационные матрицы В.[ (для сравнения см. [30, 31]).

Стоит отметить, что вычислителю или программисту, конечно, нет необходимости строить программу счета так, чтобы в ней фигурировали полностью матрицы и (D • і) со всей массой нуле­ вых и единичных элементов. Иначе говоря, матричную алгебру не стоит воспринимать буквально как вычислительный аппарат. Скорее — это аппарат качественного анализа, некий плодотворный строй мышления, который, в частности, может подсказать и эф­ фективные вычислительные пути.

Соседние файлы в папке книги из ГПНТБ