Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1185

.pdf
Скачиваний:
6
Добавлен:
15.11.2022
Размер:
11.27 Mб
Скачать

произведение имеет один столбец и пять строк, что соответствует размерности матрицы Y. И тогда матрица-произведение имеет вид

Г1 Ь0+

М - 2 П

1 й0+

М - 1 )

1&0“b ^i(0)

i^ о + М - И ) _1 &0+ М4"2)_

Сопоставление матрицы-произведения с системой уравнений убеждает нас в тождественности матричной и нематричной форм записей. Вектор Y, оказывается, и есть матрица произведений в данном случае. Элементы матрицы-произведения называются Скалярными произведениями вектор-строки матрицы, стоящей слева, и соответствующего вектор-столбца матрицы, стоящей справа.

В правилах перемножения

матриц существуют

особенности,

не имеющие аналога в числах.

Так, небезразлично,

в каком по­

рядке записаны матрицы в произведении. Вы, наверное, заметили, что левая и .правая матрицы неравноправны. Если вы захотите умножить матрицу В на матрицу X (ВХ), то убедитесь, что этого сделать невозможно, ибо длины векторов, входящих в скалярное произведение, должны быть согласованы.

Таким образом, длй двух произвольных матриц произведение су­ ществует, если число столбцов матрицы, стоящей слева, равно числу строк матрицы, стоящей справа. Ясно, что для двух'квадратных мат­ риц одинакового размера существуют оба произведения (справа и слева),однако они могут быть различными. Матрицы, произведение которых не зависит от порядка сомножителей, называются комму­ тирующими. В общем же случае для произведения матриц комму­

тативный

закон не

выполняется.

Перейдем теперь к системе нормальных уравнений МНК,

которая

в нашем

случае

выглядит следующим образом (см.

стр.

144):

 

 

 

5

Ъ0+

0&! = 10;

060 +

10Ьг = 10.

Можно показать, что в матричном виде она запишется следующим образом: XTX B = X TY. Здесь Хг обозначает матрицу, транспо­ нированную по отношению к матрице X. Протранспонировать матрицу — это значит столбцы исходной матрицы сделать строками транспонированной матрицы, сохранив их последовательность. Так, в нашем случае транспонированная матрица

Х, _ Г + 1 + 1

+ 1 + 1 + 1"

L— 2 — 1

0 + 1 + 2 J-

Для получения системы нормальных уравнений нам пришлось умножить обе части исходной системы уравнений слева на Хт. Давайте выполним эти операции

160

XrY =

+ 1 + 1

+ 1 + 1

+ 1

 

 

 

— 2 — 1

0 + 1

+ 2

 

 

 

 

 

 

 

 

'0

- f 1 + 2 + 3 + 4

' 10 '

 

 

 

. 0 - Н - 1) + 0 + 3 + 8 .

10.

 

 

 

 

 

 

 

+ 1

2'

 

хт =

 

+ 1 + 1 + 1 + 1 + 1

+ 1

- 1

 

 

+1

о

 

 

 

— 2 — 1 0 + 1 + 2

 

 

 

 

 

 

+ 1

+ 1

 

 

 

 

 

 

L+ 1

+ 2

'5 0'

 

 

1 + 1 + 1 + 1 + 1 — 2 — 1 0 + 1 + 2 '

 

— 2 — 1 0 + 1 + 2 + 4 + 1 0 + 1 + +

.0 10.

Теперь можно записать систему уравнений:

'5 ---1О

1 ■О

10

IA1

__

 

о*

1

1

'ю '

10.

Читателю представляется возможность убедиться в том, что полученная матричная запись в точности соответствует исходной системе нормальных уравнений.

Матрица ХТХ называется матрицей системы нормальных уравнений. Она обладает рядом важных для нас свойств. Прежде всего заметим, что в этой матрице два элемента, расположенных симметрично относительно диагонали, идущей с левого верхнего угла в правый нижний (так называемой главной диагонали),. равны между собой. В нашем случае это нули. Такое свойство характерно для матриц систем нормальных уравнений МНК, так как векторы, входящие в скалярные произведения, комму­ тативны.

Матрица, элементы которой симметричны относительно глав­ ной диагонали, называется симметричной. Если все элементы вне главной диагонали равны нулю, то такая матрица называется диагональной. В дальнейшем нам понадобится еще одна разновид­ ность диагональных матриц. Диагональная матрица, все элементы главной диагонали которой являются единицами, называется еди­ ничной матрицей. Единичная матрица играет в алгебре матриц такую же роль, какую единица — в алгебре чисел.

Решить систему нормальных уравнений это значит записать в явном виде элементы вектора В (Ь0 и Ъг). Если бы мы имели дело с числами, то для этого нужно было бы поделить обе части на коэф­ фициент при неизвестном и получить ответ. Но для матриц вместо деления (которое не определено) используется специальная опе-

11 Заказ М 588

161

рация умножения на обратную матрицу. Задача состойт в том, чтобы превратить матрицу, стоящую перед матрицей неизвестных коэффициентов, в единичную. Тогда умножение вектора В на еди­ ничную матрицу его не изменит, а чтобы равенство не наруши­ лось, и правую часть придется домножить на соответствующую матрицу. Если условиться обозначать обратную матрицу степенью

1 , то предыдущие рассуждения приведут к следующей записи: (Х7^ ) -1 (X7’X )B = (X TX)_1X7'Y. Здесь система нормальных уравнений МНК умножена слева на матрицу, обратную к матрице системы .нормальных уравнений.

Произведение обратной матрицы на прямую справа равно

единичной

матрице,

которую условимся

обозначать

Е:

Е = (Х гХ )-1

(Х^Х). В этом равенстве участвуют

три

матрицы.

Матрица системы нормальных уравнений Х^Х,

которую

назы­

вают

прямой матрицей,

( Х ^ ) -1,— обратная матрица.

Перепи­

шем

это равенство для

нашей задачи

 

 

 

'1

0

о I

1

а1\ а12

_ ®21 ^22 _

'5

О

---1

0

10.

Неизвестные

элементы

обратной матрицы обозначены a{j., где

i = 1, 2

соответствует

строке,

а / = 1, 2 — столбцу. Найдем эти

элементы

 

 

 

 

1

• 5 —f—a-уg *0,

0

&21 * ^ “Ь" ^22

0 =

ап • 0 -J- а12 * 10;

1 =

а2Х0 -j- а22 10.

Отсюда

следует,

что ап = 1/5,

ai2= 0 , я2i= 0 . а22= 1 /10.

Запишем

обратную

матрицу

(Х ^ Х )- ^

V,

о

 

 

 

 

о

V

 

 

Лишь благодаря простоте примера можно было воспользоваться столь элементарной процедурой. В общем случае приходится при­ бегать к более сложным алгоритмам и вычислительной технике [5, 6].

Отметим некоторые существенные свойства обратной матрицы. Произведение прямой и обратной матрицы коммутативно. Если прямую матрицу обозначить А, то АА_1= А_1А = Е .

Матрица, обратная к симметричной, тоже будет симметрична. На главной диагонали матрицы, обратной к диагональной, будут стоять числа, обратные соответствующим числам, стоящим на диагонали прямой матрицы. Зная это свойство, мы могли не про­ делывать предыдущие вычисления, а сразу записать обратную матрицу для нашего примера.

Продолжим вычисление для примера. Подставим известные матрицы в уравнение для вектора коэффициентов B = (X TX)-1X TY.

162

Имеем

' к

IA J

1 м СП

О 1

Lo

v10j

1

------ Г 0

. 1

0 .

Осталось перемножить матрицы и получить

V

IA J

1

 

 

м

сл

о

1___

 

о

о

 

о +

1—

-----1

 

Т

 

 

О

 

“Р/м *Ю

2

1 *

Две матрицы равны, когда равны их соответствующие элементы, поэтому Ъ0= 2 , Ъх= 1. Таким образом, мы получили результат, совпадающий с полученным ранее без использования матриц.

Введем еще одно важное понятие: каждой квадратной матрице можно поставить в соответствие некоторое число, называемое определителем этой матрицы. Определитель представляет собой алгебраическую сумму всех возможных произведений, в каждое из которых входит по одному элементу от каждой строки и от каждого столбца. Причем знак произведения ( + или —) зависит от положения элементов данного произведения матрицы.

Посчитаем определитель для матрицы системы нормальных уравнений. Здесь возможны два произведения, каждое из кото­ рых содержит два сомножителя 5-10=50 и 0-0=0.

Определитель принято обозначать

5

0

= 50 — 0 = 50

0

10

 

или

det 05 100 = 50

(det — определитель от латинского determinant). Вычислим определитель обратной матрицы

V5

о

—Л__ о = —

о

Vio

50

50

Можно заметить, что между определителями прямой и обратной матрицы существует в данном случае простое соотношение: они являются взаимнообратными числами. Такое соотношение выполняется и в общем случае.

Определитель может быть любым действительным числом, как положительным, так и отрицательным. Он может оказаться и равным нулю. С последним случаем связаны некоторые особен­ ности свойств матрицы. Матрица, определитель которой равен нулю, не имеет обратной. Такую матрицу называют особенной, вырожденной или сингулярной. Если же определитель матрицы не равен нулю, то матрица называется неособенной, невырожден­ ной или несингулярной.

11* 163

Например, у

следующей матрицы определитель равен нулю

и она

является

вырожденной

det

— 1

+ 2

= (—1 ) - (—2) — ( + 1 ) • ( + 2) = 0.

_+1

—2

Значит, решение системы нормальных уравнений возможно только тогда, когда матрица невырождена, т. е. det (ХгХ)т^0. Это предполагалось и имело место в нашем примере.

10.3.Обобщение метода наименьших квадратов на многофакторный линейный случай

Пусть имеется к факторов и известно, что отклик и факторы

связаны линейно: у = Ъ 0х 0 ^ - Ъ 1х 1-\-Ъ 2х 2 - {- . -\-Ъ к х к . Выпишем для

этого случая матрицы X, Y и В

 

Х 0Х

ГГц . .

 

х к Г

 

~УГ

 

 

Г Ч

 

 

 

 

 

 

 

 

 

х

Х02

х 1 2 . .

 

Х к2

Y =

У2

в

=

К

=

 

 

9

1

 

( NX к)

 

 

 

(JVX

N _

[(/с+1)Х1]

 

 

_ Х 0N

*1*

 

X k N _

 

 

 

Л _

Запишем исходную систему линейных уравнений:

 

 

Y

= : ^ в ,

 

 

 

 

 

 

 

 

~ У х ~

х ох

Х 11

Х к1

г ч

 

 

 

 

 

Уг

Х 02

Х 12

Х к2

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

J N _

_ Х 0N Х 1N * * X k N _

л .

 

 

 

 

После преобразований, аналогичных рассмотренным в пре­ дыдущем параграфе, придем к следующей формуле:

В =

(Х^Х)-1 XrY;

 

Ьо

/ Х 0Х

* 0 2

X QN

 

1h

*11

Х Х2

 

.

=

гНн____1 °

* 0 2

* п .

Х 12

“ Г гН

• • Х к2

Л .

V - Х кХ Х к2

х к Х _

_ х о х Х иу • • • Х к Х _

 

 

 

*01

Н

 

 

Ух

 

О ю

 

 

 

*11

Х 12

. X 1N

У2

 

X

 

 

 

 

 

 

 

 

 

- Х к1

Х к2 •

. Xjctf _

- У N -

Скалярные произведения удобно представлять в виде сумм, т. е. матрицу системы нормальных уравнений можно ваписать в сле­ дующем виде;

104

 

2 * о

2 * 0 * 1

2 * 0 * 2 ••

• 2 * о * *

 

Х ТХ =

2

«

л

2 * ?

2 *1*2 •

• 2 * i * *

 

 

- 2 %

2 *1 ** 2 * 2 * * • • • 2 * 1

 

Так как суммирование ведется от 1 до N по всему множеству

опытов, индекс

суммирования мы

опустили.

\

Аналогично

X rY

есть

вектор сумм произведений:

 

 

2

z/*0

 

 

 

 

 

2

*/*i

 

 

 

 

XTY =

2 ух2

 

 

 

 

_ 2 г/**

Чтобы получить ответ, т. е. вектор В, остается обратить ма­ трицу Х^Х и умножить обратную матрицу на XrY.

Проведем обработку данных табл. 7.9 матричным способом

~ + 1

+ i + 1

+ 1

 

+ 1

 

+ 1

 

+ 1

 

- f i "

+ i

_i_i _ 1

 

_ i _ i

 

1

4 - 1

 

■ fi

+ 1

1 —

1 + i + 1

 

1 —

1

4-1

 

1 + 1

1 —

1

4 - 1

1

+ 1

.

+ 1

1

1

1

+ i

4 - 1

4 - 1

1

+ 1

— 1

+ 1

+ 1

 

1

1 4 - 1

1

+ 1

4 - 1

4 - 1

1

4 - 1

1

1

1

- - Н + 1

1

4 - 1

1

4 - 1

1

1 _

г - н 4-1 + 1 + 1 + 1 4-1 4-1 + П

+ 1

+ 1

— 1 — 1 — 1 — 1 4 - 1

+

1

 

 

 

 

 

 

 

 

 

 

 

+ 1

1 — 1 4 - 1

1 4-1 4-1 — 1

+ 1

1 4 - 1

1 —

1 4 - 1

— 1 4-1

+ 1

1 4

- 1

1

4 -

1

— 1,4 -1

1

+ 1

_ i _ i _j_i 4_1 1 —

1 4-1

+ 1

+ 1

1 —

1

-[-I + 1

1

1

L + i + 1

4 - 1

4 - 1

1

 

1 1

1 _

8 0 0 0 0 0 0 0 "

0 8 0 0 0 0 0 0

0 0 8 0 0 0 0 0

Х*Х =

0 0 0 8 0 0 0 0

0 0 0 0 8 0 0 0 ;

0 0 0 0 0 8 0 0

0 0 0 0 0 0 8 0 L0 0 0 0 0 0 0 8^,

«66

‘Ve

0

0

0

0

0

0

0~

0

V8

0

0

0

0

0

0

0

0

Ve 0

0

0

0

0

0

0

0

Ve 0

0

0

0

0

0

0

0

Ve 0

0

0

0

0

0

0

0

Ve 0

0

0

0

0

0

0

0

Ve 0

.0

0

0

0

0

0

0

Ve-

 

 

 

6

2|i£oi =

i8817_ = 23,5875;

 

 

 

и

 

о

 

О

 

 

’2

Vixbi

^

 

 

=

=

1,0625;

 

ъ =

2 ^

2£=

= ^ 5 = —5>8125;

 

2

у<хи

 

 

 

 

 

 

 

 

2

Vix2i

6з =

2

| ^

=

1 А =

о,1875;

XrY =

2 * № ,•

 

 

 

 

 

 

2

Vi4i '

=

 

 

=

2 ^ = 3 ,3 1 2 5 ;

 

 

 

 

2 У iX bi

&5

=

2 |if 5 i= 0^_= 0 )0 6 25;

 

2

у>хо<

 

2

у>хп_

Ьв =

S | £^ i =

z ^ 5

==_ i )3i25;

 

 

 

 

 

 

67

2

у&1\

—14,3

1,7875.

 

 

 

 

8

 

8

 

 

 

 

 

 

 

Мы получили те же результаты, что и в седьмой главе. Детально рассмотренная процедура МНК в матричной форме показывает, как получаются формулы для коэффициентов регрессии, которые использовались в предыдущих главах.

Аналогичным путем можно оценить эффекты взаимодействия, входящие в модель. Для этого надо расширить матрицу X, вклю­ чив в нее столбцы взаимодействий. Все остальные операции про­ изводятся совершенно аналогично. В векторе В появляются при этом элементы, соответствующие эффектам взаимодействий. Рас­ ширение матрицы X подобным образом называют линеаризацией. Это эквивалентно замене эффектов взаимодействия новыми ли­ нейными членами. Подобная процедура возможна только тогда, когда все коэффициенты входят в уравнение линейно. Такие урав­ нения называются линейными по параметрам и только они рас­ сматриваются в нашей книге. В некоторых случаях приходится использовать уравнения, нелинейные по параметрам. Примером

может

служить уравнение Аррениуса y = b 0ebiXi, которое исполь­

зуется

в химической кинетике [7, 8].

166

10.4. Статистический анализ

Впредыдущей главе вначале была продемонстрирована про­ цедура МНК, а затем рассмотрены статистические аспекты. Так же построена и эта глава.

Перейдем к статистическому анализу в матричной форме. Будем предполагать, что постулаты регрессионного анализа вы­ полняются. Что значит провести статистический анализ? Это значит проверить ряд статистических гипотез: гипотезу об аде­ кватности заданной модели, гипотезы о значимости отдельных ко эффициентов регрессии и др. Дальнейшее изложение направлено на прояснение некоторых обстоятельств, определивших вид фор­ мул статистического анализа регрессионной модели. Знакомство

сэлементами алгебры матриц поможет сделать это. Фундаментальную роль в анализе уравнения регрессии играет

матрица

M'i = (X T X sl})-\

которая называется матрицей дисперсий-ковариаций. Прямая матрица М называется информационной матрицей Фишера.

В структуре матрицы дисперсий-ковариаций содержится вся информация о статистических свойствах модели. Провести стати­

стический анализ

значит извлечь

эту информацию.

Для этого

прежде всего

перейдем от матрицы, обратной к матрице системы

нормальных

уравнений, к матрице

М-1. Оценка дисперсии вос­

производимости

— скаляр;

Х^Х — квадратная

матрица.

Умножить матрицу на скаляр слева или справа — значит умно­ жить на этот скаляр каждый элемент матрицы.

Полученные таким образом произведения имеют определенный статистический смысл. Так, на главной диагонали матрицы-про­ изведения стоят оценки дисперсий коэффициентов регрессии, вне главной диагонали расположены оценки, ковариаций.

Чтобы познакомиться с понятием ковариация, рассмотрим два произвольных вектор-столбца матрицы X. Во многих случаях важно знать, сколь сильна линейная связь между этими векторами. Ковариация является одной из мер такой связи. Чтобы найти ко­ вариацию, сначала центрируют оба вектора, а затем вычисляют их скалярное произведение. Центрирование используется для устранения неопределенности, связанной с выбором начала коор­ динат. Пусть, например, изучается ковариация между темпера­ турой и каким-нибудь другим фактором. Если значения темпера­ туры записываются в шкале Цельсия, то без центрирования зна­ чение ковариации получится иное, чем для шкалы Кельвина. При центрировании же это не произойдет.

Ковариация

определяется по формул;

 

N

^

cov {Xхх2) =

2

(хи — Sj) (x2i - х2).

1=1

Заметим, что это выражение совпадает с числителем коэффициента парной корреляции, с которым мы уже сталкивались (§ 2.3).

Давайте построим матрицу М-1 для однофакторной линейной модели. Информационная матрица М равна:

М = (ХТХ •

=

N

2 * »

* 5{у}-

2 *ъ- 2 *ь-

 

 

 

 

Матрица дисперсий-ковариаций М-1

равна:

 

Л- 2

* ? f - ( 2 * 1()3 /{s,>

sh}

M 1 =

N 2 * i f - ( 2 * 1()a

 

 

 

■>

 

 

 

 

 

xlf)a sh }

 

_ TV

xf,- — (^ j x 1(-)a

 

/ Ь

0>

cov ib0’ 6i ) "

 

 

cov{b0, b j

 

s2{M J*

 

Ортогональные планы, рассматриваемые в этой книге, обла­ дают тем свойством, что ковариации между всеми парами коэф­ фициентов регрессии равны нулю. Это можно проиллюстрировать примером из предыдущего параграфа:

~s\y}/8

 

s\y)l8

О

Sli/}18

М 1 =

s\y}l8

s2{3/)/8

О

Ay)l8

 

sb }l8

 

sw l8

(так принято сокращенно записывать квадратные матрицы, когд^4 все внедиагональные элементы равны нулю). В этом примере

sa{y} = 1 и поэтому дисперсии

6-коэффпциентов

= 0,125. Таким

образом, мы пришли к формуле

 

s\bj} =

s b/}IN,

 

 

которая

уже фигурировала

раньше. Она справедлива для орто­

гональных планов.

Рассмотрим теперь проверку адекватности линейного урав­ нения регрессии. Дисперсия адекватности равна

N

2 (у,

о2 -- ___________

°*д — iv — (A -h 1) •

168

Числитель этого

выражения — остаточная сумма квадратов —

в матричной форме имеет вид

N

 

2 (у. у{)2=

(Y - Y)T (Y — Y) = Y TY — B ^ Y .

i=i

 

Приведем конкретный пример (§ 6.4, пример № 4) расчета остаточной суммы квадратов разными способами (см. табл. 10.3).

Таблица 10.3 Расчет остаточной суммы квадратов

Номер

*0

Ж|

 

 

 

у — у

(у — уУ

опыта

 

V

У

1

+

 

 

95,0

94,5

+ 0 ,5

0,25

2

+

+

90,0

90,5

— 0,5

0,25

3

+

+ ,

85,0

85,5

— 0,5

0,25

4

+

+

+

82,0

81,5

+ 0 ,5

0,25

Линейное уравнение регрессии имеет вид #=88,0 —2,0 ^ —4,5а:2. Обычный способ вычисления остаточной суммы дает

2 (у, — y ,f = (0,25 + 0,25 + 0,25 + 0,25) = 1,00.

1=1

Воспользуемся теперь матричной записью. Для этого придется ввести еще одну матричную операцию — операцию вычитания. Разностью двух матриц одинакового размера называется матрица, элементы которой являются разностями соответствующих эле­ ментов матриц уменьшаемого и вычитаемого, взятых в том же порядке:

 

"95,0“

"94,5”

 

Г+0,5-1

 

 

90,0

90,5

—0,5

 

 

85,0.

85,5

—0,5

 

 

82,0

 

81,5

 

+ 0 ,5

 

Транспонирование

и перемножение дают

 

 

 

 

 

 

 

"+ 0 ,5 "

( Y - Y ) t (Y — ? ) =

[+ 0 ,5

—0,5 —0,5 + 0,5]

—0,5

—0,5

 

 

 

 

 

 

 

 

 

 

 

 

+ 0 ,5

=

0,25 + 0,25 +

0,25 + 0,25 =

1,00.

 

Если воспользоваться другим выражением для остаточной

суммы

квадратов, то

 

 

 

 

169

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]