Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Многомерный статистический анализ (128

..pdf
Скачиваний:
8
Добавлен:
15.11.2022
Размер:
473.36 Кб
Скачать

где

D11, D12 , D21, D22

– матрицы размеров r ×r,

r ×m, m ×r,

m ×m соответственно.

 

 

G

Рассмотрим произвольные линейные комбинации компонент

G

G G

G

= Ev1 = 0. За-

ξ1,

ξ2

вида u1 = α′ξ1,

v1 =β′ξ2 . Очевидно, что Eu1

 

 

 

G

β, при кото-

дача состоит в определении таких коэффициентов α,

рых u1, v1 имели бы максимальный коэффициент корреляции ρ = max ρ(u 1,v1). Чтобы задача имела единственное решение, нор-

мируем αG, β условием единичности дисперсий

 

 

 

 

 

Du1 = Dv1 =1.

 

 

 

 

(5.1)

Очевидно, что дисперсии равны:

 

 

 

 

 

 

G

G GG G

G

 

 

 

G

G

(5.2)

Du1 = Eα ξ1ξ1α = α D11α =1;

Dv1 D22β =1.

Аналогично коэффициент корреляции равен:

 

 

 

 

 

 

 

G

GG

 

G

G

 

(5.3)

ρ(u1,v1) = Eα ξ1ξ2β = α D12β.

 

Таким образом, необходимо найти условный максимум (5.3)

при условии (5.2). Функция Лагранжа имеет вид

 

 

G

G

 

 

1

G

G

 

1

G

G

 

L = α D12β−

 

λ(α D11α −1)

 

μ(β D22β−1).

(5.4)

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

G

 

 

 

 

 

 

 

Дифференцируя L по α, β, получим систему

 

 

 

 

L

G

G

 

 

 

 

 

 

 

 

G

= D12β−λD11α = 0;

 

 

 

 

 

 

∂α

 

 

 

 

 

 

 

(5.5)

 

 

L

 

G

 

G

 

 

 

 

 

= D

 

 

 

 

 

 

 

 

 

G

α −μD

β = 0.

 

 

 

 

∂β

12

 

22

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

второе уравнение

Умножив первое уравнение (5.5) слева на α ,

слева на β′, найдем

31

G G G

−λαG DG11α +Gα′D12Gβ = 0; β′D21α −μβ′D22β = 0.

Из условий нормировки следует, что

λ =μ =αGD12β.

Тогда система (5.5) эквивалентна однородной системе

 

 

G

 

−λD11α + D12β = 0;

 

 

G

−λD

G

D α

β = 0.

 

21

22

 

Эту систему можно записать в матричном виде

−λD11

D 12

G

 

 

α

 

 

 

 

 

 

= 0.

 

D 21

−λD 22

G

 

 

β

 

 

(5.6)

(5.7)

(5.8)

Необходимо найти нетривиальное решение системы, поэтому должно выполняться условие вырожденности матрицы системы

 

−λD

D

 

 

 

det

11

12

 

= 0 .

(5.9)

 

D21

−λD22

 

 

 

 

 

 

 

Левая часть (5.9) представляет собой многочлен степени p. Расположим корни в порядке убывания λ1 > λ2 >... > λp . Мож-

но доказать (напомним, что r m ), что множество корней (5.9) имеет вид

Λ = (λ1,..., λr , −λ1,..., −λr ,0,...,0),

где λi > 0, а нулевой корень имеет кратность ( m r ).

32

Из (5.3) и (5.6) видно, что коэффициент корреляции совпадает с одним из корней. Так как нам необходим наибольший коэффициент, то полагаем λ = λ1. При этом значении λ решаем систему

(5.7) и находим искомые векторы αG, β. Обозначим их αG1, β1 . Определение 5.1. Случайные величины u1 G1′ξ1, v1 1′ξG2 на-

зываются первыми каноническими величинами, а их коэффициент

G

G

 

корреляции ρ = α D12β называется первой канонической корреля-

цией.

 

GG

Найдем теперь

вторые линейные комбинации

u2 = α ξ1,

v2 G′ξG2 , которые имели бы наибольший коэффициент корреля-

ции среди всех линейных комбинаций, некоррелированных с первыми каноническими величинами.

Из условия некоррелированности получим

0 = Eu1u2 = α′D11αG1.

Таккак λ1 0, то D11αG1 = 1 D12βG1. Тогдасправедливоравенство

λ1

0 = Ev1u2 = αGD12β1,

т. е. величины v1, u2 также некоррелированы. Аналогично находим

0 = Ev1v2 GD22βG1 = λ1 βGD21αG1 = Ev2u1.

1

Функция Лагранжа для этого случая имеет вид

L = αGD12βG 12 λ(αGD11αG 1) 12 μ(βGD22βG 1) + +ναGD11αG1 + θβGD22βG1.

33

Дифференцируя L по α, получим

L

G

G

G

 

 

G

= D12β −λD11α + νD11α1

= 0.

(5.10)

∂α

 

 

 

 

 

Умножим (5.10) слева на α1. Тогда

0 = αG1D12βG −λαG1D11α+G ναG1D11αG1 = ναG1D11αG1.

Из условия нормировки следует, что ν = 0. Совершенно аналогично предыдущему дифференцируем L по β, а затем умножаем

полученное равенство слева на β′, находим θ = 0.

Таким образом, определение наибольшего коэффициента корреляции сводится к уже решенной задаче нахождения экстремума функции Лагранжа (5.4). В качестве решения (5.9) берем второе по

величине значение

λ = λ2 , а затем находим соответствующие ему

G

G

 

 

 

 

векторы α2 ,

β2 .

 

G

 

G G

Определение 5.2. Случайные величины

,

u2 =α′2ξ1

v2 =β′2ξ2

называются вторыми каноническими величинами, а их коэффициент корреляции ρ = αGD12β называется второй канонической кор-

реляцией.

Продолжая процесс определения искомых линейных комбинаций, получим последовательность независимых пар случайных величин (u1, v1), (u2 , v2 ) ,…, (ur , vr ). Эти пары называются кано-

ническими величинами, а их коэффициенты корреляции – каноническими корреляциями.

На практике всегда вместо параметров подставляют их оценки.

Справедлива следующая теорема.

ξGn

 

Теорема 5.1. Пусть

ξG1, ξG2 ,

...,

– выборка из нормальной

совокупности

G

Оценками

наибольшего правдоподобия

N(μ, D).

для канонических корреляций являются корни уравнения

 

 

−λD11

 

 

 

 

det

 

D12

= 0,

 

 

 

 

 

 

 

 

D21

−λD22

 

34

 

 

 

 

 

где оценки Dij определяются из оценки матрицы ковариаций D.

Оценки наибольшего правдоподобия для векторов αGi , βi удовлетворяют уравнениям (5.7), (5.8) для выбранного значения λi .

6.МНОГОМЕРНЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ

6.1.Оценка параметров линейной регрессии

Пусть проводят эксперимент, в результате которого наблюдается векторная величина. При этом известно, что на результат эксперимента (точнее, на его распределение) оказывают влияние q факторов, значения которых известны в каждом эксперименте или даже прямо определяются исследователем. Ставится задача – построить модель зависимости наблюдений от значений факторов, а также оценить параметрыG этой модели.

Пусть ξ1, ...,ξn n наблюдений над случайным вектором. Обозначим zG = (z1,..., zq )вектор факторов, влияющих на исход эксперимента, и zGi = (z1i ,..., zqi )– его значение в i-м наблюдении. Будем предполагать, что ранг матрицы Z = (z1,..., zGq ) равен

r(Z) = q.

Обозначим B = ( bij ) матрицу размеров (p×q).

Определение 6.1. Линейной моделью называется следующая

система предположений о распределении вектора наблюдений

ξG = (ξ1,...,ξp ).

1. Математическое ожидание i-го наблюдения имеет вид

EξGi = BzGi .

2. Матрица ковариаций D вектора наблюдений не зависит от значений факторов zG = (z1,..., zq ).

G 3. Вектор наблюдений имеет нормальное распределение

ξ ~ N(Bz, D).

Необходимо по выборке оценить неизвестные параметры B, D. Воспользуемся методом максимального правдоподобия.

Функция правдоподобия в данном случае имеет вид

35

n

1

 

 

 

 

 

 

 

 

 

1

G

G

1 G

G

 

L =

 

 

 

 

 

 

 

 

exp(

 

(ξi Bzi )D

 

(ξi Bzi )).

(6.1)

p

D

 

 

 

2

 

i=1 (2π) 2

 

 

 

 

 

 

 

 

 

 

 

 

 

Найдем ее максимум по D, B. Логарифм функции равен

 

ln L = const

n

ln

 

D

 

1

n

(ξG

BzG )D1

(ξG

BzG ).

(6.2)

 

 

 

 

 

2

 

 

 

 

 

 

 

2 i=1

i

i

 

i

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для того чтобы найти производные по B и D, напомним правила дифференцирования функционалов по матричным аргументам, приведенные в пособии [1].

Пусть для матриц X, A, C и вектора a определены все операции, приведенные ниже. Справедливы соотношения:

X [trX AXC]= AXC + AXC;

G

 

G

GG

a

Aa

= tr( Aaa);

 

trAX 1 = −( X 1 AX 1).

X

 

Здесь tr A – след матрицы A. Получим систему уравнений

 

 

 

n

 

 

 

 

n

 

 

 

ln L

= D1 ξGi zGi′ − D1BzGi zGi′ = 0;

(6.3)

B

 

 

i=1

 

 

 

i=1

 

 

 

ln L

 

n

 

1

 

1

 

1

1

 

 

D

= −

 

D

 

+

 

D

Q(B)D

 

= 0.

(6.4)

2

 

2

 

В (6.4) матрица Q(B) равна:

Q(B) = n (ξGi BzGi )(ξG i BzGi ).

i=1

36

При выводе уравнений (6.3), (6.4) учитывалась симметричность матриц

 

zGi zGi,

ξGiξGi , D.

 

 

 

n

n

 

 

 

 

i=1

i=1

 

 

 

Введем обозначения

 

 

 

 

n

G G

n

G G

n

G G

Qξz =

ξi zi; Qzz

= zi zi; Qξξ = ξiξ′i .

i=1

 

i=1

 

i=1

 

Тогда оценки максимального правдоподобия можно записать в виде

B = Q Q1

 

1

 

 

, D =

Q(B).

(6.5)

 

ξz zz

 

n

 

 

 

 

 

 

Для вычисления оценки матрицы ковариаций D часто используют эквивалентную формулу

 

 

 

1

 

1

 

 

 

 

 

D

=

 

Qξξ

 

BQzz B .

 

 

(6.6)

 

 

n

n

 

 

Легко показать, что B – несмещенная оценка. Имеем

 

 

1

n

G G

1

 

 

n

G G

1

1

= B.

EB = EQξzQzz

= E(ξi zi)Qzz

= (Bzi zi)Qzz

= BQzzQzz

 

 

i=1

 

 

 

 

 

i=1

 

 

 

 

Можно доказать, что оценка матрицы ковариаций смещена:

= n q ED n D.

Несмещенной оценкой является статистика

1

 

 

S =

 

Q(B).

(6.7)

n q

 

 

 

37

Вычислим максимальное значение функции правдоподобия. Преобразуем квадратичную форму в показателе степени:

n

G

G

1

G

G

 

1

n

G

G G

G

(ξi

Bzi ) D

(ξi Bzi ) = trD

 

((ξi Bzi )(ξi Bzi ) ) =

i=1

 

 

 

 

 

 

 

i=1

 

 

 

= trD1nD

= ntrEp = np.

 

 

 

 

 

 

Тогда

 

1 np

 

1

n

e

1 pn

.

(6.8)

max L = L(B, D) = (2π)

 

2

D

2

 

 

2

Это значение потребуется в дальнейшем при проверке статистических гипотез о параметрах B.

6.2. Проверка гипотез в линейной модели

Пусть справедлива линейная модель. Разобьем матрицу коэффициентов B на две подматрицы: B = (B1B2 ), где B1 – матрица

размеров p ×q1 , B2 – матрица размеров p ×q 2 . В соответствии с

этим разбиением вектор факторов и матрица Qzz также распадаются на два подвектора и четыре блока соответственно:

 

 

zG

zG

 

zG1 = (z1..., zq 1 );

z2

= (zq1+1,..., zq );

 

 

= G1

;

 

 

 

z2

 

 

 

 

 

 

 

 

 

 

 

 

 

Q =

Q11

 

Q12

 

 

 

 

 

 

 

zz

 

zz

,

 

 

 

 

 

zz

Q21

 

Q22

 

 

 

 

 

 

 

zz

 

zz

 

где Q22

– матрица размеров q

2

×q

2

.

 

 

zz

 

 

, zG

 

 

 

 

 

 

 

Пусть

z

– значения подвекторов в i-м эксперименте, т. е.

 

 

1i

2i

 

 

 

 

 

 

 

 

 

 

 

 

zG1i = (z1i ,..., zq ,i );

 

z2i

= (zq + 1, i ,..., zqi ).

 

 

 

 

 

1

 

 

 

 

 

 

1

38

 

 

 

 

 

 

 

 

 

 

 

 

 

Требуется проверить гипотезу

 

 

 

 

H

0

: B = B0 ,

 

(6.9)

 

 

 

1

1

 

 

где

B0 – известная числовая матрица.

 

 

 

1

 

 

 

 

 

 

 

Для проверки (6.9) используется универсальный критерий от-

ношения правдоподобия, статистика которого имеет вид

 

 

 

 

 

max L(B, D)

 

 

 

λ =

 

 

H0

 

,

(6.10)

 

 

 

max L(B, D)

где числитель равен максимуму функции правдоподобия при условии справедливости (6.9), а знаменатель – безусловному максимуму.

Очевидно, что 0 ≤ λ ≤1, причем большие значения статистики свидетельствуют в пользу гипотезы.

Знаменатель определен в (6.8).

Обозначим L0 = L(ξG; B, D H0 ). Найдем max L0 .

Пусть ηGi = ξGi B10 zG1i . Очевидно, что при справедливости гипотезы H0 выполняется соотношение ηi ~ N (B2 z2i , D) , так как вид

распределения не изменится при вычитании константы. Однако в этом случае оценки параметров определяются по тем же форму-

лам, что и в разд. 1, с заменой ξi

на ηi . Следовательно,

 

 

0

22

)

1

;

0

n G

G

(6.11)

B20 = Qξz (Qzz

 

Qξz = ηi z2i ;

 

 

 

 

 

 

 

 

i=1

 

 

 

1 n

G

 

G

G

 

G

 

D0 =

 

(ηi B20 z2i )(ηi B20 z2i ).

(6.12)

 

 

n i=1

 

 

 

 

 

 

 

 

Нулевой индекс означает, что оценки получены в предположении справедливости H0 . Тогда условный максимум равен

39

max L = L

 

 

1 np

 

1

n

e

1 pn

.

(B

, D ) = (2π)

 

2

D

2

 

 

2

0

0

20

0

 

 

0

 

 

 

 

 

 

 

Статистика отношения правдоподобия (6.10) имеет вид

 

 

 

 

 

 

 

 

 

 

n

 

L0

 

 

 

 

 

 

(B20

, D0

)

D

 

 

2

 

λ =

 

 

 

 

=

 

 

 

 

 

 

.

 

 

L(B, D)

 

 

 

 

D

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Эта статистика эквивалентна статистике

D

U = . (6.13)

D 0

Для использования (6.13) необходимо знать распределение статистики при условии основной гипотезы. Точные распределения очень сложны уже при размерностях более двух, однако для больших объемов выборок справедлива следующая теорема.

Теорема 6.1. Если справедлива гипотеза (6.9), то при n → ∞ рас-

пределение случайной величины V = −(n q2 12 ( p + q1 +1))lnU

сходится к распределению случайной величины хи-квадрат с ( pq1 ) степенями свободы:

V = −(n q

2

1

( p + q +1))lnU ~

χ2 ( pq ) , n → ∞. (6.14)

 

 

 

2

1

1

 

 

 

 

 

Большие значения V свидетельствуют против гипотезы (6.9).

7. ФАКТОРНЫЙ АНАЛИЗ

Пусть проводят экспериментG , в результате которого наблюдается векторная величина ξ = (ξ1,..., ξp ). Модели факторного ана-

лиза базируются на предположении, что структура связей между компонентами (причинами) ξ1,...,ξp определяется их зависимо-

40

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]