Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Литература / книга.pdf
Скачиваний:
150
Добавлен:
17.04.2013
Размер:
1.36 Mб
Скачать

 

 

n

 

где α*r

,s =

1

n

xkr yks

 

k =1

 

 

 

 

a α*

+ b x = α*

;

 

 

2,0

1,1

 

(9.2)

 

 

 

 

a x + b = y,

 

 

 

 

 

 

 

- начальный выборочный момент порядка r + s;

xи y - средние значения соответствующих переменных. Решение системы (9.2), как нетрудно убедиться, имеет вид

~

 

SX ,Y

*

S

 

~

*

S

 

 

 

Y

 

 

Y

 

a

=

 

= ρ

 

,

b

= y x ρ

 

,

SX

SX

SX

где ρ* - выборочный коэффициент корреляции, SX и SY - выборочные

среднеквадратические отклонения, определенные в главе 8. Уравнение линейной регрессии приобретает вид

y(x) = y + ρ* SY (x x).

S X

Заметим, что полученное уравнение аналогично теоретическому уравнению регрессии, если заменить все входящие в него вероятностные моменты соответствующими выборочными оценками в соответствии с методом подстановки.

Глава 10.Однофакторный дисперсионный анализ

Пусть имеется l независимых нормальных совокупностей X1, X2,...Xl с

одной и той же, хотя и неизвестной дисперсией σ2 . Математические ожидания mi = M[Xi ] также неизвестны, но имеются основания предполагать, что они равны. Требуется проверить основную гипотезу H0 : m1 = m2 = ... = ml против альтернативы H1 = H0 . Для этого из каждой совокупности (подпопуляции) Xi берется выборка объемом ni :

xi1, xi2 ,..., xini , i =1,2,..., l.

Формулируетсяследующаялинейнаямодельдисперсионногоанализа:

xij = mi ij

- j-е наблюдение из i-й подпопуляции,

mi = m0 + αi

- среднее i-й подпопуляции,

150

 

n

 

 

m =

1

l

n

m - генеральное(тотальное) среднеевсейпопуляцииX,

 

 

0

 

i=1

i

i

 

 

 

 

αi

 

 

 

- дифференциальный эффект, определяющий

различие средних.

При интерпретации модели дисперсионного анализа считается, что существует некоторый фактор A, имеющий l уровней, воздействие которого приводит к расщеплению всей популяции X на l подпопуляций Xi , i =1,2,...,l . Например, если измерения проводятся на l различных

приборах, то можно исследовать влияние фактора "прибор" на результаты измерений. Термин "дисперсионный анализ" был первоначально предложен Р.Фишером (1925) для обработки результатов агрономических опытов, целью которых было выявление условий, позволяющих максимизировать урожай. Современные приложения дисперсионного анализа охватывают широкий круг задач техники, экономики, социологии, биологии, медицины и трактуются в терминах статистической теории проверки гипотез.

Заметим, что если дифференциальные эффекты αi малы, то от-

клонение средних значений отдельных подпопуляций от тотального среднего можно рассматривать как случайное отклонение и гипотеза H0 с большой вероятностью будет принята. Если l = 2 , то получается

уже известная нам задача проверки гипотезы о равенстве средних двух независимыхнормальных совокупностей, рассмотреннаяв§ 7.3.

Напомним, что для проверки этой гипотезы использовалась стъюдентова статистика W, основанная на нормированной разности выборочных средних. Фишером доказано, что при l > 2 подходящей статистикой для проверки указанной гипотезы является фишеровское отношение дисперсий, сконструированных специальным образом.

Обозначим выборочную среднюю i-й выборки как

 

1

n

 

 

xi=

i

xik ,

(10.1)

n

 

i k =1

 

 

общее среднее объединенной выборки

 

1

 

l ni

 

x =

 

∑∑

x ;

n

 

 

ik

 

 

 

i=1 k =1

 

 

 

 

объем объединенной выборки

151

l

n= ni .

i=1

Легко видеть, что

 

1

l

1

ni

1

l

 

x =

ni (

xij ) =

ni xi,

(10.2)

n

n

n

 

 

i=1

i

j=1

 

i=1

 

т.е. тотальное среднее равно среднему арифметическому внутригрупповых средних.

l

ni

 

 

 

 

 

 

 

Положим Q = ∑∑(xik x)2 - сумма квадратов отклонений резуль-

i=1 k =1

 

 

 

 

 

 

 

 

~

2

 

 

Q

 

татов наблюдений от общего среднего. Очевидно, что σ

 

=

 

 

 

 

- несме-

 

n 1

щенная оценка неизвестной дисперсии σ2 и, кроме того,

 

 

 

являются

 

x

 

 

 

 

 

i

 

несмещенными и состоятельными оценками математических ожиданий mi .

Если гипотеза H0 верна, то xiне должны сильно отличаться от

общего среднего x , но для точного решения задачи нужна подходящая статистика. Идеяеепостроенияосновананаразбиениисуммыквадратов:

Q = QB +QW ,

где

QB = l

ni (xix2 )2

-

(10.3)

i=1

 

 

 

сумма квадратов отклонений "между группами";

 

l

ni

 

 

QW = ∑∑(xik xi)2

-

(10.4)

i=1 k =1

сумма квадратов отклонений "внутри групп".

Покажем, как получается это разбиение. Преобразуем разность

xik x = (xik xi)+ (xix ). Возведем в квадрат (xik x)2 = (xix)2 + + (xik xi)2 + 2(xik xi)(xix ). Далее обе части равенства суммиру-

ем сначала по k от 1 до ni , затем по i от 1 до l. Учтем, что

152

n

 

 

n

 

i

(xik xi)= i

xik ni xi= 0

k =1

 

k =1

 

согласно (10.1).

 

 

 

 

Поэтому

 

 

 

 

l

 

l

ni

 

Q = ni

(xix)2 +∑∑(xik xi)2 = QB +QW .

i=1

 

i=1 k =1

Выражения для сумм (10.3) и (10.4) можно преобразовать к виду, более удобному для вычислений, используя определения (10.1) и (10.2):

 

 

 

l

 

l

 

 

 

 

 

QB = ni (xix)2 = ni xi2n x2 ,

 

 

 

 

i=1

i=1

 

 

 

 

 

l

ni

l

ni

l

 

 

 

 

QW = ∑∑(xik xi)2 =

∑∑xik2

ni xi2.

 

 

i=1 k =1

i=1 k =1

i=1

 

 

Теорема 10.1.

Если X1, X 2 ,..., X l

независимы

в

совокупности,

Xi ~ N (mi ,σ2 ) и справедлива гипотеза

H0 , то QB и

QW

независимы,

причем Q

B

распределенапозакону χ2

(l 1) , а Q

- позакону χ2(n l) .

 

 

 

 

W

 

 

 

Так как QB и QW - квадратичные формы, составленные из не-

зависимых нормальных величин, то результат получается на основании теоремы Пирсона (см. также [5], с. 106, теоремы 6, 7).

Из этой теоремы и теоремы Фишера следует, что статистика

F = lQB1 : nQWl = SB2 SW2

распределена по закону Фишера Fi(l 1, n l).

Нетрудно убедиться, что F является подходящей статистикой для проверки гипотезы H0 . Действительно, если гипотеза H0 верна, то

величины

SB2 = lQB1 и SW2 = nQWl

являются независимыми несмещенными оценками одного и того же

параметра σ2 , поэтому SB2 SW2 , что приводит к событию {Fвыб G1−α}. Если же верна гипотеза H1 , то разброс между группами

153