Добавил:

korayakov Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский университет «МИЭТ»

Предмет:

Теория вероятностей и математическая статистика

Файл:

Литература / книга.pdf

Скачиваний:

150

Добавлен:

17.04.2013

Размер:

1.36 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 2021 / 2221 22 > Следующая >>>

		n	∑
где α*r	,s =	1	n	xkr yks
где α*r	,s =		k =1	xkr yks
			k =1

a α*		+ b x = α*	;
	2,0	1,1		(9.2)
				(9.2)
a x + b = y,

- начальный выборочный момент порядка r + s;

xи y - средние значения соответствующих переменных. Решение системы (9.2), как нетрудно убедиться, имеет вид

~		SX ,Y	*	S		~	*	S
				Y				Y
a	=		= ρ		,	b	= y − x ρ		,
		SX		SX				SX

где ρ* - выборочный коэффициент корреляции, SX и SY - выборочные

среднеквадратические отклонения, определенные в главе 8. Уравнение линейной регрессии приобретает вид

y(x) = y + ρ* SY (x − x).

S X

Заметим, что полученное уравнение аналогично теоретическому уравнению регрессии, если заменить все входящие в него вероятностные моменты соответствующими выборочными оценками в соответствии с методом подстановки.

Глава 10.Однофакторный дисперсионный анализ

Пусть имеется l независимых нормальных совокупностей X1, X2,...Xl с

одной и той же, хотя и неизвестной дисперсией σ2 . Математические ожидания mi = M[Xi ] также неизвестны, но имеются основания предполагать, что они равны. Требуется проверить основную гипотезу H0 : m1 = m2 = ... = ml против альтернативы H1 = H0 . Для этого из каждой совокупности (подпопуляции) Xi берется выборка объемом ni :

xi1, xi2 ,..., xini , i =1,2,..., l.

Формулируетсяследующаялинейнаямодельдисперсионногоанализа:

xij = mi +εij	- j-е наблюдение из i-й подпопуляции,
mi = m0 + αi	- среднее i-й подпопуляции,

150

	n	∑
m =	1	l	n	m - генеральное(тотальное) среднеевсейпопуляцииX,
m =			n	m - генеральное(тотальное) среднеевсейпопуляцииX,
0		i=1	i	i
		i=1
αi				- дифференциальный эффект, определяющий

различие средних.

При интерпретации модели дисперсионного анализа считается, что существует некоторый фактор A, имеющий l уровней, воздействие которого приводит к расщеплению всей популяции X на l подпопуляций Xi , i =1,2,...,l . Например, если измерения проводятся на l различных

приборах, то можно исследовать влияние фактора "прибор" на результаты измерений. Термин "дисперсионный анализ" был первоначально предложен Р.Фишером (1925) для обработки результатов агрономических опытов, целью которых было выявление условий, позволяющих максимизировать урожай. Современные приложения дисперсионного анализа охватывают широкий круг задач техники, экономики, социологии, биологии, медицины и трактуются в терминах статистической теории проверки гипотез.

Заметим, что если дифференциальные эффекты αi малы, то от-

клонение средних значений отдельных подпопуляций от тотального среднего можно рассматривать как случайное отклонение и гипотеза H0 с большой вероятностью будет принята. Если l = 2 , то получается

уже известная нам задача проверки гипотезы о равенстве средних двух независимыхнормальных совокупностей, рассмотреннаяв§ 7.3.

Напомним, что для проверки этой гипотезы использовалась стъюдентова статистика W, основанная на нормированной разности выборочных средних. Фишером доказано, что при l > 2 подходящей статистикой для проверки указанной гипотезы является фишеровское отношение дисперсий, сконструированных специальным образом.

Обозначим выборочную среднюю i-й выборки как

	1	n
xi• =		∑i	xik ,	(10.1)
	n
	i k =1

общее среднее объединенной выборки

	1	l ni
x =	1	∑∑	x ;
x =	n		x ;
	n		ik
		i=1 k =1	ik
		i=1 k =1

объем объединенной выборки

151

n= ∑ni .

i=1

Легко видеть, что

	1	l	1	ni	1	l
x =	1	∑ni (	1	∑xij ) =	1	∑ni xi• ,	(10.2)
x =	n	∑ni (	n	∑xij ) =	n	∑ni xi• ,	(10.2)
		i=1	i	j=1		i=1

т.е. тотальное среднее равно среднему арифметическому внутригрупповых средних.

l	ni
Положим Q = ∑∑(xik − x)2 - сумма квадратов отклонений резуль-
i=1 k =1
	~	2			Q
татов наблюдений от общего среднего. Очевидно, что σ			=			- несме-
татов наблюдений от общего среднего. Очевидно, что σ			=	n −1		- несме-
щенная оценка неизвестной дисперсии σ2 и, кроме того,						являются
щенная оценка неизвестной дисперсии σ2 и, кроме того,					x	являются
					i•

несмещенными и состоятельными оценками математических ожиданий mi .

Если гипотеза H0 верна, то xi• не должны сильно отличаться от

общего среднего x , но для точного решения задачи нужна подходящая статистика. Идеяеепостроенияосновананаразбиениисуммыквадратов:

Q = QB +QW ,

где

QB = ∑l	ni (xi• − x2 )2	-	(10.3)
i=1
сумма квадратов отклонений "между группами";
l	ni
QW = ∑∑(xik − xi•)2		-	(10.4)

i=1 k =1

сумма квадратов отклонений "внутри групп".

Покажем, как получается это разбиение. Преобразуем разность

xik − x = (xik − xi• )+ (xi• − x ). Возведем в квадрат (xik − x)2 = (xi• − x)2 + + (xik − xi• )2 + 2(xik − xi•)(xi• − x ). Далее обе части равенства суммиру-

ем сначала по k от 1 до ni , затем по i от 1 до l. Учтем, что

152

n			n
∑i		(xik − xi•)= ∑i		xik −ni xi• = 0
k =1			k =1
согласно (10.1).
Поэтому
l		l	ni
Q = ∑ni	(xi• − x)2 +∑∑(xik − xi•)2 = QB +QW .
i=1		i=1 k =1

Выражения для сумм (10.3) и (10.4) можно преобразовать к виду, более удобному для вычислений, используя определения (10.1) и (10.2):

			l		l
		QB = ∑ni (xi• − x)2 = ∑ni xi2• −n x2 ,
			i=1	i=1
		l	ni	l	ni	l
		QW = ∑∑(xik − xi•)2 =		∑∑xik2 −		∑ni xi2• .
		i=1 k =1		i=1 k =1		i=1
Теорема 10.1.			Если X1, X 2 ,..., X l		независимы		в	совокупности,
Xi ~ N (mi ,σ2 ) и справедлива гипотеза					H0 , то QB и		QW	независимы,
причем Q	B	распределенапозакону χ2		(l −1) , а Q		- позакону χ2(n −l) .
	B				W

Так как QB и QW - квадратичные формы, составленные из не-

зависимых нормальных величин, то результат получается на основании теоремы Пирсона (см. также [5], с. 106, теоремы 6, 7).

Из этой теоремы и теоремы Фишера следует, что статистика

F = lQ−B1 : nQ−Wl = SB2 SW2

распределена по закону Фишера Fi(l −1, n −l).

Нетрудно убедиться, что F является подходящей статистикой для проверки гипотезы H0 . Действительно, если гипотеза H0 верна, то

величины

SB2 = lQ−B1 и SW2 = nQ−Wl

являются независимыми несмещенными оценками одного и того же

параметра σ2 , поэтому SB2 ≈ SW2 , что приводит к событию {Fвыб G1−α}. Если же верна гипотеза H1 , то разброс между группами

153

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 2021 / 2221 22 > Следующая >>>

Соседние файлы в папке Литература

#
17.04.20131.36 Mб150книга.pdf
#
17.04.201321.9 Mб416Феллер_теория вероятностей_I.pdf
#
17.04.201333.75 Mб372Феллер_теория вероятностей_II.pdf