Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский университет «МИЭТ»

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

VUKOLOV2.pdf

Скачиваний:

138

Добавлен:

05.06.2015

Размер:

2.12 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1718 / 2218 19 20 21 22 > Следующая >>>

5. Однофакторный дисперсионный анализ

5.1. Основные понятия

Пусть результаты наблюдений составляют l независимых выборок (групп), полученных из l нормально распределенных генеральных совокупностей, которые имеют, вообще говоря, различные средние m1, m2 , ..., ml и равные дисперсии D.

Проверяется гипотеза о равенстве

средних H0 : m1, = m2 , = ... = ml .

На практике такая задача возникает при исследовании влияния, которое оказывает изменение некоторого фактора на измеряемую величину. Например, если измерения проводятся на l различных приборах, то можно исследовать влияние фактора "прибор" на результаты измерения. Суть однофакторного дисперсионного анализа состоит в следующем.

	Пусть xik обозначает i-й элемент k-й выборки, i					=
1,	2,				…,	nk;
k =	1, 2, …, l; выборочное среднее k-й выборки
			1		nk
	xk =		1		åxik ;
	xk =		n		åxik ;
			k		i=1
x - общее выборочное среднее;
		1		l	nk
	x =	1		ååxik ;
	x =	n		ååxik ;
		k		k =1 i=1

n - общее число наблюдений,

n = ånk . k=1

141

Общая сумма квадратов отклонений наблюдений от общего среднего x может быть представлена так:

l	nk	l	l	nk
åå(xik − x)2 = ånk (xk − x)2 + åå(xik − xk )2 .
k =1 i=1		k =1	k=1 i=1

Это основное тождество дисперсионного анализа. Запишем его в виде

Q = Q1 + Q2,

где Q - общая сумма квадратов отклонений наблюдений от общего среднего; Q1 - сумма квадратов отклонений выборочных средних групп от общего среднего (между группами); Q2 - сумма квадратов отклонений наблюдений от выборочных средних групп (внутри групп).

Основное тождество легко проверяется, если

возвести в	квадрат	обе части очевидного равенства
(xik − x) = [(xk	− x) + (xik	− xk )] и затем	просуммировать обе
части по i (i	= 1, 2, …, nk) и k (k		= 1, 2, …, l), а также
учесть, что
	l	nk

åå(xik − x) (xk − x) = 0 k =1 i=1

в силу определения средних xk и x .

Если верна гипотеза H0 о равенстве средних, то можно показать, что статистики Q1/D и Q2/D независимы и имеют распределение χ2 соответственно с l – 1 и n – l степенями свободы (см. например [22]). Следовательно, статистики

	S2	=	Q1	и S2		=	Q2
	S2	=		и S2		=
	1		l −1		2		n − l
			l −1				n − l
являются	несмещенными				оценками			неизвестной
дисперсии	ошибок		наблюдений D.					Оценка S2
								1

142

характеризует рассеяние групповых средних, а оценка S22 - рассеяние внутри групп, которое обусловлено случайными вариациями результатов наблюдений. Значительное превышение величины S12 над величиной S22 можно объяснить различием средних в группах.

Отношение этих оценок при условии, что верна гипотеза H0, имеет распределение Фишера с l – 1 и n – l степенями свободы.

	S2		Q /(l −1)
F =	1	=	1	= F(l −1, n − l) .
F =	S22	=	Q2 /(n − l)	= F(l −1, n − l) .
	S22		Q2 /(n − l)

Эта статистика используется для проверки гипотезы H0 о равенстве средних H0 : m1 = m2 = ... = ml . Гипотеза H0

не противоречит результатам наблюдений, если выборочное значение Fb статистики F меньше квантили распределения Фишера F1 – α(l – 1, n – l). Если Fb больше F1 – α(l – 1, n – l), то гипотеза H0 отклоняется и следует считать, что среди средних m1, m2, …, ml имеется хотя бы два, не равных друг другу.

Пример 5.1. Три группы водителей обучались по разным методикам. По окончании обучения было проведено контрольное тестирование произвольно отобранных водителей из каждой группы. Получены следующие результаты:

								Сумма
	Число ошибок,							ошибок по	Число
Группа,	Число ошибок,							каждой	Число
Группа,		допущенных						группе	тестируемых
k		допущенных						группе	тестируемых
k	водителями, xik							nk	водителей, nk
	водителями, xik							nk	водителей, nk
								åxik
								i=1
Первая	1	3	2	1	0	2	1	10	7
Вторая	2 3 2 1 4 - -							12	5

143

Третья	4 5 3 - - - -		12	3
На уровне значимости α =			0,05 проверить гипотезу

об отсутствии влияния разных методик обучения на результаты контрольного тестирования водителей. Предполагается, что выборки получены из независимых нормально распределенных совокупностей с одной и той же дисперсией.

Очевидно, задача заключается в проверке гипотезы H0: m1 = m2 = m3, где mk - математическое ожидание числа ошибок для водителей k-й группы. В нашем случае l = 3, n = 15.

Вычисления удобно проводить в следующей последовательности.

Сумма всех элементов xik , i = 1, 2,...,nk , k = 1, 2, ..., l трех выборок равна

lnk

x= ååxik = 10 +12 +12 = 34 ,

k =1 i=1

а сумма квадратов этих элементов равна

ååxik2 = 104 .

Далее получаем

k=1 i=1

Q = åå(xik − x)2 = åå(xik )2 −

(x..)2

= 104 −

(34)2

≈ 26,93

k =1 i=1

k=1 i=1

;

Q1 = ånk (xk − x)2 = å

(xk )2 = 91,086 −

(34)2 ≈ 14,02 ;

k=1

k =1

Q2 = Q − Q1 = 26,93 −14,02 = 12,91 .

Вычисляем выборочное значение статистики:

Q1 /(l −1)

= 14,02 / 2 ≈ 6,52 .

Q2 /(n −1) 12,91/12

144

Из таблицы квантилей распределения Фишера находим

F0,95(2,12) = 3,89. Так как Fb = 6,52 > 3,89, то на уровне значимости

α = 0,05 гипотеза о равенстве средних отклоняется: разные методики обучения дают значимо различные результаты контрольного тестирования групп водителей.

Если гипотеза H0 о равенстве средних отклоняется, то требуется определить, какие именно группы водителей имеют значимое различие средних. Для этой цели используется метод линейных контрастов.

Линейный контраст Lk определяется как линейная комбинация

Lk = åck mk , k =1

где ck, k = 1, 2, …, l - константы, однозначно определяемые из формулировки проверяемых гипотез,

причем åck = 0 .

k=1

Оценка линейного контраста Lk равна

Lk% = åck xk ,

k=1

аоценка дисперсии линейного контраста Lk% равна

		Q	l		c2
	2		å		k
%						.
D[Lk] =		n − l			n	.
			k=1		k
Границы доверительного интервала для Lk имеют
вид:
%
%	(l −1)F1−α (l			−1, n −1) ,
Lk ± sLk	(l −1)F1−α (l			−1, n −1) ,

145

где SLk - оценка среднего квадратического отклонения

линейного контраста, SLk = D%[Lk] .

Пример 5.2. В условиях примера 5.1 при

двусторонних	альтернативных			гипотезах		проверить
гипотезы H (1) : m = m ;			H (2)	: m = m ;		H(3)	: m = m ;
0	1	2	0	1	3	0	2	3

H0(4) : 12 (m1 + m3) = m2 .

В соответствии с проверяемыми гипотезами H0(1) , i =

1, 2, 3, 4,

определяются линейные контрасты:

Lk1 = m1 – m2; c1 = 1, c2 = –1, c3 = 0; Lk2 = m1 – m3; c1 = 1, c2 = 0, c3 = –1; Lk3 = m2 – m3; c1 = 0, c2 = 1, c3 = –1;

Lk4 = 1/2(m1 + m2) – m3; c1 = 1/2, c2 = 1/2, c3 = –1.

Найдем границы доверительных интервалов для линейных контрастов Lki, i = 1, 2, 3, 4.

Предварительно вычислим оценки линейных контрастов и их дисперсий. Выборочные средние по

группам	равны	x1 = 1,43, x2 = 2,4, x3 = 4 .	Оценка
дисперсии ошибок наблюдений:

S22 = nQ-2l = 1512,91- 3 » 1,08 .

Оценки контрастов и их дисперсий:

æ 1

= 1,43 - 2,4 = -0,97 ;

÷ » 0,37 ;

Lk1

= 1,08×ç

è 7

æ 1

1 ö

= 1,43 - 4 = -2,57 ;

÷ » 0,51;

Lk2

= 1,08×ç

è 7

3 ø

146

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1718 / 2218 19 20 21 22 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
23.09.2019386.56 Кб1Voprosy_dlya_4_kurs_8_semestr.doc
#
22.11.201970.14 Кб2Voprosy_Informatika.doc
#
05.06.2015197.12 Кб4Voprosy_k_rubezhnomu_kontrolyu_-_informatika.doc
#
22.09.201974.36 Кб3voprosy_po_biletamshpory_-_kopia.docx
#
16.04.2019582.6 Кб1Vtoraya_chast.docx
#
05.06.20152.12 Mб138VUKOLOV2.pdf
#
25.09.2019508.93 Кб3v_lapkinx2cx20v_pantin_94_3.doc
#
27.03.20162.06 Mб277XAXANINA.pdf
#
05.06.20155.29 Mб242Yuryeva_M_V_Tsvetovedenie (без защиты).pdf
#
05.06.2015273.6 Кб22Zadachi_po_fizike.pdf
#
19.07.201935.4 Кб10Zadanie_dlya_studentov.docx