Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебное пособие по ТВ и МС

.pdf
Скачиваний:
59
Добавлен:
08.03.2016
Размер:
3.21 Mб
Скачать

Проверить гипотезу об однородности двух выборок по критерию Вилкоксона–Манна–Уитни при уровне значимости α = 0,05.

Решение. Поскольку n1 = n2 = 27 > 25 , то воспользуемся алгоритмом для случая Б. Будем считать первой выборку xi, i =1, n1 . Составим из двух выборок

общий вариационный ряд (табл. 9.9), проставляя сразу ранги Rk, k =1,n1 + n2 элементам объединенного ряда. Принадлежность элемента той или иной выборке обозначим с помощью индекса ранга.

Таблица 9.9

Элемент

8X

8Y

9X

9X

9X

9Y

9Y

10X

10Y

ряда

Rk

1

2

3

4

5

6

7

8

9

Элемент

11X

11X

11Y

11X

13X

13Y

14X

15X

15Y

ряда

Rk

10

11

12

13

14

15

16

17

18

Элемент

15Y

15Y

16Y

17X

17X

17Y

17Y

17Y

18X

ряда

Rk

19

20

21

22

23

24

25

26

27

Элемент

18Y

18Y

18Y

19X

19X

19Y

20X

20X

20X

ряда

Rk

28

29

30

31

32

33

34

35

36

Элемент

20X

20X

20Y

20Y

21X

21X

21X

21Y

21Y

ряда

Rk

37

38

39

40

41

42

43

44

45

Элемент

21Y

21Y

21Y

22X

22X

22X

22Y

22Y

23X

ряда

Rk

46

47

48

49

50

51

52

53

54

По статистической таблице функции Лапласа для уровня значимости α =

 

 

u

 

 

α

1

 

 

1

α

=

0,05 найдем

квантиль

α = arg Φ 1

2

2

= arg Φ

2

= arg Φ(0,475)

1

2

 

 

 

 

 

 

 

=1,96. Используя (9.5), (9.6), получим ψкр.н

и ψкр.в

 

 

 

 

ψкр.н = (27 + 27 +1) 27 1 1,96

27 27(27 + 27 +1)

= 628,7 ,

 

 

2

 

 

 

 

 

12

 

 

 

 

ψкр.в = (27 + 27 +1) 27 628,7 = 856,3.

 

 

 

 

 

 

 

Вычислим расчетное значение критической статистики:

 

 

n1+n2

54

 

 

 

 

 

 

 

 

 

 

 

 

ψкр = Ri(1) = Ri(1)

=1 + 3 + 4 +K50 + 51 + 54 = 734 .

 

 

 

i=1

i=1

 

 

 

 

 

 

 

 

 

 

 

 

Условие ψкр.н ψ расч

ψкр.в выполняется, следовательно, гипотеза H0 верна.

 

 

 

 

131

 

 

 

 

 

 

 

 

Упражнение 9.3. Исследование в течение 10 дней производительности двух предприятий, выпускающих холодильники, дало следующие результаты:

Таблица 9.10

X:

82

74

64

72

83

68

76

88

70

59

Y:

54

64

70

64

55

69

77

71

70

55

Проверить гипотезу об однородности двух выборок по критерию Вилкоксона–Манна–Уитни при уровне значимости α = 0,1.

9.4.Гипотезы о числовых характеристиках случайных величин

Вобщем случае гипотезы о числовых характеристиках случайных величин

имеют вид: H0 : Θ ∆0 , где Θ = (θ1 ,K,θK ) некоторый вектор параметров (но

может быть и скаляром, т.е. Θ =θ1 ), а 0 область конкретных значений этих параметров, которая может состоять из точки.

Рассмотрим некоторые из критериев статистической проверки гипотез о числовых характеристиках случайных величин.

9.4.1. Проверка гипотез о равенстве дисперсий случайной величины при известных математических ожиданиях

Пусть имеются две выборки x1 ,K, xn1 , y1 ,K, yn2 случайных величин ξ и η

из нормальных генеральных совокупностей и пусть математические ожидания aξ и aη этих случайных величин известны. Необходимо проверить гипотезу о равенстве дисперсий случайных величин.

1-й шаг.

Формирование основной H0 и альтернативной H1 гипотез:

H0 : σξ2 = ση2 ,

H1 : σξ2 ση2 .

2-й шаг. Задание уровня значимости α.

3-й шаг. Формирование критической статистики. В качестве меры различия дисперсий σξ2 и σξ2 выбираем величину ψкр =σ~ξ2 /σ~η2 .

Предложение 9.4. Предельное распределение статистики

ψкр как случайной

величины в случае справедливости проверяемой

гипотезы H0 стремится к

Fраспределению Фишера F (n1 , n2 ) с n1

и n2

числом степеней

свободы

lim Fψкр (x) = F(n1 1, n2 1) . #

 

 

 

n1 ,n2 →∞

 

 

4-й шаг. Определение критических границ.

132

Верхняя критическая граница определяется как процентная точка

распределения Фишера уровня

α 100% : ψкр.в

 

= Fα

(n1 ,n2 ) .

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

2

100%

 

 

 

Для Fраспределения Фишера нижняя критическая точка может быть

найдена из выражения ψкр.н = F

 

α

(n1,n2 ) =

 

1

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(12 )100%

 

 

 

ψкр.в

 

 

 

 

Значение

процентной

точки

 

Fα

(n1,n2 ) находится из

таблиц

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

100%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

математической

статистики

для

распределения

Фишера.

 

 

 

5-й шаг. Расчетное значение критической статистики равно:

 

 

 

 

 

 

 

 

1

 

n1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ~ξ2

 

 

 

 

(xi aξ )

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

ψ расч

=

 

=

 

1

 

i=1

 

 

.

 

 

 

 

 

 

 

 

 

(9.7)

~2

 

1

 

n2

 

 

 

 

 

 

 

 

 

 

 

 

ση

 

 

 

( yi aη )2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n2 i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

Если

выполняется условие

F

α

 

(n1

,n2 ) ψ расч Fα

 

(n1 ,n2 ) ,

то H0

 

 

 

 

 

 

 

 

 

 

 

 

(1

2

)100%

 

 

2

100%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

верна с ошибкой первого рода α, в противном случае H0 отвергается.

Пример 9.6. Для данных примера 9.4. можно ли на уровне значимости α = 0,01 считать одинаковыми отклонения от среднего времени обслуживания клиентов банка в первый и второй дни, если известно, что M [ξ] = mξ =17,8 ,

M [η] = mη =17,6 , n1 = n2 = 55.

 

 

 

 

~2

=8,38,

~2

=8,14 .

Решение. Предварительно найдем σξ

ση

1-й шаг. H0 : σξ2 = ση2 , H1 : σξ2 ση2 .

 

 

 

2-й шаг. α = 0,01.

~2

 

 

 

~2

 

 

 

3-й шаг. ψкр =σξ

/ση .

 

 

 

4-й шаг. Находим, используя таблицу процентных точек распределения Фишера, верхнюю и нижнюю критические границы: ψкр.в = F0,005 (55,55) = 2,024 ,

ψкр.н =1/ 2,024 = 0,494 .

5-й шаг. Определяем по (9.8) расчетное значение критической статистики:

ψ расч = 8,38 / 8,14 =1,03.

Поскольку условие ψкр.н ψ расч ψкр.в выполняется, то H0 верна.

133

9.4.2. Проверка гипотез о равенстве дисперсий случайной величины при неизвестных математических ожиданиях

Пусть имеются две выборки x1 ,K, xn1 , y1 ,K, yn2 случайных величин ξ и η

из нормальных генеральных совокупностей и пусть математические ожидания aξ и aη этих случайных величин неизвестны. Необходимо проверить гипотезу о равенстве дисперсий случайных величин.

1-й шаг. Формирование основной и альтернативной гипотез H0 : σξ2 = ση2 ,

H1 : σξ2 ση2 .

 

 

 

 

 

 

 

 

 

2-й шаг. Задание уровня значимости α.

 

 

 

 

 

 

3-й шаг. Выбор критической статистики ψкр = sξ2 / sη2 .

В качестве оценок

дисперсий необходимо использовать несмещенные оценки.

 

 

 

 

Предельное распределение

статистики

ψкр

при неизвестных

aξ и aη

стремится

к

распределению Фишера с (n1 1)

и (n2 1)

числом

степеней

свободы

 

lim

Fψкр (x) = F(n1 1, n2

1) .

 

 

 

 

 

 

 

 

n1 ,n2 →∞

 

 

 

 

 

 

 

 

4-й шаг. Определение критических границ. Соответственно верхняя и

нижняя критические точки равны:

 

 

 

 

 

 

 

 

ψкр.в = Fα

(n1 1,n2 1) , ψкр.н = F

α

(n1 1,n2 1) =

 

1

.

 

 

 

 

 

 

2

100%

(1

2 )100%

 

 

ψкр.в

 

5-й шаг. Расчетное значение критической статистики при неизвестных математических ожиданиях определяется из выражения

ψ расч = sξ2 =

sη2

 

 

 

1

 

n1

~

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(xi aξ )

 

 

 

 

 

 

n

1

 

 

 

 

 

 

i=1

 

 

 

.

 

 

1

 

 

 

 

 

(9.8)

 

 

 

1

 

n2

~

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

( yi aη )

 

 

 

 

n2

 

 

 

 

 

 

1 i=1

 

 

 

 

 

Если выполняется условие

F

α

)100%

(n1 1,n2 1) ψ расч Fα

(n1 1,n2 1)

,

 

(1

2

2

100%

 

 

 

 

 

 

то H0 верна с ошибкой первого рода α, в противном случае H0 отвергается.

Пример 9.7. Для данных примера 9.4 проверить гипотезу о равенстве дисперсий при неизвестных математических ожиданиях aξ и aη для уровня значимости α = 0,1.

Решение. Поскольку aξ и aη неизвестны, то определим по исходным данным их оценки: a~ξ =17,84, a~η =17,65 . Далее, используя полученные

134

оценки математических ожиданий, вычислим несмещенные оценки: sξ2 = 8,55, sη2 = 8,30.

Находим, используя таблицу процентных точек распределения Фишера, верхнюю и нижнюю критические границы: ψкр.в = F0,05 (54,54) = 1,571,

ψкр.н =1/1,571 = 0,494 .

Определяем по (9.8) расчетное значение критической статистики:

ψ расч = 8,55 / 8,30 = 1,03.

Поскольку условие ψкр.н ψ расч ψкр.в выполняется, то H0 не отвергается.

9.4.3. Проверка гипотез о равенстве математических ожиданий случайных величин при известных дисперсиях

Пусть даны две выборки из нормальных генеральных совокупностей случайных величин ξ и η, и известны их дисперсии. Необходимо проверить гипотезу о равенстве математических ожиданий.

1-й шаг. Формирование основной и альтернативной гипотез H0 : aξ = aη ,

H1 : aξ aη .

Такая задача ставится обычно тогда, когда выборочные средние оказываются различными. Возникает вопрос: значимо ли это различие?

2-й шаг. Задание уровня значимости α.

3-й шаг. Формирование критической статистики и определение ее закона распределения при n1 → ∞, n2 :

 

~

~

 

 

 

ψкр =

aξ

aη

 

 

.

/ n

+σ

 

/ n

σ 2

2

2

ξ

1

 

η

 

 

Предложение

9.5.

Предельное

распределение статистики ψкр при

известных

σξ2

и

ση2

стремится

к нормальному распределению

lim

Fψкр (x) = N (0,1) . #

 

 

 

 

 

n1 ,n2 →∞

 

 

 

 

 

 

 

 

 

4-й шаг.

Верхняя и нижняя критические точки соответственно равны:

ψкр.в

= u

α ,

ψкр.н = −ψкр.в ,

где u

α

квантиль стандартного нормального

 

1

2

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

распределения уровня 1 α / 2 .

5-й шаг. Определение расчетного значения критической статистики

135

 

~

~

 

 

 

 

ψ расч =

aξ

aη

 

 

.

(9.9)

/ n

+σ

 

/ n

σ 2

2

2

 

ξ

1

 

η

 

 

и принятие решения. Если выполняется условие ψ кр.н ψ расч ψкр.в , то гипотеза H0 принимается. В противном случае H0 отвергается с ошибкой первого рода α.

Замечание 9.8. Данный алгоритм проверки гипотез о равенстве aξ и aη справедлив и при отклонении распределения случайных величин ξ и η от нормального, но при условии, что n1 и n2 больше 30.

Пример 9.8. Для данных примера 9.4 проверить для уровня значимости α = 0,05 гипотезу о равенстве математических ожиданиях aξ и aη при условии, что

дисперсии известны и равны σξ2

= 8,65 и ση2 = 8,12 .

 

 

Решение.

Оценки

 

математических

ожиданий

определим по

исходным

 

~

= 17,84,

~

 

 

 

 

 

выборкам: aξ

 

aη = 17,65 .

 

 

 

Находим, используя таблицу функции Лапласа, верхнюю и нижнюю

критические границы: ψкр.в = u

0,05 = arg Φ(0,475) = 1,96 , ψкр.н = −1,96 .

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Определяем по

 

(9.9) расчетное

значение

критической

статистики:

ψ расч =

 

17,84 17,65

 

= 0,34.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8,65 / 55 + 8,12 / 55

 

 

 

 

 

Поскольку условие ψкр.н ψ расч ψкр.в выполняется, то H0 не отвергается.

9.4.4. Проверка гипотез о равенстве математических ожиданий случайных величин при неизвестных дисперсиях

Пусть имеются две выборки из нормальных генеральных совокупностей случайных величин ξ и η. Требуется проверить гипотезу о равенстве aξ и aη.

1-й шаг. Формирование основной и альтернативной гипотез H0 : aξ = aη ,

H1 : aξ aη .

2-й шаг. Задание уровня значимости α.

3-й шаг. Формирование критической статистики

 

 

 

~

 

~

 

 

n n

 

 

 

 

 

 

 

ψкр =

 

 

aξ

 

aη

 

 

2 .

 

 

 

 

 

 

1

1)s

 

+ (n

 

(n

2

2

1)s2

n1 + n2

1

 

 

ξ

 

η

 

 

n1 + n2 2

136

Предложение 9.6. Предельное распределение статистики ψкр стремится к

tраспределению Стьюдента с

(n1 + n2 2) числом степеней

свободы

lim Fψкр (x) = t(n1 + n2 2) . #

 

 

n1 ,n2 →∞

 

 

 

 

 

 

4-й шаг. Верхняя и нижняя критические точки определяются по формулам:

ψкр.в

= tα

100%

(n1 + n2 2) , ψкр.н = −ψкр.в ,

 

 

 

2

 

 

 

 

 

 

 

 

 

где tα

 

(n1 + n2 2) верхняя процентная точка tраспределения Стьюдента,

2

100%

 

 

 

 

 

 

 

 

 

 

которая

может

быть определена

по статистическим таблицам.

Поскольку

tраспределение Стьюдента симметрично, то нижняя и верхняя критические точки симметричны относительно 0.

5-й шаг. Определение расчетного значения критической статистики

 

 

 

 

~

~

 

 

 

n n

 

 

 

 

 

 

 

 

 

 

ψ расч =

 

 

aξ

aη

 

 

 

2 .

 

 

 

 

 

 

 

1

(9.10)

1)s2

+ (n

 

 

(n

2

1)s2

n1 + n2

1

 

 

ξ

 

η

 

 

 

 

 

n1 + n2 2

 

 

 

 

Если выполняется условие ψкр.н ψ расч

ψкр.в , то гипотеза H0 принимается.

В противном случае H0 отвергается с ошибкой первого рода α.

Замечание 9.9. Данный алгоритм проверки гипотез о равенстве aξ и aη справедлив и при отклонении распределения случайных величин ξ и η от нормального, но при условии, что n1 и n2 больше 30.

Пример 9.9. Для данных примера 9.4 проверить для уровня значимости α = 0,01 гипотезу о равенстве математических ожиданиях aξ и aη при условии, что дисперсии неизвестны.

Решение. Оценки математических ожиданий и несмещенные оценки дисперсий определим по исходным выборкам: a~ξ = 17,84 , a~η = 17,65 , sξ2 =8,55,

sη2 =8,30.

 

 

 

 

 

Находим,

используя

таблицу

процентных

точек tраспределения

Стьюдента,

верхнюю

и

нижнюю

критические

границы:

ψкр.в = t0,005 (55 + 55 2) = 2,62

, ψкр.н = −2,62 .

 

 

Определяем по (9.10) расчетное значение критической статистики:

137

ψ расч =

 

 

17,84 17,65

 

 

= 0,065.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

54 8,55 + 54 8,30

 

 

 

 

 

 

 

 

108

 

 

 

 

 

 

 

 

 

 

 

Поскольку условие ψкр.н

ψ расч ψкр.в

выполняется, то H0 не отвергается.

Упражнение 9.4. Исследование длительности оборота оборотных средств

двух групп

предприятий

 

 

(по 14 предприятий в каждой)

дало

 

следующие

результаты:

~

 

~

2

2

,

2

2

.

Выяснить,

aξ = 23 дней,

aη

= 26 дней, sξ

= 4 дней

sη = 9

дней

можно ли для уровня значимости α = 0,1 считать, что отклонения в длительности оборота оборотных средств групп предприятий одинаковы.

Упражнение 9.5. Исследование в течение месяца (25 рабочих дней) ежедневных простоев двух строительных бригад из-за отсутствия материалов

дало следующие

результаты:

~

= 1,75

~

= 1,99 ч., при

априорных

aξ

ч., aη

предположениях σξ2

=1,4 ч2., sη2

=1,1 ч2.

Выяснить, можно ли

для уровня

значимости α = 0,01 считать среднее время простоя бригад одинаковым.

9.5. Проверка гипотез о стохастической независимости элементов выборки

Прежде чем приступить к статистической обработке результатов наблюдений, необходимо убедиться в том, что элементы выборки образуют случайную последовательность (являются случайными и независимыми).

9.5.1.Критерий «восходящих» и «нисходящих» серий

Вранговом критерии «восходящих» и «нисходящих» серий предварительно формируется последовательность серий «+» и «». Для этого в исходной

выборке x1 ,K, xn на месте i-го элемента ставят «+», если xi+1 > xi , и «», если xi+1 < xi . Если xi+1 = xi , то в серии ничего не проставляется. Полученная

последовательность «+» и «» может характеризоваться количеством серий v(n) и длиной самой длинной серии τ(n) . При этом под серией понимается

последовательность подряд идущих «+» или «». Длина серии количество подряд идущих «+» или «».

1-й шаг. Формулирование основной и альтернативной гипотез:

H0: элементы выборки x1 ,K, xn являются стохастически независимыми, Н1: элементы выборки x1 ,K, xn не являются стохастически независимыми. 2-й шаг. Задание уровня значимости α.

138

3-й

шаг.

Формирование

двумерной

критической

статистики

ψкр =ψ{v(n),τ(n)}.

Предельное

распределение

статистики ψкр

является

двумерным с частными предельными распределениями v(n)

и τ(n) .

4-й шаг. Определение верхней и нижней критических точек распределения

 

1

 

 

 

 

16n

29

 

 

 

ψкр.в = vкр (n) =

 

 

(2n 1)

u

α

 

 

 

,

(9.11)

3

90

 

 

 

1

2

 

 

 

 

5,

при n 26,

 

ψкр.н =τкр (n) = 6,

при 26 < n 153,

(9.12)

7,

при153 < n 1170.

 

5-й шаг. Определение расчетных значений критической статистик v расч (n) , которая равна количеству серий в последовательности «+» и «», и τ расч (n) длина самой длинной очереди. Если одновременно выполняются условия

vрасч (n) vкр (n),

(9.13)

 

τ расч (n) τкр (n),

 

то H0 принимается с ошибкой первого рода α. В противном случае элементы выборки нельзя считать стохастически независимыми.

Замечание 9.10. Критерий «восходящих» и «нисходящих» серий улавливает смещение оценки математического ожидания монотонного и периодического характера. Данный критерий является ранговым и применим для выборки с любым законом распределения.

Пример 9.10. Для выборки xi , i = 1,27 из примера 9.5 проверить гипотезу о

стохастической независимости элементов выборки для уровня значимости α = 0,05 с помощью критерия «восходящих» и «нисходящих» серий.

Решение. Построим последовательность серий

+ + + + + + + + − − − − + + − − +.

Получим vрасч (n) = 20

,

τ расч (n) = 4 . Найдем из (9.11), (9.12) vкр (n) и τкр (n) :

vкр (27) = 6 , τкр (27) =

1

(2 27 1) 1,96

16 27 29

= 13,52 .

 

3

 

90

 

Поскольку условия (9.13) выполняются, то H0 не отвергается и элементы выборки можно считать случайными и независимыми.

139

9.5.2. Критерий стохастической независимости Аббе

Если выборка x1 ,K, xn принадлежит нормальной генеральной

совокупности, то для выяснения вопроса о ее случайности предпочтительнее воспользоваться критерием Аббе. Критерий Аббе позволяет обнаружить систематическое смещение среднего в ходе выборочного обследования.

1-й шаг. Формулирование основной и альтернативной гипотез:

H0: элементы выборки x1 ,K, xn являются стохастически независимыми, Н1: элементы выборки x1 ,K, xn не являются стохастически независимыми. 2-й шаг. Задание уровня значимости α.

3-й

 

шаг.

Формирование

критической

статистики

ψкр =

q2

(n)

,

где

 

s

2

 

 

1

n1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

q2 (n) =

 

(xi+1 xi )2 , s2 несмещенная оценка дисперсии выборки.

 

 

 

 

 

 

 

2n 1 i=1

 

 

 

 

 

 

 

 

 

При

n 60

предельное

распределение

критической

статистики

 

γα(n)

затабулировано и представлено в статистических таблицах для различных значений α.

4-й шаг. Определение нижней критической точки осуществляется двумя способами. Если n > 60, то

 

u

α

 

 

 

ψкр.н = 1 +

1

2

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

2

α

 

 

n + 0,5 1 + u

 

 

 

 

 

 

 

 

 

1

2

 

При n 60 ψкр.н =γα(n) находится по статистическим таблицам.

5-й шаг. Определение расчетного значения критической статистики

ψ расч =

q2

(n)

. Если

ψ расч ψкр.н , то гипотеза H0 о стохастической

s

2

 

 

 

 

независимости элементов выборки принимается с ошибкой первого рода α. В противном случае элементы выборки нельзя считать случайными и независимыми.

Пример 9.11. Для выборки xi , i = 1,27 из примера 9.5 проверить гипотезу о

стохастической независимости элементов выборки для уровня значимости α = 0,05 с помощью критерия Аббе.

Решение. Поскольку n 60, то с помощью таблицы для α = 0,05 получим

ψкр.н = γ0(,2705) = 0,69 .

140