Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ЛЕК __Проверка статистических гипотез__

.pdf
Скачиваний:
9
Добавлен:
05.03.2021
Размер:
203.19 Кб
Скачать

5.3. Проверка статистических гипотез

Определение 77. Статистической называют гипотезу о виде неизвестного распределения, или о параметрах известного распределения.

Определение 78. Нулевой (основной) гипотезой называют выдвинутую гипотезу H 0 .

Определение 79. Конкурирующей (альтернативной) гипотезой называют гипотезу H1 , которая

противоречит нулевой.

Определение 80. Простой называют гипотезу, содержащую только одно предположение.

Определение 81. Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.

При статистической проверке гипотезы можно допустить следующие ошибки:

1.Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза.

2.Ошибка второго рода состоит в том, что будет принята неправильная гипотеза.

Замечание: Вероятность совершить ошибку первого рода называют уровнем значимости и обозначают. Обычно его принимают равным 0,05 или 0,01. Если принят уровень значимости = 0, 01 , то это значит,

что примерно в одном случае из ста можно допустить ошибку первого рода. Для уменьшения возможности допустить ошибку первого рода эксперимент проводят повторно с большей выборкой.

Определение 82. Статистическим критерием называют случайную величину R , по значениям которой судят о справедливости нулевой гипотезы.

Определение 83. Наблюдаемым значением Rнабл называют значение статистического критерия,

вычисленное по выборочным данным.

После выбора некоторого критерия проверки статистической гипотезы множество всех его возможных значений разбивают на два непересекающихся подмножества. Если наблюдаемое значение критерия попадает в первое подмножество (область принятия гипотезы), то основная гипотеза принимается. Если – во второе подмножество (критическая область), то основная отвергается и принимается альтернативная гипотеза. Точки разделяющие эти подмножества называют критическими.

Для проверки статистической гипотезы поступают следующим образом:

1.Ранжируют данные.

2.Строят статистический ряд.

3. Вычисляют теоретические вероятности попадания в каждый интервал группирования по формуле: pi* = h f (xi0 ) .

4.Вычисляют теоретические частоты по формуле: ni* = npi* .

5.Задают уровень значимости .

6. Определяют

критическую

точку

(правосторонняя

критическая

область)

исходя из условия

P(R Rкрит ) = и количества

степеней свободы

( s = k m 1,

где k -

количество интервалов

группирования признака, m -

количество параметров рассматриваемого распределения.

Например, для

нормального

распределения

m = 2 , т.к. оно определяется двумя

параметрами –

математическим

ожиданием и средним квадратическим отклонением).

7.Вычисляют по выборке наблюдаемое значение критерия.

8.Если наблюдаемое значение больше критического, то гипотезу H 0 отвергают; в противном случае нет оснований отвергнуть гипотезу (отвергают гипотезу более категорично, чем принимают).

Вкачестве критерия проверки статистических гипотез будем рассматривать критерий Пирсона 2 (хи квадрат).

Для определения критических точек распределения 2 при различных уровнях значимости составлены

специальные таблицы.

Определение 84. Наблюдаемым значением критерия Пирсона называется величина

набл2

k

(n np* )2

=

i

i

.

 

*

 

i=1

npi

 

Пример

48. Дана выборка, проверить гипотезу при уровне значимости = 0, 05 , если

H0 ={Количественный признак генеральной совокупности распределен нормально}.

- 1 -

27,28

20,99

74,98

22,79

61,89

45,78

64,79

15,62

47,55

26,91

32,1

70,86

43,48

18,08

40,66

48,36

65,75

49,2

51,87

40,48

53,72

44,39

62,73

28,9

62,39

32,5

18,97

33,71

56,1

53,52

53,93

27

75,87

41,25

2,47

62,85

51,89

65,75

37,26

65,83

51,18

27,27

44,35

55,27

38,47

57,83

43,36

56,5

46,63

33,79

24,12

62,08

36,08

48,71

32,07

58,05

26,06

58,22

37,52

58,5

59,74

55,72

44,78

41,01

40,72

57,38

72,08

51,55

45,2

45,33

31,24

28,29

58,41

51,96

27,03

42,95

19,27

52,46

70,1

55,2

27,12

70,7

54

57,93

41,13

27,93

61,36

74,78

50,77

74,08

59,17

82,62

80,84

52,3

53,05

16,97

61,73

45,75

27,46

47,38

Решение: Объем выборки равен 100, следовательно количество интервалов группирования равно:

k =1+ log2 100 = 7, 6439 8. Длина интервала группирования равна отношению размаха

и количества

интервалов группирования:

h =

xmax xmin

=

82, 62 2, 47

=10, 01875 10,1.

Заметим,

что значение

k

8

 

 

 

 

 

 

длины интервала всегда следует округлять с избытком. В противном случае наибольшие варианты могут не включиться в последний интервал. Если же округлять с избытком на значительную долю, то последний интервал может оказаться пустым. Занесем все данные в следующую таблицу:

Наблюдаемое значение критерия равно:

2

= 9,7985.

Число степеней свободы равно:

 

набл

 

 

s = 8 2 1 = 5. По таблице, расположенной ниже,

находим: крит2

(0, 05;5) =11,1 . Так как наблюдаемое

значение критерия меньше, чем критическое (теоретическое значение), то нет оснований отвергнуть основную (нулевую) гипотезу.

Номер

Интервал

Середина

Частота

Частость

Компоненты

Отклонения

Компоненты

 

Теоретич.

Теоретич.

Компоненты

интер

[xi 1; xi )

интервала

ni

 

n

среднего

от среднего

дисперсии

 

 

 

частости

частоты

 

 

(n n* )2

вала

 

xi0

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

pi* = h f (xi0 )

ni* = n pi*

2

:

 

i

i

 

 

 

 

 

 

 

 

x

 

 

x0 x

 

 

 

n (x0 x )2

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

*

i

 

 

 

 

 

 

 

 

 

B

i

B

 

i i

B

 

 

 

 

 

 

 

ni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

1

2,47 –

7,52

1

0,01

 

 

 

0,0752

-39,592

 

 

15,67526

 

 

0,0130495

1,304953

 

0,071264

 

 

12,57

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

12,57 –

17,62

6

0,06

 

 

 

1,0572

-29,492

 

 

52,18668

 

 

0,0482933

4,829328

 

0,283781

 

 

22,67

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

22,67 –

27,72

17

0,17

 

 

 

4,7124

-19,392

 

 

63,92844

 

 

0,1219021

12,19021

 

1,897759

 

 

32,77

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

32,77 –

37,82

12

0,12

 

 

 

4,5384

-9,292

 

 

10,36095

 

 

0,2098788

20,98788

 

3,848982

 

 

42,87

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

42,87 –

47,92

24

0,24

 

 

11,5008

0,808

 

 

0,156687

 

 

0,246467

24,64669

 

0,016969

 

 

52,97

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

52,97 –

58,02

26

0,26

 

 

15,0852

10,908

 

 

30,93596

 

 

0,1974158

19,74158

 

1,984029

 

 

63,07

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

63,07 –

68,12

8

0,08

 

 

 

5,4496

21,008

 

 

35,30688

 

 

0,1078544

10,78544

 

0,719364

 

 

73,17

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

73,17 –

78,22

6

0,06

 

 

 

4,6932

31,108

 

 

58,06246

 

 

0,0401907

4,01908

 

0,976356

 

 

83,27

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

DB =

 

 

 

 

 

2

 

 

= 9,7985

 

 

 

 

 

 

 

 

x

B

=

47,112

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

набл

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

266,6133

 

 

 

 

 

 

 

 

 

 

 

 

- 2 -