Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Записка_Асб19и1_Палий.docx
Скачиваний:
14
Добавлен:
25.10.2021
Размер:
300.57 Кб
Скачать

2. Проверка гипотез по критерию Пирсона и Колмогорова-Смирнова

2.1. Критерий Колмогорова-Смирнова

Три выборки образуют три пары. Для каждой из пар выборок, используя критерий Колмогорова-Смирнова, проверить гипотезу об извлечении выборок из одной и той же генеральной совокупности. Положить . Гипотеза ложна, критерий должен все 3 раза гипотезу опровергнуть.

2.1.1. Нормальное и равномерное распределение

Возьмем выборки из нормального и равномерного распределения, указанных в приложениях А и Б соответственно. Каждая состоит из 1000 чисел. Определим, какой диапазон интервалов брать для проверки гипотезы (таблица 10).

Таблица 10 – Определение крайних значений в выборках

xmin

xmax

Нормальный

-1,37

11,37

Равномерный

-0,99

8,98

Границы нормального закона включают в себя границы равномерного, поэтому для проверки гипотезы будем использовать интервалы нормального закона.

Проверим по критерию Колмогорова – Смирнова гипотезу об извлечении выборок из одной и той же генеральной совокупности, расчеты приведены в таблице 11.

Таблица 11 – Проверка по критерию Колмогорова-Смирнова для выборок, извлеченных из нормальной и равномерной генеральных совокупностей

Равномерный закон

Нормальный закон

| - |

-2

0

0

0

0

0

-0,6

34

34

0,034

2

2

0,002

0,032

0,8

145

179

0,179

19

21

0,021

0,158

2,2

154

333

0,333

78

99

0,099

0,234

3,6

138

471

0,471

176

275

0,275

0,196

5

131

602

0,602

307

582

0,582

0,02

6,4

141

743

0,743

236

818

0,818

0,075

7,8

134

877

0,877

126

944

0,944

0,067

9,2

123

1000

1

40

984

0,984

0,016

10,6

0

1000

1

13

997

0,997

0,003

12

0

1000

1

3

1000

1

0

Чтобы найти , нужно воспользоваться формулами:

=max| - | , n = .

Следовательно, n = =500, 22,36 , max| - |=0,234,

0,234 =5,23.

Значение , следовательно, критерий отвергает гипотезу, что выборки извлечены из одной генеральной совокупности. Выборки извлечены из разных генеральных совокупностей.

2.1.2. Нормальное и экспоненциальное распределение

Возьмем выборки из нормального и экспоненциального распределения, указанных в приложениях А и приложении В соответственно. Каждая состоит из 1000 чисел. Определим, какой диапазон интервалов брать для проверки гипотезы (таблица 12).

Таблица 12 – Определение крайних значений в выборках

 

xmin

xmax

Нормальный

-1,37

11,37

Показательный

0

1,18

Границы нормального закона включают в себя границы экспоненциального, поэтому для проверки гипотезы будем использовать интервалы нормального закона.

Проверим по критерию Колмогорова – Смирнова гипотезу об извлечении выборок из одной и той же генеральной совокупности, расчеты приведены в таблице 13.

Таблица 13 – Проверка по критерию Колмогорова-Смирнова для выборок, извлеченных из нормальной и экспоненциальной генеральных совокупностей

Экспоненциальный закон

Нормальный закон

| - |

-2

 

0

0

 

0

0

0

-0,6

0

0

0

2

2

0,002

0,002

0,8

998

998

0,998

19

21

0,021

0,977

2,2

2

1000

1

78

99

0,099

0,901

3,6

0

1000

1

176

275

0,275

0,725

5

0

1000

1

307

582

0,582

0,418

6,4

0

1000

1

236

818

0,818

0,182

7,8

0

1000

1

126

944

0,944

0,056

9,2

0

1000

1

40

984

0,984

0,016

10,6

0

1000

1

13

997

0,997

0,003

12

0

1000

1

3

1000

1

0

Найдём необходимые значения: 22,36 , max| - |=0,977 (после округления),

0,977 =21,84.

Значение , следовательно, критерий отвергает гипотезу, что выборки извлечены из одной генеральной совокупности. Выборки извлечены из разных генеральных совокупностей.

2.1.3. Равномерное и экспоненциальное распределение

Возьмем выборки из равномерного и экспоненциального распределения, указанных в приложении Б и приложении В соответственно. Каждая состоит из 1000 чисел. Определим, какой диапазон интервалов брать для проверки гипотезы (таблица 14).

Таблица 14 – Определение крайних значений в выборках

xmin

xmax

Равномерный

-0,99

8,98

Показательный

0

1,18

Границы нормального закона включают в себя границы экспоненциального, поэтому для проверки гипотезы будем использовать интервалы равномерного закона.Проверим по критерию Колмогорова – Смирнова гипотезу об извлечении выборок из одной и той же генеральной совокупности, расчеты приведены в таблице 15.

Таблица 15 – Проверка по критерию Колмогорова-Смирнова для выборок, для выборок, извлеченных из равномерной и экспоненциальной генеральных совокупностей

Экспоненциальный закон

Равномерный закон

xi

| - |

-1

 

0

0

 

0

0

0

0

0

0

0

99

99

0,099

0,099

1

999

999

0,999

100

199

0,199

0,8

2

1

1000

1

112

311

0,311

0,689

3

0

1000

1

99

410

0,41

0,59

4

0

1000

1

98

508

0,508

0,492

5

0

1000

1

94

602

0,602

0,398

6

0

1000

1

101

703

0,703

0,297

7

0

1000

1

100

803

0,803

0,197

8

0

1000

1

94

897

0,897

0,103

9

0

1000

1

103

1000

1

0

Найдём необходимые значения: 22,36 , max| - |=0,8

0,8 = 17,88.

Значение , следовательно, критерий отвергает гипотезу, что выборки извлечены из одной генеральной совокупности. Выборки извлечены из разных генеральных совокупностей.

2.2. Критерий Колмогорова-Смирнова для каждой выборки.

2.2.1. Нормальное распределение

Разбиваем выборку на две равные части. Каждая часть состоит из 500 чисел.

Относительные накопленные частоты указаны в следующих трех таблицах с двумя знаками после запятой.

Проверим по критерию Колмогорова – Смирнова гипотезу об извлечении половинок из одной и той же генеральной совокупности, расчеты приведены в таблице 16.

Таблица 16 – Проверка по критерию Колмогорова-Смирнова для выборок, извлечённых из одной и той же генеральной совокупности

xi

| - |

-2

0

0

0

0

0

-0,6

1

1

0,00

1

1

0,002

0

0,8

9

10

0,02

10

11

0,022

0,002

2,2

38

48

0,10

40

51

0,102

0,006

3,6

87

135

0,27

89

140

0,28

0,01

5

155

290

0,58

152

292

0,584

0,004

6,4

117

407

0,81

119

411

0,822

0,008

7,8

61

468

0,94

65

476

0,952

0,016

9,2

22

490

0,98

18

494

0,988

0,008

10,6

7

497

0,99

6

500

1

0,006

12

3

500

1,00

0

500

1

0

Найдём необходимые значения: n = =250, 15,81,

max| - |=0,008.

0,016 = 0,252.

Значение критерий подтвердил гипотезу, что половинки извлечены из одной генеральной совокупности.

2.2.2.2 Равномерное распределение

Разбиваем выборку на две равные части. Каждая часть состоит из 500 чисел.

Проверим по критерию Колмогорова – Смирнова гипотезу об извлечении половинок из одной и той же генеральной совокупности, расчеты приведены в таблице 17.

Таблица 17 – Проверка по критерию Колмогорова-Смирнова для выборок, извлечённых из одной и той же генеральной совокупности

xi

| - |

-1

0

0,00

0

0,00

0,00

0

52

52

0,10

47

47

0,09

0,01

1

55

107

0,21

45

92

0,18

0,03

2

49

156

0,31

63

155

0,31

0,00

3

49

205

0,41

50

205

0,41

0,00

4

54

259

0,52

44

249

0,50

0,02

5

42

301

0,60

52

301

0,60

0,00

6

48

349

0,70

53

354

0,71

0,01

7

43

392

0,78

57

411

0,82

0,04

8

51

443

0,89

43

454

0,91

0,02

9

57

500

1,00

46

500

1,00

0,00

Найдём необходимые значения: 15,81, max| - |=0,04,

0,04 = 0,63

Значение критерий подтвердил гипотезу, что половинки извлечены из одной генеральной совокупности.

2.2.2.3 Экспоненциальное распределение

Разбиваем выборку на две равные части. Каждая часть состоит из 500 чисел.

Проверим по критерию Колмогорова – Смирнова гипотезу об извлечении половинок из одной и той же генеральной совокупности, расчеты приведены в таблице 18.

Таблица 18 – Проверка по критерию Колмогорова-Смирнова для выборок, извлечённых из одной и той же генеральной совокупности

xi

| - |

0

0

0,00

0

0,00

0,00

0,25

434

434

0,87

424

424

0,85

0,02

0,5

57

491

0,98

66

490

0,98

0,00

0,75

8

499

1,00

6

496

0,99

0,01

1

0

499

1,00

4

500

1,00

0,00

1,25

1

500

1,00

0

500

1,00

0,00

1,5

0

500

1,00

0

500

1,00

0,00

Найдём необходимые значения: 15,81, max| - |=0,02,

0,02 = 0,32.

Значение критерий подтвердил гипотезу, что половинки извлечены из одной генеральной совокупности.

2.3. Критерий Пирсона

Замечание. В таблицах все расчеты указаны с двумя знаками после запятой. Но в Excel они велись с большим числом знаков, из-за чего возникло некоторое несоответствие между указанными значениями и тем, что получается, если значения из таблицы умножить на 1000.

2.3.1. Нормальное распределение

Проверим по критерию Пирсона гипотезу об извлечении выборки из нормально распределенной генеральной совокупности, расчеты приведены в таблице 19.

Таблица 19 – Проверка по критерию Пирсона гипотезы о нормальном распределении генеральной совокупности, .

( -a)/σ

-2

-3,53

-0,50

-0,6

-2,79

-0,50

0,00

2

2,50

0,10

0,8

-2,05

-0,48

0,02

19

17,46

0,14

2,2

-1,32

-0,40

0,07

78

74,92

0,13

3,6

-0,58

-0,22

0,19

176

189,24

0,93

5

0,16

0,06

0,28

307

275,28

3,66

6,4

0,89

0,31

0,25

236

253,65

1,23

7,8

1,63

0,45

0,14

126

135,18

0,62

9,2

2,37

0,49

0,04

40

42,41

0,14

10,6-12

6,95

0,50

0,01

16

9,04

5,36

Сумма

-

-

1,00

1000

999,68

12,30

Формула для теоретической вероятности попадания случайной величины , распределенной по нормальному закону, в интервал [xi-1, xi) такова

,

где Ф(х) – функция Лапласа.

Чтобы определить нужно найти число степеней свободы r.

r = k − 1 − S, где k – число интервалов; S – число параметров закона распределения, вычисленных по выборке.

r = 10 – 1 − 0=9, , тогда значение

Следовательно, гипотеза о соответствии распределения нормальному закону подтвердилась.

2.3.2. Равномерное распределение

Проверим по критерию Пирсона гипотезу об извлечении выборки из равномерно распределенной генеральной совокупности, расчеты приведены в таблице 20.

Таблица 20 – Проверка по критерию Пирсона гипотезы о равномерном распределении генеральной совокупности,

-1

0

0,10

99

100,00

0,01

1

0,10

100

100,00

0,00

2

0,10

112

100,00

1,44

3

0,10

99

100,00

0,01

4

0,10

98

100,00

0,04

5

0,10

94

100,00

0,36

6

0,10

101

100,00

0,01

Сумма

1,00

1000

1000,00

2,32

Формула для теоретической вероятности попадания случайной величины , распределенной по равномерному закону, в интервал [xi-1, xi) такова

, в нашем случае h = 1.

r = 10 – 1 −0 = 9, , следовательно, .

Гипотеза об извлечении выборки из равномерно распределенной генеральной совокупности равномерному закону подтвердилась.

2.3.3. Экспоненциальное распределение

Проверим по критерию Пирсона гипотезу об извлечении выборки из экспоненциально распределенной генеральной совокупности, расчеты приведены в таблице 21.

Таблица 21 – Проверка по критерию Пирсона гипотезы об экспоненциальном распределении генеральной совокупности,

0

0,25

858

0,86

857,73

0,00

0,5

123

0,12

122,03

0,01

0,75

14

0,02

17,36

0,65

1-1,5

5

0,00

2,87

1,58

Сумма

1000

1,00

999,99

2,24

Формула для теоретической вероятности попадания случайной величины , распределенной по экспоненциальному закону,

в интервал [xi-1, xi) такова

.

r = 6 – 1 – 0 = 5, , следовательно, .

Значение , гипотеза об извлечении выборки из экспоненциально распределенной генеральной совокупности подтвердилась.

2.4 Критерий Пирсона для распределения Пуассона.

Для выполнения задания возьмем книгу К.Ф. Рериха «Алтай гималаи». Используя приложенную программу, разобьем текст на блоки из 200 букв, считая пробелы. Программа подсчитала число вхождений буквы «х» в каждый блок.

Построим выборку для буквы «х», представленную в приложении Д.

Найдём некоторые числовые характеристики данной выборки.

Количество строк n = 368; минимальное значение ymin = 0; максимальное значение ymax = 10; мода = 1;

Среднее значение (среднее число вхождений буквы "х" в блок из 200 букв) равно 2,16. Таким образом,  = 2,16.

Вероятность встречаемости буквы «е» в русском языке из приведенной таблицы равна p = 0,009; поэтому λ1 = 200 0,009=1,8;

Экспериментальное значение  = 2,16 и теоретическое значение 1 = 1,8 различаются значительно. Будем проверять гипотезу об извлечении полученной выборки из генеральной совокупности, имеющей распределение Пуассона с параметром  = 2,16. Расчеты приведены в таблице 22.

Вероятность того, что случайная величина, распределенная по закону Пуассона примет значение i, i = 0, 1, 2, … вычисляется по формуле

Таблица 22 – Проверка по критерию Пирсона гипотезы о распределении генеральной совокупности по закону Пуассона,  = 2,16

0

58

0,157609

0,1153

42,43964

5,71

1

100

0,271739

0,2491

91,66963

0,76

2

70

0,190217

0,2690

99,0032

8,50

3

67

0,182065

0,1937

71,28231

0,26

4

37

0,100543

0,1046

38,49245

0,06

5

19

0,05163

0,0452

16,62874

0,34

6

13

0,035326

0,0163

5,986345

8,22

7-10

4

0,01087

0,0068

2,491518

0,91

Сумма

368

1,00

1,0000

367,99

24,74

Проверим гипотезу об извлечении выборки из генеральной совокупности, имеющей распределение Пуассона.

Гипотеза об извлечении выборки из генеральной совокупности, имеющей распределение Пуассона не подтвердилась.

На рисунке 7 представлены полигоны экспериментальных относительных частот и вероятностей теоретического распределения Пуассона.

Рисунок 7 – Полигон относительных частот вхождений буквы "е" и полигон вероятностей закона Пуассона