Лабораторная работа «Математическая статистика» Вариант 24
Пусть в результате некоторого эксперимента получено n значений изучаемой случайной величины Х. Данные записаны в виде таблицы и составляют первичную выборку объёма n =100.
19,36 |
24,13 |
33,38 |
16,18 |
19,93 |
26,27 |
23,81 |
19,09 |
26,90 |
22,54 |
14,28 |
16,49 |
23,75 |
22,81 |
16,80 |
25,90 |
22,11 |
21,12 |
18,36 |
20,81 |
29,42 |
31,54 |
15,91 |
27,59 |
26,76 |
16,78 |
15,62 |
22,76 |
36,04 |
24,79 |
18,80 |
27,80 |
16,61 |
23,21 |
9,73 |
29,29 |
21,08 |
26,79 |
29,36 |
28,21 |
25,93 |
27,78 |
18,03 |
21,83 |
30,58 |
19,36 |
16,59 |
33,69 |
22,54 |
26,00 |
26,86 |
23,17 |
32,10 |
23,23 |
23,23 |
27,16 |
26,97 |
21,47 |
26,05 |
21,74 |
23,92 |
28,43 |
22,11 |
22,96 |
20,45 |
24,65 |
23,33 |
29,16 |
27,09 |
34,83 |
18,51 |
23,58 |
16,52 |
30,22 |
20,53 |
28,58 |
25,94 |
27,92 |
30,83 |
23,86 |
22,94 |
18,04 |
26,42 |
22,40 |
16,33 |
27,27 |
15,34 |
16,21 |
26,40 |
23,80 |
27,69 |
25,97 |
21,82 |
21,88 |
20,83 |
26,21 |
16,45 |
18,60 |
29,00 |
29,73 |
Представим выборку в виде вариационного ряда: последовательности исходных величин, записанных в возрастающем порядке.
9,73
20,45
23,58
27,16
14,28
20,53
23,75
27,27
15,34
20,81
23,80
27,59
15,62
20,83
23,81
27,69
15,91
21,08
23,86
27,78
16,18
21,12
23,92
27,80
16,21
21,47
24,13
27,92
16,33
21,74
24,65
28,21
16,45
21,82
24,79
28,43
16,49
21,83
25,90
28,58
16,52
21,88
25,93
29,00
16,59
22,11
25,94
29,16
16,61
22,11
25,97
29,29
16,78
22,40
26,00
29,36
16,80
22,54
26,05
29,42
18,03
22,54
26,21
29,73
18,04
22,76
26,27
30,22
18,36
22,81
26,40
30,58
18,51
22,94
26,42
30,83
18,60
22,96
26,76
31,54
18,80
23,17
26,79
32,10
19,09
23,21
26,86
33,38
19,36
23,23
26,90
33,69
19,36
23,23
26,97
34,83
19,93
23,33
27,09
36,04
Таблица 1
Интервал |
[9; 12,5] |
(12,5; 16] |
(16; 19,5] |
(19,5;23] |
(23; 26,5] |
(26,5; 30] |
(30; 33,5] |
(33,5; 37] |
|
1 |
4 |
19 |
21 |
24 |
22 |
5 |
4 |
Для построения гистограммы дополним таблицу 1 тремя строками: , и , где длина - ого промежутка; – относительная частота попадания элементов выборки в -ый промежуток.
Таблица 2
Интервал |
[9; 12,5] |
(12,5; 16] |
(16; 19,5] |
(19,5;23] |
(23;26,5] |
(26,5;30] |
(30; 33,5] |
(33,5; 37] |
|
1 |
4 |
19 |
21 |
24 |
22 |
5 |
4 |
|
3,5 |
3,5 |
3,5 |
3,5 |
3,5 |
3,5 |
3,5 |
3,5 |
|
0,01 |
0,04 |
0,19 |
0,21 |
0,24 |
0,22 |
0,05 |
0,04 |
|
0,003 |
0,011 |
0,054 |
0,060 |
0,069 |
0,063 |
0,014 |
0,011 |
Последняя строка таблицы2 определяет высоты столбцов гистограммы, приведённой на рисунке 1.
Рис. 1
Для непрерывной случайной величины гистограмма аппроксимирует плотность вероятности генеральной совокупности.
Для построения графика эмпирической функции распределения в таблицу 1 добавим две строки, в которых следует записать значения и .
Таблица 3
Интервал |
[9; 12,5] |
(12,5; 16] |
(16; 19,5] |
(19,5;23] |
(23;26,5] |
(26,5;30] |
(30;33,5] |
(33,5; 37] |
|
1 |
4 |
19 |
21 |
24 |
22 |
5 |
4 |
|
1 |
5 |
24 |
45 |
69 |
91 |
96 |
100 |
|
0,01 |
0,05 |
0,24 |
0,45 |
0,69 |
0,91 |
0,96 |
1 |
Значения эмпирической функции распределения равны , если принадлежит - ому промежутку; 0, если и 1, если . Получим
График эмпирической функции распределения (кумулята) имеет вид:
Рис. 2
Эмпирическая функция аппроксимирует функцию распределения генеральной совокупности.
Для вычисления числовых характеристик выборки построим новый вариационный ряд. Обозначим – середину - того промежутка. Это значение присваивается всем элементам выборки, попавшим в -ый интервал.
Таблица 4
Интервал |
|
|
|
|
[9; 12,5] |
1 |
10,75 |
10,75 |
115,56 |
(12,5; 16] |
4 |
14,25 |
57,00 |
812,25 |
(16; 19,5] |
19 |
17,75 |
337,25 |
5986,19 |
(19,5; 23] |
21 |
21,25 |
446,25 |
9482,81 |
(23; 26,5] |
24 |
24,75 |
594,00 |
14701,50 |
(26,5; 30] |
22 |
28,25 |
621,50 |
17557,37 |
(30; 33,5] |
5 |
31,75 |
158,75 |
5040,31 |
(33,5; 37] |
4 |
35,25 |
141,00 |
4970,25 |
Сумма |
100 |
|
2366,5 |
58666,24 |
Для группированного ряда выборочное среднее и выборочная дисперсия вычисляются по формулам:
;
;
Подставляя величины, приведенные в таблице 4, получим:
;
Выборочное среднеквадратическое отклонение .
Замечание. При расчётах результат округляем до двух десятичных знаков.
Составим ещё одну таблицу.
Таблица 5
Интервал |
|
|
|
|
|
[9; 12,5] |
1 |
10,75 |
-12,915 |
-2154,19 |
27821,31 |
(12,5; 16] |
4 |
14,25 |
-9,415 |
-3338,27 |
31429,78 |
(16; 19,5] |
19 |
17,75 |
-5,915 |
-3932,04 |
23258,01 |
(19,5; 23] |
21 |
21,25 |
-2,415 |
-295,78 |
714,31 |
(23; 26,5] |
24 |
24,75 |
1,085 |
30,65 |
33,26 |
(26,5; 30] |
22 |
28,25 |
4,585 |
2120,51 |
9722,55 |
(30; 33,5] |
5 |
31,75 |
8,085 |
2642,47 |
21364,37 |
(33,5; 37] |
4 |
35,25 |
11,585 |
6219,39 |
72051,69 |
Сумма |
100 |
|
|
1292,74 |
186395,28 |
Коэффициенты асимметрии А и эксцесса Е вычисляются по формулам:
.
Подставляя величины, приведенные в таблице 4, получим:
.
Если коэффициенты А и Е значительно отклоняются от нулевого значения, то выборочное распределение отличается от нормального.
Замечание. При n < 30 в расчетах следует использовать исправленную оценку среднеквадратического отклонения
Оценку истинного значения параметра а(математического ожидания)дает доверительный интервал, который для случая большой выборки определяется формулой
,
где значение находится из условия .
Для доверительной вероятности (надёжности) по таблице значений функции Лапласа , приведённой в приложении 2, находим число 0,4015, наиболее близкое к . Это число расположено в строке, именованной «1,2», и столбце с названием «9». Искомое значение = 1,2 + 0,09 = 1,29, так как (1,29) 0,8. При 23,665 и точности оценки 0,66с надёжностью 0,8 доверительный интервал для математического ожидания равен (23,005; 24,325).
7. Оценку истинного значения параметра дает доверительный интервал для среднеквадратического отклонения, который для случая большой выборки определяется по формуле
.
По заданной доверительной вероятности по таблице значений функции Лапласа, находим , следовательно, . Тогда с надёжностью 0,95 доверительный интервал для среднеквадратического отклонения имеет вид (4,56; 6,07).
8. Проверка нулевой гипотезы по критерию Пирсона состоит из следующих этапов.
a) По выборке вычисляются точечные оценки математического ожидания и среднеквадратического отклонения .
b) В каждом промежутке определяются эмпирические частоты и теоретические вероятности.
c) Для данной выборки вычисляется наблюдаемое значение критерия Пирсона.
d) Задается уровень значимости и подсчитывается количество степеней свободы.
e) По таблице приложения 3 определяется значение .
f) Если , то гипотеза отвергается как маловероятная.
Значения коэффициентов асимметрии А и эксцесса Е, близкие к нулю, а также вид гистограммы позволяют выдвинуть гипотезу о том, что генеральная совокупность распределена по нормальному закону.Проверим эту гипотезу с помощью критерия Пирсона.
а) Этот этап проделан в пункте 5.
b) Используя таблицу приложения 2, найдем теоретические вероятности попадания варианты в каждый промежуток по формуле
,
и вычислим
Вычисления удобно проводить по таблице 6. Предварительно следует изменить таблицу 1, объединив первый интервал со вторым и седьмой интервал с восьмым, так как в критерии Пирсона предполагается, что количество вариант в каждом интервале не меньше пяти. Крайние интервалы расширяются влево и вправо до бесконечности, причем
Таблица 6
Интервал |
|
(– ; 16] |
|
(16;19,5] |
|
(19,5; 23] |
|
(23; 26,5] |
|
(26,5; 30] |
|
(30; ) |
|
Граница |
|
|
16 |
|
19,5 |
|
23 |
|
26,5 |
|
30 |
|
|
|
|
5 |
|
19 |
|
21 |
|
24 |
|
22 |
|
9 |
|
|
|
|
– 1,48 |
|
– 0,81 |
|
– 0,13 |
|
0,55 |
|
1,23 |
|
|
|
– 0,5 |
|
– 0,43 |
|
– 0,29 |
|
– 0,05 |
|
0,21 |
|
0,39 |
|
0,5 |
|
|
0,07 |
|
0,14 |
|
0,24 |
|
0,26 |
|
0,18 |
|
0,11 |
|
|
|
7 |
|
14 |
|
24 |
|
26 |
|
18 |
|
11 |
|
|
|
2 |
|
5 |
|
3 |
|
2 |
|
4 |
|
2 |
|
|
|
0,57 |
|
1,79 |
|
0,37 |
|
0,15 |
|
0,89 |
|
0,36 |
|
Сначала в граничных точках вычисляем аргументы функции Лапласа. Например, для промежутка (23; 26,5] имеем
,
.
По таблице приложения 2 вычисляем теоретическую вероятность попадания варианты в промежуток (23; 26,5]
Функция является нечетной, следовательно,
.
В последней строке таблицы 6 помещены значения .Для промежутка [23; 26,5) эта величина принимает значение
.
c)Суммируя все числа последней строки, получаем . Полученное число необходимо сравнить с величиной .
d) Количество интервалов вариационного ряда, приведённого в таблице 6, равно шести.Число степеней свободы .
e) Выбираем уровень значимости . В таблице приложения 3 параметрам и соответствует значение .
f) При выбранной надёжности 0,95: .
Следовательно, отвергать гипотезу оснований нет. Предположение о том, что исследуемая физическая величина распределена по нормальному закону с параметрами ; не противоречит результатам измерений.
Значит, можно считать, что функция плотности вероятности изучаемой физической величины имеет вид.
.
Значения функции приведены в таблице приложения 1, а график изображён на рисунке 3 сплошной линией. Отдельные точки на том же рисунке последней строке таблицы 1, по которой строилась гистограмма. Очевидно, что теоретическое распределение вполне согласуется с результатами выборки.
Рис. 3