Лабораторная работа «Математическая статистика» Вариант 24
Пусть в результате некоторого эксперимента получено n значений изучаемой случайной величины Х. Данные записаны в виде таблицы и составляют первичную выборку объёма n =100.
19,36 |
24,13 |
33,38 |
16,18 |
19,93 |
26,27 |
23,81 |
19,09 |
26,90 |
22,54 |
14,28 |
16,49 |
23,75 |
22,81 |
16,80 |
25,90 |
22,11 |
21,12 |
18,36 |
20,81 |
29,42 |
31,54 |
15,91 |
27,59 |
26,76 |
16,78 |
15,62 |
22,76 |
36,04 |
24,79 |
18,80 |
27,80 |
16,61 |
23,21 |
9,73 |
29,29 |
21,08 |
26,79 |
29,36 |
28,21 |
25,93 |
27,78 |
18,03 |
21,83 |
30,58 |
19,36 |
16,59 |
33,69 |
22,54 |
26,00 |
26,86 |
23,17 |
32,10 |
23,23 |
23,23 |
27,16 |
26,97 |
21,47 |
26,05 |
21,74 |
23,92 |
28,43 |
22,11 |
22,96 |
20,45 |
24,65 |
23,33 |
29,16 |
27,09 |
34,83 |
18,51 |
23,58 |
16,52 |
30,22 |
20,53 |
28,58 |
25,94 |
27,92 |
30,83 |
23,86 |
22,94 |
18,04 |
26,42 |
22,40 |
16,33 |
27,27 |
15,34 |
16,21 |
26,40 |
23,80 |
27,69 |
25,97 |
21,82 |
21,88 |
20,83 |
26,21 |
16,45 |
18,60 |
29,00 |
29,73 |
Представим выборку в виде вариационного ряда: последовательности исходных величин, записанных в возрастающем порядке.
Составим группированный статистический ряд. Найдём наименьший и наибольший элемент выборки:9,73
20,45
23,58
27,16
14,28
20,53
23,75
27,27
15,34
20,81
23,80
27,59
15,62
20,83
23,81
27,69
15,91
21,08
23,86
27,78
16,18
21,12
23,92
27,80
16,21
21,47
24,13
27,92
16,33
21,74
24,65
28,21
16,45
21,82
24,79
28,43
16,49
21,83
25,90
28,58
16,52
21,88
25,93
29,00
16,59
22,11
25,94
29,16
16,61
22,11
25,97
29,29
16,78
22,40
26,00
29,36
16,80
22,54
26,05
29,42
18,03
22,54
26,21
29,73
18,04
22,76
26,27
30,22
18,36
22,81
26,40
30,58
18,51
22,94
26,42
30,83
18,60
22,96
26,76
31,54
18,80
23,17
26,79
32,10
19,09
23,21
26,86
33,38
19,36
23,23
26,90
33,69
19,36
23,23
26,97
34,83
19,93
23,33
27,09
36,04
.
Разобьём
отрезок
на
равных по длине промежутков.
При объеме выборки
n=100
рекомендуется взять
Число
– частота попадания элементов выборки
в
-ый
промежуток.
Таблица 1
Интервал |
[9; 12,5] |
(12,5; 16] |
(16; 19,5] |
(19,5;23] |
(23; 26,5] |
(26,5; 30] |
(30; 33,5] |
(33,5; 37] |
|
1 |
4 |
19 |
21 |
24 |
22 |
5 |
4 |
Для построения гистограммы дополним таблицу 1 тремя строками:
,
и
,
где
длина
-
ого промежутка;
– относительная частота попадания
элементов выборки в
-ый
промежуток.
Таблица 2
Интервал |
[9; 12,5] |
(12,5; 16] |
(16; 19,5] |
(19,5;23] |
(23;26,5] |
(26,5;30] |
(30; 33,5] |
(33,5; 37] |
|
1 |
4 |
19 |
21 |
24 |
22 |
5 |
4 |
|
3,5 |
3,5 |
3,5 |
3,5 |
3,5 |
3,5 |
3,5 |
3,5 |
|
0,01 |
0,04 |
0,19 |
0,21 |
0,24 |
0,22 |
0,05 |
0,04 |
|
0,003 |
0,011 |
0,054 |
0,060 |
0,069 |
0,063 |
0,014 |
0,011 |
Последняя строка таблицы2 определяет высоты столбцов гистограммы, приведённой на рисунке 1.
Рис. 1
Для непрерывной случайной величины гистограмма аппроксимирует плотность вероятности генеральной совокупности.
Для построения графика эмпирической функции распределения в таблицу 1 добавим две строки, в которых следует записать значения
и
.
Таблица 3
Интервал |
[9; 12,5] |
(12,5; 16] |
(16; 19,5] |
(19,5;23] |
(23;26,5] |
(26,5;30] |
(30;33,5] |
(33,5; 37] |
|
1 |
4 |
19 |
21 |
24 |
22 |
5 |
4 |
|
1 |
5 |
24 |
45 |
69 |
91 |
96 |
100 |
|
0,01 |
0,05 |
0,24 |
0,45 |
0,69 |
0,91 |
0,96 |
1 |
Значения эмпирической
функции распределения равны
,
если
принадлежит
-
ому промежутку;
0,
если
и
1,
если
.
Получим
График эмпирической функции распределения (кумулята) имеет вид:
Рис. 2
Эмпирическая
функция
аппроксимирует
функцию распределения генеральной
совокупности.
Для вычисления числовых характеристик выборки построим новый вариационный ряд. Обозначим
–
середину
-
того промежутка. Это значение присваивается
всем элементам выборки, попавшим в
-ый
интервал.
Таблица 4
Интервал |
|
|
|
|
[9; 12,5] |
1 |
10,75 |
10,75 |
115,56 |
(12,5; 16] |
4 |
14,25 |
57,00 |
812,25 |
(16; 19,5] |
19 |
17,75 |
337,25 |
5986,19 |
(19,5; 23] |
21 |
21,25 |
446,25 |
9482,81 |
(23; 26,5] |
24 |
24,75 |
594,00 |
14701,50 |
(26,5; 30] |
22 |
28,25 |
621,50 |
17557,37 |
(30; 33,5] |
5 |
31,75 |
158,75 |
5040,31 |
(33,5; 37] |
4 |
35,25 |
141,00 |
4970,25 |
Сумма |
100 |
|
2366,5 |
58666,24 |
Для группированного
ряда выборочное среднее
и выборочная дисперсия
вычисляются
по формулам:
;
;
Подставляя величины, приведенные в таблице 4, получим:
;
Выборочное
среднеквадратическое отклонение
.
Замечание. При расчётах результат округляем до двух десятичных знаков.
Составим ещё одну таблицу.
Таблица 5
Интервал |
|
|
|
|
|
[9; 12,5] |
1 |
10,75 |
-12,915 |
-2154,19 |
27821,31 |
(12,5; 16] |
4 |
14,25 |
-9,415 |
-3338,27 |
31429,78 |
(16; 19,5] |
19 |
17,75 |
-5,915 |
-3932,04 |
23258,01 |
(19,5; 23] |
21 |
21,25 |
-2,415 |
-295,78 |
714,31 |
(23; 26,5] |
24 |
24,75 |
1,085 |
30,65 |
33,26 |
(26,5; 30] |
22 |
28,25 |
4,585 |
2120,51 |
9722,55 |
(30; 33,5] |
5 |
31,75 |
8,085 |
2642,47 |
21364,37 |
(33,5; 37] |
4 |
35,25 |
11,585 |
6219,39 |
72051,69 |
Сумма |
100 |
|
|
1292,74 |
186395,28 |
Коэффициенты асимметрии А и эксцесса Е вычисляются по формулам:
.
Подставляя величины, приведенные в таблице 4, получим:
.
Если коэффициенты А и Е значительно отклоняются от нулевого значения, то выборочное распределение отличается от нормального.
Замечание.
При n < 30
в расчетах следует использовать
исправленную оценку среднеквадратического
отклонения
Оценку истинного значения параметра а(математического ожидания)дает доверительный интервал, который для случая большой выборки определяется формулой
,
где значение
находится из условия
.
Для доверительной
вероятности (надёжности)
по
таблице значений функции Лапласа
,
приведённой
в приложении 2, находим число 0,4015,
наиболее близкое к
.
Это число расположено в строке, именованной
«1,2»,
и столбце с названием «9».
Искомое значение
= 1,2 + 0,09 = 1,29,
так как
(1,29) 0,8.
При
23,665
и точности оценки
0,66с
надёжностью
0,8
доверительный интервал для математического
ожидания равен
(23,005;
24,325).
7. Оценку истинного
значения параметра
дает
доверительный интервал для
среднеквадратического отклонения,
который для случая большой выборки
определяется по формуле
.
По заданной
доверительной вероятности
по таблице значений функции Лапласа,
находим
,
следовательно,
.
Тогда с надёжностью
0,95
доверительный
интервал для среднеквадратического
отклонения
имеет
вид (4,56;
6,07).
8. Проверка нулевой
гипотезы
по критерию Пирсона состоит из следующих
этапов.
a) По
выборке вычисляются точечные оценки
математического ожидания
и среднеквадратического отклонения
.
b) В каждом промежутке определяются эмпирические частоты и теоретические вероятности.
c) Для
данной выборки вычисляется наблюдаемое
значение
критерия
Пирсона.
d) Задается
уровень значимости
и подсчитывается количество степеней
свободы.
e)
По таблице приложения 3 определяется
значение
.
f)
Если
,
то гипотеза
отвергается
как
маловероятная.
Значения коэффициентов асимметрии А и эксцесса Е, близкие к нулю, а также вид гистограммы позволяют выдвинуть гипотезу о том, что генеральная совокупность распределена по нормальному закону.Проверим эту гипотезу с помощью критерия Пирсона.
а) Этот этап проделан в пункте 5.
b) Используя таблицу приложения 2, найдем теоретические вероятности попадания варианты в каждый промежуток по формуле
,
и вычислим
Вычисления удобно
проводить по таблице 6. Предварительно
следует изменить таблицу 1, объединив
первый интервал со вторым и седьмой
интервал с восьмым, так как в критерии
Пирсона предполагается, что количество
вариант в каждом интервале не меньше
пяти. Крайние интервалы расширяются
влево и вправо до бесконечности, причем
Таблица 6
Интервал |
|
(– ; 16] |
|
(16;19,5] |
|
(19,5; 23] |
|
(23; 26,5] |
|
(26,5; 30] |
|
(30; ) |
|
Граница |
|
|
16 |
|
19,5 |
|
23 |
|
26,5 |
|
30 |
|
|
|
|
5 |
|
19 |
|
21 |
|
24 |
|
22 |
|
9 |
|
|
|
|
– 1,48 |
|
– 0,81 |
|
– 0,13 |
|
0,55 |
|
1,23 |
|
|
|
– 0,5 |
|
– 0,43 |
|
– 0,29 |
|
– 0,05 |
|
0,21 |
|
0,39 |
|
0,5 |
|
|
0,07 |
|
0,14 |
|
0,24 |
|
0,26 |
|
0,18 |
|
0,11 |
|
|
|
7 |
|
14 |
|
24 |
|
26 |
|
18 |
|
11 |
|
|
|
2 |
|
5 |
|
3 |
|
2 |
|
4 |
|
2 |
|
|
|
0,57 |
|
1,79 |
|
0,37 |
|
0,15 |
|
0,89 |
|
0,36 |
|
Сначала в граничных точках вычисляем аргументы функции Лапласа. Например, для промежутка (23; 26,5] имеем
,
.
По таблице приложения
2 вычисляем теоретическую вероятность
попадания
варианты в промежуток
(23;
26,5]
Функция
является нечетной, следовательно,
.
В последней строке таблицы 6 помещены значения .Для промежутка [23; 26,5) эта величина принимает значение
.
c)Суммируя
все числа последней строки, получаем
.
Полученное число необходимо сравнить
с величиной
.
d) Количество
интервалов
вариационного ряда, приведённого
в таблице 6, равно шести.Число степеней
свободы
.
e) Выбираем
уровень значимости
.
В таблице приложения 3 параметрам
и
соответствует
значение
.
f) При
выбранной
надёжности
0,95:
.
Следовательно,
отвергать гипотезу
оснований нет. Предположение о том, что
исследуемая физическая величина
распределена по нормальному закону с
параметрами
;
не
противоречит результатам измерений.
Значит, можно считать, что функция плотности вероятности изучаемой физической величины имеет вид.
.
Значения функции
приведены в таблице приложения 1, а
график
изображён
на рисунке 3 сплошной линией. Отдельные
точки на том же рисунке последней строке
таблицы 1, по которой строилась гистограмма.
Очевидно, что теоретическое распределение
вполне согласуется с результатами
выборки.
Рис. 3
