Решение.
Найдем
,
где
.
(Ранее была формула
.
.
=1,25.
.
3) Вычислим теоретические частоты по
замечанию 2. n = 100, h
= 0,5,
.
Составим таблицу:
i |
xi |
|
|
|
1 |
2,5 |
-1,9 |
0,0656 |
2,93 |
2 |
3 |
-1,45 |
0,1394 |
6,22 |
3 |
3,5 |
-1 |
0,242 |
10,8 |
4 |
4 |
-0,56 |
0,341 |
15,22 |
5 |
4,5 |
-0,11 |
0,3965 |
17,7 |
6 |
5 |
0,33 |
0,3778 |
16,86 |
7 |
5,5 |
0,78 |
0,2943 |
13,14 |
8 |
6 |
1,23 |
0,1872 |
8,36 |
9 |
6,5 |
1,67 |
0,0989 |
4,41 |
10 |
7 |
2,12 |
0,0422 |
1,88 |
4) По формуле (*) найдем величину набл. – наблюдаемое значение критерия Пирсона.
Составим таблицу:
i |
ni |
|
|
|
1 |
5 |
2,93 |
1,46 |
8,53 |
2 |
7 |
6,22 |
0,1 |
7,88 |
3 |
8 |
10,8 |
0,73 |
5,93 |
4 |
18 |
15,22 |
0,51 |
21,29 |
5 |
20 |
17,7 |
0,3 |
22,6 |
6 |
15 |
16,86 |
0,21 |
13,35 |
7 |
10 |
13,14 |
0,75 |
7,61 |
8 |
7 |
8,36 |
0,22 |
5,86 |
9 |
6 |
4,41 |
0,57 |
8,16 |
10 |
4 |
1,88 |
2,39 |
8,51 |
Σ |
n = 100 |
97,52 |
7,24 |
109,72 |
.
Контроль:
.
5) Найдем число степеней свободы:
,
где r – число групп
выборки.
6) Найдем
.
Уровень значимости α = 0,01.
.
7) Сравним
и
:
.
Так как
,
то гипотезу о нормальном распределении
генеральной совокупности принимаем.
Эмпирические и теоретические частоты
различаются незначимо.
Пп. 2. Критерий Стьюдента.
Для определения достоверности разницы средних для двух выборок применяют метод (критерий) Стьюдента или t - критерий. Этот критерий применяется к зависимым выборкам, например, результаты одной и той же группы испытуемых до и после воздействия независимой переменной.
Пусть случайная величина Х имеет нормированное нормальное распределение, то есть М(Х) = 0, σХ = 1.
Определение 53. Распределением
Стьюдента с n-1
степенью свободы называется распределение
случайной величины
,
где
,
,
где Х подчинена нормальному закону
с математическим ожиданием, равным
нулю, и дисперсией, равной единице. Это
распределение характеризуется плотностью
,
где Г(х) – известная гамма-функция
.
Число
степеней свободы
- число данных из
выборки, значения которых могут быть
случайными, то есть могут варьироваться.
Для распределения Стьюдента
составлены специальные таблицы.
По-другому, критерий Стьюдента - метод проверки однородности двух независимых выборок (то есть нет различий). В математико-статистических терминах постановка задачи такова: имеются две выборки x1, x2,..., xm и y1, y2,...,yn (т. е. наборы из m и n действительных чисел), требуется проверить их однородность. Можно переформулировать задачу: требуется проверить, есть ли различие между выборками. Если различия нет, то для дальнейшего изучения часто выборки объединяют.
Опишем традиционный статистический
метод проверки однородности. Вычисляют
средние арифметические в каждой выборке:
,
,
затем выборочные дисперсии:
,
,
затем статистику t,
на основе которой принимают решение:
.
По заданному уровню значимости и числу степеней свободы (m+n - 2) из таблиц распределения Стьюдента находят критическое значение tкр. Если |t| > tкр, то гипотезу однородности (отсутствия различия) отклоняют, если же |t| < tкр, то принимают. (При односторонних альтернативных гипотезах вместо условия |t| > tкр проверяют, что t > tкр; эту постановку рассматривать не будем, так как в ней нет принципиальных отличий от обсуждаемой нами.)
Замечание 1. Для обоснованного применения математико-статистических методов необходимо, прежде всего, построить и обосновать вероятностную модель порождения данных. При проверке однородности двух выборок общепринята модель, в которой x1, x2,..., xm рассматриваются как результаты m независимых наблюдений некоторой случайной величины Х с функцией распределения F(x), неизвестной статистику, а y1, y2,...,yn - как результаты n независимых наблюдений, вообще говоря, другой случайной величины Y с функцией распределения G(у), также неизвестной статистику. Предполагается также, что наблюдения в одной выборке не зависят от наблюдений в другой, поэтому выборки и называют независимыми. Возможность применения модели в конкретной реальной ситуации требует обоснования. Независимость и одинаковая распределенность результатов наблюдений, входящих в выборку, могут быть установлены или исходя из методики проведения конкретных наблюдений, или путем проверки статистических гипотез независимости и одинаковой распределенности с помощью соответствующих критериев. Если проведено (m+n) измерений линейных размеров деталей, то описанную выше модель, как правило, можно применять. Если же, например, xi и yi - результаты наблюдения одного и того же образца до и после определенного технологического воздействия, то рассматриваемую модель применять нельзя. (В этом случае используют модель так называемых связанных выборок, в которой обычно строят новую выборку zi = xi - yi и используют статистические методы анализа одной выборки, а не двух.)
Замечание 2. Для определения
достоверности разницы средних в случае
зависимых выборок применяется следующая
формула:
,
где d —
разность между
результатами в каждой паре;
— сумма этих частных
разностей;
-
сумма квадратов частных разностей.
Полученные результаты сверяют с таблицей
t,
отыскивая в ней значения, соответствующие
n-1
степени свободы; n —
это в данном случае число пар
данных.
Перед
тем как использовать формулу, необходимо
вычислить для каждой группы частные
разности между результатами во всех
парах, квадрат каждой из этих разностей,
сумму этих разностей и сумму их квадратов.
