- •Основные понятия
- •Проверка гипотезы о равенстве дисперсий двух нормально распределенных генеральных совокупностей
- •Проверка гипотезы о равенстве средних
- •Дисперсии которых неизвестны и одинаковы
- •Проверка гипотезы о нормальном распределении случайной величины с помощью критерия Пирсона
- •«Проверка статистических гипотез»
- •«Проверка статистических гипотез»
- •Основные понятия
Проверка гипотезы о нормальном распределении случайной величины с помощью критерия Пирсона
Выяснение вопроса о принадлежности выборочных данных нормально распределенному признаку генеральной совокупности является одной из важнейших задач математической статистики. Предположение о нормальном распределении некоторой случайной величины требуется при проверке многих статистических гипотез, в основных положениях дисперсионного и регрессионного анализов.
Существует несколько способов, позволяющих по выборочным данным с различной степенью уверенности принять или отвергнуть предположение о нормальном распределении признака. Один из них рассматривается ниже.
Пусть непрерывная
случайная величина (признак)
представлена выборкой значений в виде
интервального распределения, причем
известны выборочное среднее
и исправленное выборочное с.к.о.
.
Пусть имеются
основания предполагать, что случайная
величина
подчинена нормальному закону распределения
(например, из визуального соответствия
гистограммы и нормальной кривой).
Проверка этой
гипотезы при уровне значимости
с помощью критерия Пирсона осуществляется
по следующей схеме.
1. Нужно проанализировать
интервальное распределение выборки,
объем которой должен быть не менее 50, и
в случае, если какому-нибудь частичному
интервалу выборочных значений
соответствует эмпирическая частота
,
которая меньше, чем 5, этот интервал
следует объединить с соседним (соседними),
поставив в соответствие новому интервалу
сумму эмпирических частот объединенных
интервалов. Так как нормальное
распределение определено для всех
действительных значений
,
то принято
левую границу первого частичного
интервала расширить до
,
а правую границу последнего
до
.
По окончании описанной процедуры будем
обозначать число частичных интервалов
через
.
2. В предположении,
что исследуемая случайная величина
действительно распределена нормально
с параметрами
и
(
~
),
нужно вычислить вероятности
попадания ее значений в каждый из
частичных интервалов по формуле
;
,
(11.1)
где
,
и
заменены соответственно на
и
,
а значения функции Лапласа можно найти
в таблицах приложения 2. При безошибочном
счете должно выполняться условие
.
3. Нужно вычислить теоретические частоты по формулам
,
(11.2)
где
–объем
выборки. Отметим, что при этом должно
выполняться условие
.
4. Теперь требуется
вычислить наблюдаемое значение критерия
:
. (11.3)
Кроме того, нужно
найти критическое значение критерия
(
)
в зависимости от выбранного уровня
значимости
и числа степеней свободы
.
Это осуществляется с помощью таблиц
приложения 3.
5. Наконец необходимо
сравнить полученные значения
и
:
если > , то гипотеза о нормальном распределении случайной величины при уровне значимости отвергается;
если < , то считают, что при заданном уровне значимости нет оснований отвергнуть гипотезу о нормальном распределении рассматриваемой случайной величины .
Пример 11.3.
Имеется 200 изделий, изготовленных на
некотором станке. Требуется при уровне
значимости
проверить гипотезу о подчинении
нормальному закону распределения
отклонений контролируемого размера
изделий от номинала.
Решение.
Обозначим рассматриваемые отклонения
через
и
будем исходить из следующего выборочного
распределения:
Таблица 11.1
Интервалы значений (мк)
|
(-20; -15) |
(-15; -10) |
(-10; -5) |
(-5; 0) |
(0; 5) |
Частоты значений |
7 |
11 |
15 |
24 |
49 |
Продолжение таблицы 11.1
(5; 10) |
(10; 15) |
(15; 20) |
(20; 25) |
(25; 30) |
41 |
26 |
17 |
7 |
3 |
Пусть известным
образом вычислены
=
4.3 мк и
=
9.7 мк.
Согласно рекомендациям, данным выше, объединим последние два интервала таблицы 11.1. В результате получим уже 9 (m = 9) частичных интервалов (вместо первоначальных десяти). Теперь заполним следующую таблицу.
Таблица 11.2
Интервалы значений |
|
|
|
|
(- |
0.0233 |
7 |
4.66 |
1.18 |
(-15; -10) |
0.0475 |
11 |
9.50 |
0.24 |
(-10; -5) |
0.0977 |
15 |
19.54 |
1.05 |
(-5; 0) |
0.1615 |
24 |
32.30 |
2.13 |
(0; 5) |
0.1979 |
49 |
39.58 |
2.24 |
(5; 10) |
0.1945 |
41 |
38.90 |
0.11 |
(10; 15) |
0.1419 |
26 |
28.38 |
0.20 |
(15; 20) |
0.0831 |
17 |
16.62 |
0.01 |
(20; + ) |
0.0526 |
10 |
10.52 |
0.02 |
Сумма |
1 |
200 |
200 |
7.18 |
Здесь
;
;
...........................................................................................
Поскольку
,
(0.05; 93) = (0.05; 6)=12.6,
то
< .
В ы в о д. В нашем
случае при уровне значимости
нет оснований отвергнуть гипотезу о
нормальном распределении величин
отклонений от номинала контролируемого
размера изделий.
ИНДИВИДУАЛЬНЫЕ ЗАДАНИЯ К ЛАБОРАТОРНОЙ РАБОТЕ
