
- •Алгоритм проверки статистических гипотез
- •3.6.2 Проверка статистических гипотез о числовом значении генерального среднего
- •3.6.3 Сравнение генеральных средних двух нормально распределенных совокупностей
- •3.6.4 Гипотезы о числовом значении дисперсии
- •3.6.5 Гипотезы о законе распределения
- •3.6.6 Гипотеза об однородности выборок
- •Список литературы
- •Приложение 1
- •Приложение 2
3.6.5 Гипотезы о законе распределения
Критерий
согласия Пирсона (-критерий).Ранее
предполагалось, что закон распределения
либо является нормальным, либо близок
к нему. Неизвестными же являлись отдельные
параметры распределения: генеральное
среднее (математическое ожидание) и
дисперсия. В тех случаях, когда закон
распределения не известен, подсказать
его вид может гистограмма. Например,
если ее вид напоминает кривую Гаусса,
то можно высказать гипотезу о нормальном
законе распределения исследуемой
случайной величины.
Проверка
гипотезы H0
о том, что эмпирическая частота мало
отличается от соответствующей
теоретической частоты, осуществляется
с помощью величины
–
меры расхождения между ними. Пустьpi
– вероятность принятия значения xi,
а ni
– эмпирическая
частота для соответствующих значений
xi.
Тогда
,
(3.44)
где n – объем выборки, а m – число различных вариант выборки. Числа ni и npi – называют соответственно эмпирическими и теоретическими частотами.
В
том случае, когда распределение непрерывно
или число различных вариант достаточно
большое, то выборку группируют с учетом,
что ni>5.
Такая статистика имеет распределение
(m-r-1),
где m
– число
различных интервалов группировки
выборки, а r
– число
параметров теоретического распределения,
вычисленных по данным выборки.
Причины расхождения результатов эксперимента и теоретических характеристик могут быть вызваны малым объемом выборки, неудачным способом группировки наблюдений, неверными вычислениями теоретических частот, ошибками в выборе гипотезы о виде распределения генеральной совокупности и др.
Рассмотрим простые гипотезы о степени близости эмпирического закона распределения теоретическому, т.е. соответствия опытных данных и теоретической модели. Критериями согласия называют критерии, в которых гипотеза определяет закон распределения полностью, либо с точностью до небольшого числа параметров.
Рассмотрим универсальный критерий согласия – критерий Пирсона 2 (для простой гипотезы), т.к. он используется и при независимых повторных испытаниях для дискретной выборки и в более сложных случаях: произвольных выборках.
Для произвольных выборок все пространство наблюдаемых вариант делят на конечное число непересекающхся областей, в каждой из которых подсчитывают наблюдаемую частоту и теоретическую (гипотетическую) вероятность.
Для применения критерия согласия Пирсона необходимо:
вычислить значение статистики по формуле
;
по таблице значений распределения
найти критические значения
, у которогоk= m -r-1 – число степеней свободы и – выбранный уровень значимости. Это значит, что строится правосторонний интервал.
Если
гипотеза0 отвергается, для
гипотеза0 принимается, т.е. чем больше значение отклонения, тем меньше согласованы теоретическое и эмпирическое распределение. Поэтому принято использовать только правостороннюю критическую область.
Задача 19. В известном опыте Бюффона (Задача 9, п.2.9.4) определить, согласуются ли экспериментальные данные с теоретической вероятностью выпадения герба.
Решение: Данные эксперимента это число опытов n=4040, число выпадения герба m=2048. Тогда эмпирическая частота pi=0.507.
Составим ряд распределений, приняв случайную величину – выпадение решки за x1=0, а случайную величину – выпадение герба за x2=1. Соответствующие вероятности занесем в таблицу:
-
xi
ni
npi
ni- npi
(ni- npi)2
(ni- npi)2/ npi
0
1992
2020
-28
784
0.388
1
2048
2020
28
784
0.388
Тогда
статистика
=0.388+0.388=0.776
, а число степеней свободы найдем по
формулеk=m-r-1.
Т.к. случайная величина X
принимает всего два значения (m=2),
а неизвестных параметров нет, то r=0.
Поэтому число степеней свободы равно
k=2-0-1=1.
По таблице распределений
находим значение
=3.84
при уровне значимости=0.05.
Это значит, что найденное значение
=0.776
меньше критерия
и поэтому можно сделать вывод о том, что
гипотеза о равновероятном выпадении
герба и решки в опытах Бюффона хорошо
согласуется с теоретической вероятностью.
Задача 20.
По таблице эмпирического распределения изменения (в %) темпа роста акций проверим гипотезу о нормальном распределении выборки:
Интервалы |
(-3;-1) |
(-1;0) |
(0;1) |
(1;3) |
Итого |
|
7 |
14 |
18 |
11 |
50 |
|
0.14 |
0.28 |
0.36 |
0.22 |
1.0 |
Решение:
Гипотезу
о нормальном распределении проверим
по критерию
,
используя расчетную таблицу эмпирического
распределения для формулы
:
Интервалы |
ni |
|
|
ni-npi |
|
|
(-3;-1) |
7 |
0.157 |
7.85 |
-0.85 |
0.7225 |
0.092 |
(-1;0) |
14 |
0.341 |
17.05 |
-3.05 |
9.3025 |
0.546 |
(0;1) |
18 |
0.341 |
17.05 |
-0.95 |
0.9025 |
0.053 |
(1;3) |
11 |
0.157 |
7.85 |
-3.15 |
9.9225 |
1.264 |
Итого: 1.955.
=1.955.
Находим
по числу степеней свободы
.
Т.к.m=4
- число интервалов, r=2
- число параметров теоретического
распределения, то
,
для=0.05
имеем
.
Т.к. 1.955<3.841, то
, т.е. гипотеза о нормальном распределении
подтверждается.
Критерий
Колмогорова. Для
проверки гипотезы о виде распределения
вероятностей кроме критерия
используетсякритерий
Колмогорова,
где в качестве меры расхождения между
теоретическим и эмпирическим
распределениями рассматривается
максимальное значение абсолютной
величины разности между эмпирической
функцией распределения Fn(x)
и соответствующей
теоретической функцией распределения
F(x):
D=max|Fn(x)-F(x)|.
Здесь
случайная величина D
– наибольшее уклонение эмпирической
функции распределения от теоретической.
При неограниченном увеличении числа
наблюдений (при n)
,
где
K(t)
–распределение Колмогорова. Например,
при t=1.36
и при достаточно большом объеме выборки
n,
из таблиц функции Колмогорова (Таблица
10, приложение 1) имеем неравенство
<
(или
,
которое выполняется с вероятностью
0.95. Величина
,
называемаястатистикой
критерия
Колмогорова,
т.е. мера расхождения между теоретическими
и эмпирическим распределением, при
больших n
имеет
распределение Колмогорова.
Критерий Колмогорова, несмотря на свою простоту, имеет ограниченное применение, т.к. для его использования необходимо полное задание теоретической функции распределения, которым чаще всего не располагают.