![](/user_photo/2706_HbeT2.jpg)
- •1. Основные понятия из теории вероятностей и математической статистики
- •2. Эмпирическая функция распределения. Гистограмма
- •3. Точечные оценки для моментов
- •4. Доверительные интервалы для моментов. Доверительная вероятность
- •5. Оценивание параметров. Метод моментов
- •6. Критерии согласия
- •7. Задания практических работ
- •Приложение 1 Нормальное распределение
- •Приложение 2 Критические точки распределения χ2-квадрат
- •П риложение 3 Распределение Стьюдента
- •П риложение 4 Распределение χ2-квадрат
- •Литература
- •Коллектив авторов основы математической статистики Учебно-методическое пособие
- •6 30092, Г. Новосибирск, пр. К. Маркса, 20
6. Критерии согласия
Пусть дана выборка из генеральной совокупности, закон распределения которой неизвестен, и пусть найдены точечные оценки для математического ожидания и дисперсии. Относительно вида теоретического распределения исследователем выдвигаются различные гипотезы. Согласованность наблюдений с гипотезой можно проверять сравнением графиков эмпирической и теоретической функций распределения или гистограммы с графиком плотности вероятности. Ввиду случайности выборки эмпирическая функция распределения может существенно отличаться от теоретической, даже если гипотеза верна. Перед исследователем стоит задача определить, какие отличия не противоречат гипотезе, а какие являются значимыми и гипотезу от-вергают.
С помощью критериев согласия оценивают, насколько полученные наблюдения согласуются с гипотезой распределения.
Критерий согласия χ2
Критерий Пирсона
(читается «хи-квадрат») наиболее часто
используется среди критериев согласия.
Меру расхождения эмпирического и
теоретического законов распределения
этот критерий представляет в виде
величины
.
Здесь n
есть объем выборки; l
– число интервалов, на которые разбивается
вся область значений случайной величины;
– эмпирические частоты, а
– теоретические вероятности попадания
в i-й
интервал с границами
,
которые находятся по формуле
,
i = 1, 2, …, l
, где F(x)
есть
теоретическая функция распределения.
Для нормального теоретического закона
где
– функция Лапласа.
Если проверяемая гипотеза верна, то значение является приближенно реализацией случайной величины, имеющей распределение с k = l – m – 1 степенями свободы, где m – число параметров теоретического распределения. Для нормального и равномерного распределений m = 2, поскольку параметрами нормального распределения являются математическое ожидание и квадратическое отклонение, а для равномерного – концы отрезка, где задана плотность.
Очевидно, что чем меньше отличаются теоретические вероятности от соответствующих эмпирических частот, тем меньше величина . Слишком большая мера расхождения означает, что гипотеза о распределении неверна. Какой должна быть величина , зависит от задаваемого уровня значимости α.
Критические
значения
,
зависящие от α и k
, находятся
из условия
и затабулированы. Иными словами, уровень
значимости α
есть вероятность того, что случайная
величина
попадает в критическую
область [
∞). Величина β = 1 − α есть вероятность
попадания случайной величины
в область
допустимых значений
(0,
).
Схема применения критерия согласия Пирсона
Вычисляется наблюдаемое значение
величины по приведенной выше формуле; находится по таблице критических точек распределения при заданном уровне значимости α.
Если
, т.е. попало в область допустимых значений, то оснований отвергнуть гипотезу нет. Отклонения эмпирических частот от теоретических вероятностей носят случайный характер, являются незначимыми.
Если
, то гипотезу о теоретическом распределении следует отвергнуть. Расхождения частот и вероятностей являются значимыми при данном уровне значимости α.
Критерий согласия Пирсона, как и все критерии согласия, позволяет отвергнуть неподходящие гипотезы, но доказательством справедливости гипотезы не служит. Гипотеза принимается не как истинная, а как согласующаяся с результатами наблюдений.
Существует также несколько иная схема применения критерия , состоящая в следующем. По найденному и числу k находится вероятность p того, что случайная величина, распределенная по закону , будет больше . Используется любая таблица распределения с подходящими входами. Если найденная вероятность меньше уровня значимости, то результат опыта считается противоречащим выбранному теоретическому закону. Если она сравнительно велика (больше уровня значимости), то расхождение теоретического и эмпирического распределения считается незначимым. Такая схема дает оценку вероятности полученного уклонения, что позволяет численно выразить меру соответствия выборки гипотезе.
Использование критерия Пирсона
В задании 4 практической работы 2 по критерию нужно проверить гипотезы о согласии выборки с нормальным и равномерным распределениями. Параметры обоих законов распределения оценены методом моментов в предыдущем разделе.
Используем готовое
интервальное задание выборки из табл.
5 (вариант 0). Предварительно восьмой,
девятый и десятый интервалы объединяются
в один (под восьмым номером), поскольку
практически требуется, чтобы в интервал
попало не менее пяти выборочных точек.
Тогда новое число точек в разряде будет
.
При достаточном числе выборочных точек
в интервалах изменений не требуется.
Помимо этого крайние интервалы необходимо
продлить соответственно до –∞ и до +∞,
в соответствии с требованиями критерия.
Для нормального
закона теоретические вероятности
попадания
в i-й
интервал вычислены по приведенной выше
формуле, с использованием затабулированных
значений функции Лапласа. Далее указаны
величины
,
а также значения
отдельно для каждого интервала.
Сумма величин
по столбцу дает искомое значение критерия
.
Для равномерного
закона распределения теоретические
вероятности
попадания в каждый из 10 интервалов
одинаковы и равны 1/10. Но поскольку
последние три интервала объединялись
в один, для восьмого интервала
.
Значение критерия
также получено суммированием по столбцу.
Все вычисления представлены в табл. 3.
Проверим сначала гипотезу о согласии выборки с нормальным законом распределения.
По таблице критических точек распределения (приложение 2) находим значение = 9,24, соответствующее уровню значимости (критической вероятности) α = 0,1 и числу степеней свободы k = 8–2–−1=5. Так как < 9,24= , то попадает в область допустимых значений. Поэтому нет оснований отвергнуть гипотезу. Расхождение между эмпирическим и теоретическим распределениями незначимо и носит случайный характер.
Таблица 3
i |
Интервал |
ni |
Нормальный закон |
Равномерный закон |
||||
pi |
npi |
|
pi |
npi |
|
|||
1 |
(–∞,14) |
6 |
0.045 |
4.509 |
0.493 |
0.1 |
10 |
1.6 |
2 |
[14,18) |
7 |
0.070 |
7.017 |
0.000 |
0.1 |
10 |
0.9 |
3 |
[18,22) |
11 |
0.126 |
12.559 |
0.194 |
0.1 |
10 |
0.1 |
4 |
[22,26) |
17 |
0.177 |
17.672 |
0.026 |
0.1 |
10 |
4.9 |
5 |
[26,30) |
19 |
0.196 |
19.551 |
0.016 |
0.1 |
10 |
8.1 |
6 |
[30,34) |
18 |
0.170 |
17.005 |
0.058 |
0.1 |
10 |
6.4 |
7 |
[34,38) |
13 |
0.116 |
11.629 |
0.162 |
0.1 |
10 |
0.9 |
8 |
[38,+∞) |
9 |
0.101 |
10.059 |
0.111 |
0.3 |
30 |
14.7 |
Сумма |
|
100 |
1 |
100 |
1.059 |
1 |
100 |
37.6 |
Для проверки гипотезы о согласии выборки с равномерным законом распределения рассуждаем следующим образом.
Значение критерия > 9,24= , поэтому попадает в критическую область. На основании этого гипотезу о равномерном законе распределения отвергаем, как не согласующуюся с результатами наблюдений. Расхождение между эмпирическим и теоретическим законами распределения значимо при данном уровне значимости 0.1.
Рассмотрим также другую схему применения критерия.
В таблице вероятностей
для распределения
(приложение 4)
по аргументу 1,059 и числу степеней свободы
k = 8 − 2 − 1 = 5
находим
(ближайшее табличное значение 0,9626 для
аргумента 1). Поскольку 0.958 > 0,1 = α
(уровня значимости), принимаем гипотезу
о том, что выборка из нормального
распределения. Аналогично для равномерного
закона находим вероятность
< α
(уже для аргумента 30 вероятность меньше
,
поэтому в таблице стоит нулевое значение).
Поскольку найденная вероятность меньше
уровня значимости, гипотезу о равномерном
законе распределения отвергаем при
данном уровне значимости.