- •28 Марта 1987 г.
- •Часть 3
- •Проверка непараметрических статистических гипотез.
- •Критерий согласия (Пирсона).
- •Задания для расчетно-графической работы
- •8. При изучении влияния механизации уборочных работ на себестоимость центнера кукурузы в районе в отчетном году были получены следующие данные (процент механизации и себестоимости 1 ц в рублях):
- •7. Методом наименьших квадратов найти оценки параметров модели по опытным данным:
- •7. Используя метод наименьших квадратов, найти оценки параметров модели: по выборке:
Проверка непараметрических статистических гипотез.
При обработке результатов эксперимента
над случайной величиной экспериментатор
по выборке подбирает теоретико-вероятностную
модель (нормальную, показательную,
биномиальную и т.д.). Предположим, что
по виду гистограммы или полигона частот
или из каких-либо других соображений
выдвинута гипотеза относительно общего
вида функции распределения наблюдаемой
случайной величины, т.е. гипотезы вида
или
,
где
- класс функций распределения определенного
вида (нормальных, показательных,
биномиальных и т.д.). Такую гипотезу
называют нулевой непараметрической
гипотезой. Гипотетическая функция
распределения может быть определена
полностью, либо с точностью до параметров.
В последнем случае по данным выборки
может быть произведена точечная оценка
неизвестных параметров. Но как бы хорошо
ни была подобрана теоретическая кривая
распределения, между нею и статистическим
распределением неизбежны некоторые
расхождения. Естественно возникает
вопрос: объясняются ли эти расхождения
только случайными причинами или они
являются существенными и связаны с
тем, что плохо подобрана вероятностная
модель. Для ответа на этот вопрос
производится проверка нулевой гипотезы
с помощью так называемых критериев
согласия. Принципы построения таких
критериев и методика проверки остаются
практически такими же, как и в случае
параметрических гипотез. Для того чтобы
принять или опровергнуть гипотезу
,
рассматривают некоторую выборочную
статистику (критерий), характеризующую
степень расхождения теоретического и
статистического распределений. По
распределению этой статистики, полученному
в предложении истинности нулевой
гипотезы, и заданному уровню значимости
находятся критические значения и
сравниваются с наблюдаемым значением
критерия. Наиболее распространенными
из непараметрических критериев значимости
являются критерий согласия
Пирсона и
-критерий
Колмогорова. Мы рассмотрим здесь критерий
согласия Пирсона. Относительно критерия
А.Н.Колмогорова отметим только, что он
выгодно отличается своей простой от
критерия
,
но применяется только в случае, когда
гипотетическое распределение полностью
известно заранее из каких-либо
теоретических соображений, т.е. когда
известны не только вид функции
распределения, но и все определяющие
ее параметры. Такой случай сравнительно
редко встречается на практике.
Критерий согласия (Пирсона).
Пусть произведено n независимых опытов, в каждом из которых случайная величина X приняла определенное значение. Результаты опытов сгруппированы в K разрядов и оформлены в виде статистического ряда:
|
разряды |
|
|
. . . |
|
|
Относительные частоты |
|
|
. . . |
|
Зная теоретический (гипотетический)
закон распределения, можно найти
теоретические вероятности попадания
случайной величины в каждый из разрядов:
,
,
. . . ,
.
Проверяя согласованность теоретического
и статистического распределений, будем
исходить и расхождений между теоретическими
вероятностями
и наблюденными частотами
.
Естественно выбрать в качестве меры
расхождения между ними сумму квадратов
отклонений (
-
),
взятых с некоторыми «весами»
:
.
Коэффициенты
(«веса»
разрядов) вводятся потому, что отклонения
нельзя считать равноценными по значимости
для всех разрядов: одно и то же по
абсолютной величине отклонения
может быть малозначительным, если сама
вероятность
велика, и очень заметным, если она мала.
Поэтому естественно «веса» взять обратно
пропорциональными вероятностям
разрядов.
К.Пирсон показал, что если положить
,
то при больших n закон
распределения величины К практически
не зависит от функции распределения
наблюдаемой случайной величины и от
числа опытов и при увеличении их числа
приближается к распределению
с
степенями свободы (К-число разрядов,
r-число параметров
гипотетической функции F(x),
оцениваемых по выборке). Таким образом,
.
В дальнейшем мы эту статистику будем
обозначать
и для удобства вычислений записывать
в виде:
,
где
-частота
i-го разряда.
Критерий
использует тот факт, что случайная
величина
имеет распределение, близкое к нормальному
N(0;1). Чтобы это утверждение
было достаточно точным, необходимо,
чтобы для всех интервалов выполнялось
условие
.
Если в некоторых интервалах это условие
не выполняется, то их следует объединить
с соседними.
Такими образом, процедура применения
критерия согласия
(Пирсона)
состоит из следующих этапов.
-
По выборке найти точечные оценки неизвестных параметров предполагаемого закона распределения F(x).
-
Составить группированный статистический ряд с достаточной для выполнения условия
частотой
разрядов. -
Вычислить теоретические вероятности
попадания случайной величины в каждый
из разрядов. -
Вычислить выборочное значение статистики критерия
. -
По таблицам распределения
с
степенями свободы и при уровне значимости
найти квантиль
. -
Принять статистическое решение: если
,
то данные наблюдений не противоречат
гипотезе
на уровне значимости
.
Если же окажется
,
то гипотезу
следует отклонить.
Критерий
сконструирован таким образом, что чем
ближе к нулю наблюдаемое значение
критерия, тем вероятнее, что нулевая
гипотеза справедлива. Поэтому критическая
область критерия правосторонняя.
Пример. В течение 100 дней фиксировалось число аварий водопроводно-канализационной сети в некотором районе города. Получены следующие данные:
|
Число аварий,
|
0 |
1 |
2 |
3 |
4 |
5 |
|
Частота,
|
8 |
28 |
31 |
18 |
9 |
6 |
Проверить гипотезу о том, что число аварий имеет распределение Пуассона. Уровень значимости принять равным 0,05.
Решение. Согласно условию

Теоретические вероятности
появления равно
аварий
в течение 100 дней вычислим по формуле
Пуассона:
![]()
Результаты дальнейших вычислений сведем в таблицу:
|
|
0 |
1 |
2 |
3 |
4 |
5 |
|
|
|
8 |
28 |
31 |
18 |
9 |
6 |
100 |
|
|
0,122 |
0,257 |
0,270 |
0,189 |
0,099 |
0,063 |
1,000 |
|
|
12,2 |
25,7 |
27,0 |
18,9 |
9,9 |
6,3 |
100 |
|
|
17,64 |
5,29 |
16,00 |
0,81 |
0,81 |
0,09 |
|
|
|
1,45 |
0,21 |
0,59 |
0,04 |
0,08 |
0,01 |
2,38 |
Таким образом,
.
По таблице
-распределенная
по уровню значимости 0,05 и числу степеней
свободы
найдем критическое значение
.
Так как
,
то для отклонения нулевой гипотезы нет
оснований. Значит, с вероятностью ошибки
0,05 принимаем, что число аварий
водопроводно-канализационной сети
распределено по закону Пуассона с
параметром
.
ЛИТЕРАТУРА
-
Герасимович А.И., Математическая статистика. – Минск: Высшая школа, 1983.
-
Сборник задач по математике для вузов; специальные курсы, т.3 (под.ред. Ефимова А.В.).-М.:Наука, 1984.
-
Вентцель Е.С., Теория вероятностей.-М.:Физматгиз, 1962.
-
Ивченко Г.И., Медведев Ю.И., Математическая статистика.- М.:Высшая школа, 1984.
-
Королюк В.С. и др., Справочник по теории вероятностей и математической статистике. – М.: Наука, 1985.
ВОПРОСЫ ДЛЯ САМОПРОВЕРКИ И ЗАЩИТЫ РАСЧЕТНО-ГРАФИЧЕСКОЙ РАБОТЫ
-
Сформулируйте задачу статистической проверки гипотез.
-
Как проводится статистическая проверка гипотез?
-
какие гипотезы называют параметрическими, непараметрическими?
-
Какие ошибки возможны при статистической проверке гипотез? В чем их сущность? Что такое мощность критерия?
-
Какие статистики используются при проверке параметрических гипотез? Каковы распределения этих статистик?
-
Что такое критерии согласия? В чем заключается идея применения критериев согласия?
-
В чем состоит критерий согласия Пирсона?
-
Приведите оценки средних, дисперсий, ковариации и коэффициента коореляции двумерного случайного вектора.
-
Что такое регрессия одной случайной величины на другую, кривая регрессии и линейная регрессия?
-
В чем заключается метод наименьших квадратов при обработке результатов наблюдения?
