- •Проверка статистических гипотез
- •Статистические гипотезы
- •1. Простые и сложные гипотезы и их проверка
- •2. Критерий согласия Пирсона
- •Поведение , когда гипотезаверна.
- •Поведение , когда гипотезаневерна.
- •Критерий проверки.
- •Границы применимости критерия на практике.
- •3. Критерий согласия для сложных гипотез
- •4. О критериях согласия Колмогорова и Смирнова
- •5. Проверка нормальности при помощи вероятностной бумаги
- •Статистические критерии.
- •[Править] Уровень значимости и мощность.
- •[Править] Состоятельность и несмещенность критериев.
- •[Править] Некоторые типовые задачи прикладной статистики [править] Статистические данные и прикладная статистика
- •[Править] Статистический анализ точности и стабильности технологических процессов и качества продукции
- •[Править] Задачи одномерной статистики (статистики случайных величин)
- •[Править] Непараметрическое оценивание математического ожидания.
- •[Править] Непараметрическое оценивание функции распределения.
- •[Править] Таблица 1
- •[Править] Проблема исключения промахов.
- •[Править] Многомерный статистический анализ
- •[Править] Корреляция и регрессия.
- •[Править] Дисперсионный анализ.
- •[Править] Методы классификации.
- •[Править] Дискриминантный анализ.
- •[Править] Кластер-анализ.
- •[Править] Задачи группировки.
- •[Править] Снижение размерности.
- •[Править] Статистика случайных процессов и временных рядов
- •[Править] Статистика объектов нечисловой природы
- •Лабораторная работа №14. Изучение критериев Колмогорова и омега-квадрат
- •Лабораторная работа №15. Изучение критерия хи-квадрат Пирсона
Поведение , когда гипотезаверна.
Речь идет о поведении
при увеличении объема выборки:
.
Теорема
К. Пирсона.
Предположим,
что гипотеза
верна.
Тогда при
распределение
величины
сходится
к распределению хи-квадрат с
степенью
свободы, то есть,
![]()
Практический смысл
этой теоремы в том, что при большом
объемевыборки распределение
можно считать распределением хи-квадрат
с
степенью
свободы.
Поведение , когда гипотезаневерна.
Предположим теперь,
что
и
разбиение
таково,
что
![]()
где вероятности
вычислены
по функции распределения
.
Тогда можно показать (см., например, [13,
§ 10.4]), что
|
|
(52) |
Критерий проверки.
То обстоятельство,
что поведение
существенно
различно в зависимости от того верна
или нет гипотеза
,
дает возможность построить критерий
для ее проверки. Зададимся некоторымуровнем значимости
(допустимой
вероятностью ошибки) и возьмем квантиль
,
определенную формулой (45):
![]()
Определим критическое
множество
:
![]()
Таким образом,
наши действия по принятию (или отвержению)
гипотезы
состоят в следующем. Подстановкой
имеющихся данных
в
формулу (51)
вычисляется значение функции
,
которое затем сравнивается с
:
если
,
то гипотеза
отвергается
(при этом говорят, что выборка обнаруживает
значимое
отклонение
от гипотезы
),если
,
то гипотеза
принимается
(говорят, что выборка совместима
с гипотезой
).
Действительно,
такое решающее правило соответствует
вышеизложенным фактам о поведении
функции
.
Приведем аргументы, основанные на
здравом смысле, свидетельствующие в
пользу этого решающего правила. Если
значения функции
оказались ``слишком большими'', то,
принимая во внимание (52),
разумно считать, что гипотеза
не имеет места. Если же значения
``не слишком большие'', то, скорее всего,
гипотеза
верна, поскольку это согласуется с
теоремой Пирсона.
При таком решающем
правиле мы может допустить ошибку,
отвергнув верную гипотезу
.
Из теоремы Пирсона вытекает, что при
больших
величина
вероятности этой ошибки близка к
.
Границы применимости критерия на практике.
Утверждения теоремы
Пирсона и (52)
относятся к пределам при
.На практике, конечно, мы имеем дело
лишь с выборками ограниченного объема.
Поэтому, применяя вышеописанный критерий,
необходимо проявлять осторожность.
Согласно рекомендациям, изложенным
в [7],
применение критерия дает хорошие
результаты, когда все ожидаемые частоты
.
Если же какие-то из этих чисел малы,
рекомендуется, укрупняя некоторые
группы, перегруппировать данные таким
образом, чтобы ожидаемые частоты всех
групп были не меньше десяти. Если число
достаточно
велико, то, как указывается в книге [13],
порог для ожидаемых частот может быть
понижен до
или даже до
,
если
имеет
порядок нескольких десятков.
3. Критерий согласия для сложных гипотез
На практике задача
о согласии данных наблюдений с некоторым
совершенно конкретным распределением,
рассмотренная в
9.2,
встречается реже, чем задача проверки
сложной гипотезы, которую мы рассматриваем
ниже. Итак, рассмотрим независимую
выборку
,
соответствующую неизвестной функции
распределения
.
Поставим вопрос о том, согласуются ли
данные наблюдений
со
сложной гипотезой
![]()
где
--
(вообще говоря) многомерный параметр.
В эту формальную схему можно включить,
например, рассмотрение гипотезы о
принадлежности к классу показательных
распределений (без уточнения параметра
показательного распределения) и т. п.
Группируя данные
аналогично
9.2и вычисляя
по
функции распределения
,
обнаруживаем, что теперь эти вероятности
являются функциями от неизвестного
параметра:
![]()
Это обстоятельство
делает невозможным непосредственное
воспроизведение метода
9.2,
так как, если бы мы подставили эти
вероятности в (51),
то мы бы получили совершенно непригодную
с практической
точки зрения
функцию: ведь для ее вычисления, кроме
полученных в эксперименте данных
,
требовалось бы также знать сами
неизвестные параметры. Чтобы выйти из
положения, следует подставить в
вместо
параметра
его
оценку
,
вычисленную по выборке. Это можно сделать
разными способами, но мы остановимся
на одном из них.
Пусть числа
,
,
вычислены по выборке согласно формуле (50).
Запишем следующую функцию правдоподобия
![]()
Находя значение
,
при котором эта функция максимальна,
получим оценку наибольшего правдоподобия
.
Особо отметим, что для ее вычисления
достаточно знать только
.
По аналогии с (51)
определим
|
|
(53) |
Справедлив следующий
вариант
теоремы Пирсона5:
Предположим,
что гипотеза
верна.
Тогда при
распределение
величины
,
определяемой по формуле(53),
сходится к
распределению хи-квадрат с
степенью
свободы.
Заметим, что по
сравнению с теоремой из
9.2за замену
-мерного
неизвестного параметра его оценкой нам
пришлось ``заплатить''
степенями
свободы в предельном распределении
хи-квадрат.
В дальнейшем,
фиксируя
и
выбирая критическое множество
![]()
получим искомый
критерий уровня значимости
для
проверки сложной гипотезы
.
Все примечания
относительности применимости этого
критерия, сделанные в
9.2,
разумеется, остаются в силе.
Замечание 9.1
То обстоятельство,
что оценка
,
которую мы используем в определении (53),
зависит от выборки только через значения
,
является важным для утверждения
сформулированной выше теоремы. Как
показано в книге [13,
§ 10.6], замена параметра
произвольной
его оценкой по выборке
приводит
к тому, что
больше
не является удовлетворительной
аппроксимацией для
.

