- •Оглавление
- •Список используемых сокращений
- •Введение
- •Понятие и сущность статистических гипотез
- •1.1.Постановка проблемы
- •1.2. Статистический критерий
- •Классификация статистических критериев:
- •1.3. Функция потерь и критерий качества выбора решения
- •2. Проверка простой гипотезы против простой альтернативы
- •2.1. Вероятности правильных и ошибочных решений
- •Критерии принятия решений
- •Байесовское решение
- •Максимум апостериорной вероятности
- •Максимальное правдоподобие
- •Критерий Неймана-Пирсона
- •Минимаксное правило
- •Критерии значимости
- •3.1. Проверка гипотез для нормального распределения
- •3.1.1. Гипотезы о неизвестном среднем при известной дисперсии
- •3.1.2. Гипотезы о неизвестном среднем при неизвестной дисперсии
- •3.1.3. Гипотеза о неизвестной дисперсии
- •3.2. Сравнение средних нормального распределения
- •3.2.1. Проверка гипотез о равенстве средних для двух выборок
- •3.2.1.1. Гипотеза о равенстве средних при неизвестных равных дисперсиях
- •3.2.1.2. Гипотеза о равенстве средних при известных дисперсиях
- •3.2.1.3. Сравнение средних при неизвестных неравных дисперсиях
- •3.2.1.3.1. Критерий Кохрана-Кокса
- •3.2.1.3.2. Критерий Сатервайта
- •3.2.2. Проверка гипотез о равенстве средних для выборок
- •3.2.2.1. Критерий Полсона
- •3.2.2.2. Критерий Шеффе
- •3.3. Сравнение дисперсий нормального распределения
- •3.3.1. Проверка гипотез о равенстве дисперсий для двух выборок
- •3.3.1.1. Критерий Фишера
- •3.3.1.2. Критерий Романовского
- •3.3.2. Проверка гипотез о равенстве дисперсий для выборок
- •3.3.2.1. Критерии Бартлетта
- •3.3.2.2. Критерии Кохрена
- •3.3.2.3. Критерий Самиуддина
- •3.4. Проверка гипотез для экспоненциального распределения
- •3.4.1. Гипотеза о неизвестном параметре экспоненциального распределения
- •4. Общие критерии согласия
- •4.1.Критерии хи-квадрат Пирсона
- •4.2. Критерии хи-квадрат Фишера
- •4.3. Критерий согласия Колмогорова- Смирнова
- •4.4. Критерий Смирнова-Крамера-фон Мизеса
- •4.5. Критерий Андерсона-Дарлинга
- •4.6. Критерий согласим Дарбина
- •5. Частные критерии согласия
- •5.1. Критерии проверки нормальности распределения
- •5.1.1. Сравнительный анализ критериев нормальности
- •5.1.2. Критерий Шапиро-Уилка
- •5.1.3 Критерий
- •5.1.4 Критерий
- •5.1.5 Критерий
- •5.1.6. Критерий нормальности д'Агостино
- •5.1.7. Энтропийный критерий нормальности (критерий Васичека)
- •5.1.8. Критерий Дэвида-Хартли-Пирсона
- •5.2. Критерии проверки экспоненциальности распределения
- •5.2.1. Критерий Фроцини
- •5.2.2. Критерий Бартлетта-Морана
- •5.3. Критерии проверки равномерности распределения
- •5.3.1. Критерий Ченга – Спиринга
- •5.3.2. Критерий Саркади – Косика
- •5.4. Критерии симметрии
- •5.4.1. Критерий симметрии Смирнова
- •5.4.2. Одновыборочный критерий Вилкоксона
- •6. Критерии однородности
- •6.1. Критерий -квадрат
- •6.2. Критерий Колмогорова
- •6.3. Критерий Уилкоксона — Манна — Уитни
- •7. Подбор кривых распределения вероятностей по экспериментальным данным
- •7.1. Кривые Пирсона типа I
- •7.2. Кривые Пирсона типа II
- •7.3. Кривые Пирсона типа III
- •7.4. Кривые Пирсона типа IV
- •7.5. Кривые Пирсона типа V
- •7.6. Кривые Пирсона типа VI
- •7.7. Кривые Пирсона типа VII
- •Список используемой литературы
Минимаксное правило
Минимаксное правило выбора решения представляет собой специальный случай байесовского решения для наименее благоприятного априорного распределения состояний изучаемого явления. Так как в рассматриваемом случае проверки простых гипотез имеется лишь два возможных состояния и , то указанное распределение определяется лишь одной вероятностью (или ). Поэтому для того, чтобы найти то значение ,с которым связано наибольшее значение байесовского риска, необходимо определить максимум величины как функции .
Дифференцируя правую часть уравнения полученного из и (23) по , приравнивая результат дифференцирования нулю и учитывая, что точки поверхности, разделяющей критическую и допустимую области пространства выборок, удовлетворяют условию(25), приходим к трансцендентному уравнению относительно искомого наименее благоприятного значения вероятности :
(34)
Учитывая, что для байесовского критерия , , - интегральные функции распределения отношения правдоподобия при гипотезах и соответственно, получим
(35)
Решая уравнение (35) и выделяя тот корень уравнения (и, следовательно, )которому соответствует абсолютный максимум байесовского риска, приходим к следующему минимаксному правилу выбора решения: отвергается гипотеза , если для наблюдаемой выборки выполняется неравенство
(36)
В противном случае, гипотеза принимается.
Величина минимаксного риска в соответствии может быть вычислена по формуле
(37)
где
, (38)
Разность между минимаксным (при неизвестном ) и байесовским риском (при известном )является платой за отсутствие априорной информации о состояниях изучаемого явления.
Сведем полученные соотношения в таблицу:
Таблица 1. Пороги различных критериев
Критерий |
Порог «С» |
Байесовские |
|
Максимум апостериорной вероятности |
|
Максимум правдоподобия |
1 |
Неймана-Пирсона |
Из уравнения |
Минимаксный |
Из уравнения |
Критерии значимости
3.1. Проверка гипотез для нормального распределения
Рассмотрим простые методы проверки параметрических гипотез в случае нормального распределения (которые являются формально точными).
3.1.1. Гипотезы о неизвестном среднем при известной дисперсии
Пусть случайная величина , причем неизвестно значение математического ожидания ,а дисперсия известна . Требуется на уровне значимости проверить нулевую гипотезу : , если альтернативная гипотеза : . Вычислить необходимый объем выборки при ошибке второго рода, равной .
Решение:Несмещенной и состоятельной оценкой математического ожидания является:
(39)
Поэтому естественно выбрать ту гипотезу, к параметру которой ближе среднее выборочное . При любой из гипотез и случайная величина имеет нормальное распределение с параметрами , - т.е. математическое ожидание зависит от гипотез. Поэтому распределения случайной величины при гипотезах и будут различны:
и
Функции правдоподобия (19) соответственно равны:
Отсюда отношение правдоподобия (20) имеет вид:
Критическая область определяется из условия . Преобразуем выражение, стоящее в показателе степени:
Отношение правдоподобия имеет вид:
Поскольку , это отношение является монотонно возрастающей функцией величины , и так как , то неравенство равносильно неравенству , где и - некоторые константы. Поэтому критическая область имеет вид , и определяется из равенства .
Для вычисления прологарифмируем неравенство . Получим или , откуда найдем :
(40)
Тогда из определений ошибок первого и второго рода их можно записать в виде:
(41)
(42)
где - интегральная функция Лапласа.
Замечание: Величина может быть определена одним из рассмотренных выше методов, по данным таблицы 1.Рассмотрим несколько критериев принятия решения:
Критерий Неймана-Пирсона:
Поскольку при условии истинности нулевой гипотезы случайная величина , то , и вероятность попасть в критическую область будет равна
где - функция нормального распределения, которая связанна с интегральной функцией Лапласа соотношением:
(43)
Обозначим через решение уравнения . Величина является квантилем уровня для стандартного нормального распределения и принимается здесь в качестве критической точки. Ее значения находят по таблице функции Лапласа из условия . Тогда из равенства из таблиц функции Лапласа находим квантиль и определяем константу полагая , или .
Критерий проверки гипотезы можно сформулировать следующим образом: если , то при принимается гипотеза , а при принимается гипотеза .
Таким образом, наиболее мощный критерий проверки гипотезы : при альтернативной : следующий:
если , то гипотеза отклоняется,
если , то гипотеза принимается.
Если верна гипотеза , но произошло событие , то принимается гипотеза ,т. е. это ошибка первого рода.
Если же верна гипотеза , а произошло событие , то принимается гипотеза , и это ошибка второго рода.
Теперь критическая область полностью определена и можно найти мощность критерия или ошибку второго рода. При истинности гипотезы среднее наблюдаемое значение имеет нормальное распределение . Тогда, по определению, ошибка второго рода и мощность критерия равна
(44)
(45)
Подставляя в это равенство значение и учитывая, что , получаем мощность критерия в виде:
(46)
Величина называется расстоянием между гипотезами. Из последнего равенства можно определить наименьший объем выборки – такой, чтобы при заданном уровне значимости вероятность ошибки второго рода была бы равна .
Поскольку , то при заданном аргумент равен квантили , т.е. , где - квантиль уровня , полученная как решение уравнения . Отсюда получаем, что при заданном риск ошибки второго рода, меньше , обеспечивается объемом выборки
(47)
Замечание:Приведенная формула может давать слишком малые значения , так как основывается на строго нормальном распределении. На практике должно быть достаточно велико, чтобы пользоваться асимптотической нормальностью оценок.
Замечание: Практически бывает удобнее, когда конкурирующая гипотеза сложная, возможны 3 варианта: а) , б) , в) . При этом основная гипотеза .
При этом для критерия Неймана-Пирсона2 статистический критерий имеет вид:
(48)
В случае а) критическая точка выбирается из условия . Если , гипотеза принимается, если - отвергается. Таким образом, в данном случае имеет место двусторонняя критическая область.
В случаях б) и в) критическая точка выбирается из условия .
В случае в), если , то гипотеза принимается, если же - отвергается.
В случае в), если , то гипотеза принимается, если же - отвергается.
Здесь имеют место односторонние критические области (правосторонняя и левосторонняя соответственно).
Таблица 2. Критические значения функции
|
|
|
|
|
|
|
|
0 |
0 |
|
|
|
|
|
|
0,01 |
0,004 |
0,13 |
0,0517 |
0,25 |
0,0987 |
0,37 |
0,1443 |
0,02 |
0,008 |
0,14 |
0,0557 |
0,26 |
0,1026 |
0,38 |
0,148 |
0,03 |
0,012 |
0,15 |
0,0596 |
027 |
0,1064 |
0,39 |
0,1517 |
0,04 |
0,016 |
0,16 |
0,0636 |
0,28 |
0,1103 |
0,4 |
0,1554 |
0,05 |
0,0199 |
0,17 |
0,0675 |
0,29 |
0,1141 |
0,41 |
0,1591 |
0,06 |
0,0239 |
0,18 |
0,0714 |
0,3 |
0,1179 |
0,42 |
0,1628 |
0,07 |
0,0279 |
0,19 |
0,0753 |
0,31 |
0,1217 |
0,43 |
0,1664 |
0,08 |
0,0319 |
0,2 |
0,0793 |
0,32 |
0,1255 |
0,44 |
0,17 |
0,09 |
0,0359 |
0,21 |
0,0832 |
0,33 |
0,1293 |
0,45 |
0,1736 |
Продолжение табл.2. |
|||||||
|
|
|
|
|
|
|
|
0,1 |
0,0398 |
0,22 |
0,0871 |
0,34 |
0,1331 |
0,46 |
0,1772 |
0,11 |
0,0438 |
0,23 |
0,091 |
0,35 |
0,1368 |
0,47 |
0,1808 |
0,12 |
0,0478 |
0,24 |
0,0948 |
0,36 |
0,1406 |
0,48 |
0,1844 |
|
|
|
|
|
|
|
|
0,49 |
0,1879 |
1,02 |
0,3461 |
1,55 |
0,4394 |
2,16 |
0,4846 |
0,5 |
0,1915 |
1,03 |
0,3485 |
1,56 |
0,4406 |
2,18 |
4854 |
0,51 |
0,195 |
1,04 |
0,3508 |
1,57 |
0,4418 |
2,2 |
0,4861 |
0,52 |
0,1985 |
1,05 |
0,3531 |
1,58 |
0,4429 |
2,22 |
0,4868 |
0,53 |
0,2019 |
1,06 |
0,3554 |
1,59 |
0,4441 |
2,24 |
0,4875 |
0,54 |
0,2054 |
1,07 |
0,3577 |
1,6 |
0,4452 |
2,26 |
0,4881 |
0,55 |
0,2088 |
1,08 |
0,3599 |
1,61 |
0,4463 |
2,28 |
0,4887 |
0,56 |
0,2123 |
1,09 |
0,3621 |
1,62 |
0,4474 |
2,3 |
0,4893 |
0,57 |
0,2157 |
1,1 |
0,3643 |
1,63 |
0,4484 |
2,32 |
0,4898 |
0,58 |
0,219 |
1,11 |
0,3665 |
1,64 |
0,4495 |
2,34 |
0,4904 |
0,59 |
0,2224 |
1,12 |
0,3686 |
1,65 |
0,4505 |
2,36 |
0,4908 |
0,6 |
0,2257 |
1,13 |
0,3708 |
1,66 |
0,4515 |
2,38 |
0,4913 |
0,61 |
0,2291 |
1,14 |
0,3729 |
1,67 |
0,4525 |
2,4 |
0,4918 |
0,62 |
0,2324 |
1,15 |
0,3749 |
1,68 |
0,4535 |
2,42 |
0,4922 |
0,63 |
0,2357 |
1,16 |
0,377 |
1,69 |
0,4545 |
2,44 |
0,4927 |
0,64 |
0,2389 |
1,17 |
0,379 |
1,7 |
0,4554 |
2,40 |
0,4931 |
0,65 |
0,2422 |
1,18 |
0,381 |
1,71 |
0,4564 |
2,48 |
0,4934 |
0,66 |
0,2454 |
1,19 |
0,383 |
1,72 |
0,4573 |
2,5 |
0,4938 |
0,67 |
0,2486 |
1,2 |
0,3849 |
1,73 |
0,4582 |
2,52 |
0,4941 |
0,68 |
0,2517 |
1,21 |
0,3869 |
1,74 |
0,4591 |
2,54 |
0,4945 |
0,69 |
0,2549 |
1,22 |
0,3888 |
1,75 |
0,4599 |
2,56 |
0,4948 |
0,7 |
0,258 |
1,23 |
0,3907 |
1,76 |
0,4608 |
2,58 |
0,4951 |
0,71 |
0,2611 |
1,24 |
0,3925 |
1,77 |
0,4616 |
2,6 |
0,4953 |
0,72 |
0,2642 |
1,25 |
0,3914 |
1,78 |
0,4625 |
2,62 |
0,4956 |
0,73 |
0,2673 |
1,26 |
0,3962 |
1,79 |
0,4633 |
2,64 |
0,4959 |
074 |
0,2703 |
1,27 |
0,398 |
1,8 |
0,4641 |
2,60 |
0,4961 |
0,75 |
0,2734 |
1,28 |
0,3997 |
1,81 |
0,4649 |
2,68 |
0,4963 |
0,76 |
0,2764 |
1,29 |
0,4015 |
1,82 |
0,4656 |
2,7 |
0,4965 |
0,77 |
0,2794 |
1,3 |
0,4032 |
1,83 |
0,4664 |
2,72 |
0,4967 |
0,78 |
0,2823 |
1,31 |
0,4049 |
1,84 |
0,4671 |
2,74 |
0,4969 |
0,79 |
0,2852 |
1,32 |
0,4066 |
1,85 |
0,4678 |
2,76 |
0,4971 |
0,8 |
0,2881 |
1,33 |
0,4082 |
1,86 |
0,4686 |
2,78 |
0,4973 |
0,81 |
0,291 |
1,34 |
0,4099 |
1,87 |
0,4693 |
2,8 |
0,4974 |
0,82 |
0,2939 |
1,35 |
0,4115 |
1,88 |
0,4699 |
2,82 |
0,4976 |
0,83 |
0,2967 |
1,36 |
0,4131 |
1,89 |
0,4706 |
2,84 |
0,4977 |
0,84 |
0,2995 |
1,37 |
0,4147 |
1,9 |
0,4713 |
2,86 |
0,4979 |
0,85 |
0,3023 |
1,38 |
0,4162 |
1,91 |
0,4719 |
2,88 |
0,498 |
0,86 |
0,3051 |
1,39 |
0,4177 |
1,92 |
0,4726 |
2,9 |
0,4981 |
0,87 |
0,3078 |
1,4 |
0,4192 |
1,93 |
0,4732 |
2,92 |
0,4982 |
0,88 |
0,3106 |
1,41 |
0,4207 |
1,94 |
0,4738 |
2,94 |
0,4984 |
0,89 |
0,3133 |
1,42 |
0,4222 |
1,95 |
0,4744 |
2,96 |
0,4985 |
0,9 |
0,3159 |
1,43 |
0,4236 |
1,96 |
0,475 |
2,98 |
0,4986 |
0,91 |
0,3186 |
1,44 |
0,4251 |
1,97 |
0,4756 |
3 |
0,49865 |
Окончание табл.2. |
|||||||
|
|
|
|
|
|
|
|
0,92 |
0,3112 |
1,45 |
0,4265 |
1,98 |
0,4761 |
3,2 |
0,49931 |
0,93 |
0,3238 |
1,46 |
0,4279 |
1,99 |
0,4767 |
3,4 |
0,49966 |
0,94 |
0,3264 |
1,47 |
0,4292 |
2 |
0,4772 |
3,6 |
0,499941 |
0,95 |
0,3289 |
1,48 |
0,4306 |
2,02 |
0,4783 |
3,8 |
0,499928 |
0,96 |
0,3315 |
1,49 |
0,4319 |
2,04 |
0,4793 |
4 |
0,499968 |
0,97 |
0,334 |
1,5 |
0,4332 |
2,06 |
0,4803 |
4,5 |
0,499997 |
0,98 |
0,3365 |
1,51 |
0,4345 |
2,08 |
0,4812 |
5 |
0,5 |
0,99 |
0,3389 |
1,52 |
0,4357 |
2,1 |
0,4821 |
|
|
1 |
0,3413 |
1,53 |
0,437 |
2,12 |
0,483 |
|
|
1,01 |
0,3438 |
1,54 |
0,4382 |
2,14 |
0,4838 |
|
|
Пример2
Пусть имеется 100 выборочных значений из генеральной совокупности:
Необходимо используя критерий Неймана-Пирсона на уровне значимости проверить гипотезу о равенстве среднего значения при СКО , при условии, что конкурирующая гипотеза . Решение Для решения поставленной задачи, необходимо рассчитать статистику Неймана-Пирсона определяемую формулой (48). В статистику входит средне выборочная величина определяемая формулой (39). В данном случае она равна:
Тогда, статистика Неймана-Пирсона равна:
Критическое значение определяется соотношением . Используя таблицу 2 критических значений функции находим . Так как гипотеза о равенстве среднего значения принимается на уровне значимости . В случае, если нулевая гипотеза : , то соответствующая статистика принимает значение: и данная гипотеза на уровне значимости отвергается. |
Критерий максимального правдоподобия:
Согласно критерию максимального правдоподобия , следовательно, критерий , подставляя данное значение критерия в уравнения (41)и (42) получаем
(49)
Таким образом, наиболее мощный критерий проверки гипотезы : при альтернативной : , следующий:
если , то гипотеза отклоняется,
если , то гипотеза принимается.
Обозначим через решение уравнения , тогда
(50)
Пример 3
Для выборки из примера 2 проверим гипотезу о том, что среднее значение против альтернативы методом максимального правдоподобия. Решение Как отмечалось выше, пороговым значением для данного критерия является значение:
Так как то нулевая гипотеза принимается, то есть среди двух значений среднего, выбор падает в пользу первого. |
Минимаксный критерий:
Пусть , . Тогда и уравнение, определяющее наименее благоприятную величину априорной вероятности , может быть представлено в виде:
Таким образом, наиболее мощный критерий проверки гипотезы : при альтернативной : , следующий:
если , то гипотеза отклоняется,
если , то гипотеза принимается.