
- •I. Основы проверки гипотез: критерии одиночной выборки
- •1.1. Нулевая и альтернативная гипотеза
- •1.2. Области отклонения и принятия гипотез. Критическое значение тестовой статистики
- •Область отклонения гипотезы
- •Область отклонения гипотезы
- •Область принятия гипотезы
- •1.3. Риски, возникающие при проверке гипотез
- •1.4. Риски, возникающие при принятии решений
- •Проверка гипотез и принятие решения
- •1.5. Использование z-критерия для проверки гипотезы о математическом ожидании при известном стандартном отклонении
- •Область принятия гипотезы
- •1.6. Односторонние критерии
- •1.7. Использование t-критерия для проверки гипотезы о математическом ожидании при неизвестном стандартном отклонении
- •1.8. Применение z-критерия для проверки гипотезы о доле признака в генеральной совокупности
- •II. Проверка гипотез для оценки свойств двух генеральных совокупностей
- •2,1. Использование z-критерия6 для оценки разности между двумя математическими ожиданиями
- •2.2. Применение t-критерия7 для оценки разности между математическими ожиданиями с помощью суммарной дисперсии
- •2.3. Использование t-критерия для оценки разности между двумя математическими ожиданиями с помощью раздельной дисперсии
- •III. Критерии оценки свойств двух зависимых генеральных совокупностей
- •3. 1. Критерии для оценки разности между двумя математическими ожиданиями
- •Измерения результатов тестирования
- •3.2. Использование z-критерия для оценки разности между двумя долями признака
- •IV. Вопросы и задачи проверки знаний
- •4.1. Общие вопросы проверки знаний
- •4.2. Задачи проверки знаний по материалу учебного модуля «Основы проверки гипотез»
1.4. Риски, возникающие при принятии решений
В табл.1 показаны два возможных решения (принять или отклонить нулевую гипотезу Но) при проверке гипотез. Как видим, решение может оказаться правильным либо стать причиной ошибки 1- или 2-го рода3.
Ошибку 1-го рода можно уменьшить, увеличив объем выборки. Более крупные объемы выборки позволяют снизить отклонение выборочных статистик от оцениваемых параметров генеральной совокупности. При заданной ошибке 1-го рода α увеличение объема выборки приводит к уменьшению величины β и, следовательно, к возрастанию мощности критерия. Однако объем выборки нельзя увеличивать бесконечно.
Таблица 1
Проверка гипотез и принятие решения
Статистическое решение |
Фактическая ситуация |
|
Гипотеза Н0 верна |
Гипотеза Н0 неверна |
|
Гипотеза Н0 не отклоняется |
Правильное решение Доверительная вероятность равна 1-α |
Ошибка 2-го рода Вероятность ошибки 2-го рода равна β |
Гипотеза Н0 отклоняется |
Ошибка 1-го рода Вероятность ошибки 1-го рода равна α |
Правильное решение Мощность критерия равна 1-β |
Таким образом, необходимо найти компромисс между ошибками двух видов. Поскольку в нашем распоряжении находится лишь вероятность ошибки 1-го рода, следует уменьшить ее величину. Например, если при проверке гипотез ошибка 1-го рода приводит к крайне нежелательным последствиям, необходимо выбрать α = 0,01, а не α = 0,05. Однако при уменьшении величины α увеличивается величина β, следовательно, снижение вероятности ошибки 1-го рода сопровождается увеличением вероятности ошибки 2-го рода. С другой стороны, уменьшая вероятность β, мы увеличиваем вероятность α. Следовательно, если необходимо избежать ошибки 2-го рода, можно выбрать α = 0,05 или α = 0,1, а не α = 0,01.
Выбор конкретных значений α и β зависит от конкретной стоимости последствий, вызываемых ошибками 1-го и 2-го рода.
1.5. Использование z-критерия для проверки гипотезы о математическом ожидании при известном стандартном отклонении
В общей теории управления указывается, что основным и первоочередным этапом управления в любой сфере или отрасли деятельности должен быть этап по формированию цели (или целевой функции), которую необходимо достичь, используя для ее реализации определенные силы и средства. Однако какие бы средства для практической реализации цели не выделялись, она не может быть выполнена «идеально» в точности с планируемыми требованиями. Она, в процессе ее реализации, отличается от запланированного либо по темпам, либо по срокам, либо по качеству исполнения, особенно, если к ее реализации подходить с системных позиций, учитывая дестабилизирующие массовые процессы и явления. Поэтому при создании и производстве любого вида продукции4 на номинальные значения ее определяющих параметров задаются возможные вариации (допуска), в пределах которых качество продукции остается приемлемым. Для гарантии того, что параметры продукции находятся в допустимых пределах, необходимо периодически проводить проверки – проверки качества. Но всю продукцию не проверишь. А раз так, то о качестве продукции можно судить только с некоторой вероятностью. Поэтому по результатам испытаний выдвигаются статистические гипотезы – нулевая H0 и альтернативная H1 - гипотезы, которые, в общем случае, можно определить так:
H0 – продукция или процесс соответствуют требованиям;
H1 - продукция или процесс не соответствуют требованиям.
Процесс принятия решения в пользу той или иной гипотезы существенно зависит от субъективного восприятия понятий того, какие отклонения от установленных значений следует считать «большие отклонения», а какие - «небольшие отклонения». Проверка гипотез позволяет формализовать эти понятия и оценить вероятность того, при каких условиях нулевая гипотеза является истинной. Для этого сначала вычисляется выборочная статистика (например, выборочное среднее), а затем устанавливается критическое значение статистики, которое, как правило, определяют по таблицам стандартизованного нормального распределения (Z-критерий) или распределения Стьюдента (t- критерий).
Рассмотрим следующий сценарий процесса проверки гипотез, опираясь на Z-критерий.
Упражнение 1.
В
составе одной таблетки нового
полусинтетического антибиотика Аугментин
должно
содержаться 125 мг клавулановой кислоты.
Для всех возможных видов дозировок
лекарства определены вариации веса для
клавулановой кислоты, которые выражаются
стандартным отклонением σ
= ± 1
мг. Процесс качества производства
антибиотика состоит в том, что периодически
контролируются приготовленные дозы
клавулановой кислоты. Каждая доза
взвешивается, вычисляется средний вес
выборки (
),
а затем оценивается - существенно ли
отклонение среднего веса
от номинального
значения
μ
= 125 мг. По результатам этих вычислений
принимается решение: нулевая гипотеза
верна или ложна.
Нулевая и альтернативная гипотезы формулируются так:
H0: μ = 125,
H1: μ ≠ 125.
Если стандартное отклонение σ известно, а выборочное распределение средних значений подчиняется нормальному закону, то для проверки гипотезы о качестве процесса производства нового антибиотика может быть применен Z-критерий о математическом ожидании при известном стандартном отклонении:
(1)
Числитель формулы (1) представляет собой отклонение выборочного среднего от математического ожидания генеральной совокупности. Знаменатель формулы (1) равен стандартному отклонению σ (принятому для всей генеральной совокупности лекарств), деленному на корень квадратный из объема выборки n. Статистику Z именуют квантилем нормального распределения. Статистика Z определяет площадь под кривой нормального распределения, внутри которой находится значение .
Пусть в процессе контроля качества приготовления доз клавулановой кислоты для выборки объема n = 30 получено среднее = 124,79 мг.
Необходимо принять решение в пользу нулевой или альтернативной гипотезы, определив, существенно ли отклонение 124,79 мг от величины 125 мг?
По формуле (1) имеем:
Чтобы принять окончательное решение надо сравнить расчетное значение Z с критическим Zкр., величина которого определяет принятую достоверность контроля. Если уровень значимости α = 0,05, то размер критической области (области отклонения гипотезы H0) также равен 0,05. Следовательно, можно определить критическое значение нормального распределения, выраженное через стандартизованную Z-статистику. Поскольку критическая область разделена на две части (так называемый двусторонний критерий), число 0,05 также следует разделить на два. Таким образом, площадь критической области, ограниченная хвостом гауссовой кривой и нижним критическим значением, равна 0,025. Соответственно, площадь области, ограниченной гауссовой кривой и верхним критическим значением, равна 0,975. По таблице, содержащей значения стандартизованного нормального распределения, легко определить критические значения, разделяющие области принятия и отклонения гипотезы. Они равны -1,96 и +1,96.
Эта ситуация проиллюстрирована на рис. 2. Если значение статистики Z меньше -1,96 или больше +1,96, величина «существенно» (статистически) далека от значения μ = 125, и гипотезу H0 нельзя признать истинной.
Следовательно, решающее правило выглядит следующим образом:
Если Z > +1,96 или Z < -1,96, гипотеза H0 отклоняется; в противном случае она не отклоняется.
Поскольку Z = - 1,15, и -1,96 < -1,15 < +1,96, то нет оснований для отклонения гипотезы H0. Таким образом, следует признать, что средний вес приготавливаемых доз клавулановой кислоты равен 125 мг. Чтобы учесть ошибку 2-го рода, результат необходимо сформулировать так: «Гипотеза о том, что средний вес доз отличается от 125 мг, не имеет достаточных подтверждений».
Алгоритм проверки гипотезы о математическом ожидании при известном стандартном отклонении имеет следующий вид:
1. Формулируется нулевая гипотеза H0 о параметрах генеральной совокупности.
2. Формулируется альтернативная гипотеза H1 о параметрах генеральной совокупности.
3. Выбирается уровень значимости α. Как правило, его конкретная величина рядом значений: 0,05; 0,01; 0,1.
4. Выбирается требуемый статистический метод и соответствующая статистика, положенная в основу критерия. Поскольку в нашем примере стандартное отклонение известно заранее, для проверки критерия применяется Z-статистика.
5. Устанавливаются критические значения, разделяющие плоскость на области отклонения и принятия гипотезы. В нашем примере критическими значениями являются числа -1,96 и +1,96, поскольку статистика Z имеет стандартизованное нормальное распределение, уровень значимости α = 0,05.
6. Определяется объем выборки n, зависящий от величины риска, вызванного ошибками 1-го и 2-го рода (т.е. от величин α и β), а также от затрат, необходимых для ее формирования.
7. По выборке вычисляется значение Z - статистики, положенной в основу критерия. В нашем примере Z = -1,15.
8. Определяется область, в которую попадает вычисленное значение статистики, положенной в основу критерия. Для этого статистика сравнивается с критическими значениями. В нашем примере вычисленное значение Z =-1,15 лежит в области принятия гипотезы, поскольку
-1,96 < - 1,15 < +1,96.
9. Принимается статистическое решение. Если статистика, положенная в основу критерия, попадает в область принятия гипотезы, нулевую гипотезу H0 отклонять нельзя. В противном случае нулевая гипотеза отклоняется. В нашем примере нулевая гипотеза не была отвергнута.
10. Формулируется статистическое решение, учитывающее специфику задачи. В нашем примере гипотеза о том, что средний вес доз отличается от 125 мг, не имеет достаточных подтверждений.