Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
II- Гипотезы БАЗА-1.doc
Скачиваний:
2
Добавлен:
01.04.2025
Размер:
675.33 Кб
Скачать

1.4. Риски, возникающие при принятии решений

В табл.1 показаны два возможных решения (принять или отклонить нулевую гипотезу Но) при проверке гипотез. Как видим, решение может оказаться правильным либо стать причиной ошибки 1- или 2-го рода3.

Ошибку 1-го рода можно уменьшить, увеличив объем выборки. Более крупные объемы выборки позволяют снизить отклонение выборочных статистик от оцениваемых параметров генеральной совокупности. При заданной ошибке 1-го рода α увеличение объема выборки приводит к уменьшению величины β и, следовательно, к возрастанию мощности критерия. Однако объем выборки нельзя увеличивать бесконечно.

Таблица 1

Проверка гипотез и принятие решения

Статистическое решение

Фактическая ситуация

Гипотеза Н0 верна

Гипотеза Н0 неверна

Гипотеза Н0 не отклоняется

Правильное решение

Доверительная вероятность равна 1-α

Ошибка 2-го рода

Вероятность ошибки 2-го рода равна β

Гипотеза Н0 отклоняется

Ошибка 1-го рода

Вероятность ошибки 1-го рода равна α

Правильное решение

Мощность критерия равна 1-β

Таким образом, необходимо найти компромисс между ошибками двух видов. Поскольку в нашем распоряжении находится лишь вероятность ошибки 1-го рода, следует уменьшить ее величину. Например, если при проверке гипотез ошибка 1-го рода приводит к крайне нежелательным последствиям, необходимо выбрать α = 0,01, а не α = 0,05. Однако при уменьшении величины α увеличивается величина β, следовательно, снижение вероятности ошибки 1-го рода сопровождается увеличением вероятности ошибки 2-го рода. С другой стороны, уменьшая вероятность β, мы увеличиваем вероятность α. Следовательно, если необходимо избежать ошибки 2-го рода, можно выбрать α = 0,05 или α = 0,1, а не α = 0,01.

Выбор конкретных значений α и β зависит от конкретной стоимости последствий, вызываемых ошибками 1-го и 2-го рода.

1.5. Использование z-критерия для проверки гипотезы о математическом ожидании при известном стандартном отклонении

В общей теории управления указывается, что основным и первоочередным этапом управления в любой сфере или отрасли деятельности должен быть этап по формированию цели (или целевой функции), которую необходимо достичь, используя для ее реализации определенные силы и средства. Однако какие бы средства для практической реализации цели не выделялись, она не может быть выполнена «идеально» в точности с планируемыми требованиями. Она, в процессе ее реализации, отличается от запланированного либо по темпам, либо по срокам, либо по качеству исполнения, особенно, если к ее реализации подходить с системных позиций, учитывая дестабилизирующие массовые процессы и явления. Поэтому при создании и производстве любого вида продукции4 на номинальные значения ее определяющих параметров задаются возможные вариации (допуска), в пределах которых качество продукции остается приемлемым. Для гарантии того, что параметры продукции находятся в допустимых пределах, необходимо периодически проводить проверки – проверки качества. Но всю продукцию не проверишь. А раз так, то о качестве продукции можно судить только с некоторой вероятностью. Поэтому по результатам испытаний выдвигаются статистические гипотезы – нулевая H0 и альтернативная H1 - гипотезы, которые, в общем случае, можно определить так:

H0продукция или процесс соответствуют требованиям;

H1 - продукция или процесс не соответствуют требованиям.

Процесс принятия решения в пользу той или иной гипотезы существенно зависит от субъективного восприятия понятий того, какие отклонения от установленных значений следует считать «большие отклонения», а какие - «небольшие отклонения». Проверка гипотез позволяет формализовать эти понятия и оценить вероятность того, при каких условиях нулевая гипотеза является истинной. Для этого сначала вычисляется выборочная статистика (например, выборочное среднее), а затем устанавливается критическое значение статистики, которое, как правило, определяют по таблицам стандартизованного нормального распределения (Z-критерий) или распределения Стьюдента (t- критерий).

Рассмотрим следующий сценарий процесса проверки гипотез, опираясь на Z-критерий.

Упражнение 1.

В составе одной таблетки нового полусинтетического антибиотика Аугментин должно содержаться 125 мг клавулановой кислоты. Для всех возможных видов дозировок лекарства определены вариации веса для клавулановой кислоты, которые выражаются стандартным отклонением σ = ± 1 мг. Процесс качества производства антибиотика состоит в том, что периодически контролируются приготовленные дозы клавулановой кислоты. Каждая доза взвешивается, вычисляется средний вес выборки ( ), а затем оценивается - существенно ли отклонение среднего веса от номинального значения μ = 125 мг. По результатам этих вычислений принимается решение: нулевая гипотеза верна или ложна.

Нулевая и альтернативная гипотезы формулируются так:

H0: μ = 125,

H1: μ ≠ 125.

Если стандартное отклонение σ известно, а выборочное распределение средних значений подчиняется нормальному закону, то для проверки гипотезы о качестве процесса производства нового антибиотика может быть применен Z-критерий о математическом ожидании при известном стандартном отклонении:

(1)

Числитель формулы (1) представляет собой отклонение выборочного среднего от математического ожидания генеральной совокупности. Знаменатель формулы (1) равен стандартному отклонению σ (принятому для всей генеральной совокупности лекарств), деленному на корень квадратный из объема выборки n. Статистику Z именуют квантилем нормального распределения. Статистика Z определяет площадь под кривой нормального распределения, внутри которой находится значение .

Пусть в процессе контроля качества приготовления доз клавулановой кислоты для выборки объема n = 30 получено среднее = 124,79 мг.

Необходимо принять решение в пользу нулевой или альтернативной гипотезы, определив, существенно ли отклонение 124,79 мг от величины 125 мг?

По формуле (1) имеем:

Чтобы принять окончательное решение надо сравнить расчетное значение Z с критическим Zкр., величина которого определяет принятую достоверность контроля. Если уровень значимости α = 0,05, то размер критической области (области отклонения гипотезы H0) также равен 0,05. Следовательно, можно определить критическое значение нормального распределения, выраженное через стандартизованную Z-статистику. Поскольку критическая область разделена на две части (так называемый двусторонний критерий), число 0,05 также следует разделить на два. Таким образом, площадь критической области, ограниченная хвостом гауссовой кривой и нижним критическим значением, равна 0,025. Соответственно, площадь области, ограниченной гауссовой кривой и верхним критическим значением, равна 0,975. По таблице, содержащей значения стандартизованного нормального распределения, легко определить критические значения, разделяющие области принятия и отклонения гипотезы. Они равны -1,96 и +1,96.

Эта ситуация проиллюстрирована на рис. 2. Если значение статистики Z меньше -1,96 или больше +1,96, величина «существенно» (статистически) далека от значения μ = 125, и гипотезу H0 нельзя признать истинной.

Следовательно, решающее правило выглядит следующим образом:

Если Z > +1,96 или Z < -1,96, гипотеза H0 отклоняется; в противном случае она не отклоняется.

Поскольку Z = - 1,15, и -1,96 < -1,15 < +1,96, то нет оснований для отклонения гипотезы H0. Таким образом, следует признать, что средний вес приготавливаемых доз клавулановой кислоты равен 125 мг. Чтобы учесть ошибку 2-го рода, результат необходимо сформулировать так: «Гипотеза о том, что средний вес доз отличается от 125 мг, не имеет достаточных подтверждений».

Алгоритм проверки гипотезы о математическом ожидании при известном стандартном отклонении имеет следующий вид:

1. Формулируется нулевая гипотеза H0 о параметрах генеральной совокупности.

2. Формулируется альтернативная гипотеза H1 о параметрах генеральной совокупности.

3. Выбирается уровень значимости α. Как правило, его конкретная величина рядом значений: 0,05; 0,01; 0,1.

4. Выбирается требуемый статистический метод и соответствующая статистика, положенная в основу критерия. Поскольку в нашем примере стандартное отклонение известно заранее, для проверки критерия применяется Z-статистика.

5. Устанавливаются критические значения, разделяющие плоскость на области отклонения и принятия гипотезы. В нашем примере критическими значениями являются числа -1,96 и +1,96, поскольку статистика Z имеет стандартизованное нормальное распределение, уровень значимости α = 0,05.

6. Определяется объем выборки n, зависящий от величины риска, вызванного ошибками 1-го и 2-го рода (т.е. от величин α и β), а также от затрат, необходимых для ее формирования.

7. По выборке вычисляется значение Z - статистики, положенной в основу критерия. В нашем примере Z = -1,15.

8. Определяется область, в которую попадает вычисленное значение статистики, положенной в основу критерия. Для этого статистика сравнивается с критическими значениями. В нашем примере вычисленное значение Z =-1,15 лежит в области принятия гипотезы, поскольку

-1,96 < - 1,15 < +1,96.

9. Принимается статистическое решение. Если статистика, положенная в основу критерия, попадает в область принятия гипотезы, нулевую гипотезу H0 отклонять нельзя. В противном случае нулевая гипотеза отклоняется. В нашем примере нулевая гипотеза не была отвергнута.

10. Формулируется статистическое решение, учитывающее специфику задачи. В нашем примере гипотеза о том, что средний вес доз отличается от 125 мг, не имеет достаточных подтверждений.