Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Глава 14. ПРОВЕРКА СТАТИСТИЧЕСКИХ.doc
Скачиваний:
4
Добавлен:
10.09.2019
Размер:
118.27 Кб
Скачать

Критическая область и область допустимых значений

Все возможное множество выборок объема п можно раз­делить на два непересекающихся подмножества (обозначим их через О и W), таких, что проверяемая гипотеза H0 долж­на быть отвергнута, если наблюдаемая выборка попадет в подмножество W, и принята, если выборка принадлежит подмножеству О.

Определение 14.4. Подмножество W выборок таких, что проверяемая гипотеза Н0 должна быть отвергнута, на­зывают критической областью; О выборок таких, что про­веряемая гипотеза Н0 должна быть принята,— областью допустимых значений.

Так как подмножество О состоит из всех тех выборок, которые не вошли в подмножество W, то подмножество W однозначно определяет подмножество О, и наоборот, т.е. необходимо определить одно подмножество, второе же по­лучается автоматически единственным образом.

Возникает вопрос о том, какими принципами следует руководствоваться при построении критической области W. Эти принципы были сформулированы в работах известных математиков Е. Неймана и Э. Пирсона. При выборе крити­ческой области следует иметь в виду, что принимая или от­клоняя гипотезу Н0, можно допустить ошибки двух видов.

Определение 14.5. Ошибка первого рода состоит в том, что нулевая гипотеза Н0 отвергается, т.е. принимается гипотеза в то время как в действительности все же верна гипотеза Н0.

Определение 14.6. Ошибка второго рода состоит в том, что гипотеза Н0 принимается, в то время как верна гипо­теза

Рассмотренные случаи наглядно иллюстрирует сле­дующая таблица:

Гипотеза Н0

Верна

Неверна

Отвергается

Ошибка 1-го рода

Правильное решение

Принимается

Правильное решение

Ошибка 2-го рода

Вероятности ошибок первого и второго рода однозначно определяются выбором критической области W. Для любой заданной критической области W условимся обозначать через вероятность ошибки первого рода (уровень значи­мости), через β — вероятность ошибки второго рода (мощ­ность критерия).

При большом количестве выборок можно сказать, что доля ложных заключений равна а, если верна гипотеза Н0, и β, если верна гипотеза .

В теории статистической проверки гипотез доказывается, что при фиксированном объеме выборки соответствующий выбор критической области ^позволяет сделать как угод­но малой либо либо

При фиксированном объеме выборки принято задавать вероятность ошибки первого рода = 1 - , где — вероят­ность значимости гипотезы HQ. Если вероятность, с которой мы хотим определить достоверность предположения Н0, = 0,95, то уровень значимости равен 0,05. Обычно уро­вень значимости а не превышает 0,1.

Методы оценки статистических гипотез

Проверка статистических гипотез осуществляется с по­мощью выбранного статистического критерия.

Определение 14.7. Статистическим критерием называ­ют правило, которое позволяет оценить меру расхожде­ния результатов, полученных при оценке выборочного наблюдения и основной выдвинутой гипотезы Н0

Статистический критерий подбирается в каждом отдель­ном случае таким образом, чтобы он соответствовал принципу отношения правдоподобия. Критерий К с известной функцией плотности f(k) позволяет при заданном уровне значимости определить критическую точку распреде­ления f(k), которая разделяет область значений критерия на две части: область допустимых значений, в которой резуль­таты выборочного исследования выглядят более правдопо­добно, и критическую область, в которой результаты вы­борочного наблюдения менее правдоподобны в отношении гипотезы H0. Обычно определяется по таблице соот­ветствующего распределения.

Значение критерия на основе выборочного наблюдения определяется по специальным правилам и называется на­блюдаемым значением критерия Кнабл

Определение 14.8. Если наблюдаемое значение критерия попадает в область допустимых значений О, значит, на ос­нове выборочных данных на принятом уровне значимо­сти можно принять нулевую гипотезу Н0 как более прав­доподобную для результатов выборочного исследования, и отклонить альтернативную.

Определение 14.9. Если же наблюдаемое значение крите­рия попадает в критическую область W, то нулевая гипо­теза отклоняется в пользу альтернативной гипотезы .

Критическая область может быть односторонней (лево­сторонней и правосторонней) или двухсторонней в зависи­мости от того, как задана конкурирующая гипотеза .

В том случае, когда конкурирующая гипотеза . — пра­восторонняя, то и критическая область — правосторонняя (рис 14.1). Тогда, если Кнабл попадает в интервал от до

, то нулевая гипотеза принимается, а альтернативная от­клоняется. Если же Кнабл > , то нулевая гипотеза откло­няется в пользу альтернативной.

В том случае, когда конкурирующая гипотеза Н1 лево­сторонняя, то и критическая область левосторонняя (рис. 14.2). Тогда, если Кнабл лежит в интервале от до , то нуле­вая гипотеза отклоняется в пользу альтернативной. Если же Кнабл > , то нулевая гипотеза принимается, а альтер­нативная отклоняется.

Если конкурирующая гипотеза Н1 двухсторонняя, то и критическая область, двухсторонняя (рис. 14.3). Тогда ну­левая гипотеза принимается, если < Кнабл< ,и от­клоняется в противном случае в пользу альтернативной.

Проверка выдвинутого в процессе анализа или исследо­вания предположения выполняется обычно по следующе­му плану:

  1. выдвигается нулевая гипотеза Н0;

  2. формулируется альтернативная гипотеза Н1;

  3. задается уровень значимости , удовлетворяющий ис­следователя;

4) подбирается наиболее мощный критерий оценки гипотезы по статистическим данным. Чаще всего это:

и — нормальное распределение;

2 — распределение Пирсона хи- квадрат;

t — распределение Стьюдента;

F— распределение Фишера- Снедекора;

  1. вычисляется экспериментальное значение критерия на основе выборочных данных;

  2. определяется табличное значение критерия. В зависимо­сти от вида альтернативной гипотезы в соответствующей таблице выбирают квантили критерия для двусторонней и или односторонней области ( или );

  3. табличное значение критерия определяет точку , ко­торая отделяет критическую область W от области допу­стимых значений;

  4. если значение Кнаб находится в области допустимых зна­чений О, то на уровне значимости а нулевая гипотеза принимается, а конкурирующая отклоняется;

  5. если вычисленное по выборочным данным значение Кнаб , попадает в критическую область, то нулевая гипо­теза отклоняется в пользу конкурирующей гипотезы.

Вопросы для самоконтроля

  1. Когда и с какой целью используется проверка статисти­ческих гипотез?

  2. Какую гипотезу называют нулевой?

  3. Определите правила, которыми следует руководствовать­ся при построении критической области.

  4. Какую гипотезу называют конкурирующей?

  5. Что такое уровень значимости?

  6. Объясните смысл ошибок первого и второго рода.

  7. Как определяются ошибки статистической проверки ги­потез?

8 Что называют наблюдаемым значением критерия?

9 Какие виды статистических критериев вам известны?

  1. Какие распределения используются в качестве критериев?

  2. По каким формулам вычисляются наблюдаемые значе­ния критерия, полученные на основе выборочных дан­ных?

  3. Если найдена левосторонняя критическая область, то при каком условии нулевую гипотезу принимают?

  4. Какая из случайных величин служит для проверки ги­потезы о нормальном законе распределения генераль­ной совокупности?

  5. Если найдена правосторонняя критическая область, то при каком условии нулевая гипотеза отклоняется?

  6. Какая из случайных величин служит для проверки ги­потезы о равенстве генеральной средней нормальной совокупности, дисперсия которой известна предпола­гаемому значению?

  7. В том случае если конкурирующая гипотеза — пра­восторонняя, то где определяется критическая область?

  8. Если Гнабл попадает в интервал от до при лево­сторонней конкурирующей гипотезе, то принимается или отклоняется нулевая гипотеза?

  9. Какой критерий следует использовать при проверке ги­потезы о нормальном распределении?

  10. Как вычисляется наблюдаемое значение критерия, если надо проверить гипотезу о том, что неизвестная гене­ральная средняя нормальной совокупности точно рав­на определенному числу, когда дисперсия генеральной совокупности не известна при малой выборке?

  11. Как проверить гипотезу о том, что неизвестная гене­ральная средняя нормальной совокупности точно рав­на числовому значению, когда дисперсия генеральной совокупности известна при большой выборке?

Какой критерий служит для сравнения двух средних нор­мально распределенных генеральных совокупностей, генеральные дисперсии которых известны и независи­мые выборки большие?

  1. Опишите метод сравнения двух средних нормально рас­пределённых генеральных совокупностей при неизвес­тных генеральных дисперсиях.

  2. Как проверить гипотезу о том, что неизвестная гене­ральная доля точно равна определенному числу?

  1. Какой критерий служит для сравнения двух средних нормально распределенных совокупностей, генеральные дисперсии которых известны и независимы выборки большие?

  2. Опишите метод сравнения двух средних нормально распределенных генеральных совокупностей при неизвестных генеральных дисперсиях.

  3. Как проверить гипотезу о том, что неизвестная генеральная доля точно равна определенному числу?