Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
otvety_matstat.docx
Скачиваний:
66
Добавлен:
22.09.2019
Размер:
5.97 Mб
Скачать
  1. Сущность метода минимума риска при решении задачи проверки гипотез. Сформулируйте оптимальное решающее правило. Ошибки первого и второго рода. Сущность метода

Множество всех значений критерия разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается; другое – при которых она принимается.

Критической областью называется совокупность значений критерия, при которых нулевую гипотезу отвергают.

Областью принятия гипотезы (областью допустимых значений) называется совокупность значений критерия, при которых нулевую гипотезу принимают.

Обозначим критическую область .

Если вычисленное по выборке значение критерия попадает в критическую область , то гипотеза отвергается и принимается гипотеза . В этом случае можно совершить ошибку первого рода, вероятность которой равна . Иначе, вероятность того, что критерий примет значение из критической области , должна быть равна заданному значению , то есть .

Критическая область определяется неоднозначно. Возможны три случая расположения . Они определяются видом нулевой и альтернативной гипотез и законом распределения критерия .

Правосторонняя критическая область (рис.4 а) состоит из интервала , где определяется из условия и называется правосторонней точкой, отвечающей уровню значимости .

Левосторонняя критическая область (рис.4 б) состоит из интервала , где определяется из условия и называется левосторонней точкой, отвечающей уровню значимости .

Двусторонняя критическая область (рис.4 в) состоит из следующих двух интервалов: и , где точки и определяются из условий и

и называются двусторонними критическими точками.

Рис.4

§ 2. Ошибки первого и второго рода

Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки. Поскольку проверку производят статистическими методами, ее называют статистической. В итоге статистической проверки гипотезы в двух случаях может быть принято неправильное решение, т. е. могут быть допущены ошибки двух родов.

Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза.

Ошибка второго рода состоит в том, что будет принята неправильная гипотеза.

Подчеркнем, что последствия этих ошибок могут оказаться весьма различными. Например, если отвергнуто правильное решение, «продолжать строительство жилого дома», то эта ошибка первого рода повлечет материальный ущерб; если же принято неправильное решение «продолжать строительство», несмотря на опасность обвала стройки, то эта ошибка второго рода может повлечь гибель людей. Можно привести примеры, когда ошибка первого рода влечет более тяжелые последствия, чем ошибка второго рода.

Замечание 1. Правильное решение может быть принято также в двух случаях:

1) гипотеза принимается, причем и в действительности она правильная;

2) гипотеза отвергается, причем и в действительности она неверна.

Замечание 2. Вероятность совершить ошибку первого рода принято обозначать через α; ее называют уровнем значимости. Наиболее часто уровень значимости принимают равным 0,05 или 0,01. Если, например, принят уровень значимости, равный 0,05, то это означает, что в пяти случаях из ста имеется риск допустить ошибку первого рода (отвергнуть правильную гипотезу).

26. Идея применения критериев согласия при решении задачи о согласованности теоретического и статистического распределения. Статистический критерий проверки нулевой гипотезы. Критерий Фишера-Снедекора.

Идея применения критериев согласия заключается в следующем.

На основании данного статистического материала нам предстоит проверить гипотезу  , состоящую в том, что случайная величина   подчиняется некоторому определенному закону распределения. Этот закон может быть задан в той или иной форме: например, в виде функции распределения   или в виде плотности распределения   или же в виде совокупности вероятностей  , где   - вероятность того, что величина   попадет в пределы  -го разряда.

Рис. 7.6.1

Так как из этих форм функция распределения   является наиболее общей и определяет собой любую другую, будем формулировать гипотезу  , как состоящую в том, что величина   имеет функцию распределения  .

Для того чтобы принять или опровергнуть гипотезу  , рассмотрим некоторую величину  , характеризующую степень расхождения теоретического и статистического распределений. Величина   может быть выбрана различными способами; например, в качестве   можно взять сумму квадратов отклонений теоретических вероятностей   от соответствующих частот   или же сумму тех же квадратов с некоторыми коэффициентами («весами»), или же максимальное отклонение статистической функции распределения   от теоретической   и т. д. Допустим, что величина   выбрана тем или иным способом. Очевидно, это есть некоторая случайная величина. Закон распределений этой случайной величины зависит от закона распределения случайной величины  , над которой производились опыты, и от числа опытов  . Если гипотеза   верна, то закон распределения величины   определяется законом распределения величины   (функцией  ) и числом  .

Допустим, что этот закон распределения нам известен. В результате данной серии опытов обнаружено, что выбранная нами мера расхождения   приняла некоторое значение  . Спрашивается, можно ли объяснить это случайными причинами или же это расхождение слишком велико и указывает на наличие существенной разницы между теоретическим и статистическим распределениями и, следовательно, на непригодность гипотезы  ? Для ответа на этот вопрос предположим, что гипотеза   верна, и вычислим в этом предположении вероятность того, что гипотеза   верна, и вычислим в этом предположении вероятность того, что за счет случайных причин, связанных с недостаточным объемом опытного материала, мера расхождения   окажется не меньше, чем наблюденное нами в опыте значение  , т. е. вычислим вероятность события:

.

Если эта вероятность весьма мала, то гипотезу   следует отвергнуть как мало правдоподобную; если же эта вероятность значительна, следует  признать, что экспериментальные данные не  противоречат гипотезе  .

Возникает вопрос о том, каким же способом следует выбирать меру расхождения  ? Оказывается, что при некоторых способах ее выбора закон распределения величины   обладает весьма простыми свойствами при достаточно большом   практически не зависит от функции  . Именно такими мерами расхождения и пользуются в математической статистике в качестве критериев согласия.

Статистической называют гипотезу о виде неизвестного распределения или о параметрах известных распределений.

Нулевой (основной) называют выдвинутую гипотезу H0.

Конкурирующей (альтернативной) называют гипотезу Н1 которая противоречит нулевой.

Различают гипотезы, которые содержат одно и более одного предположений.

Простой называют гипотезу, содержащую только одно предположение.

Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.

Статистическим критерием (или просто критерием) называют случайную величину K, которая служит для проверки гипотезы.

Критерий Фишера-Снедекора

По независимым выборкам, объемы которых n1, n2, извлеченным из нормальных генеральных совокупностей, найдены исправленные выборочные дисперсии s2х и s2у. Требуется сравнить эти дисперсии.

Правило 1. Для того чтобы при заданном уровне значимости α проверить нулевую гипотезу H0: D(X)=D(Y) о равенстве генеральных дисперсий нормальных совокупностей при конкурирующей гипотезе H1:D(X)>D(Y), надо вычислить наблюдаемое значение критерия(отношение большей исправленной дисперсии к меньшей) Fнабл=S2б/S2м и по таблице критических точек распределения ФишераСнедекора, по заданному уровню значимости α и числам степеней свободы k1=n1—1, k2 = n2—1 найти критическую точку Fкр(α; k1; k2). Если Fнабл <Fкр— нет оснований отвергнуть нулевую гипотезу. Если Fнабл >Fкрнулевую гипотезу отвергают.

Правило 2. При конкурирующей гипотезе H1:D(X)≠D(Y) критическую точку Fкр (а/2; k1; k2) ищут по уровню значимости а/2(вдвое меньшему заданного) и числам степеней свободы k1 и k2.

27. Понятие критической области, критические точки, область принятия гипотезы. Левосторонняя и двусторонняя критическая область. Методика отыскания правосторонней критической точки. Мощность критерия.

Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.

Областью принятия гипотезы(областью допустимых значений) называют совокупность значений критерия, при которых нулевую гипотезу принимают.

Основной принцип проверки статистических гипотез: если наблюдаемое значение критерия принадлежит критической области, то нулевую гипотезу отвергают; если наблюдаемое значение критерия принадлежит области принятия гипотезы, то гипотезу принимают.

Критическими точками(границами) kкр называют точки, отделяющие критическую область от области принятия гипотезы.

Правосторонней называют критическую область, определяемую неравенством К > kкр, где kкр—положительное число.

Левосторонней называют критическую область, определяемую неравенством К < kкр, где kкр —отрицательное число.

Двусторонней называют критическую область, определяемую неравенством К<k1; К>k2, где k2>k1. В частности, если критические точки симметричны относительно нуля, то двусторонняя критическая область определяется неравенствами (в предположении, что kкр>0) К<—kкр; К > kкр

или равносильным неравенством |K|>kкр.

Для отыскания критической области задаются уровнем значимости α и ищут критические точки, исходя из следующих соотношений:

а) для правосторонней критической области Р{К>kкр)=α (kкр>0);

б) для левосторонней критической области Р{К<kкр)=α (kкр<0);

в) для двусторонней симметричной области Р(К>kкр)=α/2; Р(К<-kкр)=а/2 (kкр>0);

Мощностью критерия называют вероятность попадания критерия в критическую область при условии, что справедлива конкурирующая гипотеза. Другими словами, мощность критерия есть вероятность

того, что нулевая гипотеза будет отвергнута, если верна конкурирующая гипотеза.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]