
23. Ошибки первого и второго рода. Доверительная вероятность.
(см. частично вопрос №22, вторую половину отрывка titkova-matmetody.pdf с. 15)
с. 7 (103), 101.JPG
До сих пор под проверкой статистической гипотезы мы подразумевали процедуру определения надежности связи (р-уровня, как показателя статистической значимости). Однако в конечном итоге проверка статистической гипотезы должна заканчиваться принятием статистического решения о том, какая же гипотеза верна: нулевая — об отсутствии связи или альтернативная — о ее наличии. Соответственно, от этого зависит и окончательный, содержательный вывод исследования: подтверждена или нет исходная научная гипотеза.
Вполне очевидно, что основанием для принятия исследователем решения о том, какая гипотеза верна, является /^-уровень — вероятность того, что верна все-таки нулевая гипотеза. Чем меньше р-уровень, тем с большей уверенностью можно отклонить Но в пользу Н], тем самым подтвердив исходную содержательную гипотезу. Не менее очевидно и то, что, принимая решение, исследователь всегда допускает вероятность его ошибочности: ведь исследование проведено на выборке, а вывод делается в отношении генеральной совокупности. При отклонении Но в пользу Н, исследователь рискует, что связи на самом деле в генеральной совокупности нет. И наоборот, решение в пользу Но вовсе не исключает наличие связи. Рассмотрим возможные исходе! принятия решения в зависимости от действительного положения дел:
В действительности:
Решение н а н истинна
Неправильное решение, |
Правильное решение, |
ошибка I рода, |
вероятность = 1 — р |
вероятность = а |
(мощность или |
|
чувствительность критерия) |
Правильное решение, |
Неправильное решение, |
вероятность — 1 — а |
Ошибка 11 рода, |
(доверительная вероятность) |
вероятность = р |
Отклонить Н(1 (принять Н)
Принять Н
Как следует из таблицы, решение исследователя зависит от того, какую вероятность ошибки I рода а, он считает допустимой: если ^-уровень, полученный в процессе проверки гипотезы, меньше или равен а, исследователь отклоняет Но, и это, как правило, желательный для него результат (содержательная гипотеза подтверждается!). Отметим, что в этом случае вероятность ошибки известна, она меньше или равна а, точнее, равна /ьуровню. Если же /^-уровень превышает а, то принимается Но и содержательная гипотеза не подтверждается1. Но при этом вероятность ошибки II рода f$ — того, что верна все же Н] обычно остается неизвестной.
Рассмотрим соотношение ошибок I и II рода. Предположим, как и в прошлых примерах, проверяется гипотеза об отличии среднего значения от некоторой величины А. Нулевой гипотезе Но: М = А соответствует известное теоретическое распределение со средним А. Предположим также, что в генеральной совокупности на самом деле среднее значение больше А и равно В, а исследователь, как обычно, об этом даже и не догадывается. Этому положению дел будет соответствовать свое, «альтернативное» теоретическое распределение, сходное с распределением для Но, но со средним В (рис. 7.3). На рис. 7.3 видно, что с уменьшением а растет «доверительная вероятность» 1 — а, которая определяет величину отклонения выборочного среднего от А для принятия Н(); уменьшая а, исследователь увеличивает возможное отклонение выборочного среднего от Л, при котором принимается Но. Принятие Но при больших отклонениях выборочного среднего от А увеличивает вероятность ошибки II рода, р\ вероятность того, что на самом деле верна альтернативная гипотеза. Таким образом, снижение величины а увеличивает риск допустить ошибку IIрода — не обнаружить различия или связи, которые на самом деле существуют.
Вероятность (1 —13) называется мощностью (чувствительностью) критерия. Эта величина характеризует статистический критерий с точки зрения его способности отклонять Но, когда она не верна. Точное значение величины мощности критерия в большинстве случаев остается неизвестным. Величина(1 —а) характеризует степень доверия к результатам статистической проверки и называется доверительной вероятностью.
Итак, основная проблема статистического вывода заключается в том, что заранее должно быть установлено оптимальное значение величины а, удовлетворяющее двум противоречивым требованиям. Величина а должна быть достаточно мала, чтобы обеспечивать доверие к результатам исследования при отклонении Но. Величина а должна быть достаточно велика, чтобы отклонить Но при наличии связи (различий), не допуская ошибки II рода. Вопрос о том, какая же величина а является приемлемой, не имеет однозначного ответа. Есть лишь общие соображения, которыми можно руководствоваться при назначении а для статистического вывода:
Для установленного значения а вероятность ошибки (3 уменьшается с ростом объема выборки.
Вероятность ошибки (3 уменьшается при увеличении значения а (на пример, с 0,01 до 0,05).
Вопрос о величине а — вопрос о том, при каком же /7-уровне исследователь может отклонить Но, решается преимущественно исходя из неформальных соглашений, принятых на основе практического опыта в различных областях исследования. Традиционная интерпретация различных уровней значимости исходит из а = 0,05 и приведена в табл. 7.1. В соответствии с ней приемлемым для отклонения Но признается уровень р < 0,05. Такая относительно высокая вероятность ошибки I рода может быть рекомендована для небольших выборок (когда высока вероятность ошибки II рода). Если объемы выборок около 100 и более объектов, то порог отклонения Но целесообразно снизить до а = 0,01 и принимать решение о наличии связи (различий) при р < 0,01.
Таблица 7.1 Традиционная интерпретация уровней значимости при а = 0,05
Уровень значимости |
Решение |
Возможный статистический вывод |
р > 0,1 |
Принимается Но |
«Статистически достоверные различия не обнаружены» |
р<0,1 |
сомнения в истинности Н(), неопределенность |
«Различия обнаружены на уровне статистической тенденции» |
/?< 0,05 |
значимость, отклонение Н() |
«Обнаружены статистически достоверные (значимые) различия» |
р < 0,01 |
высокая значимость, отклонение Но |
«Различия обнаружены на высоком уровне статистической значимости» |
31. χ2-критерий Пирсона. Применение критерия для установления сходства-различия между эмпирическим и равномерным распределением.
с. 31 (123) 121.JPG