- •Статистическая проверка гипотез.
- •2.1 Понятие о статистических гипотезах
- •2.2 Ошибки при проверке гипотез. Уровни статистической значимости
- •2.3 Статистические критерии
- •Подсчет критерия
- •Задача 5.1
- •Гипотезы:
- •§1. Статистическая и корреляционная зависимости.
- •§2. Форма и направление корреляционной связи: уравнение регрессии, линия регрессии. Линейная корреляция, коэффициенты регрессии
- •§3. Коэффициент корреляции.
- •§4. Понятие об однофакторном дисперсионном анализе.
2.2 Ошибки при проверке гипотез. Уровни статистической значимости
Статистическая проверка гипотез, основанная на экспериментальных, выборочных данных, неизбежно связана с риском (вероятностью) принять ложное решение. Ошибки, допускаемые при проверке гипотез можно разделить на два типа.
Отклонение гипотезы Н0, в то время как она верна |
- ошибка 1-го рода. Вероятность ошибки 1-го рода обозначается . Вероятность же правильного решения: . |
Принятие гипотезы Н0, в то время как она неверна |
- ошибка 2-го рода. Вероятность ошибки 2-го рода обозначается . |
Поскольку исключить ошибки при принятии статистических гипотез невозможно, то необходимо минимизировать возможные последствия, т. е. принятие неверной статистической гипотезы. В большинстве случаев единственный путь минимизации ошибок заключается в увеличении объема выборки.
При обосновании статистического вывода следует решить вопрос, где же проходит линия между принятием и отвержением нулевой гипотезы. Так как в эксперименте имеются случайные влияния, эта граница не может быть проведена абсолютно точно. Она базируется на понятии уровня значимости.
Статистическая значимость результата (p-уровень) – количественная мера уверенности в его «истинности». Более высокий p-уровень соответствует более низкой надежности (уровню доверия) результата: . Величину еще называют доверительной вероятностью. Уровень значимости р представляет собой вероятность ошибки, связанной с распространением наблюдаемого результата на генеральную совокупность. показывает, что имеет место 5% вероятность того, что найденная в выборке связь между переменными является лишь случайной особенностью данной выборки. Таким образом, уровень значимости – это вероятность того, что мы сочли различия существенными, а они на самом деле случайны. Если мы указываем, что различия достоверны на 1% уровне значимости (), то имеем в виду, что вероятность того, что они все-таки недостоверны, составляет 0,01. В сущности уровень значимости р представляет собой вероятность ошибки 1-го рода .
Любая гипотеза должна формулироваться, а уровень значимости задаваться исследователем всегда до получения экспериментальных данных, по которым эта гипотеза будет проверяться. При выборе уровня значимости исследователь исходит из практических соображений: какую вероятность ошибки он считает допустимой для его конкретной задачи.
Исторически сложилось, что в прикладных науках, использующих статистику, принято считать:
-
низшим уровнем статистической значимости 5%-ый уровень ;
-
достаточным – 1%-ый уровень ;
-
высшим - 0,1%-ый уровень .
Поэтому в статистических таблицах критических значений обычно приводятся значения критериев, соответствующих данным уровням статистической значимости. Как видим, наибольшая величина, или нижняя граница, уровня статистической значимости равна 0,05 – это означает, что допускается пять ошибок в выборе из ста элементов (случаев испытуемых).
Для некоторых критериев указан точный уровень для различных эмпирических значений. Заметим также, что в современных статистических пакетах для компьютеров используются не стандартные уровни значимости, а уровни, подсчитываемые непосредственно в процессе работы с соответствующим статистическим методом. Эти уровни могут иметь различное числовое выражение в интервале от 0 до 1.