- •Тема 1. Вариационные ряды и их характеристики
- •1.1. Выборка и генеральная совокупность
- •1.2. Вариационные ряды и их графическое изображение
- •Пользуясь формулой, вычисляем накопленные частоты интервалов. В частности,
- •1 .3. Статистические характеристики вариационного ряда
- •Тема 2. Статистические оценки параметров распределения
- •( Число степеней свободы)
- •Тема 3. Статистическая проверка гипотез
- •Тема 4. Корреляционный и регрессионный анализ
- •4.1. Корреляционный анализ
- •Пример 2. Определить тесноту взаимосвязи между результатами, показанными легкоатлетами в беге на 100 м, и местом, занятым ими же в соревновании по тройному прыжку. Данные приведены в табл.
- •4.2. Оценка достоверности коэффициента корреляции
- •4.3. Регрессионный анализ
Тема 3. Статистическая проверка гипотез
Статистической называют гипотезу о виде закона распределения или о параметрах известного распределения. В первом случае гипотеза непараметрическая, во втором – параметрическая.
Гипотеза Н0, подлежащая проверке, называется нулевой (основной). Наряду с нулевой рассматривают гипотезуН1, которая будет приниматься, если отклоняется Н0. Такая гипотеза называется альтернативной (конкурирующей). Например, если проверяется гипотеза о равенстве параметра Θ некоторому значению Θ0, т.е. Н0: Θ= Θ0, то в качестве альтернативной могут рассматриваться следующие гипотезы:
; ; ; .
Выбор альтернативной гипотезы определяется конкретной формулировкой задачи.
Гипотезу называют простой, если она содержит одно конкретное предположение. Гипотезу называют сложной, если она состоит из конечного или бесконечного числа простых гипотез (; ; ).
Сущность проверки статистической гипотезы заключается в том, чтобы установить, согласуются или нет данные наблюдений и выдвинутая гипотеза. Эта задача решается с помощью специальных методов математической статистики – методов статической проверки гипотез.
При проверке гипотезы выборочные данные могут противоречить гипотезе Но. Тогда она отклоняется. Если же статистические данные согласуются с выдвинутой гипотезой, то она не отклоняется. В последнем случае часто говорят, что нулевая гипотеза принимается (такая формулировка не совсем точна, однако она широко распространена). Статистическая проверка гипотез на основании выборочных данных неизбежно связана с риском принятия ложного решения. При этом возможны ошибки двух родов.
Ошибка первого рода состоит в том, что будет отвергнута правильная нулевая гипотеза.
Ошибка второго рода состоит в том, что будет принята нулевая гипотеза, в то время как в действительности верна альтернативная гипотеза.
Возможные результаты статистических выводов представлены следующей таблицей:
Результаты про верки гипотезы |
Возможные состояния гипотезы |
|
|
|
|
верна Но |
верна Н1 |
|
Гипотеза Но отклоняется |
Ошибка первого рода |
Правильный вывод |
Гипотеза Но не отклоняется |
Правильный вывод |
Ошибка второго рода |
Последствия указанных ошибок неравнозначны. Первая приводит к более осторожному, консервативному решению, вторая - к неоправданному риску. Что лучше или хуже - зависит от конкретной постановки задачи и содержания нулевой гипотезы. Например, если Но состоит в признании продукции предприятия качественной и допущена ошибка первого рода, то будет забракована годная продукция. Допустив ошибку второго рода, мы отправим потребителю брак. Очевидно, последствия второй ошибки более серьезны с точки зрения имиджа фирмы и ее долгосрочных перспектив.
Исключить ошибки первого и второго рода невозможно в силу ограниченности выборки. Поэтому стремятся минимизировать потери от этих ошибок. Отметим, что одновременное уменьшение вероятностей данных ошибок невозможно, так как задачи их уменьшения являются конкурирующими, и снижение вероятности допустить одну из них влечет за собой увеличение вероятности допустить другую. В большинстве случаев единственный способ уменьшения вероятности ошибок состоит в увеличении объема выборки.
Вероятность совершить ошибку первого рода принято обозначать буквой α, и ее называют уровнем значимости. Вероятность совершить ошибку второго рода обозначают β. Тогда вероятность не совершить ошибку второго рода (1 - β) называется мощностью критерия.
Обычно значения α задают заранее, «круглыми» числами (например, 0,1; 0,05; 0,01 и т.п.), а затем стремятся построить критерий наибольшей мощности. Таким образом, если α = 0,05, то это означает, что исследователь не хочет совершить ошибку первого рода более чем в 5 случаях из 100.
Общая схема проверки гипотез:
1. Формулировка проверяемой (нулевой - Но) и альтернативной (Н1) гипотез.
-
Выбор соответствующего уровня значимости α.
-
Определение объема выборки п.
-
Выбор критерия К для проверки Но.
-
Определение критической области и области принятия гипотезы.
-
Вычисление наблюдаемого значения критерия Кнабл.
-
Принятие статистического решения.