
- •Случайные события. Действия над событиями.
- •Классическая вероятность и ее свойства.
- •Формулы комбинаторики. Гипергеометрическое распределение.
- •Условная вероятность. Независимость событий.
- •Формула полной вероятности. Формула Байеса.
- •Предельные теоремы в схеме Бернулли
- •7. Функция распределения вероятностей и ее свойства.
- •Плотность распределения вероятностей и ее свойства.
- •Математическое ожидание и его свойства
- •Дисперсия и ее свойства
- •Ковариация и коэффициент корреляции.
- •12. Основные дискретные распределения случайных величин. Биномиальное распределение
- •Распределение Пуассона
- •Геометрическое распределение
- •13.Равномерное и показательное распределения.
- •14.Нормальное распределение.
- •15.Закон больших чисел.
- •Неравенство Чебышева
- •Теорема Чебышева (Закон больших чисел)
- •16.Центральная предельная теорема.
- •17. Выборочный метод
- •18. Эмпирическая функция распределения и ее свойства
- •19.Гистограмма и полигон.
- •20. Числовые характеристики выборки
- •21. Точечное оценивание
- •22. Доверительные интервалы
- •23. Распределения х2, Стьюдента, Фишера.
- •24. Доверительные интервалы для оценки математического ожидания
- •25.Проверка статистических гипотез.
- •26. Критерий согласия Пирсона
- •27. Вычисления теоретических частот для нормального распределения
- •28.Парная регрессия.
- •29.Парный коэффициент корреляции, его свойства.
- •30. Проверка гипотезы о достоверности коэффициента корреляции.
25.Проверка статистических гипотез.
Статистической гипотезой называется гипотеза о виде неизвестного распределения или о параметрах известного распределения.
Нулевой или основной называется выдвинутая гипотеза H0 .
Конкурирующей или альтернативной называется гипотеза H1 , которая противоречит нулевой.
Для проверки нулевой гипотезы используют специально подобранную случайную величину, точное или приближенное значение которой известно. Эту величину обозначают через χ2 , если она распределена по закону «хи-квадрат», через Т – по за- кону Стьюдента, F – по закону Фишера и так далее.
В данном параграфе мы не принимаем во внимание распределение этой случайной величины, поэтому, в целях общности, обозначим ее через K.
Статистическим критерием называется случайная величина K, которая служит для проверки гипотезы H0 .
Для проверки гипотезы по данным выборки (выборок) вычисляют частные значения входящих в критерий величин, и получают наблюдаемое значение критерия Kнабл .
Значения статистического критерия, при которых H0 принимают, называются областью принятия гипотезы. Значения критерия, при которых гипотезу H0 отвергают, называется
критической областью. Точки, которые отделяют эти области, называют критическими.
Различают
левостороннюю, правостороннюю и
двустороннюю критические области.
Правосторонней называется критическая область (рис.15, a), определяемая неравенством К>Kкр, Kкр> 0
Левосторонней называется критическая область (рис.15, б) определяемая неравенством К<Kкр, Kкр< 0
Односторонней называют правостороннюю или левостороннюю критическую область.
Двусторонней называется критическая область, определяемая неравенством
К<K`кр, К< K``кр
В частности, если критические точки симметричны относительно нуля, то говорят о двусторонней симметрической критической области (рис. 15, с) |K|>Kкр, Ккр>0
При проверке статистических гипотез возможно возникновение ошибок.
Ошибка первого рода возникает, когда мы отвергаем правильную нулевую гипотезу. Вероятность совершить ошибку первого рода называется уровнем значимости и обозначается
α : P(H1 /H0 ) =α
Ошибка второго рода возникает, когда мы отвергаем правильную гипотезу H1 . Вероятность совершить ошибку второго рода обозначается β : P(H0 /H1 ) = β
Величину ошибки первого и второго рода исследователь выбирает самостоятельно близкую к нулю: 0,01; 0,05; 0,001.
Отметим, что невозможно одновременно уменьшать ошибки первого и второго рода.
Проверка статистических гипотез осуществляется следующим образом:
1) по выборке вычисляется наблюдаемое значение критерия (Кнабл);
2) если Кнабл попало в критическую область, то нулевую гипотезу отвергают, а если в область принятия гипотезы, то говорят, что нет оснований отвергнуть гипотезу H0 .
26. Критерий согласия Пирсона
Одной из основных задач математической статистики является установление закона распределения случайной величины на основании экспериментальных данных.
На практике о виде закона распределения можно судить по графику гистограммы. Параметры закона распределения обычно неизвестны и их заменяют на выборочные значения. Однако, как бы мы ни выбрали вид закона распределения и его параметры, полной уверенности в том, что мы получим истинный закон распределения, к которому принадлежит имеющаяся у нас выборка, не существует. Речь может идти лишь о том, что при определенном уровне значимости, выбранный нами закон согласуется с данными выборки.
Критерий проверки гипотезы о предполагаемом виде распределения называется критерием согласия. Наиболее распространенным из них является критерий согласия Пирсона или
критерий χ2 .
Пусть вид распределения изучаемого признака Х неизвестен и пусть есть основание предполагать, что он распределен по некоторой функции теоретического распределения F(x) . Сформулируем нулевую и альтернативную гипотезы. Пусть H0 : Fn (x) = F(x), H1 : Fn (x) ≠ F(x)
На основании данных выборки построим интервальный вариационный ряд. Для этого найдем:
1. xmin, xmax и размах варьирования R = xmax – xmin .
Весь интервал наблюдаемых значений Х разделим на k частичных интервалов (xi,xi+1) одинаковой длины, где k можно вычислить по формуле Стержеса k =3,32⋅ln n +1.
2. Подсчитаем эмпирические частоты ni – число вариант, попавших в интервал (xi,xi+1)
3. Затем вычислим вероятности pi попадания случайной величины в построенные интервалы, исходя из функции распределения F(x)
Pi = F (xi+1) − F (xi)
4. На основании теоремы Бернулли теоретические частоты вычислим по формуле ni'=npi
Критерий Пирсона позволяет ответить на вопрос, значимо ли различаются теоретические и эмпирические частоты. В качестве критерия проверки нулевой гипотезы принимается величина
χ2
(2.20)
Можно доказать, что при n→∞ закон распределения случайной величины (2.20) стремится к закону распределения χ2 ,поэтому случайная величина обозначается через χ2 , а сам критерий называют критерием согласия «хи-квадрат».
Число степеней свободы равно ν = k − r −1, где k – число частичных интервалов выборки, r – число оцениваемых параметров. В частности, для нормального распределения оценивают 2 параметра (математическое ожидание и среднее квадратическое отклонение), то есть r = 2. В этом случае ν = k − 3.
Проверим нулевую гипотезу, исходя из требований, что вероятность попадания критерия в правостороннюю критическую область равна принятому уровню значимости α :
χ2 > χкр2 )=α .
Значение критерия, вычисленное по данным наблюдений, обозначим через Χнабл2 и сформулируем правило проверки нулевой гипотезы.
Правило проверки нулевой гипотезы
Для того, чтобы при заданном уровне значимости α проверить гипотезу о соответствии выборочных данных закону F(x), надо вычислить наблюдаемое значение критерия
Затем по таблице критических точек распределения χ2 по заданному уровню значимости α и числу степеней свободы ν = k − r −1 найти критическую точку χкр2 (α, ν).
Если χ2 наб< χ2 кр , то нет оснований отвергнуть H0, следовательно, признак Х распределен по закону F(x) .
Если χ2 наб ≥χ2 кр, то H0 отвергаем и принимаем Н1, следовательно, признак Х распределен по другому закону.