
- •Глава 5. Проверка статистических гипотез
- •5.1. Статистические гипотезы.
- •5.2. Статистические критерии.
- •5.3. Область принятия гипотезы. Критическая область. Критические точки
- •5.4. Нахождение критических точек
- •5.5. Проверка гипотезы о равенстве двух средних значений нормальных генеральных совокупностей
- •5.6. Проверка гипотезы о равенстве генеральной средней нормальной совокупности гипотетическому числовому значению
- •5.7. Проверка гипотез о соотношении двух дисперсий нормальных генеральных совокупностей
- •5.8. Проверка гипотезы о нормальности распределения генеральной совокупности
- •5.8.1. Критерий согласия χ 2 (“хи квадрат”) Пирсона
- •5.8.2. Метод вычисления теоретических частот нормального распределения. Пример применения критерия χ 2
- •5.9. Элементы дисперсионного анализа
- •5.9.1. Общая, факторная и остаточная суммы квадратов отклонений
- •5.9.2. Общая, факторная и остаточная дисперсии
- •5.9.3. Расчетная схема дисперсионного анализа
5.9.2. Общая, факторная и остаточная дисперсии
Исправленные общая, факторная и остаточная дисперсии получаются в результате деления сумм квадратов отклонений на соответствующие числа степеней свободы
,
,
(5.9)
где k – число уровней фактора,m – число измерений на каждом уровне фактора.
Число степеней свободы k(m-1) остаточной дисперсии равно разности между числами степеней свободы общей и факторной дисперсий: (mk-1) – (k – 1) =k(m-1).
5.9.3. Расчетная схема дисперсионного анализа
Пусть фактор существенно влияет на
признак X. В этом
случае групповые средниеизмеренных значений признакаX
должны различаться значимо. Поэтому
расчетная схема дисперсионного анализа
состоит в проверке при заданном уровне
значимости нулевой гипотезы о равенстве
групповых средних. При этом предполагается,
что значения признака
X , соответствующие разным уровням фактора (т.е. попадающие в разные группы), распределены нормально и имеют одинаковые (неизвестные) дисперсии.
Пусть нулевая гипотеза о равенстве нескольких групповых средних является правильной. В этом случае факторная и остаточная дисперсии будут различаться незначимо. Сравнение этих дисперсий по критерию Фишера-Снедекора покажет, что нулевую гипотезу о равенстве факторной и остаточной дисперсий следует принять. Таким образом, если нулевая гипотеза о равенстве групповых средних верна (это означает, что фактор несущественно влияет на признак X), то верна и нулевая гипотеза о равенстве факторной и остаточной дисперсий.
Пусть нулевая гипотеза о равенстве
групповых средних не верна. В этом случае
из-за того, что различие между групповыми
средними существенно, факторная дисперсия
и наблюдаемое значение Fнабл=/
критерия
Фишера-Снедекора будут велики. В
результатеFнабл окажется большеFкри нулевая гипотеза о равенстве факторной
и остаточной дисперсий должна быть
отвергнута. Таким образом, если нулевая
гипотеза о равенстве групповых средних
является ложной (это означает, что фактор
существенно влияет на признакX), то ложной будет и нулевая гипотеза о
равенстве факторной и остаточной
дисперсий.
Справедливы и обратные утверждения, на которых и основана расчетная схема дисперсионного анализа:
1. Если нулевая гипотеза о равенстве факторной и остаточной дисперсий верна, то верна и нулевая гипотеза о равенстве групповых средних (это означает, что фактор несущественно влияет на признак X ).
2. Если нулевая гипотеза о равенстве факторной и остаточной дисперсий неверна, то неверна и нулевая гипотеза о равенстве групповых средних (это означает, что разброс групповых средних велик и фактор существенно влияет на признак X ).
Если установлено, что фактор существенно влияет на признак, и далее требуется выяснить, какой уровень фактора оказывает наибольшее воздействие, то производят попарное сравнение групповых средних с помощью критерия Стьюдента.
Вопросы и задачи
Дайте определение понятия “статистический критерий”? Что такое наблюдаемое значение статистического критерия?
Дайте определения понятий: “критическая область”, “область принятия гипотезы” , “критическая точка”.
Сформулируйте основной принцип проверки статистических гипотез.
Из нормальных генеральных совокупностей X и Y извлечены независимые выборки объемовn= 45 иn= 50 соответственно. По этим выборкам найдены выборочные средние
= 16,1 и
= 14,4 , а также исправленные выборочные дисперсииs2(X) = 5,71 иs2(Y) = 4,87. При уровне значимости α = 0,05 проверить нулевую гипотезуН0 :M(X) =M(Y) о равенстве математических ожиданий признаковX и Y при конкурирующих гипотезах:
а) Н1 :M(X) ≠M(Y) ; б)Н1 :M(X) >M(Y) ; с)Н1 :M(X) <M(Y) .
5. Из нормальной генеральной совокупности
Xизвлечена выборка
объемаn= 40 и найдены
выборочная средняя=
3,9 и исправленное среднее квадратичное
отклонение
s = 0,81. При уровне значимости 0,05 проверить нулевую гипотезуН0 :M(X) = 3,1 , о равенстве математического ожидания признакаX гипотетическому значению 3,1 , если противоречащая гипотезаН1 :M(X) ≠ 3,1 .
6. Из нормальных генеральных совокупностей X и Y извлечены независимые выборки объемовn= 25 иn= 20 соответственно. По этим выборкам найдены исправленные выборочные дисперсииs2(X) = 4,8 иs2(Y) = 4,1. При уровне значимости 0,05 проверить нулевую гипотезуН0 :D(X) =D(Y) о равенстве о равенстве генеральных дисперсий при конкурирующей гипотезеН1 :D(X) >D(Y).
7. Проверить гипотезу о нормальности распределения значений признака в генеральной совокупности, если известны эмпирические и теоретические частоты:
эмпирические частоты 4 6 13 31 42 41 29 18 7 3
теоретические частоты 3 7 12 29 47 39 33 18 8 4.
С помощью однофакторного дисперсионного анализа установить, существенно ли влияет крутизна склона (фактор А) на содержание некоторого микроэлемента в почве. Исследования проведены для трех уровней фактора: а1 = 5˚ (первый уровень),а2 = 10˚ (второй уровень),а3 = 15˚ (третий уровень). Для каждого уровня фактора проведено четыре измерения содержания микроэлемента:
xi1 3,43,5 3,7 3,6 ;xi2 3,2 3,3 3,2 3,5 ;xi3 3,1 3,0 3,2 3,2 .