
- •Основные понятия
- •Проверка гипотезы о равенстве дисперсий двух нормально распределенных генеральных совокупностей
- •Проверка гипотезы о равенстве средних
- •Дисперсии которых неизвестны и одинаковы
- •Проверка гипотезы о нормальном распределении случайной величины с помощью критерия Пирсона
- •«Проверка статистических гипотез»
- •«Проверка статистических гипотез»
- •Основные понятия
«Проверка статистических гипотез»
1. Пусть первые
столбцы таблиц 1–30
лабораторной работы «Описательные
статистики» являются выборками значений
нормально распределенного признака
,
а вторые
нормально распределенного признака
.
Требуется при уровне значимости
проверить гипотезу
.
2. Если в задании
предыдущего пункта нулевая гипотеза
о равенстве дисперсий
и
не была отвергнута, то на тех же выборках
при уровне значимости
проверить гипотезу
о равенстве генеральных средних.
3. По выборкам
значений признака
из таблиц 130
лабораторной работы «Описательные
статистики» проверить при уровне
значимости
с помощью критерия Пирсона гипотезу о
нормальном распределении
.
КОНТРОЛЬНЫЕ ВОПРОСЫ К ЛАБОРАТОРНОЙ РАБОТЕ
«Проверка статистических гипотез»
Что такое статистическая гипотеза, критерий? Что такое критическая область и область принятия гипотезы?
Сформулируйте постановку задачи проверки гипотезы о равенства генеральных дисперсий двух нормально распределенных признаков и опишите алгоритм ее решения.
Сформулируйте постановку задачи проверки гипотезы о равенстве средних двух нормально распределенных генеральных совокупностей, дисперсии которых неизвестны и одинаковы. Опишите алгоритм ее решения.
Сформулируйте постановку задачи проверки гипотезы о нормальном распределении признака с помощью критерия Пирсона. Опишите алгоритм ее решения.
Приведите пример первых четырех интервалов выборочного распределения признака, подготовленного для использования критерия Пирсона. Как ищется, например,
?
Пусть проверяется гипотеза о нормальном распределении признака, причем
(здесь m итоговое число частичных интервалов после подготовки выборочного распределения к использованию критерия Пирсона). Какой вывод следует сделать?
Тема 12. |
ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ |
Основные понятия
При изучении различных явлений или процессов важно выяснить, в какой мере существенно влияние того или иного фактора, а также их комбинаций на рассматриваемый признак. Ведь средние значения наблюдаемых величин при проведении любого эксперимента меняются не только в связи с изменением уровней факторов (как количественных, так и качественных), определяющих условия проведения опытов, но и из-за наличия случайных причин, отражающихся на проведении экспериментов и их результатах. Задачей дисперсионного анализа является изучение степени влияния различных факторов на изменчивость средних.
Выдающийся английский математик-статистик Р.А.Фишер определил в 1925 году дисперсионный анализ как “отделение дисперсии, приписываемой одной группе причин, от дисперсии, приписываемой другим группам”. Основной принцип, лежащий в основе дисперсионного анализа, заключается в разложении суммы квадратов отклонений от общего среднего на составляющие, обусловленные независимыми факторами. При этом с помощью каждой из составляющих получается оценка дисперсии генеральной совокупности. Проверка значимости влияния того или иного фактора проводится путем сравнения выборочной дисперсии, соответствующей этому фактору, с дисперсией, обусловленной случайными факторами (остаточной дисперсией). Для этого вычисляется эмпирическое значение критерия Фишера-Снедекора и сравнивается с табличным значением этого критерия (приложение 5). В случае если вычисленное по результатам наблюдений значение критерия Фишера-Снедекора окажется меньше табличного, оснований считать влияние рассматриваемого фактора значимым нет. В противном случае рассматриваемый фактор признается статистически значимым, т.е. существенно влияющим на изменчивость средних.
Отметим, что при выполнении процедуры дисперсионного анализа считаются выполненными следующие предположения:
а) случайные ошибки наблюдений имеют нормальное распределение с нулевым математическим ожиданием;
б) эксперименты
считаются равноточными, дисперсия
наблюдений постоянна и равна
.
Сформулируем в общем виде задачу и алгоритм однофакторного дисперсионного анализа.
Пусть исследуется
влияние одного количественного или
качественного фактора
на нормально распределенную случайную
величину (признак)
.
Предположим, что фактор
фиксируется на
уровнях
и на каждом уровне
в одинаковых условиях с одинаковой
степенью точности проведена серия из
наблюдений над
,
результаты которых
представлены таблицей:
Уровни фактора A |
|||||
|
|
... |
|
... |
|
|
|
… |
|
… |
|
|
|
… |
|
... |
|
... |
... |
... |
... |
... |
... |
|
|
... |
|
... |
|
Пусть общее число наблюдений
.
Положим
,
,
(12.1)
Сформулируем
нулевую гипотезу
«влияние фактора незначимо» и выберем
уровень значимости .
Для проверки нулевой гипотезы необходимо реализовать следующий алгоритм действий.
1. Вычислить суммы квадратов
=
факторная или межгрупповая сумма
квадратов;
=
остаточная или внутригрупповая сумма
квадратов.
2. Найти соответствующие этим суммам числа степеней свободы
;
.
3. Вычислить дисперсии
;
.
4. Вычислить
-отношение
(
):
.
5. Сравнить с табличным значением
,
где
заданный уровень значимости.
Если
,
влияние фактора статистически значимо
(нулевая гипотеза отвергается).
Если
,
то при заданном уровне значимости
нет оснований отвергнуть нулевую
гипотезу (влияние фактора статистически
не значимо).
Результаты дисперсионного анализа принято представлять в виде таблицы 12.1.
Таблица 12.1
Дисперсионный анализ данных (общая форма)
Источник вариации |
Суммы квадратов
( |
Числа степеней
свободы ( |
Дисперсии (средние квадраты) |
F-отношение ( |
Между группами |
|
|
|
|
Внутри Групп |
|
|
|
|
Общий |
|
|
|
Отметим, что в таблице 12.1
и
Наряду с оценкой достоверности (значимости) влияния фактора дисперсионный анализ позволяет оценить и силу этого влияния. Показателем силы влияния фактора служит величина
,
которая характеризует долю вариации, обусловленной влиянием фактора, в общей вариации признака.
Пример 12.1. Оценивались технологические показатели рыхления почвообрабатывающим рабочим органом. Для трех скоростей обработки (м/с) получены следующие данные о глубине рыхления (мм):
|
Скорость обработки, м/с |
||
|
1.1 |
1.7 |
2.0 |
Глубина рыхления, мм |
62 67 74 75 |
80 75 76 84 |
85 80 77 81 |
Сумма |
278 |
315 |
323 |
Определим, существенны ли различия в средней глубине рыхления почвы на различных скоростях ее обработки исследуемым почвообрабатывающим рабочим органом (иначе говоря, значимо ли влияние фактора “скорость обработки почвы” на показатель “глубина рыхления”).
Решение.
Задаемся уровнем значимости
= 0.05 и вычисляем групповые средние,
групповые дисперсии, общее среднее по
формулам (12.1):
Далее проводим вычисления по предложенной выше схеме.
1. Находим факторную (межгрупповую) и остаточную (внутригрупповую) суммы квадратов:
=
=
2. Находим числа степеней свободы:
3. Вычисляем дисперсии (средние квадраты):
4. Находим F-отношение:
5. По таблицам
приложения 5 ищем
:
Таким образом, в итоге получены результаты, которые в соответствии с таблицей 12.1 могут быть представлены в следующем виде:
Источник рассеяния |
Суммы квадратов |
Числа степеней свободы |
Дисперсии (средние квадраты) |
F- отношение ( ) |
|
Между группами
Внутри групп
|
288.17
196.52
|
2
9
|
144.08
21.84 |
6.60 |
4.26
|
Общий |
484.69 |
11 |
|
Поскольку
,
то при уровне значимости
делаем вывод
о значимости влияния скорости вспашки
рассматриваемым почвообрабатывающим
рабочим органом на глубину рыхления
почвы.
Завершая решение примера, определим силу влияния фактора на результативный признак. Для этого вычисляем отношение
В ы в о д. Влиянием фактора обусловлено 59% общей вариации признака.