- •Оглавление
- •Задача о выборе теоретического вида распределения ……………………….12
- •Задание 1 ……….………..…………………………………..………………….33
- •Выборочный метод
- •Статистические оценки параметров распределения
- •Доверительный интервал
- •Метод моментов для точечной оценки параметров распределения
- •Проверка статистических гипотез
- •6. Однофакторный анализ
- •Регрессионный анализ
- •Библиографический список
- •Приложение 1 Критические точки распределения
- •Приложение 2 Критические точки распределения Стьюдента
- •Приложение 3 Критические точки распределения Фишера
- •Задание 2
- •620364, Екатеринбург, ул. Коломогорова, 66, УрГупс
6. Однофакторный анализ
Рассматриваются
некоторая генеральная совокупность
и некоторый фактор
,
имеющий
уровней:
,
который влияет на генеральную совокупность
,
в результате чего образуются генеральные
совокупности
,
имеющие нормальные распределения,
дисперсии которых одинаковы. Требуется
установить, существенно ли влияет фактор
на изучаемую величину
,
иными словами, значимо или незначимо
различаются средние выборочных
совокупностей
при заданном уровне значимости.
Итак,
пусть на нормально распределенный
признак
воздействует фактор
,
имеющий
уровней
.
Число наблюдений (испытаний) на каждом
уровне
,
и всего наблюдалось
значений
признака
.
Результаты наблюдений записываем в
таблицу.
|
|
… |
|
… |
… |
… … … |
… |
|
|
… |
|
Выдвигается
нулевая гипотеза о равенстве математических
ожиданий
:
.
Проверим выполнение нулевой гипотезы
по критерию Фишера. Для этого введем
следующие величины:
факторная (межгрупповая) сумма квадратов отклонений
,
где
– выборочная средняя в
факторе (группе) (
),
– общая выборочная средняя; характеризует
разброс значений относительно общего
среднего значения в силу влияния уровней
фактора.
Остаточная (внутригрупповая) сумма квадратов отклонений
отражает влияние случайных причин на разброс значений относительно общего среднего; ее удобно рассчитывать по более простой формуле
,
где
– выборочная дисперсия
.
Общая сумма квадратов отклонений
включает в себя влияние и фактора, и случайных причин на разброс значений. Ее также можно вычислить по следующей формуле
,
где
– общая выборочная дисперсия по всем
наблюдениям. При этом должно выполняться
основное тождество дисперсионного
анализа
.
Найдем исправленные факторную и остаточную дисперсии по формулам
,
где
,
,
где
.
Для проверки нулевой гипотезы рассмотрим величину
,
которая
является случайной, так как в различных
опытах принимает различные неизвестные
заранее значения. При выполнении гипотезы
случайная величина
имеет распределение Фишера, которое
зависит только от числа степеней свободы
и
.
Если
,
то по данным задачи вычисляем наблюдаемое
значение критерия
.
По таблице критических значений
распределения Фишера в зависимости от
уровня значимости
и числа степеней свободы
и
находим критическое значение критерия
.
Если
,
тогда нулевая гипотеза о равенстве
математических ожиданий принимается,
выборочные средние всех уровней фактора
различаются незначимо, следовательно,
фактор (а именно, его уровни) не оказывает
существенное влияние на признак
.
Иначе, если
,
нулевая гипотеза отвергается, и фактор
оказывает существенное влияние на
исследуемый признак
.
Замечание.
Если
,
то это означает, что разброс, вызванный
случайными причинами, поглощает в себе
разброс в силу влияния фактора,
следовательно, фактор незначимо влияет
на признак
,
и нулевая гипотеза принимается без
использования вычисления критерия
.
Задача
о влиянии фактора на случайную величину.
Проведем выборочное обследование
количества опозданий студентов на
занятия в зависимости от времени, в
течение которого студенты могут добраться
до университета (фактор
),
где
– менее 20 минут,
– 20-40 минут,
– 40-60 минут,
– более часа.
|
|
|
|
|
1 |
6 |
6 |
9 |
7 |
2 |
7 |
7 |
12 |
9 |
3 |
8 |
11 |
13 |
10 |
4 |
11 |
12 |
14 |
10 |
Требуется построить доверительные интервалы для математических ожиданий четырех совокупностей уровней фактора с доверительной вероятностью и установить, значимо ли влияет время в пути на количество опозданий при уровне значимости .
Решение
Построим доверительные интервалы. Для удобства создадим расчетную таблицу.
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
1 |
6 |
36 |
6 |
36 |
9 |
81 |
7 |
49 |
|
2 |
7 |
49 |
7 |
49 |
12 |
144 |
9 |
81 |
|
3 |
8 |
64 |
11 |
121 |
13 |
169 |
10 |
100 |
|
4 |
11 |
121 |
12 |
144 |
14 |
196 |
10 |
100 |
|
|
32 |
|
36 |
|
48 |
|
36 |
|
152 |
|
|
270 |
|
350 |
|
590 |
|
730 |
1540 |
Всего
наблюдаемых значений
,
уровней фактора
.
Вычисляем групповые средние
,
,
,
.
Вычисляем выборочные дисперсии
,
,
,
.
Вычисляем исправленные выборочные дисперсии
,
,
,
.
Вычисляем исправленные выборочные среднеквадратические отклонения
,
,
,
.
По
таблице критических значений распределения
Стьюдента для доверительной вероятности
и числа степеней свободы
находим
.
Находим доверительные интервалы вероятности 0.95 для математических ожиданий по формуле
.
Для
первого уровня фактора
.
Тогда
;
с
вероятностью 0.95.
Для
второго уровня фактора
.
Тогда
;
с
вероятностью 0.95.
Для
третьего уровня фактора
.
Тогда
;
с
вероятностью 0.95.
Для
четвертого уровня фактора
.
Тогда
;
с
вероятностью 0.95.
П
роиллюстрируем
полученные доверительные интервалы на
следующем рисунке
Построенные интервалы имеют общие для всех точки, значит, можно предположить, что влияние времени на опоздание в университет незначимо.
2.
Проверим предположение о незначимом
влиянии с помощью критерия Фишера.
Выдвигаем нулевую гипотезу
.
Найдем общую среднюю и дисперсию:
,
.
Вычисляем общую, остаточную и факторную суммы
,
,
.
Проверяем
основное тождество дисперсионного
анализа:
.
Найдем исправленные факторную и остаточную дисперсии
,
.
Так
как
,
то вычисляем наблюдаемое значение
критерия Фишера
.
По
таблице критических значений распределения
Фишера в зависимости от уровня значимости
и числа степеней свободы
и
находим
.
Так как
,
то нулевая гипотеза о равенстве
математических ожиданий принимается,
и групповые средние различаются
незначимо. Следовательно, влияние
времени на количество опозданий не
существенно.
