Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Элементы математической статистики.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
3.83 Mб
Скачать

6. Однофакторный анализ

Рассматриваются некоторая генеральная совокупность и некоторый фактор , имеющий уровней: , который влияет на генеральную совокупность , в результате чего образуются генеральные совокупности , имеющие нормальные распределения, дисперсии которых одинаковы. Требуется установить, существенно ли влияет фактор на изучаемую величину , иными словами, значимо или незначимо различаются средние выборочных совокупностей при заданном уровне значимости.

Итак, пусть на нормально распределенный признак воздействует фактор , имеющий уровней . Число наблюдений (испытаний) на каждом уровне , и всего наблюдалось значений признака . Результаты наблюдений записываем в таблицу.

испытаний

испытаний

испытаний

Выдвигается нулевая гипотеза о равенстве математических ожиданий : . Проверим выполнение нулевой гипотезы по критерию Фишера. Для этого введем следующие величины:

факторная (межгрупповая) сумма квадратов отклонений

,

где – выборочная средняя в факторе (группе) ( ), – общая выборочная средняя; характеризует разброс значений относительно общего среднего значения в силу влияния уровней фактора.

Остаточная (внутригрупповая) сумма квадратов отклонений

отражает влияние случайных причин на разброс значений относительно общего среднего; ее удобно рассчитывать по более простой формуле

,

где – выборочная дисперсия .

Общая сумма квадратов отклонений

включает в себя влияние и фактора, и случайных причин на разброс значений. Ее также можно вычислить по следующей формуле

,

где – общая выборочная дисперсия по всем наблюдениям. При этом должно выполняться основное тождество дисперсионного анализа

.

Найдем исправленные факторную и остаточную дисперсии по формулам

, где ,

, где .

Для проверки нулевой гипотезы рассмотрим величину

,

которая является случайной, так как в различных опытах принимает различные неизвестные заранее значения. При выполнении гипотезы случайная величина имеет распределение Фишера, которое зависит только от числа степеней свободы и . Если , то по данным задачи вычисляем наблюдаемое значение критерия . По таблице критических значений распределения Фишера в зависимости от уровня значимости и числа степеней свободы и находим критическое значение критерия . Если , тогда нулевая гипотеза о равенстве математических ожиданий принимается, выборочные средние всех уровней фактора различаются незначимо, следовательно, фактор (а именно, его уровни) не оказывает существенное влияние на признак . Иначе, если , нулевая гипотеза отвергается, и фактор оказывает существенное влияние на исследуемый признак .

Замечание. Если , то это означает, что разброс, вызванный случайными причинами, поглощает в себе разброс в силу влияния фактора, следовательно, фактор незначимо влияет на признак , и нулевая гипотеза принимается без использования вычисления критерия .

Задача о влиянии фактора на случайную величину. Проведем выборочное обследование количества опозданий студентов на занятия в зависимости от времени, в течение которого студенты могут добраться до университета (фактор ), где – менее 20 минут, – 20-40 минут, – 40-60 минут, – более часа.

1

6

6

9

7

2

7

7

12

9

3

8

11

13

10

4

11

12

14

10

Требуется построить доверительные интервалы для математических ожиданий четырех совокупностей уровней фактора с доверительной вероятностью и установить, значимо ли влияет время в пути на количество опозданий при уровне значимости .

Решение

  1. Построим доверительные интервалы. Для удобства создадим расчетную таблицу.

1

6

36

6

36

9

81

7

49

2

7

49

7

49

12

144

9

81

3

8

64

11

121

13

169

10

100

4

11

121

12

144

14

196

10

100

32

36

48

36

152

270

350

590

730

1540

Всего наблюдаемых значений , уровней фактора .

Вычисляем групповые средние

, , , .

Вычисляем выборочные дисперсии

, , , .

Вычисляем исправленные выборочные дисперсии

, , , .

Вычисляем исправленные выборочные среднеквадратические отклонения

, , , .

По таблице критических значений распределения Стьюдента для доверительной вероятности и числа степеней свободы находим .

Находим доверительные интервалы вероятности 0.95 для математических ожиданий по формуле

.

Для первого уровня фактора . Тогда

;

с вероятностью 0.95.

Для второго уровня фактора . Тогда

;

с вероятностью 0.95.

Для третьего уровня фактора . Тогда

;

с вероятностью 0.95.

Для четвертого уровня фактора . Тогда

;

с вероятностью 0.95.

П роиллюстрируем полученные доверительные интервалы на следующем рисунке

Построенные интервалы имеют общие для всех точки, значит, можно предположить, что влияние времени на опоздание в университет незначимо.

2. Проверим предположение о незначимом влиянии с помощью критерия Фишера. Выдвигаем нулевую гипотезу .

Найдем общую среднюю и дисперсию:

, .

Вычисляем общую, остаточную и факторную суммы

,

, .

Проверяем основное тождество дисперсионного анализа: .

Найдем исправленные факторную и остаточную дисперсии

, .

Так как , то вычисляем наблюдаемое значение критерия Фишера .

По таблице критических значений распределения Фишера в зависимости от уровня значимости и числа степеней свободы и находим . Так как , то нулевая гипотеза о равенстве математических ожиданий принимается, и групповые средние различаются незначимо. Следовательно, влияние времени на количество опозданий не существенно.