
Тема 3 Двухфакторный дисперсионный анализ
При исследовании зависимости средней оценки Y по математической статистике в группе от метода обучения (A(1) — традиционный классический, A(2) — компьютерный, A(3) — комбинированный), будущего направления подготовки (B(1) — «Менеджмент», B(2) — «Социология») и их взаимодействия было выделено случайным образом 18 групп, которые приписывались в равных количествах шести комбинациям методов и специальностей. Знания оценивались тестом, состоящим из 120 вопросов. Сведения о среднем числе правильных ответов в группах приведены в табл.:
|
|
|
||||
|
64 |
64 |
65 |
74 |
73 |
75 |
|
64 |
69 |
70 |
81 |
82 |
83 |
|
80 |
80 |
83 |
95 |
93 |
92 |
Задание 1
Записать детерминированную модель двухфакторного дисперсионного анализа (с повторениями) средней оценки по математической статистике в группе и предъявляемые к модели требования; проверить гипотезу о равенстве групповых генеральных дисперсий.
Детерминированная модель двухфакторного дисперсионного анализа (с повторениями) средней оценки по математической статистике в группе имеет следующий вид:
где
,
и
- неслучайные эффекты влияния на
наблюдение
уровней
факторов
А
и В
и взаимодействия этих уровней,
- случайный эффект влияния прочих
неконтролируемых факторов.
К этой модели предъявляются следующие требования:
все
случайных величин или, иначе, все 18 наблюдений должны быть независимыми;
или, иначе,
, т.е. при каждой комбинации уровней факторов наблюдения должны проводиться в одинаковых («нормальных») вероятностных условиях с дисперсией, не изменяющейся при переходе от одной комбинации уровней к другой;
Задание 2
Построить дисперсионную таблицу; на 5%ном уровне значимости проверить гипотезы об отсутствии влияния на среднюю оценку: метода обучения; будущей специальности; взаимодействия метода обучения и будущей специальности.
Для исследования модели воспользуемся программой «Двухфакторный дисперсионный анализ с повторениями», выбрав соответствующий пункт меню надстойки «Анализ данных».
Двухфакторный дисперсионный анализ с повторениями |
|
|
||||||
|
|
|
|
|
|
|
||
ИТОГИ |
B(1) |
B(2) |
Итого |
|
|
|
||
A(1) |
|
|
|
|
|
|
||
Счет |
3 |
3 |
6 |
|
|
|
||
Сумма |
193 |
222 |
415 |
|
|
|
||
Среднее |
64,33333 |
74 |
69,17 |
|
|
|
||
Дисперсия |
0,333333 |
1 |
28,56667 |
|
|
|
||
|
|
|
|
|
|
|
||
A(2) |
|
|
|
|
|
|
||
Счет |
3 |
3 |
6 |
|
|
|
||
Сумма |
203 |
246 |
449 |
|
|
|
||
Среднее |
67,66667 |
82 |
74,83 |
|
|
|
||
Дисперсия |
10,33333 |
1 |
66,16667 |
|
|
|
||
|
|
|
|
|
|
|
||
A(3) |
|
|
|
|
|
|
||
Счет |
3 |
3 |
6 |
|
|
|
||
Сумма |
243 |
280 |
523 |
|
|
|
||
Среднее |
81 |
93,33 |
87,17 |
|
|
|
||
Дисперсия |
3 |
2,333 |
47,76667 |
|
|
|
||
|
|
|
|
|
|
|
||
Итого |
|
|
|
|
|
|
||
Счет |
9 |
9 |
|
|
|
|
||
Сумма |
639 |
748 |
|
|
|
|
||
Среднее |
71 |
83,11 |
|
|
|
|
||
Дисперсия |
61,75 |
71,86 |
|
|
|
|
||
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
||
Дисперсионный анализ |
|
|
|
|
|
|
||
Источник вариации |
SS |
df |
MS |
F |
P-Значение |
F критическое |
||
Выборка |
1016,444 |
2 |
508,2222 |
169,4074074 |
1,60184E-09 |
3,885293835 |
||
Столбцы |
660,0556 |
1 |
660,0556 |
220,0185185 |
4,4169E-09 |
4,747225336 |
||
Взаимодействие |
16,44444 |
2 |
8,222222 |
2,740740741 |
0,104620808 |
3,885293835 |
||
Внутри |
36 |
12 |
3 |
|
|
|
||
|
|
|
|
|
|
|
||
Итого |
1728,944 |
17 |
|
|
|
|
Таблица
«Дисперсионный анализ», полученная в
результате работы программы, представляет
собой дисперсионную таблицу. В этой
таблице «Выборка»
- это фактор А,
«Столбцы»
- это фактор В,
«Взаимодействие»
- это взаимодействие факторов А
и В,
«Внутри»
- это неконтролируемые факторы, «SS»
- сумма квадратов, «df»
- число степеней свободы, «MS»
- средняя сумма квадратов, равная
отношению SS
к df,
«F»
- числовое значение статистики F,
соответствующей проверямой гипотезе,
«Р-значение»
- это рассчитанный уровень значимости,
«F
критическое»
-
ная
критическая точка распределения
Фишера-Снедекора с соответствующими
числами степеней свободы.
Проверим
на 5%-ном уровне значимости гипотезу
об отсутствии влияния на среднюю оценку
Y
фактора А
– метода обучения.
Наблюдаемое значение статистики
равно 508,21/3=169,41
Если
гипотеза
верна, то статистика
имеет распределение Фишера-Снедекора
с
и
степенями свободы. При проверке гипотезы
Р-значение
(которое приводится в результатах работы
программы в таблице «Дисперсионный
анализ») равно рассчитанному уровню
значимости гипотезы НА),
и гипотеза НА
отвергается,
поскольку
1,60184E-09<0.05.
Аналогичным
образом отвергаются гипотезы
(об отсутствии влияния на среднюю оценку
Y
по математической статистике фактора
В
– будущей специальности) а гипотеза
(об отсутствии влияния на среднюю оценку
Y
взаимодействия метод обучения и будущей
специальности) принимается, поскольку
P>α
а именно 0,104>0,05. Таким образом, метод
обучения, будущая специальность влияют
на среднюю оценку по математической
статистике в группе,а их взаимодействие
не влияет. Оценим силу этого влияния,
вычислив соответствующие коэффициенты
детерминации.
Задание 3
При отклонении каких-либо из перечисленных гипотез рассчитать соответствующий коэффициент детерминации
Поскольку
коэффициент детерминации ή2
=
,
то 59% общей вариации средней оценки Y
обусловлено изменчивостью фактора А–
метода обучения.
Так
как ή2
=
= 0.38 то 38% общей вариации средней оценки
Y
обусловлено изменчивостью фактора В–
будущей специальности. Так как
взаимодействие факторов А и В не влияет
на результативный показатель коэффициент
детерминации для него мы не рассчитываем
Влиянием неконтролируемых факторов обусловлен 100-59-38=3% вариации средней оценки по математической статистике.
Задание 4
Оценить параметры модели
Оценки |
Формулы и числовые значения |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|