Семинар4 Дисперсионный анализ
.docxДисперсионный анализ — метод в математической статистике, направленный на поиск зависимостей в экспериментальных данных путём исследования значимости различий в средних значениях. В отличие от t-критерия позволяет сравнивать средние значения трёх и более групп.
Фактор – независимая переменная, влияние которого мы оцениваем (например пол)
Однофакторный дисперсионный анализ
В Excel
Откройте Excel с данными, используемыми в предыдущих занятиях, либо скопируйте отсюда.
№ п/п |
Пол |
Адаптация |
Самопринятие |
Принятие других |
Эмоциональная комфортность |
Интернальность |
Стремление к доминированию |
1 |
0 |
0,65 |
0,23 |
0,59 |
0,78 |
0,41 |
0,13 |
2 |
1 |
0,72 |
0,35 |
0,61 |
0,82 |
0,37 |
0,23 |
3 |
1 |
0,49 |
0,47 |
0,73 |
0,63 |
0,42 |
0,92 |
4 |
1 |
0,81 |
0,19 |
0,69 |
0,57 |
0,39 |
0,13 |
5 |
1 |
0,92 |
0,21 |
0,61 |
0,35 |
0,42 |
0,23 |
6 |
0 |
0,65 |
0,27 |
0,62 |
0,78 |
0,41 |
0,31 |
7 |
0 |
0,59 |
0,19 |
0,51 |
0,61 |
0,48 |
0,19 |
8 |
0 |
0,39 |
0,21 |
0,53 |
0,63 |
0,52 |
0,21 |
9 |
0 |
0,42 |
0,23 |
0,52 |
0,47 |
0,33 |
0,11 |
10 |
0 |
0,57 |
0,24 |
0,59 |
0,71 |
0,34 |
0,15 |
11 |
0 |
0,32 |
0,31 |
0,47 |
0,77 |
0,52 |
0,17 |
12 |
1 |
0,59 |
0,37 |
0,71 |
0,73 |
0,5 |
0,14 |
13 |
0 |
0,47 |
0,46 |
0,69 |
0,32 |
0,54 |
0,12 |
14 |
1 |
0,81 |
0,21 |
0,57 |
0,47 |
0,93 |
0,2 |
15 |
1 |
0,65 |
0,23 |
0,47 |
0,78 |
0,39 |
0,31 |
16 |
1 |
0,57 |
0,19 |
0,57 |
0,71 |
0,57 |
0,35 |
17 |
1 |
0,65 |
0,23 |
0,56 |
0,68 |
0,32 |
0,32 |
Оценим влияние фактора Пол на все остальные характеристики.
Для этого нажмете Данные – Анализ Данных – Однофакторный дисперсионный анализ.
В появившемся окне выделите входный интервал вместе с названиями столбцов (кроме столбца с номером строки). Поставьте галочку Метки в первой строке. Нажмите ОК.
На новом рабочем листе изучим полученные данные (если p-значение представлено в виде -1.43602E+03, то измените формат ячейки на числовой)
P- значение меньше, чем 0,05 это означает, что Критерий считаем значимым.
Далее сравниваем значения Столбца F и Столбца F Критическое. В нашем случае 7,87>2,18. Это означает, что Фактор пол оказывает статистически значимое влияние на остальные характеристики.
В SPSS
В SPSS также выявим влияние фактора Пол на прочие характеристики.
Запустите SPSS. Вставьте таблицу со значениями и укажите наименования столбцов (для этого необходимо транспонировать строку и названиями и вставить ее в поле Представление – Метки). Нажмите Анализ-Сравнение средних-Однофакторный дисперсионный анализ.
Перенесите Пол в поле Фактор (выделите пол и нажмите стрелочку напротив Фактор).
А затем, перенесите остальные характеристики в поле Зависимые переменные
Укажите параметры. Описательные, Проверка однородности и График Средних.
Нажмите ОК.
В появившемся Окне Вывод изучим таблицу Критерий однородности дисперсий. Для значимости критерия значения в столбце Знач. Должны быть больше 0,05
В нашем случае критерий значим.
Теперь изучим таблицу Anova.
Как мы видим, что только для параметра Адаптация значимо влияние Фактора, т.к. значение 0.012<0.05. Для всех остальных p-значение больше 0,05. Полученные данные не противоречат, полученным данным в Excel, так как в Excel показывает общее влияние Фактора Пол на измеряемые параметры. Если бы мы посчитали дисперсионный анализ отдельной для каждого параметра, то получили бы такие же значения.
F – критерий для параметра Адаптация значительно больше 0.
Многофакторный дисперсионный анализ
Для изучения влияния 2 и более факторов на переменные используют многофакторный дисперсионный анализ.
В Excel реализован дисперсионный анализ для 2 факторов. Для этого необходимо в столбце указать 1 фактор, а в строке над таблицей второй. Затем зайти Данные-Анализ-2-факторный дисперсионный анализ. Но из-за сложности создания матрицы со значениями (сверху1 фактора, сбоку второй), проще 2 раза провести однофакторный анализ для каждого фактора в отдельности.
Минус этого решения, что мы не увидим связи между влияния 2 факторов
В SPSS
Добавим еще 1 фактор – возраст и зададим ему следующие обозначения
16-17 лет
17-18 лет
18-19 лет
Пол |
Возраст |
Адаптация |
Самопринятие |
Принятие других |
Эмоциональная комфортность |
Интернальность |
Стремление к доминированию |
0 |
1 |
0,65 |
0,23 |
0,59 |
0,78 |
0,41 |
0,13 |
1 |
2 |
0,72 |
0,35 |
0,61 |
0,82 |
0,37 |
0,23 |
1 |
3 |
0,49 |
0,47 |
0,73 |
0,63 |
0,42 |
0,92 |
1 |
2 |
0,81 |
0,19 |
0,69 |
0,57 |
0,39 |
0,13 |
1 |
3 |
0,92 |
0,21 |
0,61 |
0,35 |
0,42 |
0,23 |
0 |
3 |
0,65 |
0,27 |
0,62 |
0,78 |
0,41 |
0,31 |
0 |
1 |
0,59 |
0,19 |
0,51 |
0,61 |
0,48 |
0,19 |
0 |
2 |
0,39 |
0,21 |
0,53 |
0,63 |
0,52 |
0,21 |
0 |
1 |
0,42 |
0,23 |
0,52 |
0,47 |
0,33 |
0,11 |
0 |
2 |
0,57 |
0,24 |
0,59 |
0,71 |
0,34 |
0,15 |
0 |
3 |
0,32 |
0,31 |
0,47 |
0,77 |
0,52 |
0,17 |
1 |
2 |
0,59 |
0,37 |
0,71 |
0,73 |
0,5 |
0,14 |
0 |
2 |
0,47 |
0,46 |
0,69 |
0,32 |
0,54 |
0,12 |
1 |
1 |
0,81 |
0,21 |
0,57 |
0,47 |
0,93 |
0,2 |
1 |
1 |
0,65 |
0,23 |
0,47 |
0,78 |
0,39 |
0,31 |
1 |
2 |
0,57 |
0,19 |
0,57 |
0,71 |
0,57 |
0,35 |
1 |
3 |
0,65 |
0,23 |
0,56 |
0,68 |
0,32 |
0,32 |
Скопируйте эти значения в SPSS и также задайте наименование столбцов.
Для расчета Многофакторного дисперсионного анализа выберите Анализ-Общая линейная модель ОЛМ-одномерная
В поле Зависимая переменная вносим тот Параметр, влияние на который мы хотим измерить
В поле Фиксированные факторы указываем все факторы (в данном случае 2, но можно и больше)
Нажимаем Параметры и указываем Описательную статистику и Критерий однородности
Затем нажимаем графики. В поле Горизонтальная ось вносим Первый фактор, В поле Отдельные линии вносим второй. Нажимаем Добавить
Затем нажимаем Продолжить и ОК.
В Окне вывод, так же проверяем критерий Ливиня.
Затем таблицу Критерий межгрупповых эффектов. Как видим Фактор 1(var00001) – Пол оказывает влияние (p=<0.05), а Фактор 2 (var00002) Возраст не влияет. Также отсутствует статистически значимое взаимодействие между Фактор 1 и 2 (var00001* var00002)
График также позволяет интерпретировать взаимосвязь между Факторами. Чем больше похожи графики, тем меньше взаимосвязи. В нашем случае графики практически идентичны.
Многофакторный дисперсионный анализ для 3 и более факторов
Проводится аналогично Двухфакторному дисперсионному анализу, только в поле Фиксируемые факторы указывается больше факторов.
Многомерный дисперсионный анализ
Многомерный дисперсионный анализ позволяет изучить влияние нескольких факторов на несколько переменных.
Для этого нажмите Анализ-Общая Линейная Модель – ОЛМ-многомерная
В поле зависимые переменные вносим все Характеристики
В поле Фиксированные факторы – Пол и возраст
Нажимаем Параметры и указываем Описательная статистика и Критерий однородности.
Нажимаем ОК.
Оцениваем критерий Ливиня. Как видим, что для Самопринятия и Интернальности критерий меньше 0,05. Значит адекватно оценивать дисперсионный анализ для них мы не в праве.
Затем изучим Таблицу Критерий межгрупповых эффектов. Как мы видим для Фактора 1 Пол показатели идентичны одномерному факторному анализу, а для Фактора 2 Возраст нет статистически значимого влиния
