
- •Дисциплина: Теоретические основы выборочных исследований Лабораторная работа №8 Дисперсионный анализ
- •1. Реализация в spss
- •1.1. Однофакторный дисперсионный анализ (Одномерный дисперсионный анализ по методу Фишера)
- •1.2. Парные сравнения
- •1.3. Контрасты
- •1.4. Одномерный дисперсионный анализ (Общий многофакторный)
- •1.5. Одномерный дисперсионный анализ с повторным измерением
- •1.6. Многомерный дисперсионный анализ
- •2. Реализация в statistica
- •2.1. Однофакторный дисперсионный анализ (Одномерный дисперсионный анализ по методу Фишера)
- •2.2. Парные сравнения
- •2.3. Контрасты
- •2.4. Одномерный дисперсионный анализ (Общий многофакторный)
- •2.5. Одномерный дисперсионный анализ с повторным измерением
- •Индивидуальное задание:
1.4. Одномерный дисперсионный анализ (Общий многофакторный)
Для того, чтобы провести многофакторный дисперсионный анализ на основе метода "обобщенной линейной модели" необходимо выполнить следующую последовательность команд:
Analyze (Анализ) - General Linear Model (Общая линейная модель) –
Univariate... (Одномерная)
В результате откроется диалоговое окно (рис.7), в котором необходимо указать в поле Dependent Variableзависимую переменную, а в полеFixed Factors- фиксируемые факторы.
Фиксированными факторами или факторами с фиксированными эффектами называются такие факторы, которые охватывают все возможные классификационные слои одной независимой переменной, к примеру, пол мужской — женский или образование начальное — среднее — высшее.
Рис.7.Диалоговое окно Univariate
Щёлчком по кнопке Model... (Модель) открывается диалоговое окно (рис.8), в котором в разделеSpecify Modelможно выбрать форму модели:Full factorial (полнофакторная)(установлена по умолчанию) илиCustom (Пользовательский режим).
Для формирования сумм квадратов для МНК существует четыре различных подхода (четыре типа, обозначенных с помощью римских чисел I, II, III и IV), по умолчанию установлен тип III.
Рис.8.Диалоговое окно Univariate: Model (Одномерная: Модель)
Щёлчком на кнопке Options... (Опции)открывается диалоговое окно (рис.9), в котором для вывода средних значений и стандартных ошибок для совокупной выборки (OVERALL) и для всех слоев по указанным факторам, необходимо перенести их в полеDisplay means for (Показать средние значения для).В разделеDisplay для вывода описательных статистик и для осуществления проверки однородности дисперсий необходимо установить соответствующие флажки.
Рис.9. Диалоговое окно Univariate: Options
При помощи выключателя Plots... (Диаграммы)открывается диалоговое окно (рис.10), где можно графически представить средние значения слоев выбранных факторов в виде линейчатых диаграмм.
В поле Horizontal Axis (Горизонтальная ось)необходимо поместить один из факторов, а в полеSeparate Lines (Отдельные линии), фактор слои которого будут построены отдельными линиями. Можно указывать дополнительную переменную и в полеSeparate Plots (Отдельные графики)тогда для отдельных слоев этой переменной будут построены отдельные диаграммы.
Рис.10. Диалоговое окно Univariate: Profile Plots
Щелчком на кнопке выключателе Post Hoc... (Дополнительный тест)откроется диалоговое окно (рис.11.), в котором есть возможность выбрать один или несколько из восемнадцати тестов, необходимых для проведения дополнительного сравнения отдельных слоев выбранных факторов. Это имеет смысл только для факторов с более чем двумя слоями.
Рис.11.Диалоговое окно Univariate: Post Hoc Multiple Comparisons for Observed Means
Так же в диалоговом окне Univariate (рис.7.) есть возможность определить контрасты (кнопкаContrasts) и для каждого наблюдения сохранить некоторые статистические характеристики, как новые переменные (кнопкаSave).
Пример многофакторного дисперсионного анализа для зависимой переменной weight_1 и двух независимых переменныхfoodиsport_1 с указанием средних значений и стандартных ошибок для совокупной выборки и для всех слоев факторов, проверкой теста Шефе для фактораfoodи графиком, где градации переменнойsport_1 изображаются отдельными линиями представлен ниже.
Сначала появляется сводная таблица, озаглавленная Between Subjects Factors "Межсубъектные факторы", затем следует вывод средних значений, стандартных отклонений и количества наблюдений для отдельных ячеек, а также результаты теста на однородность (рис.12).
Рис.12. Таблицы Between Subjects Factors, Discriptive Statistics и Levene’s Test
Тест Левене на равенство дисперсий показывает, не значимый результат со значением вероятности ошибки р = 0,058. Это означает, что дисперсии между группами являются однородными, что говорит о возможности применения дисперсионного анализа.
Анализ таблицы Test of Between-Subjects Effects(рис.13.) показал незначимое влияние фактора «занятия спортом до программы похудения» (р = 0,815), значимое влияние фактора правильного питания (р = 0,003) на вес респондента до программы похудения и незначимое взаимодействие между обоими переменными (р = 0,906).
Рис.13. Таблица Test of Between-Subjects Effects
Далее следует вывод дескриптивных статистик для совокупной выборки и для отдельных слоев факторов (рис.14.).
Рис.14.Дескриптивные статистики для совокупной выборки и для отдельных слоев факторов
Затем следует вывод результатов теста Шеффе для переменной food(рис.15). На основании частично дублированных результатов, можно сделать вывод, что группа респондентов, которая ответила на вопрос о правильном питании «полностью не согласен» и «полностью согласен», «согласен» значимо отличается
Рис.15.Тест Шеффе
Усреднённая разность является значимой на уровне 0,05. Этот факт подтверждается ещё раз при выводе результатов для рассматриваемых "однородных подгрупп" в другой форме (рис.16).
Рис.16.Таблица однородных подгрупп
Завершает вывод результатов профильная диаграмма, в которой представлена линейчатая диаграмма переменной foodотдельно по частоте занятиями спортом (рис.17).
Рис.17.Линейчатая диаграмма переменнойfoodпо переменнойsport_1
Для исключения влияния количественной переменной на зависимую переменную необходимо в диалоговом окне Univariate (рис.7.) в поле Covariate(s) (Ковариаты)указать эту переменную (ковариату). Ковариату проще всего представить как переменную, значительно коррелирующую с зависимой переменной и позволяющую уменьшить ее дисперсию. За счет включения в анализ ковариаты дисперсия зависимой переменной уменьшается, что позволяет сделать более очевидным влияние анализируемых факторов.
Пример многофакторного дисперсионного анализа для зависимой переменной weight_1 и двух независимых переменныхfoodиsport_1 за исключением количественной переменнойheightпредставлен на рис.18.
Рис.18. Таблица Test of Between-Subjects Effects с учетом ковариаты height
Включение ковариаты не меняет описательные статистики, но вносит некоторые изменения в результаты проверки гипотез дисперсионного анализа, как видно из рис.18.
Ковариата оказывает влияние на суммы квадратов и, как следствие, на число степеней свободы (в некоторых случаях), средние квадраты, величины F, а также значения p-уровней значимости. Если это влияние существенно, то, как правило, значения среднего квадрата и F-критерия увеличиваются, а соответствующие значения р-уровней уменьшаются.
Ковариата heightоказывает статистически достоверное влияние (p<0.001) на зависимую переменнуюweight_1, значимое влияние фактора правильного питания (р = 0,002), а так же незначимое влияние фактора «занятия спортом до программы похудения» (р = 0,809), и незначимое взаимодействие между обоими переменными (р = 0,404).