
- •Глава 8.4. Однофакторный дисперсионный анализ. Приактикум
- •Пример 8.4.1. Исходные данные для однофакторного дисперсионного анализа: выделение независимой и зависимой переменных
- •Пример 8.4.3. Расчет непараметрического аналога однофакторного дисперсионного анализа - критерия Краскала-Уоллиса
- •Пример 8.4.4. Зависимость результатов дисперсионного анализа от внутригрупповой дисперсии.
- •Пример 8.4.5. Использование апостериорных критериев в дисперсионном анализе.
- •Пример 8.4.6. Преобразование количественной независимой переменной в качественную: возможности дисперсионного анализа при немонотонных взимосвязях
- •Задание 8.4.4.
- •Задание 8.4.5.
- •Задание 8.4.6.
- •Задание 8.4.7. Множественное сравнение большого количества групп.
- •Задание 8.4.8. Демонстрация зависимости результатов да от объема выборки.
Глава 8.4. Однофакторный дисперсионный анализ. Приактикум
В этой главе мы обсудим основные практические моменты использования однофакторного дисперсионного анализа (ОДА). В результате освоения изложенного ниже материала у читателя должно сформироваться достаточно конкретное представление о том, какие результаты психологического исследования могут быть обработаны с помощью этого метода, какого рода исследовательские гипотезы могут быть проверены с его помощью.
Однофакторный дисперсионный анализ решает задачи сравнения средних значений. Но в ситуации большего, чем две, количества групп. Переменная, кодирующая принадлежность к группе (обычно – номер группы, к которой принадлежит испытуемый), называется независимой, или фактором. Даже если эта переменная является порядковой (например, курс, на котором учится студент) в дисперсионном анализе порядок игнорируется, и переменная считается номинативной.
Зависимая переменная должна быть измерена в интервальной или шкале отношений.
Предполагается также нормальное распределение выборочных значений (см. главу 8.2) и равная дисперсия в группах. В некоторых случаях нарушение этих предположений (например, неравенство дисперсий) искажает выводы. Мы более подробно обсудим этот вопрос в приложении 4.
Пример 8.4.1. Исходные данные для однофакторного дисперсионного анализа: выделение независимой и зависимой переменных
В некотором ВУЗе исследовался уровень самооценки студентов, обучающихся на различных факультетах. В исследовании принимали участие 4 группы студентов: учащиеся психологического, химического, математического и филологического факультетов. У всех этих испытуемых был измерен уровень самооценки с помощью стандартной методики Дембо-Рубинштейн в модификации Прихожан1.
Конкретная (и самая очевидная) эмпирическая гипотеза, которую можно сформулировать в рамках такого исследования, может быть, например, такой: студенты, обучающиеся на различных факультетах, имеют различный уровень самооценки по шкалам "умный-глупый" и "способный-неспособный". Уровень самооценки в данной методике измеряется в баллах от 0 до 100, эти шкалы можно считать интервальными. Параметр "принадлежность к факультету" является независимой переменной или фактором, измеренной в шкале наименований.
Далее, мы предлагаем ещё несколько примеров краткого описания исследований, изучив которые, следует проделать следующее:
Сформулировать гипотезу исследования.
Обосновать, применим ли дисперсионный анализ для проверки гипотез данного типа.
Выявить независимую и зависимую (зависимые) переменные. Определить, сколько уровней имеет независимая переменная.
Задание 8.4.1.
Исследовалось влияние типа личностного расстройства на понимание эмоций других людей. В качестве испытуемых были отобраны здоровые люди, а также люди с истерическим расстройством и с шизоидным расстройством личности. Восприятие эмоций испытуемыми оценивалось с помощью опросника Н. Холла2, по "Распознавание эмоций других людей" (предполагаем, что шкала интервальная).
Задание 8.4.2.
Исследовалось влияние конфликтов с родителями на уровень тревожности подростков. По частоте конфликтов подростков разделяли на тех, у кого практически не бывает конфликтов с родителями, тех, у кого они бывают иногда, и тех, кто конфликтует постоянно. Уровень тревожности оценивался при помощи опросника Спилбергера-Ханина (предполагаем, что шкала интервальная).
Задание 8.4.3.
В стране N исследовалось, как влияет пол избирателей (мужчины в отличие от женщин) на их предпочтения на выборах президента (в президенты баллотировались 3 кандидата). Одной из переменных исследования был пол, указанный в анкете, а второй – кандидатура, за которую этот человек голосовал на выборах.
Пример 8.4.2. Проведение однофакторного дисперсионного анализа в SPSS
В файле writing_ellis.sav содержатся смоделированные результаты исследовании письма у младших школьников3. В нем проверялось, насколько возможность планирования текста влияет на качество письма. В эксперименте принимали участие три группы испытуемых, детей, изучавших английский язык. Каждой из групп предлагалось написать небольшое сочинение-рассказ по серии сюжетных картинок. При этом одной из групп предлагалось писать сочинение сразу, без подготовки, общее время для написания ограничивалось 17 минутами, минимальный размер сочинения, требующийся от испытуемых --- 200 слов. Во второй группе детям давалось 10 минут на подготовку сочинения, а затем 17 минут на письмо, при этом требовалось также написать не менее 200 слов. В третьей группе никаких ограничений не вводилось: дети могли писать любое количество времени, объем сочинения также никак не ограничивался.
В качестве оценки качества написанного текста были измерена скорость письма (количество знаков в минуту).
В файле данных первая переменная содержит информацию о принадлежности испытуемого к экспериментальной группе, вторая --- скорость письма.
Для проведения однофакторного дисперсионного анализа в SPSS необходимо вызвать в меню Анализ --- Сравнение средних --- Однофакторный дисперсионный анализ (Analyze --- Compare means --- One-way ANOVA). После этого на экране возникнет стандартное диалоговое окно, в котором необходимо указать переменные, участвующие в дисперсионном анализе. Независимую переменную надо перенести в поле "Фактор" (Factor), а зависимую --- в поле "Список независимых переменных" (Dependent list)4. В нашем примере независимой переменной является группы испытуемых (group5), а зависимую --- скорость письма (переменная SPM ).
При проведении дисперсионного анализа в SPSS можно также установить дополнительные параметры. В меню "Параметры" (Options) можно установить следующие дополнительные опции:
- Вывод описательной статистики зависимых переменных по уровням фактора – пункт "Описательные" (Descriptive)
- Вывод графика средних значений зависимой переменной на различных уровнях независимой переменной – пункт "График средних" (Means Plot).
В пункте "Апостериорные" (Post hoc) можно задать критерии для попарного сравнения средних значений независимой переменной на различных уровнях независимой переменной. Мы говорили в главе 8.1 о проблемах, возникающих при множественном сравнении средних --- ситуация, в которой можно сделать такого рода ложные выводы рассмотрена ниже (задание 7). Апостериорные сравнения, во-первых, вводятся в дело, когда ОДА уже указал на значимые различия средних по группам, а во-вторых, учитывают количество сравнений, проводимых при множественном сравнении, за счет корректировки уровней значимости по специальным формулам. В списке методов апостериорных сравнений, которые выводятся в соответствующем окне SPSS, предлагается 18 методов, в тонкости различий между которыми мы не будем здесь входить. Более подробную информацию о различных методах множественного попарного сравнения можно найти, например, в книге "Дисперсионный анализ в экспериментальной психологии" А.Н. Гусева (Гусев, 2000). Мы же отметим только, что будем использовать наиболее широко употребимые методы Шеффе и Бонферрони.
После установки необходимых параметров можно выполнить процедуру дисперсионного анализа. Рассмотрим основные результаты, позволяющие оценить и проинтерпретировать результаты однофакторного анализа в SPSS.
Таблица 8.4.1 представляет собой данные описательной статистики зависимых переменных на различных уровнях независимой.
Таблица 8.4.1. Описательные статистики зависимой переменной на различных уровнях фактора
|
|
N |
Среднее |
Стд. отклонение |
Стд. Ошибка |
95% доверительный интервал для среднего |
Минимум |
Максимум |
|
|
|
Нижняя граница |
Верхняя граница |
||||||
скорость письма (знаков в минуту) |
Без планирования |
14 |
12,54 |
2,00 |
0,54 |
11,38 |
13,69 |
9,59 |
16,24 |
С планированием |
14 |
16,31 |
3,29 |
0,88 |
14,41 |
18,20 |
11,29 |
25,35 |
|
Без ограничений |
14 |
11,81 |
2,66 |
0,71 |
10,28 |
13,34 |
7,96 |
18,20 |
|
Итого |
42 |
13,55 |
3,30 |
0,51 |
12,52 |
14,58 |
7,96 |
25,35 |
Из таблицы видно, что средняя скорость письма отличается в трех экспериментальных группах различен: быстрее всего писали дети из группы, в которой не устанавливалось никаких ограничений, медленнее всего --- из группы, в которой не давалось время на подготовку к сочинению. Таким образом, можно предварительно сказать, что экспериментальные условия влияют на скорость письма.
Также в результатах дисперсионного анализа выводится график средних зависимых переменной на различных уровнях фактора, являющийся визуализацией средних значений в приведенной выше таблице (Рис. 8.4.1.)
Рис. 8.4.1. График средних значений скорости письма и сложности синтаксической сложности текста на различных уровнях фактора
Насколько значимы наблюдаемые различия средних в трех экспериментальных группах изменения показывают результаты дисперсионного анализа. Таблица 8.4.2. представляет собой результаты собственно однофакторного дисперсионного анализа.
Таблица 8.4.2. Результаты расчета дисперсионного анализа
|
|
Сумма квадратов |
ст.св. |
Средний квадрат |
F |
Знч. |
скорость письма (знаков в минуту) |
Между группами |
163,118 |
2 |
81,559 |
11,190 |
,000 |
Внутри групп |
284,255 |
39 |
7,289 |
|
|
|
Итого |
447,373 |
41 |
|
|
|
В данной таблице по строчкам выводится информация о межгрупповом, внутригрупповом и общем для всей выборке разбросе. Второй столбец содержит информацию о сумме квадратов отклонений зависимой величины от среднего, в третьем столбце указаны соответствующие степени свободы, в четвертом --- средние квадраты для межгруппового и внутригруппового разброса (отношение суммы квадратов к степеням свободы). В последних двух столбцах выводится F-отношение (Sbg/Swg) и уровень его значимости.
В нашем примере средний квадрат межгруппового разброса первой зависимой переменной составляет 81.6, а внутригруппового --- 7.3. Соответственно, F-отношение равно примерно 11.2. Это означает, что межгрупповая дисперсия отличается от внутригрупповой более, чем в 11 раз. Соответствующий уровень значимости --- p < 0,001 свидетельствует о том, что фактор экспериментальное условие значимо влияет на скорость письма. В научных работах результаты дисперсионного анализа кратко записывают следующим образом: F(2,39)=11.19, p<0.001, где F --- значение F-отношения, 39 и 2 --- его степени свободы, а p --- уровень его значимости.
Последняя таблица, выводимая SPSS представляет собой результаты апостериорного множественного сравнения (post hoc). Результаты попарного сравнения значений зависимых переменных в экспериментальных группах с помощью критерия Шеффе представлены в таблице 8.4.3.
Таблица 8.4.3. Результаты множественного сравнения в рамках процедуры Post hoc в дисперсионном анализе
Шеффе |
|
|||||||
Зависимая переменная |
(I) группа испытуемых |
J) группа испытуемых |
(I-J)-я разность средних |
Стд. Ошибка |
Знч. |
95% доверительный интервал |
||
Нижняя граница |
Верхняя граница |
|||||||
скорость письма (знаков в минуту) |
Без планирования |
с планированием |
-3,76891* |
1,02041 |
,003 |
-6,3657 |
-1,1721 |
|
без ограничений |
,72772 |
1,02041 |
,777 |
-1,8690 |
3,3245 |
|||
с планированием |
Без планирования |
3,76891* |
1,02041 |
,003 |
1,1721 |
6,3657 |
||
без ограничений |
4,49663* |
1,02041 |
,000 |
1,8999 |
7,0934 |
|||
без ограничений |
Без планирования |
-,72772 |
1,02041 |
,777 |
-3,3245 |
1,8690 |
||
с планированием |
-4,49663* |
1,02041 |
,000 |
-7,0934 |
-1,8999 |
|||
*. Разность средних значима на уровне 0.05. |
|
Во втором столбце указаны уровни независимой переменной, в третьем столбце --- все другие (сравниваемые) значения независимой переменной. Далее приводятся различия в средних зависимой переменной на сравниваемых уровнях независимой. В столбце Знч. (Sig) указано значимость наблюдаемого различия в средних на соответствующих уровнях независимой переменной. Как видно из таблицы, в рассматриваемом примере показатель скорости письма значимо выше в группе с планированием сочинения по сравнению с группой без планирования и без ограничений (p=0.003 и p<0.001). Различия этого параметра в последних двух группах незначимы (p=0.777).