- •Радчикова н.П.
- •Справочный материал. Выбор метода статистического анализа
- •Тема 1.
- •Http://www.Statsoft.Ru
- •2. Введите данные студентов по эмпатии (три различные теста):
- •3. Добавьте в список еще одного студента:
- •4. Переведите все сырые баллы в стенайны:
- •6. Создайте переменную sum 'сумма баллов':
- •Тема 2
- •Описание одной выборки
- •Справочный материал.
- •Описательная статистика
- •3. Теперь посчитайте описательную статистику отдельно для группы мужчин и для группы женщин.
- • Распределение можно считать нормальным, если критерий не значимый!
- •Тема 3.
- •Исследование взаимосвязи между переменными
- •СправочнЫй материал
- •Корреляционные исследования
- •Лабораторная работа 3 Корреляция и простая линейная регрессия
- •2. Подсчет коэффициента корреляции Пирсона.
- •Лабораторная работа 5. Проверка гипотез. Статистические критерии для простЫх экспериментальнЫх схем
- •1. Загрузите файл данных.
- •2. Подсчет t-критерия Стьюдента
- •2. Подсчет t-критерия Стьюдента
- •3. Подсчет критерия Вилкоксона
- •Таблицы сопряженности
- •Справочный материал.
- •Статистика для таблиц сопряженности
- •Коэффициент . Употребляется в основном с таблицами 2*2, изменяется от 0 (когда переменные независимы) до 1 (когда переменные абсолютно зависимы).
- •V Крамера можно употреблять для любых таблиц – и квадратных, и прямоугольных. Изменяется от 0 (когда переменные независимы) до 1 (когда переменные абсолютно зависимы).
- •Лабораторная работа 5. Статистический анализ таблиц сопряженности
- •1. Загрузите файл данных.
- •2. Статистика для таблиц сопряженности в модуле Basic Statistics
- •3. Статистика для таблиц сопряженности в модуле
- •Тема 6.
- •Лабораторная работа 6.
- •Проверка гипотез.
- •Однофакторный Дисперсионный анализ
- •И его непараметрические аналоги.
- •Тема 7.
- •Лабораторная работа 7.
- •Проверка гипотез.
- •Многофакторный Дисперсионный анализ
- •(Межгрупповая схема)
- •Лабораторная работа 8. Проверка гипотез. Дисперсионный анализ (Интра-индивидуальная схема)
Тема 7.
ПРОВЕРКА ГИПОТЕЗ.
СЛОЖНЫЕ МНОГОФАКТОРНЫЕ СХЕМЫ
Справочный материал.
Взаимодействие и главные эффекты
Часто в социальных науках проводятся исследования, в которых используется более одной независимой переменной. Такие исследования качественно отличаются от исследований с одной независимой переменной и требуют применения специальных статистических техник для обработки данных.
Эффект одной независимой переменной в сложном (факторном) эксперименте называется главным эффектом (main effect). Он показывает, имеется ли эффект от воздействия данного отдельно взятого фактора.
Кроме главных эффектов в сложной экспериментальной схеме возможно взаимодействие. Взаимодействие это количественный результат, обусловленный соотношением между действием двух или нескольких независимых переменных, выделенный в факторном эксперименте. Вычисляется как разность между различиями значений зависимой переменной, полученных при действии разных условий первой, второй и т. д. переменных, и иллюстрируется графически. Взаимодействие показывает, зависит ли величина воздействия фактора от значений других факторов (переменных).
Нельзя интерпретировать результаты исследования, не принимая во внимание взаимодействие.
Рассмотрим пример, иллюстрирующий проблему. Психолог провел тренинг развития эмпатии для группы студентов, состоявшей из юношей и девушек. Эмпатия измерялась до и после тренинга, и психологу интересно узнать, как повлиял тренинг на развитие этого качества. В этом исследовании были выбраны две независимые переменные: 1) пол испытуемых (имеет два уровня юноши и девушки) и 2) условия измерения эмпатии (имеет два уровня до тренинга и после тренинга). Зависимой переменной являлся уровень эмпатии (чем больше балл, набранный по некоторому тесту, тем больше уровень эмпатии). В результате проведенной работы получились следующие результаты:
Эти два графика представляют два главных эффекта – эффект переменной "пол" и эффект переменной "условие измерения". Если мы проинтерпретируем эти графики, то придем к следующим выводам: 1) у девушек эмпатия выше, чем у юношей; 2) тренинг привел к повышению уровня эмпатии у студентов.
Однако если мы рассмотрим все результаты сразу, чтобы определить, есть ли взаимодействие, то получим другие выводы. Когда психолог изобразил все данные на одном графике, то получилась следующая картинка:
Проинтерпретировав теперь получившиеся результаты, мы придем совершенно к другим выводам: 1) тренинг оказал влияние только на юношей (уровень эмпатии вырос только у них) и 2) хотя до тренинга юноши и девушки различались по эмпатии, после тренинга эмпатия стала у них одинаковой.
Следует также помнить, что главные эффекты статистически независимы от эффектов взаимодействия, поэтому нельзя предсказать, какое будет взаимодействие, зная только главные эффекты.
Пример. Рассмотрим эксперимент с двумя независимыми переменными – 1 и 2. Независимая переменная 1 имеет два уровня – А и В. Независимая переменная 2 тоже имеет два уровня – 1 и 2. Во всех трех изображенных ниже случаях главные эффекты этих переменных одинаковы (разница в зависимой переменной между двумя уровнями независимой переменной 1 составляет 20 единиц, а разница между двумя уровнями независимой переменной 1 составляет 60 единиц).
1) В этом случае взаимодействия нет.
Независимая переменная 1 | ||
А |
В |
В-А |
50 |
70 |
20 |
Независимая переменная 2 | ||
1 |
2 |
2-1 |
30 |
90 |
60 |
|
А |
В |
среднее |
1 |
20 |
40 |
30 |
2 |
80 |
100 |
90 |
среднее |
50 |
70 |
|
2) В этом случае взаимодействие есть.
Независимая переменная 1 | ||
А |
В |
В-А |
50 |
70 |
20 |
Независимая переменная 2 | ||
1 |
2 |
2-1 |
30 |
90 |
60 |
|
А |
В |
среднее |
1 |
30 |
30 |
30 |
2 |
70 |
110 |
90 |
среднее |
50 |
70 |
|
3) А в этом случае есть пересекающееся взаимодействие
Независимая переменная 1 | ||
А |
В |
В-А |
50 |
70 |
20 |
Независимая переменная 2 | ||
1 |
2 |
2-1 |
30 |
90 |
60 |
|
А |
В |
среднее |
1 |
60 |
0 |
30 |
2 |
40 |
140 |
90 |
среднее |
50 |
70 |
|
Для оценки значимости главных эффектор и значимости взаимодействия служит многофакторный дисперсионный анализ. Этот метод не имеет непараметрических аналогов – его нельзя заменить другими статистическими методами. В то же время предположения многофакторного дисперсионного анализа остаются теми же, что и однофакторного. Во-первых, зависимая переменная должна быть измерена в интервальной шкале; во-вторых, зависимая переменная должна иметь нормальное распределение внутри каждой группы. Вообще F-критерий очень устойчив к отклонению от нормальности (подробнее см. Lindman, 1974). Если эксцесс больше 0, то значение статистики F может стать очень маленьким. Нулевая гипотеза при этом не может быть отвергнута, хотя она и не верна. Ситуация меняется на противоположную, если эксцесс меньше 0. Асимметрия распределения обычно незначительно влияет на F статистику. Если число наблюдений в ячейке достаточно большое, то отклонение от нормальности не имеет особого значения в силу центральной предельной теоремы, в соответствии с которой, распределение среднего значения при большом объеме выборки близко к нормальному, независимо от начального распределения. Подробное обсуждение устойчивости F статистики можно найти в Box and Anderson (1955) или Lindman (1974).
Предполагается также, что дисперсии в разных группах одинаковы. Это предположение называется предположением об однородности дисперсии. Модуль Дисперсионный анализ содержит большой набор статистических критериев, позволяющих обнаружить неоднородность дисперсии. Однако, Линдман (Lindman 1974, стр. 33) показывает, что F критерий вполне устойчив относительно нарушения предположений однородности дисперсии (см. также Box, 1954a, 1954b).
Lindman, H. R. (1974). Analysis of variance in complex experimental designs. San Francisco: W. H. Freeman & Co.
Box, G. E. P., & Anderson, S. L. (1955). Permutation theory in the derivation of robust criteria and the study of departures from assumptions. Journal of the Royal Statistical Society, 17, 1-34.
Box, G. E. P. (1954a). Some theorems on quadratic forms applied in the study of analysis of variance problems: I. Effect of inequality of variances in the one-way classification. Annals of Mathematical Statistics, 25, 290-302.
Box, G. E. P. (1954b). Some theorems on quadratic forms applied in the study of analysis of variance problems: II. Effect of inequality of variances and of correlation of errors in the two-way classification. Annals of Mathematical Statistics, 25, 484-498.