Семинар5 Регрессионный анализ
.docxРегрессионный анализ
РЕГРЕССИОННЫЙ АНАЛИЗ – раздел математической статистики, объединяющий практические методы исследования регрессионной зависимости между величинами по статистическим данным
Регрессионный анализ в Excel
Excel позволяет рассчитать только линейную регрессию
Откройте данные в Excel
Пол |
Адаптация |
Самопринятие |
Принятие других |
Эмоциональная комфортность |
Интернальность |
Стремление к доминированию |
0 |
0,65 |
0,23 |
0,59 |
0,78 |
0,41 |
0,13 |
0 |
0,65 |
0,27 |
0,62 |
0,78 |
0,41 |
0,31 |
0 |
0,59 |
0,19 |
0,51 |
0,61 |
0,48 |
0,19 |
0 |
0,39 |
0,21 |
0,53 |
0,63 |
0,52 |
0,21 |
0 |
0,42 |
0,23 |
0,52 |
0,47 |
0,33 |
0,11 |
0 |
0,57 |
0,24 |
0,59 |
0,71 |
0,34 |
0,15 |
0 |
0,32 |
0,31 |
0,47 |
0,77 |
0,52 |
0,17 |
0 |
0,47 |
0,46 |
0,69 |
0,32 |
0,54 |
0,12 |
1 |
0,72 |
0,35 |
0,61 |
0,82 |
0,37 |
0,23 |
1 |
0,49 |
0,47 |
0,73 |
0,63 |
0,42 |
0,92 |
1 |
0,81 |
0,19 |
0,69 |
0,57 |
0,39 |
0,13 |
1 |
0,92 |
0,21 |
0,61 |
0,35 |
0,42 |
0,23 |
1 |
0,59 |
0,37 |
0,71 |
0,73 |
0,5 |
0,14 |
1 |
0,81 |
0,21 |
0,57 |
0,47 |
0,93 |
0,2 |
1 |
0,65 |
0,23 |
0,47 |
0,78 |
0,39 |
0,31 |
1 |
0,57 |
0,19 |
0,57 |
0,71 |
0,57 |
0,35 |
1 |
0,65 |
0,23 |
0,56 |
0,68 |
0,32 |
0,32 |
Заходим Данные-Анализ Данных.
Выбираем Регрессия.
Входной Интервал Y – это зависимая переменная (например мы планируем вычислить влияния всех факторов на Адаптацию, тогда Y-это Столбец с Адаптацией).
Входной интервал Х – это независимые переменные, 2и более. В нашем случае это все остальные параметры.
Поставьте галочку Метки, для вывода названия столбцов (для этого необходимо выделять столбцы с Заголовком, без учета Пола).
Для выделения Интервала Х – интервал должен быть непрерывен (столбцы должны стоять подряд).
Программа рассчитает необходимые данные
В первую очередь обращаем внимание на R-квадрат и коэффициенты.
R-квадрат – коэффициент детерминации. В нашем примере – 0,45, или 45,0%. Это означает, что расчетные параметры модели на 45,0% объясняют зависимость между изучаемыми параметрами. Чем выше коэффициент детерминации, тем качественнее модель. Хорошо – выше 0,8. Плохо – меньше 0,5 (такой анализ вряд ли можно считать резонным). В нашем примере – «плохо».
Коэффициент 0,13 показывает, каким будет Y, если все переменные в рассматриваемой модели будут равны 0. То есть на значение анализируемого параметра влияют и другие факторы, не описанные в модели.
Исходя из полученных данных, можно построить следующее уравнение.
Y=-1.34X+1.37Z-0.03W+0.08Q+0.03U+0,13, где
Y – Адаптация
X – Самопринятие
Z – Принятие других
W – Эмоциональный комфорт
Q – Интернальность
U – Стремление к доминированию
Коэффициент -1,34 показывает весомость переменной Х на Y. То Самопринятие влияет на Адаптацию с весом -1,34. Знак «-» указывает на отрицательное влияние: чем больше Самопринятие, тем меньше Адаптация.
Влияние Эмоционального комфорта, Интернальности и Стремление к доминированию близко к нулю, их можно исключить из Уравнения.
Регрессия в SPSS
Перейдите Анализ-Регрессия-Линейная
В поле Зависимые переменные внесите зависимую переменную (адаптация)
В поле независимые переменные внесите независимые (все остальные кроме Пола)
Затем нажмите Следующее для добавления еще 1 Блока, с целью сравнения полученных уравнений с разным количеством переменных (с Полом и без)
И в поле Независимые переменные внесите все переменные.
Нажмите ОК
Программа выведет полученные результаты
Как видим, что R-квадрат в первом случае такой же как в Excel, а уравнение с включением параметра Пол, имеет большую объяснительную дисперсию (0,653).
В первом случае полученные, такие же результаты как в Excel.
Во втором случае уравнение будет выглядеть следующим образом
Y=-0.65X+0.88Z-0.086W-0.028Q-0.155U+0.168K, где
Y – Адаптация
X – Самопринятие
Z – Принятие других
W – Эмоциональный комфорт
Q – Интернальность
U – Стремление к доминированию
K – Пол
Так же стоит обратить внимание на столбец Стандартизированные коэффициенты, он отражает фактическое влияние оказываемое независимой переменной на зависимую.
Анализ надежности
Анализ надежности необходим для проверки согласованности используемых измерений. То есть можно ли использовать все тесты в исследовании.
Коэффициент альфа
Коэффициент а является мерой внутренней согласованности, или однородности, измерительной
шкалы. Как правило, а лежит в пределах от 0 до 1, однако может принимать
и отрицательные значения. Последние свидетельствуют о том, что часть элементов, или
пунктов, шкалы измеряет противоположные величины. Чем ближе коэффициент а к 1,тем выше внутренняя согласованность системы заданий.
а > 0,9 — отличная;
а > 0,8 — хорошая;
а > 0,7 — приемлемая;
а > 0,6 — сомнительная;
а > 0,5 — малопригодная;
а < 0,5 — недопустимая.
Для расчета Альфа Кронбаха нажмите в SPSS Анализ-Шкалы-Анализ Надежности.
Перенесите измерения в поле Элементы
Нажмите Статистики.
Поставьте галочку Шкалы, если элемент удален.
Нажмите ОК
Программа выведет результаты.
Альфа Кронбаха = 0,427<0.5, необходимо изменить тесты.
Во второй таблице показано, каким станет коэффициент Альфа, в случае удаления измерения.
Также необходимо обратить внимание на колонку Исправленную корреляцию между элементом и итогом. Здесь показаны элементы, которые меньше всего связаны с окончательным результатом, то есть чем меньше значение, тем меньше влияет Параметр.
Надежность половинного расщепления
В случае, когда исследование включает в себя множество различных вопросов, то достаточно сложно корректно рассчитать Альфа Кронбаха, так как он основан на корреляции между элементами. Поэтому возможно разделить параметры на 2 группы вычислить Альфа отдельно.
В этом случае главную роль играет коэффициент корреляции между группами.
В SPSS.
Нажмите Анализ-Шкалы-Анализ надежности и выберите Модель – Разбиение надвое.
В полученной таблице нужно оценить коэффициент Альфа для каждой из групп, а также на остальные коэффициент. Они должны быть больше 0,5.
