
- •Министерство образования и науки Российской Федерации Автономная некоммерческая образовательная организация высшего профессионального образования «тамбовский институт социальных технологий»
- •Учебно-методический комплекс дисциплины «Математические методы психологии» Автор: к.Пс.Н. Андреева а.А.
- •Раздел 1. Организационно-педагогическое описание учебного курса «Математические методы в психологии»
- •1.1. Назначение и цели дисциплины
- •1.2. Обязательный минимум содержание дисциплины
- •1.3. Структура дисциплины
- •1.4. Общие методические рекомендации по организации самостоятельной работы при изучении дисциплины
- •1.5. Требования к знаниям студентов и уровню их подготовки по завершению изучения дисциплины
- •1.6. Критерии оценки знаний студентов
- •Раздел 2. Тематическое содержание учебной дисциплины «Математические методы в психологии»
- •2.1. Рабочая учебная программа
- •Вопросы для подготовки к зачету по курсу
- •Раздел 3. Лекционный материал
- •3.1.Содержание лекционного материала (основной информационный блок) по темам программы учебного курса.
- •1. Первичное представление экспериментальных данных. Первичные описательные статистики.
- •2. Нормальный закон распределения. Проверка нормальности распределения.
- •Проверка гипотез с помощью статистических критериев. Содержательная интерпретация статистического решения.
- •Параметрические методы сравнения двух выборок. Сравнение дисперсий. Критерий t-Стьюдента для зависимых и независимых выборок.
- •1. Случай несвязных выборок
- •Выявление различий в уровне исследуемого признака. Оценка сдвига.
- •Выявление различий в распределении признака. Применение многофункциональных критериев к решению психологических задач.
- •Корреляция метрических переменных.
- •Применение непараметрических коэффициентов корреляции.
- •1. Математико-статистические идеи метода регрессионного анализа
- •2. Множественная линейная регрессия. Нелинейная регрессия.
- •1. Назначение, общие понятия и применение anova.
- •2. Однофакторный дисперсионный анализ anova.
- •1. Математико-статистические идеи и проблемы метода.
- •2. Использование факторного анализа в психологии
- •1. Многомерное шкалирование: назначение. Суть методов многомерного шкалирования (мш).
- •2. Меры различия.
- •3. Неметрическая модель.
- •Дискриминантный анализ: назначение.
- •Математико-статистические идеи метода. Исходные данные и результаты.
- •Кластерный анализ (ка) и система классификации исследованных объектов.
- •2. Методы кластерного анализа
- •Раздел 4. Самостоятельная работа
- •4.1. Задания для самостоятельной работы по темам
- •4.2. Примерная тематика контрольных работ и методические рекомендации по их написанию
- •Примерная тематика контрольных работ
- •Раздел 5. Литература
- •5.1. Основная литература
- •5.2. Дополнительная литература
- •Раздел 6. Тезаурус (определения основных понятий, категорий).
1. Математико-статистические идеи метода регрессионного анализа
Взаимосвязь между переменными величинами может быть описана разными способами. Например, как было показано в предыдущей теме эту связь можно описать с помощью различных коэффициентов корреляции (линейных, частных, корреляционного отношения и т.п.). В то же время эту связь можно выразить по-другому: как зависимость между аргументом (величиной) Х и функцией Y. В этом случае задача будет состоять в нахождении зависимости вида Y = F(X) (или YX = F(X)) или, напротив, в нахождении зависимости вида Х= F(Y) (или Xy = F(Y)). При этом изменение функции в зависимости от изменений одного или нескольких аргументов называется регрессией. Понятие регрессии ввел в науку Ф. Гальтон.
Регрессионный анализ (лат. regressio — движение назад) - область статистического анализа, изучающая зависимость изменений значений переменных от одной или нескольких независимых переменных (факторов). Регрессионный анализ применим только по отношению к количественно выраженным переменным, измеряемым в интервальных шкалах. Различные способы регрессионного анализа широко применяются в эмпирических психодиагностических исследованиях для выявления влияния отдельных факторов на результирующие показатели теста, анализа надежности, внутренней и внешней валидности методики и др.
Итак, регрессионная модель описывает зависимость случайно величины от независимой величины в генеральной совокупности. Но поскольку вся генеральная совокупность недоступна для наблюдений, то истинное уравнение регрессии неизвестно, и люба регрессионная модель будет лишь приближением к действительности.
Как выбрать наилучшую регрессионную модель? Математическая статистика по этому поводу говорит, что выбор модели – искусство и правильность выбора целиком зависит от опыта исследователя. Обычно при выборе модели исходят из предметного анализа явления (какую форму связи можно ожидать?), и если имеющейся информации недостаточно, то, как правило, помогает графическое представление экспериментальных данных в виде диаграммы рассеяния (корреляционного поля) (рис. 1).
Если удается «на глазок» провести прямую линию, так, что все значения случайное величины будет достаточно близки к ней, то можно ожидать, что модель простой линейной регрессии окажется в данном случае адекватной экспериментальным данным.
Основными процедурами регрессионного анализа являются построение линий регрессии и нахождение уравнений регрессии.
Под линией регрессии понимается линия, соединяющая точки средних значений сгруппированных признаков-факторов (т. е. тех признаков, влияние которых на переменную изучается). Построенные таким образом линии в общем виде определяют взаимодействие изучаемого показателя и одного (или группы) из объясняющих факторов, позволяют дать предварительную наглядную оценку воздействия фактора на результирующий признак (рис. 1).
Оценка по тесту
yx
Рис. 1. Эмпирическая и выровненная линии регрессии средних оценок по тесту при лонгитюдном обследовании группы испытуемых.
Уравнение регрессии (упрощенно уравнение парной регрессии, описывающее воздействие одного фактора на результирующий признак) строится следующим образом. Линейная зависимость признака описывается уравнением
y = а + bх (1),
где a — свободный член уравнения,
b — коэффициент регрессии.
С точки зрения аналитической геометрии b — угловой коэффициент, определяющий наклон линии регрессии по отношению к осям X, Y.
В аспекте регрессионного анализа этот параметр показывает, насколько в среднем величина признака Y изменяется при соответствующем изменении на единицу меры признака X. Наглядное представление об этом параметре и о положении линий регрессии Y по Х и Х по Y в системе прямоугольных координат дает рис. 2.
Показано, что линии регрессии пересекаются в точке 0 (х, у ), соответствующей средним арифметическим корреляционно связанных друг с другом признаков Y и X. Линия АВ, проходящая через эту точку, изображает полную функциональную зависимость между переменными Y и Х (коэффициент корреляции r = 1). Чем сильней связь между Y и X, тем ближе линии регрессии к АВ, и наоборот, чем слабее эта связь, тем более удаленными оказываются линии регрессии от АВ. При отсутствии связи между признаками (r = 0) линии регрессии оказываются под прямым углом по отношению друг к другу.
x/y
Рис. 2. Линии регрессии Х по Y и Y по Х в системе прямоугольных координат
Линия регрессии выражает наилучшее предсказание зависимой переменной по независимым переменным. Эти независимые переменные, а их может быть много, носят название предикторов.
Главная задача регрессионного анализа заключается, собственно говоря, в нахождении коэффициентов а и b и определении уровня значимости полученных аналитических выражений.
Для нахождения рассмотренных выше параметров (а, b) решается система уравнений:
∑
y
= an + b ∑x;
∑xy = a ∑x + b ∑ x2,
∑y ∑ x2 - ∑x ∑ xy
отсюда ayx = n∑x2 – (∑x)2 (2);
∑x ∑ y2 - ∑y ∑ xy
axy = n ∑y2 – (∑y)2 (3);
n ∑ xy - ∑x ∑ y
byx = n∑x 2 – (∑x)2 (4) ;
n ∑ xy - ∑x ∑ y
bxy = n∑y2 – (∑y)2 (5) .
В выражениях (2) - (5) используются следующие обозначения:
n - число элементов в переменной X или в переменной Y,
∑x - сумма всех элементов переменной X,
∑y - сумма всех элементов переменной Y,
∑y2 - произведение всех элементов переменной Y друг на друга,
∑x 2 - произведение всех элементов переменной X друг на друга,
∑ xy - попарное произведение всех элементов переменной X на соответствующие элементы переменной Y.
Приведем несколько примеров линейной регрессии.
Пример 1. В исследовании Ф. Гальтона был измерен рост 205 родителей и 930 их взрослых детей (см. таблицу ). При этом, если за Y взять рост ребенка, а за X рост родителя, уравнение регрессии, связывающее рост ребенка с ростом родителей, имеет вид:
Yар =Yi + 2/3 ∙ (Xi – Xар) (6)
где Yар , Xар - средние по всей выборке испытуемых.
Таким образом, зная величины средних по всей выборке и рост одного из родителей — Хi из уравнения (6) можно подсчитать величину Yi, т.е. рост ребенка.
Таблица 1
-
Рост родителей
Рост детей в дюймах
Всего
60,7
62,7
64,7
66,7
68,7
70,7
72,7
74,7
74
4
4
72
1
4
11
17
20
6
62
70
1
2
21
48
83
66
22
8
251
68
1
15
56
130
148
69
11
430
66
1
15
19
56
41
11
1
144
64
2
7
10
14
4
37
Всего
5
39
107
255
387
163
58
14
928
В таблице представлены классические данные Ф. Гальтона, иллюстрирующие наличие положительной зависимости между ростом родителей и их детей. Таблица организована таким образом, что позволяет оценить частоту встречаемости в популяции однозначно фиксируемых соотношений роста родителей и роста ребенка. Например, при низком росте родителей в 66 дюймов (1 дюйм равен 2,54 см) только один из 144 обследованных детей имел рост в 60,7 дюймов, а 56 детей имели рост 66,7 дюйма. В то же время высокий рост детей (74,7 дюйма) был зафиксирован только в тех семьях, где родители имели рост не ниже 70 дюймов.
Эта таблица позволяет выявить тенденцию, заключающуюся в том, что у высоких родителей, как правило, дети имеют высокий рост, а у низкорослых родителей чаще бывают дети невысокого роста. Данный пример показывает, что таблицы имеют не только иллюстративное, но и аналитическое значение, позволяя обнаруживать разные аспекты связей между варьирующими признаками.
Пример 2. Психологи выявили взаимосвязь между успешностью обучения математике Y и показателем невербального интеллекта X. Было получено следующее уравнение регрессии:
Y= 1 +0,025 X (7)
Предположим, что показатель невербального интеллекта учащегося равен 132, тогда согласно уравнению регрессии (7) можно предсказать его показатель средней успеваемости по математике:
Y= 1 + 0,025 132 = 4,3
У другого учащегося показатель невербального интеллекта оказался равен 82, тогда его средняя успеваемость по математике составит:
Y= 1 + 0,025 82 = 3,05
Для применения метода линейного регрессионного анализа необходимо соблюдать следующие условия:
1. Сравниваемые переменные X и Y должны быть измерены в шкале интервалов или отношений.
2. Предполагается, что переменные X и Y имеют нормальный закон распределения.
3. Число варьирующих признаков в сравниваемых переменных должно быть одинаковым.