
- •Министерство образования и науки Российской Федерации Автономная некоммерческая образовательная организация высшего профессионального образования «тамбовский институт социальных технологий»
- •Учебно-методический комплекс дисциплины «Математические методы психологии» Автор: к.Пс.Н. Андреева а.А.
- •Раздел 1. Организационно-педагогическое описание учебного курса «Математические методы в психологии»
- •1.1. Назначение и цели дисциплины
- •1.2. Обязательный минимум содержание дисциплины
- •1.3. Структура дисциплины
- •1.4. Общие методические рекомендации по организации самостоятельной работы при изучении дисциплины
- •1.5. Требования к знаниям студентов и уровню их подготовки по завершению изучения дисциплины
- •1.6. Критерии оценки знаний студентов
- •Раздел 2. Тематическое содержание учебной дисциплины «Математические методы в психологии»
- •2.1. Рабочая учебная программа
- •Вопросы для подготовки к зачету по курсу
- •Раздел 3. Лекционный материал
- •3.1.Содержание лекционного материала (основной информационный блок) по темам программы учебного курса.
- •1. Первичное представление экспериментальных данных. Первичные описательные статистики.
- •2. Нормальный закон распределения. Проверка нормальности распределения.
- •Проверка гипотез с помощью статистических критериев. Содержательная интерпретация статистического решения.
- •Параметрические методы сравнения двух выборок. Сравнение дисперсий. Критерий t-Стьюдента для зависимых и независимых выборок.
- •1. Случай несвязных выборок
- •Выявление различий в уровне исследуемого признака. Оценка сдвига.
- •Выявление различий в распределении признака. Применение многофункциональных критериев к решению психологических задач.
- •Корреляция метрических переменных.
- •Применение непараметрических коэффициентов корреляции.
- •1. Математико-статистические идеи метода регрессионного анализа
- •2. Множественная линейная регрессия. Нелинейная регрессия.
- •1. Назначение, общие понятия и применение anova.
- •2. Однофакторный дисперсионный анализ anova.
- •1. Математико-статистические идеи и проблемы метода.
- •2. Использование факторного анализа в психологии
- •1. Многомерное шкалирование: назначение. Суть методов многомерного шкалирования (мш).
- •2. Меры различия.
- •3. Неметрическая модель.
- •Дискриминантный анализ: назначение.
- •Математико-статистические идеи метода. Исходные данные и результаты.
- •Кластерный анализ (ка) и система классификации исследованных объектов.
- •2. Методы кластерного анализа
- •Раздел 4. Самостоятельная работа
- •4.1. Задания для самостоятельной работы по темам
- •4.2. Примерная тематика контрольных работ и методические рекомендации по их написанию
- •Примерная тематика контрольных работ
- •Раздел 5. Литература
- •5.1. Основная литература
- •5.2. Дополнительная литература
- •Раздел 6. Тезаурус (определения основных понятий, категорий).
Примерная тематика контрольных работ
Предмет и задачи дисциплины
Понятие измерения. Виды измерительных шкал.
Генеральная совокупность и выборка.
4.Первичная описательная статистика. Меры центральной тенденции.
Меры изменчивости.
Закон нормального распределения и его применение.
Параметрические критерии сравнения двух выборок.
Непараметрические критерии сравнения выборок. Критерий Викоксона Манна- Уитни. Критерий H Крускала-Уоллеса.
Понятие корреляции. Корреляционный анализ.
Коэффициент произведения моментов Пирсона. Коэффициент ранговой корреляции Спирмена
Корреляция бинарных данных. Коэффициент ассоциации.
Расчет дихотомических данных. Критерий согласия хи-квадрат.
Принцип проверки статистических гипотез.
Линейная регрессия
Множественный регрессионный анализ.
Дисперсионный анализ (ANOVA)
Кластерный анализ
Факторный анализ
Выбор подходящего метода математического обобщения результатов применительно к задачам психологического исследования
Классификация психологических задач и методов их статистического решения
Раздел 5. Литература
5.1. Основная литература
Суходольский Г.В. Математические методы в психологии.-3-е изд., испр. Гуманитарный центр 2008
5.2. Дополнительная литература
1. Ермолаев-Томин О. Ю. Математические методы в психологии. Учебник для бакалавров 4-е изд., пер. и доп. - М.: ЮРАЙТ, 2012. «Университетская библиотека» www.biblioclub.ru
2. Основные методы сбора данных в психологии. Учебное пособие - М.: Аспект Пресс, 2012. «Университетская библиотека» www.biblioclub.ru
Раздел 6. Тезаурус (определения основных понятий, категорий).
Альтернативная гипотеза - это гипотеза о значимости различий.
Вариационный размах - разность между наибольшей и наименьшей вариантами.
Вероятность (математическая) P - это определенная количественная (и соответственно формализованная) оценка (или мера) объективной возможности появления определенного события А в заданной совокупности условий, что обозначается обычно как Р(А).
Выборка - группа каких-либо явлений, событий, являющаяся частью практически бесконечной генеральной совокупности.
Генеральная совокупность - это неограниченно большая или вся мыслимая совокупность измерений, индивидуумов или явлений, о свойствах которых мы собираемся судить в результате эксперимента, на основании данной статистической совокупности.
Гистограмма используется для графического представления распределений непрерывно варьирующих признаков и состоит из примыкающих друг к другу прямоугольников. Основание каждого прямоугольника равно ширине интервала группировки, а высота его такова, что площадь прямоугольника пропорциональна частоте (или частости) попадания в данный интервал.
Группировка представляет собой процесс систематизации, или упорядочения, первичных данных с целью извлечения содержащейся в них информации. Группировка выполняется различными методами в зависимости от целей исследования, вида изучаемого признака и количества экспериментальных данных (объема выборки), но наиболее часто группировка сводится к представлению данных в виде статистических таблиц.
Групповая таблица (или корреляционная решетка) - результат совместной группировки двух варьирующих рядов, которые исследуются на корреляцию. В клетках таблицы проставляется число вариант с данными параметрами.
Дискриминантный анализ- разновидность регрессионного анализа, который позволяет использовать непрерывные независимые переменные, для того, чтобы поместить индивидуальные случаи в категории зависимой переменной. Например, можно использовать такие переменные, как индекс оценок или число дней отсутствия в школе, чтобы предсказать, закончат ли учащиеся школу вовремя.
Дисперсия - величина равная квадрату стандартного отклонения.
Дисперсионный анализ, предложенный Р. Фишером, является статистическим методом, предназначенным для выявления влияния ряда отдельных факторов на результаты экспериментов. Этот метод базируется на предположении о том, что если на объект (группу испытуемых) влияет несколько независимых факторов и их влияние складывается, то общую дисперсию значений признака, характеризующую объект (группу испытуемых), можно разложить на сумму дисперсий, возникающих в результате воздействия каждого отдельного фактора, а также обусловленных случайными влияниями (остаточная дисперсия).
Доверительный интервал – интервал, который построен с учетом вероятности попадания значения параметра в границы интервала.
Зависимые (связные) выборки – это выборки, для которых соблюдается условие: если процедура эксперимента и полученные результаты измерения некоторого свойства, проведенные на одной выборке, оказывают влияние на другую.
Закон больших чисел – трактовка: если однородное событие наблюдается в очень большом числе испытаний и его исходы зависят от постоянных причин, имеющих определенное направление, но меняющихся в ту и другую стороны вне каких-либо закономерностей, то между результатами различных испытаний устанавливаются почти неизменные отношения.
Измерение - это приписывание какому-либо явлению определенного числа в соответствии с определенными правилами.
Кластерный анализ предназначен для разбиения множества объектов на заданное или неизвестное число классов на основании некоторого математического критерия качества классификации (cluster (англ.) — гроздь, пучок, скопление, группа элементов, характеризуемых каким-либо общим свойством).
Корреляционная зависимость - это изменения, которые вносят значения одного признака в вероятность появления разных значений другого признака.
Корреляционная связь - это согласованные изменения двух признаков или большего количества признаков (множественная корреляционная связь).
Корреляционное поле (диаграмма рассеяния) - совокупность точек на плоскости, у которых оси абсцисс и ординат есть значения двух сопоставляемых статистических признаков.
Корреляция бисериальная (лат. bis series — два ряда, две серии) — метод корреляционного анализа отношения переменных, одна из которых измерена в дихотомической шкале наименований, а другая — в интервальной шкале отношений или порядковой шкале. К ней относятся: точечный бисериальный коэффициент корреляции, бисериальный коэффициент корреляции, рангово-бисериальный коэффициент корреляции.
Коэффициент (показатель) асимметрии А дает численную меру скошенности распределений.
Коэффициента асцилляции - отношение размаха вариации к средней арифметической величине, выраженное в процентах.
Коэффициент вариации - это выраженное в процентах отношение стандартного отклонения к среднему арифметическому значению.
Коэффициент корреляции - это математический показатель силы (тесноты) связи между двумя сопоставляемыми статистическими признаками.
Коэффициент линейной корреляции Пирсона - метод является параметрическим, характеризует наличие только линейной связи между признаками.
Коэффициент корреляции Кендалла - коэффициент корреляции Кендалла относится к числу непараметрических, предназначен для работы с данными, полученными в ранговой шкале.
Коэффициент корреляции Пирсона (коэффициент ассоциации, тетрахорический коэффициент корреляции) используется при сравнении двух переменных, измеренных в дихотомической шкале.
Коэффициент корреляции рангов Ч. Спирмена относится к непараметрическим показателям связи между переменными, измеренными в ранговой шкале.
Критерий знаков – критерий, предназначенный для установления общего направления сдвига исследуемого признака. Он позволяет установить, в какую сторону в выборке в целом изменяются значения признака при переходе от первого измерения ко второму.
Критерий Колмогорова - Смирнова предназначен для сопоставления двух распределений: эмпирического с теоретическим (равномерным или нормальным); одного эмпирического распределения с другим эмпирическим распределением.
Критерий Крускала-Уоллиса -критерий предназначен для оценки различий одновременно между тремя, четырьмя и т.д. выборками по уровню какого-либо признака. Он позволяет установить, что уровень признака изменяется при переходе от группы к группе, но не указывает на направление этих изменений.
Критерий Макнамары относится к числу непараметрических критериев и предназначен для работы с данными, полученными в самой простой из номинальных — в дихотомической шкале.
Критерий Манна-Уитни - критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественного измеренного. Он позволяет выявлять различия между малыми выборками, когда n1, n2 ≥ 3 или n1 =2, n2 ≥ 5 и является более мощным, чем критерий Розенбаума.
Критерии многофункциональные - это критерии, которые могут использоваться по отношению к самым разнообразным данным, выборкам и задачам.
Критерии непараметрические - критерии, не включающие в формулу расчета параметров распределения и основанные на оперировании частотами или рангами (критерий Q Розенбаума, критерий Т Вилкоксона и др.).
Критерии параметрические - критерии, включающие в формулу расчета параметры распределения, т.е. средние и дисперсии (t-критерий Стьюдента, критерий F).
Критерий Пейджа применяется для сопоставления показателей, измеренных в трех и более условиях на одной и той же выборке испытуемых. Критерий позволяет выявить тенденции в изменении величин признака при переходе от условия к условию.
Критерий Пирсона применяется для сопоставления эмпирического распределения признака с теоретическим - равномерным, нормальным или каким-то иным; для сопоставления двух, трех и более эмпирических распределений одного и того же признака.
Критерий тенденций Джонкира предназначен для выявления тенденций изменения признака при переходе от выборки к выборке при сопоставлении трех и более выборок, позволяет упорядочить обследованные выборки по какому-либо признаку.
Критерий Фридмана применяется для сопоставления показателей, измеренных в трех или более условиях на одной и той же выборке испытуемых. Критерий позволяет установить, что величины показателей от условия к условию изменяются, но при этом не указывает на направление изменений.
Линейный коэффициент вариации – это отношение линейного отклонения к средней арифметической величине, выраженное в процентах.
Линии регрессии - линии, отображающие зависимость каждого статистического признака от средней величины другого статистического признака.
Математическая обработка - это оперирование со значениями признака, полученными у испытуемых в психологическом исследовании.
Математическая психология - особая научная дисциплина, находящаяся на стыке психологии и математики и направленная на: 1) исследование теоретических вопросов применения математического аппарата в психологии; 2) математическое моделирование сложных систем, обладающих «психическими свойствами»; 3) разработку и применение математических методов.
Математическая статистика является прикладной областью математики, основанной на теории вероятностей и предназначенной для систематизации и анализа эмпирических (опытных) данных, получаемых при изучении массовых явлений, т.е. явлений повторяющихся и непременно варьирующихся.
Медиана - это такое значение переменной, которое является срединным, центральным (по положению) в общем упорядоченном ряду вариант выборки.
Методы многомерного шкалирования – это методы, при использовании которых предполагается, что в основе сложных суждений человека лежит система из нескольких субъективных шкал, которая и формирует субъективное пространство.
Методы психологического шкалирования: методы измерения чувствительности; методы одномерного шкалирования; методы многомерного шкалирования.
Меры изменчивости – статистические показатели вариации (разброса) признака относительно среднего значения, степени индивидуальных отклонений от центральной тенденции распределения.
Меры центральной тенденции - характеристики совокупности переменных (признака), указывающие на наиболее типичный, репрезентативный для данной выборки результат. Чаще всего используются: средние величины, медиана, мода.
Мода - это значение варианты, наиболее часто встречающееся в выборке.
Мощность критерия - это его способность выявлять различия, если они есть.
Независимые (несвязные) выборки – ими являются такие выборки, если процедура эксперимента и полученные результаты измерения некоторого свойства у испытуемых одной выборки не оказывают влияния на особенности протекания этого же эксперимента и результаты измерения этого же свойства у испытуемых другой выборки.
Нулевая гипотеза - это гипотеза об отсутствии различий.
Объект измерения - свойства изучаемых эмпирических объектов.
Объем совокупности (выборки) - общее число вариант в статистической совокупности (выборке), общее количество единичных измерений.
Ошибка 1 рода - ошибка, состоящая в том, что мы отклонили нулевую гипотезу, в то время как она верна.
Ошибка II рода - ошибка, состоящая в том, что мы приняли нулевую гипотезу, в то время как она неверна.
Полигон накопленных частот (кумулята) получается при соединении отрезками прямых точек, координаты которых соответствуют верхним границам интервалов группировки и накопленным частотам.
Полигон (или многоугольник) частот- это ломаная линия, соединяющая точки, соответствующие величинам частот, откладываемым по оси ординат, по оси абсцисс откладывается значение признака (срединные значения интервалов группировки).
Правило 3-х (трех сигм) проверки принадлежности к выборке крайних ее членов – данное правило основано на том, что в интервале М3 располагается 99,7% всех вариант, образующих нормальное распределение; при допущении такого распределения и после соответствующих вычислений и можно отбросить варианты, меньшие, чем 3σ, и большие, чем +3σ, как чрезвычайно маловероятные.
Регрессионный анализ (лат. regressio — движение назад) - область статистического анализа, изучающая зависимость изменений значений переменных от одной или нескольких независимых переменных (факторов).
Репрезентативная (представительная) выборка – это такая выборка, в которой все основные признаки генеральной совокупности представлены приблизительно в той же пропорции и с той же частотой, с которой данный признак выступает в данной генеральной совокупности.
Статистическая гипотеза - это формальное предположение о том, что сходство (или различие) некоторых параметрических или функциональных характеристик случайно или, наоборот, неслучайно. Статистические гипотезы подразделяются на нулевые и альтернативные, направленные и ненаправленные.
Статистический критерий - это решающее правило, обеспечивающее надежное поведение, т.е. принятие истинной и отклонение ложной гипотезы с высокой вероятностью.
Событие - это один из возможных исходов эксперимента. События могут быть и равновероятными, и разновероятными, но сумма вероятностей всех возможных событий, всех исходов эксперимента должна равняться 1 (полная группа событий).
Способы графического представления - гистограмма, полигон частот и полигон накопленных частот (кумулята).
Среднее квадратическое отклонение (ошибка), или стандартное отклонение , вычисляется для сгруппированных данных по следующей формуле:
= ( fi (xi - Xар)2) / N-1
Среднее квартильное отклонение (или семиинтерквартильный размах) - это мера разброса в распределениях, которые имеют параметром средней величины медиану. Квартильное отклонение Q - это половина расстояния между двумя квартилями: верхним Qв и нижним Qн.
Табулирование - то построение таблиц или собственно статистических распределений, в которых каждой варианте поставлена в соответствие ее частота в выборке или при необходимости – частость.
Тау- критерий - количественная оценка отклонения максимальной и минимальной вариант в выборке.
Уравнение регрессии (упрощенно уравнение парной регрессии, описывающее воздействие одного фактора на результирующий признак) описывается уравнением y = а + bх, где a — свободный член уравнения, b — коэффициент регрессии.
Уровень значимости - это вероятность того, что мы сочли различия существенными, а они на самом деле случайны, или вероятность отвергания гипотезы в случае ее справедливости.
Частота - число, показывающее, сколько раз встречается в выборке каждая варианта хi , так что по определению сумма всех частот равна объему выборки.
Частость - это доля каждой частоты fi в общем объеме выборки N.
Шкала наименований - это шкала, классифицирующая по названию.
Шкала порядковая - это шкала, классифицирующая по принципу “больше - меньше”, но не имеет смысла ни вопрос - на сколько больше, ни вопрос - во сколько раз больше.
Шкала интервальная - это шкала, классифицирующая по принципу “больше на определенное количество единиц - меньше на определенное количество единиц”.
Шкала (равных) отношений (самая “сильная” шкала) - это шкала классифицирующая объектов или субъектов пропорционально степени выраженности измеряемого свойства.
Шкалирование (англ. scalling – определение масштаба, единицы измерения) – метод моделирования явлений с помощью числовых систем, способ организации в измерительных шкалах данных экспериментальных исследований, анализа информации.
Эксцесс - это количественная мера “горбатости” симметричного распределения, т.е. некоторой плавности (крутости, остро- или туповершинности) верхней части распределения.