
- •Министерство образования и науки Российской Федерации Автономная некоммерческая образовательная организация высшего профессионального образования «тамбовский институт социальных технологий»
- •Учебно-методический комплекс дисциплины «Математические методы психологии» Автор: к.Пс.Н. Андреева а.А.
- •Раздел 1. Организационно-педагогическое описание учебного курса «Математические методы в психологии»
- •1.1. Назначение и цели дисциплины
- •1.2. Обязательный минимум содержание дисциплины
- •1.3. Структура дисциплины
- •1.4. Общие методические рекомендации по организации самостоятельной работы при изучении дисциплины
- •1.5. Требования к знаниям студентов и уровню их подготовки по завершению изучения дисциплины
- •1.6. Критерии оценки знаний студентов
- •Раздел 2. Тематическое содержание учебной дисциплины «Математические методы в психологии»
- •2.1. Рабочая учебная программа
- •Вопросы для подготовки к зачету по курсу
- •Раздел 3. Лекционный материал
- •3.1.Содержание лекционного материала (основной информационный блок) по темам программы учебного курса.
- •1. Первичное представление экспериментальных данных. Первичные описательные статистики.
- •2. Нормальный закон распределения. Проверка нормальности распределения.
- •Проверка гипотез с помощью статистических критериев. Содержательная интерпретация статистического решения.
- •Параметрические методы сравнения двух выборок. Сравнение дисперсий. Критерий t-Стьюдента для зависимых и независимых выборок.
- •1. Случай несвязных выборок
- •Выявление различий в уровне исследуемого признака. Оценка сдвига.
- •Выявление различий в распределении признака. Применение многофункциональных критериев к решению психологических задач.
- •Корреляция метрических переменных.
- •Применение непараметрических коэффициентов корреляции.
- •1. Математико-статистические идеи метода регрессионного анализа
- •2. Множественная линейная регрессия. Нелинейная регрессия.
- •1. Назначение, общие понятия и применение anova.
- •2. Однофакторный дисперсионный анализ anova.
- •1. Математико-статистические идеи и проблемы метода.
- •2. Использование факторного анализа в психологии
- •1. Многомерное шкалирование: назначение. Суть методов многомерного шкалирования (мш).
- •2. Меры различия.
- •3. Неметрическая модель.
- •Дискриминантный анализ: назначение.
- •Математико-статистические идеи метода. Исходные данные и результаты.
- •Кластерный анализ (ка) и система классификации исследованных объектов.
- •2. Методы кластерного анализа
- •Раздел 4. Самостоятельная работа
- •4.1. Задания для самостоятельной работы по темам
- •4.2. Примерная тематика контрольных работ и методические рекомендации по их написанию
- •Примерная тематика контрольных работ
- •Раздел 5. Литература
- •5.1. Основная литература
- •5.2. Дополнительная литература
- •Раздел 6. Тезаурус (определения основных понятий, категорий).
1. Первичное представление экспериментальных данных. Первичные описательные статистики.
Основой применения математических методов в психологии является теория психологических измерений.
Правила, на основании которых числа приписываются объектам, определяют шкалу измерения.
Шкала (лат. scala — лестница) в буквальном значении есть измерительный инструмент.
Измерительная шкала — основное понятие, введенное в психологию в 1950 г. С.С.Стивенсом.
С.Стивенсом предложена классификация из четырех основных типов шкал измерения:
1) номинативная, или номинальная, или шкала наименований; 2) порядковая, или ординальная, шкала; 3) интервальная, или шкала (равных) интервалов; 4) шкала (равных) отношений.
В основу этой классификации положен признак метрической детерминированности.
Метрические (интервальные и шкалы отношений) и неметрические (номинативные, шкалы порядка).
Шкала наименований - это шкала, классифицирующая по названию: nomen - имя, название. Название же не измеряется количественно, оно лишь позволяет отличить один объект от другого или одного субъекта от другого.
Единица измерения - количество наблюдений (испытуемых, реакций, выборов) или частота.
Методы 2, биноминальный критерий m и угловое преобразование Фишера .
Порядковая шкала - это шкала, классифицирующая по принципу “больше - меньше”, но не имеет смысла ни вопрос - на сколько больше, ни вопрос - во сколько раз больше. Порядковые шкалы дают возможность оценить степень выраженности признака.
Применимы метод ранговой корреляции, непараметрические критерии.
Интервальная шкала - это шкала, классифицирующая по принципу “больше на определенное количество единиц - меньше на определенное количество единиц”. Каждое из возможных значений признака отстоит от другого на равном расстоянии.
К разряду шкалы интервалов относятся шкалы IQ - показателя стандартного, Е-баллов, процентилей.
Шкала (равных) отношений (самая “сильная” шкала) - это шкала классифицирующая объектов или субъектов пропорционально степени выраженности измеряемого свойства. Пример - шкала порогов абсолютной чувствительности анализатора.
Формы фиксации эмпирических данных: шкалы вербальные, шкалы числовые и шкалы графические.
Шкала вербальная – форма фиксации данных в шкалах измерительных, опирающаяся на набор суждений о наличии или степени выраженности изучаемого признака.
Шкала числовая (балльная) – форма фиксации данных в измерительных шкалах посредством их числовых значений.
Шкала графическая – форма фиксации данных по шкалам измерительным при помощи наглядного отображения развития признака в виде непрерывной линии или определенной фигуры.
Шкалирование (англ. scalling – определение масштаба, единицы измерения) – метод моделирования явлений с помощью числовых систем. Это способ организации в измерительных шкалах данных экспериментальных исследований, анализа информации.
Методы психологического шкалирования: 1) методы измерения чувствительности; 2) методы одномерного шкалирования; 3) методы многомерного шкалирования.
Существуют различные способы последовательной записи вариант (вариационного ряда).
Начинают с записи в алфавитном порядке (по первой букве имени или фамилии испытуемого), далее возможно упорядочить варианты по убыванию или возрастанию.
Если группа большая, то будут возникать ситуации, когда несколько человек получают одинаковые оценки, результаты. Поэтому следующим шагом осуществляют ранжирование.
Следующий способ упорядочивания - табулирование. Это построение таблиц или собственно статистических распределений, в которых каждой варианте Xi поставлена в соответствие ее частота в выборке или при необходимости – частость.
Группировка представляет собой процесс систематизации, или упорядочения, первичных данных с целью извлечения содержащейся в них информации. Группировка выполняется различными методами в зависимости от целей исследования, вида изучаемого признака и количества экспериментальных данных (объема выборки), но наиболее часто группировка сводится к представлению данных в виде статистических таблиц.
Наиболее распространенными способами графического представления являются гистограмма, полигон частот и полигон накопленных частот (кумулята).
Гистограмма используется для графического представления распределений непрерывно варьирующих признаков и будет представлять график, имеющий вид прямоугольников, основание которых (по оси абсцисс) соответствует интервалу, а высота - частоте (частотному интервалу);
Полигон (или многоугольник) частот. Это ломаная линия, соединяющая точки, соответствующие величинам частот, откладываемым по оси ординат, по оси абсцисс откладывается значение признака (срединные значения интервалов группировки).
Полигон накопленных частот (кумулята) получается при соединении отрезками прямых точек, координаты которых соответствуют верхним границам интервалов группировки и накопленным частотам. Если по оси ординат откладывать накопленные частости, то полученный график называется полигоном накопленных частостей.
Помимо указанных, могут оказаться полезными графические представления в виде различных диаграмм, например, круговых.
Кривая распределения. Основные типы форм распределения эмпирических результатов.
Кривая распределения - это предел, к которому стремится полигон частот при неограниченном увеличении объема статистической совокупности и уменьшении. Она дает характеристику некоторой генеральной совокупности, т.е. получаемые в эксперименте выборки лишь в той или иной степени приближаются к своему теоретическому пределу. Кривая распределения позволяет наглядно представить форму распределения, т.е. определенную закономерность специфической концентрации вариант в цельной статистической совокупности.
Принято выделять две большие группы кривых распределений: одновершинные и многовершинные (составные) (рис. ).
Одновершинные распределения делятся на следующие группы:
а) симметричные (см.рис.б), т.е. такие, в которых идет равновероятное уменьшение величины признака по обе стороны от некоторого и максимально частого значения; примером таких, сравнительно редко встречающихся в практике распределений является расположение людей по величине роста;
б) умеренно асимметричные или скошенные (см.рис. в), в которых убывание числовых значений переменной в одну из сторон выражено заметно сильнее; таковы, например, распределения подавляющего большинства измерений эффективности человеческой деятельности;
в) распределения крайне асимметричные (см.рис., г), характерные, например, для распределения населения по величине материальной обеспеченности;
г) U-образные (см.рис., д), в которых наибольшая частота свойственна обоим крайним значениям признака, например, распределение облачности в районе Гринвичского меридиана.
Таким образом, очевидна большая показательность формы статистического распределения и необходимость ее рассмотрения при анализе полученных данных.
а - многовершинные, б - симметричные, в - умеренно скошенные, г - крайне асимметричные, д — U-образные.
Числовые характеристики выборки: меры центральной тенденции, меры изменчивости (рассеяния, разброса).
В качестве меры центральной тенденции (т.е. величины, вокруг которой группируются отдельные, расходящиеся между собой значения показателя), представляющей множество данных одним числом чаще всего используются: средние величины, медиана, мода.
Среднее значение (центральное) - это некий обобщающий показатель положения и уровня центра распределения, т.е. того значения признака, вокруг которого концентрируются все другие варьирующие значения. Поэтому выбор формы средней - это выбор способа опосредствования данных, заключенных в полном объеме исходной выборки.
Средняя арифметическая величина – одна из основных характеристик выборки.
Для несгруппированных данных среднее арифметическое вычисляется по формуле:
n
Xар = 1/n( xi),
i =1
где хi - значение варианты с номером от 1 до n, N - объем выборки.
n
xi – обозначение суммы n чисел xi, где индекс i (порядковый номер)
i =1 суммируемых чисел пробегает значения от 1 до n (1, 2, …, n).
Если данные сгруппированы, то
k
Xар = 1/n ( fi xi),
i =1
где хi - срединные значения интервалов, f i - частоты интервалов, n - объем выборки, k – число интервалов группировки.
Во втором случае среднее арифметические называют также взвешенным средним.
Сумма отклонений всех вариант от среднего арифметического равняется нулю (( xi - Xар)=0), средняя арифметическая суммы (разности) нескольких выборок равна сумме (или разности) средних арифметических значений этих выборок.
В практике измерений параметр Xар чрезвычайно распространен, и превратился в определенный стереотип при количественном анализе результатов. В ряде практических случаев, при недостаточности объема выборки некритическое использование параметра средней арифметической величины чревато серьезными ошибками в последующем содержательном анализе экспериментального материала (так называемые огульные средние).
Медиана Мd - это такое значение переменной, которое является срединным, центральным (по положению) в общем упорядоченном ряду вариант выборки.
Для определения медианы можно воспользоваться следующей формулой (n+1 – е место): n+1/ 2.
Если выборка содержит четное число членов, то медиана есть, точка, лежащая по середине между двумя центральными значениями.
Медиана менее подвержена влияниям случайных (в особенности крайних) колебаний вариант, выгодна в случае неточностей концов распределения.
Медиана совпадает со средней арифметической только в случае распределения симметричного. Для тех случаев, когда эмпирическое распределение оказывается сильно асимметричным, медиана представляет собой лучшую характеристику центра распределения.
Мода Мо - это значение варианты, наиболее часто встречающееся в выборке. Мода указывает наиболее типичное значение статистического признака и представляет особый интерес в распределении асимметричном, где вокруг значения моды концентрируются наибольшие частоты выборки.
Моду находят согласно следующим правилам:
В том случае, когда все значения в выборке встречаются одинаково часто, принято считать, что этот выборочный ряд не имеет моды.
Когда два соседних (смежных) значения имеют одинаковую частоту и их частота больше частот любых других значений, мода вычисляется как среднее арифметическое этих двух значений.
Если два несмежных (не соседних) значения в выборке имеют равные частоты, которые больше частот любого другого значения, то выделяют две моды.
Могут существовать и так называемые мультимодальные распределения, имеющие более двух мод (вершин).
Если мода оценивается по множеству сгруппированных данных, то для нахождения моды необходимо определить группу с наибольшей частотой признака. Эта группа называется модальной группой.
Параметр моды незаменим для шкалы наименований, и удобен для всех других шкал измерения, особенно для случаев большой вариативности показателя, для распределений многовершинных, где мода как бы выразительница типа.
Меры изменчивости (рассеяния, разброса) вариант – статистические показатели вариации (разброса) признака относительно среднего значения, степени индивидуальных отклонений от центральной тенденции распределения. Меры изменчивости позволяют судить о достоверности и однородности полученной эмпирически совокупности данных, существенности сходств и различий в распределении и сравниваемых группах распределений, точности проведенных измерений.
Простейшей мерой рассеяния является вариационный размах (обозначается lim, R, W). Размах вариации вычисляется как разность между наибольшей и наименьшей вариантами: R = хmax - хmin.
Информативность этого показателя невелика. Вариационный размах используется иногда в практических исследованиях при малых (не более 10) объемах выборки.
Среднее линейное (абсолютное, арифметическое) отклонение вычисляется по формуле:
d = ( | xi - Xар| fi) / N
Данный вариант формулы представлен для сгруппированных данных.
Недостаток показателя среднего линейного отклонения заключается в том, что он не учитывает знак отклонения.
Среднее квартильное отклонение (или семиинтерквартильный размах) - это мера разброса в распределениях, которые имеют параметром средней величины медиану. Квартильное отклонение Q - это половина расстояния между двумя квартилями: верхним Qв и нижним Qн , т.е.
Q = Qв – Qн /2
Известно, что медиана делит выборку на две равные по количеству вариант части (половины). Верхний квартиль Qв - это медиана половины выборки со значениями больше медианы, нижний квартиль Qн - это медиана другой половины выборки.
Среднее квадратическое отклонение (ошибка), или стандартное отклонение , вычисляется для сгруппированных данных по следующей формуле:
= ( fi (xi - Xар)2) / N-1
Причем, деление (под радикалом) не на объем выборки, а на величину (N-1) является некоторой практической поправкой для измерений не слишком репрезентативных (N < 100).
Стандартное отклонение является классической мерой разброса симметричного распределения, так как мы приблизительно знаем, какой процент данных лежит внутри одного, двух, трех и долее стандартных отклонений от среднего.
Величина D = 2 носит название дисперсии (флуктуации, девиаты). Чем больше дисперсия, тем больше разброс данных, как, например, для кривых на рис. D3 > D2 > D1 , где индексы соответствуют номеру кривой. Расчет дисперсии применяют для выделения выборочной совокупности, определения ошибки выборки, однородности изучаемой совокупности по тому или иному признаку. Он лежит в основе факторного анализа, дисперсионного анализа и ряда других статистических показателей.
Относительные показатели: коэффициент вариации, линейный коэффициент вариации, коэффициент асцилляции.
Коэффициент вариации (V) - это выраженное в процентах отношение стандартного отклонения к среднему арифметическому значению.
V = (/ Хар ) 100%
Коэффициент вариации используется и как показатель однородности выборочных наблюдений. Считается, что если коэффициент вариации не превышает 10%, о выборку можно считать однородной.
Линейный коэффициент вариации (Vd)– это отношение линейного отклонения к средней арифметической величине, выраженное в процентах:
Vd = (d / Хар ) 100%.
Отношение размаха вариации к средней арифметической величине, выраженное в процентах, получило название коэффициента асцилляции (VR).
VR = (R / Хар ) 100%.