- •О.Ю. Ермолаев математическая статистика для психологов Учебник
- •Глава 8 критерии согласия распределений и
- •Глава 10 введение в дисперсионный анализ anova 178
- •Глава 11 корреляционный анализ 202
- •Глава 13 факторный анализ 274
- •Введение
- •Глава 1 понятие измерения
- •1.1. Измерительные шкалы
- •1.2. Номинативная шкала (шкала наименований)
- •1.3. Порядковая (ранговая, ординарная) шкала
- •1.3.1. Правила ранжирования
- •1.3.2. Проверка правильности ранжирования
- •1.3.3. Случай одинаковых рангов
- •1.4. Шкала интервалов
- •1.5. Шкала отношений
- •Глава 2 понятие выборки
- •2.1. Полное исследование
- •2.2. Выборочное исследование
- •2.3. Зависимые и независимые выборки
- •2.4. Требования к выборке
- •2.5. Репрезентативность выборки
- •2.6. Формирование и объем репрезентативной выборки
- •Глава 3 формы учета результатов измерений
- •3.1. Таблицы
- •3.2. Статистические ряды
- •3.3. Понятие распределения и гистограммы
- •Глава 4
- •4.1. Мода
- •4.2. Медиана
- •4.3. Среднее арифметическое
- •4.4. Разброс выборки
- •4.5. Дисперсия
- •Степень свободы
- •4.7. Понятие нормального распределения
- •Стандартизация по шкалам:
- •Глава 5 общие принципы проверки статистических гипотез
- •5.1. Проверка статистических гипотез
- •5.2. Нулевая и альтернативная гипотезы
- •5.3. Понятие уровня статистической значимости
- •5.4. Этапы принятия статистического решения
- •5.5. Классификация психологических задач, решаемых с помощью статистических методов
- •Глава 6 статистические критерии различий
- •Выбор метода статистического вывода
- •Классификация методов статистического вывода
- •Методы сравнения (X— качественный, y— количественный)
- •6.1.1. Параметрические и непараметрические критерии
- •6.1.2. Рекомендации к выбору критерия различий
- •6.2. Непараметрические критерии для связных выборок
- •6.2.1. Критерий знаков g
- •6.2.2. Парный критерий т — Вилкоксона
- •6.2.3. Критерий Фридмана
- •6.2.4. Критерий Пейджа
- •6.2.5. Критерий Макнамары
- •Глава 7 непараметрические критерии для несвязных выборок
- •7.1. Критерий u Вилкоксона-Манна-Уитни
- •7.1 1. Первый способ расчета по критерию u
- •7.1.2. Второй способ расчета по критерию u
- •7.2. Критерий q Розенбаума
- •Глава 8 критерии согласия распределений и многофункциональный критерий «φ»
- •8.1. Критерий хи-квадрат
- •8.1.1. Сравнение эмпирического распределения с теоретическим
- •8.1.2. Сравнение двух экспериментальных распределений
- •8.1.3. Использование критерия хи-квадрат для сравнения показателей внутри одной выборки
- •8.2. Критерий Колмогорова-Смирнова
- •8.3. Критерий Фишера — φ
- •8.3.1. Сравнение двух выборок по качественно определенному признаку
- •8.3.2. Сравнение двух выборок по количественно определенному признаку
- •Глава 9 параметрические критерии различия
- •9.1.1. Случай несвязных выборок
- •9.1.2. Случай связных выборок
- •Глава 10 введение в дисперсионный анализ anova
- •10.1. Однофакторный дисперсионный анализ
- •10.2. «Быстрые» методы — критерии дисперсионного анализа
- •10.2.1. Критерий Линка и Уоллеса
- •10.2.2. Критерий Немени
- •Глава 11 корреляционный анализ
- •11.1. Понятие корреляционной связи
- •11.2. Коэффициент корреляции Пирсона
- •11.3. Коэффициент корреляции рангов Спирмена
- •11.3.1. Случай одинаковых (равных) рангов
- •11.4. Расчет уровней значимости коэффициентов корреляции
- •11.5. Коэффициент корреляции «φ»
- •11.5.1. Второй способ вычисления коэффициента «φ»
- •11.6. Коэффициент корреляции «τ» Кендалла
- •11.7. Бисериальный коэффициент корреляции
- •11.8. Рангово-бисериальный коэффициент корреляции
- •11.9. Корреляционное отношение Пирсона η
- •11.10. Множественная корреляция
- •11.11. Частная корреляция
- •Глава 12 регрессионный анализ
- •12.1. Линейная регрессия
- •12.2. Множественная линейная регрессия
- •12.3. Оценка уровней значимости коэффициентов регрессионного уравнения
- •12.4. Нелинейная регрессия
- •Глава 13 факторный анализ
- •13.1. Основные понятия факторного анализа
- •13.2. Условия применения факторного анализа
- •13.3. Приемы для определения числа факторов
- •13.4. Вращение факторов
- •13.5. Использование факторного анализа в психологии
- •Приложение Пример использования методов математической статистики в дипломной работе
- •Приведем оглавление диплома:
- •Глава I. Теоретические основы агрессивности и тревожности личности.
- •Глава II. Основные результаты выполненного исследования агрессивности и тревожности личности и их зависимости от уровня субъективного контроля.
- •Методика Басса—Дарки
- •Литература
4.3. Среднее арифметическое
Среднее арифметическое ряда из п числовых значений X1 X2 ...Xn обозначается X и подсчитывается как:
Здесь величины 1, 2...и являются так называемыми индексами. В том случае, если отдельные значения выборки повторяются, среднюю арифметическую вычисляют по формуле:
X в таком случае называют взвешенной средней, где fi — частоты повторяющихся значений.
Знак Σ является символом операции суммирования. Он означает, что все значения Xt должны быть просуммированы. Числа, стоящие над и под знаком Σ называются пределами суммирования и указывают наибольшее и наименьшее значения индекса суммирования, между которыми расположены его промежуточные значения.
Например, в формуле (4.1) суммирование начинается с первого элемента выборки, поэтому и пишется так: ι = 1, и заканчивается последним, поэтому наверху символа суммирования Σ стоит величина п.
Если же мы запишем так:
то, поскольку нижний индекс суммирования i равен 4, а верхний равен 6, то будут просуммированы следующие элементы ряда Х4, Х5 и Х6, и в результате будет получено: Х4 + Х5 + Х6. Или, если будет написано следующее выражение:
то, поскольку нижний индекс суммирования ι равен 1, а верхний равен 3, то будут просуммированы следующие элементы ряда X1, Х2 и Х3, и в итоге будет получено: Х1 + Х2 + Х3
В дальнейшем мы будем пользоваться сокращением, которое состоит в том, что если производится суммирование всех элементов выборки от первого до последнего, то верхний и нижний пределы суммирования указываться не будут, а пишется просто: ΣΧ или ΣΧi
При вычислении величины средней по таблице чисел в дальнейшем будет использоваться следующая формула:
где хji — значения всех переменых, полученных в эксперименте, или все элементы таблицы;
при этом индекс j меняется от 1 до р, где р число столбцов в таблице, а индекс i меняется от 1 до n, где п — число испытуемых или число строк в таблице.
Тогда X — общая средняя всей анализируемой совокупности данных; N — общее число всех элементов в таблице (анализируемой совокупности экспериментальных данных) и в общем случае N = р ·п.
Символическое обозначение хij очень удобно. Например, пусть перед нами стоит задача — указать конкретный элемент нашей таблицы. Для этого мы должны знать номер столбца, например 4, и номер строки (или порядковый номер испытуемого), например 5. Тогда его обозначение будет таково: х54. Это значит, что выбран пятый элемент в строчке из четвертого столбца.
Символ ΣΣ (двойная сумма) означает, что вначале осуществляется суммирование всех элементов таблицы по индексу i — т.е. по строкам, затем полученные суммы по строчкам складываются по столбцам, или, иначе говоря, по индексу j.
Следует подчеркнуть, что средние величины характеризуют выборку одним (средним) числом. Преимущество, или иначе, информативная значимость, средних величин заключается в их способности аккумулировать или уравновешивать все индивидуальные отклонения, в результате чего проявляется то наиболее устойчивое и типичное, что характеризует качественное своеобразие варьирующего объекта, позволяя отличить одну выборку от другой, а на этой основе, например, одно измеренное психологическое свойство от другого.
Однако среднее как статистический показатель не лишено недостатков. Так, например, при вычислении среднего количества ошибок при выполнении корректурной пробы может быть получена величина равная 1,3 ошибки или при определении среднего числа учеников, обучающихся в пятых классах данной школы, может быть получена величина равная 30,07. Конечно, с точки зрения статистика эти величины обычны, но для психологических задач они могут быть неприемлемы.
Кроме того, среднее оказывается достаточно чувствительным к очень маленьким или очень большим величинам, отличающимся от основных значений измеренных характеристик.
Приведем пример из книги Дж. Б. Мангейма и Ричарда К. Рича: «Политология. Методы исследования» М., 1997 г. «Пусть 9 человек имеют доход от 4500 до 5200 тыс. долларов в месяц. Величина их среднего дохода равняется 4900 долларов. Если же к этой группе добавить человека, имеющего доход в 20000 тыс. долларов в месяц, то средняя всей группы сместится и окажется равной 6410 долларов, хотя никто из всей выборки (кроме одного человека) реально не получает такой суммы. Понятно, что аналогичное смещение, но в противоположную сторону можно получить и в том случае, если добавить в эту группу человека с очень маленьким годовым доходом».
Важно подчеркнуть, что подобные крайние величины, т.е. те, которые существенно искажают величину средней, оказываются в то же время и наименее характерными для изучаемой генеральной совокупности. Именно поэтому в статистике, кроме средней величины, используются и другие характеристики «типичных значений» выборки, такие, как мода, медиана и ряд других характеристик.
КВАНТИЛИ РАСПРЕДЕЛЕНИЯ
Помимо мер центральной тенденции в психологии широко используются меры положения, которые называются квантилями распределения. Квантиль — это точка на числовой оси измеренного признака, которая делит всю совокупность упорядоченных измерений на две группы с известным соотношением их численности. С одним из квантилей мы уже знакомы — это медиана. Это значение признака, которое делит всю совокупность измерений на две группы с равной численностью. Кроме медианы часто используются процентили и квартили.
Процентили (Percentiles) — это 99 точек — значений признака (Р1, ..., Р99), которые делят упорядоченное (по возрастанию) множество наблюдений на 100 частей, равных по численности. Определение конкретного значения процентиля аналогично определению медианы. Например, при определении 10-го процентиля, P10, сначала все значения признака упорядочиваются по возрастанию. Затем отсчитывается 10% испытуемых, имеющих наименьшую выраженность признака. P10 будет соответствовать тому значению признака, который отделяет эти 10% испытуемых от остальных 90%.
Квартили (Quartiles) — это 3 точки — значения признака (Р25, Р50, Р75), которые делят упорядоченное (по возрастанию) множество наблюдений на 4 равные по численности части. Первый квартиль соответствует 25-му процентилю, второй — 50-му процентилю или медиане, третий квартиль соответствует 75-му процентилю.
Процентили и квартили используются для определения частоты встречаемости тех или иных значений (или интервалов) измеренного признака или для выделения подгрупп и отдельных испытуемых, наиболее типичных или нетипичных для данного множества наблюдений.
