- •О.Ю. Ермолаев математическая статистика для психологов Учебник
- •Глава 8 критерии согласия распределений и
- •Глава 10 введение в дисперсионный анализ anova 178
- •Глава 11 корреляционный анализ 202
- •Глава 13 факторный анализ 274
- •Введение
- •Глава 1 понятие измерения
- •1.1. Измерительные шкалы
- •1.2. Номинативная шкала (шкала наименований)
- •1.3. Порядковая (ранговая, ординарная) шкала
- •1.3.1. Правила ранжирования
- •1.3.2. Проверка правильности ранжирования
- •1.3.3. Случай одинаковых рангов
- •1.4. Шкала интервалов
- •1.5. Шкала отношений
- •Глава 2 понятие выборки
- •2.1. Полное исследование
- •2.2. Выборочное исследование
- •2.3. Зависимые и независимые выборки
- •2.4. Требования к выборке
- •2.5. Репрезентативность выборки
- •2.6. Формирование и объем репрезентативной выборки
- •Глава 3 формы учета результатов измерений
- •3.1. Таблицы
- •3.2. Статистические ряды
- •3.3. Понятие распределения и гистограммы
- •Глава 4
- •4.1. Мода
- •4.2. Медиана
- •4.3. Среднее арифметическое
- •4.4. Разброс выборки
- •4.5. Дисперсия
- •Степень свободы
- •4.7. Понятие нормального распределения
- •Стандартизация по шкалам:
- •Глава 5 общие принципы проверки статистических гипотез
- •5.1. Проверка статистических гипотез
- •5.2. Нулевая и альтернативная гипотезы
- •5.3. Понятие уровня статистической значимости
- •5.4. Этапы принятия статистического решения
- •5.5. Классификация психологических задач, решаемых с помощью статистических методов
- •Глава 6 статистические критерии различий
- •Выбор метода статистического вывода
- •Классификация методов статистического вывода
- •Методы сравнения (X— качественный, y— количественный)
- •6.1.1. Параметрические и непараметрические критерии
- •6.1.2. Рекомендации к выбору критерия различий
- •6.2. Непараметрические критерии для связных выборок
- •6.2.1. Критерий знаков g
- •6.2.2. Парный критерий т — Вилкоксона
- •6.2.3. Критерий Фридмана
- •6.2.4. Критерий Пейджа
- •6.2.5. Критерий Макнамары
- •Глава 7 непараметрические критерии для несвязных выборок
- •7.1. Критерий u Вилкоксона-Манна-Уитни
- •7.1 1. Первый способ расчета по критерию u
- •7.1.2. Второй способ расчета по критерию u
- •7.2. Критерий q Розенбаума
- •Глава 8 критерии согласия распределений и многофункциональный критерий «φ»
- •8.1. Критерий хи-квадрат
- •8.1.1. Сравнение эмпирического распределения с теоретическим
- •8.1.2. Сравнение двух экспериментальных распределений
- •8.1.3. Использование критерия хи-квадрат для сравнения показателей внутри одной выборки
- •8.2. Критерий Колмогорова-Смирнова
- •8.3. Критерий Фишера — φ
- •8.3.1. Сравнение двух выборок по качественно определенному признаку
- •8.3.2. Сравнение двух выборок по количественно определенному признаку
- •Глава 9 параметрические критерии различия
- •9.1.1. Случай несвязных выборок
- •9.1.2. Случай связных выборок
- •Глава 10 введение в дисперсионный анализ anova
- •10.1. Однофакторный дисперсионный анализ
- •10.2. «Быстрые» методы — критерии дисперсионного анализа
- •10.2.1. Критерий Линка и Уоллеса
- •10.2.2. Критерий Немени
- •Глава 11 корреляционный анализ
- •11.1. Понятие корреляционной связи
- •11.2. Коэффициент корреляции Пирсона
- •11.3. Коэффициент корреляции рангов Спирмена
- •11.3.1. Случай одинаковых (равных) рангов
- •11.4. Расчет уровней значимости коэффициентов корреляции
- •11.5. Коэффициент корреляции «φ»
- •11.5.1. Второй способ вычисления коэффициента «φ»
- •11.6. Коэффициент корреляции «τ» Кендалла
- •11.7. Бисериальный коэффициент корреляции
- •11.8. Рангово-бисериальный коэффициент корреляции
- •11.9. Корреляционное отношение Пирсона η
- •11.10. Множественная корреляция
- •11.11. Частная корреляция
- •Глава 12 регрессионный анализ
- •12.1. Линейная регрессия
- •12.2. Множественная линейная регрессия
- •12.3. Оценка уровней значимости коэффициентов регрессионного уравнения
- •12.4. Нелинейная регрессия
- •Глава 13 факторный анализ
- •13.1. Основные понятия факторного анализа
- •13.2. Условия применения факторного анализа
- •13.3. Приемы для определения числа факторов
- •13.4. Вращение факторов
- •13.5. Использование факторного анализа в психологии
- •Приложение Пример использования методов математической статистики в дипломной работе
- •Приведем оглавление диплома:
- •Глава I. Теоретические основы агрессивности и тревожности личности.
- •Глава II. Основные результаты выполненного исследования агрессивности и тревожности личности и их зависимости от уровня субъективного контроля.
- •Методика Басса—Дарки
- •Литература
8.1.3. Использование критерия хи-квадрат для сравнения показателей внутри одной выборки
Критерий хи-квадрат может быть применен и для выявления сходства или различия внутри одной, но численно достаточно большой выборки. В этом случае вычленяются показатели (а их может быть два и больше), по которым и осуществляется сравнение. Этот аспект применения критерия хи-квадрат сближает его с коэффициентом корреляции, который также находит степень связи между двумя или большим числом признаков. Различие между этими двумя методами, прежде всего в том, что для подсчета коэффициента корреляции необходимо знать все величины сравниваемых признаков, а для использования критерия хи-квадрат важно знать только уровни (градации) сравниваемых признаков.
При сравнении показателей с помощью критерия хи-квадрат нулевая гипотеза Но звучит так: сравниваемые признаки не влияют друг на друга. В терминах корреляционных отношений: между признаками связи нет, корреляция не отличается от нуля.
Соответственно альтернативная гипотеза Н1 звучит следующим образом: сравниваемые признаки влияют друг на друга. В терминах корреляционных отношений: между признаками связь есть, корреляция значимо отличается от нуля.
В этих случаях применение критерия хи-квадрат основывается на использовании так называемых многопольных таблиц или, как их еще называют, таблиц сопряженности, т.е. таких таблиц, эмпирические данные в которых представлены размерностью большей, чем 2x2.
В этом случае расчет эмпирического значения критерия хи-квадрат может осуществляться по следующим двум формулам:
где di разность между эмпирическими и «теоретическими» частотами;
fmi есть вычисленная, или «теоретическая» частота.
где k — число строк многопольной таблицы
m — число столбцов многопольной таблицы
N — общее число значений (элементов) в многопольной таблице, оно всегда является произведением N= k ∙ m
Сij. — элементы многопольной таблицы
Сi. — суммарные значения по строкам многопольной таблицы
Сj — суммарные значения по столбцам многопольной таблицы
Проиллюстрируем все вышесказанное решением примера, взятого с некоторыми модификациями из учебного пособия «Психологическая диагностика» под ред. К.М. Гуревича и М.К. Акимовой. М. Изд-во УРАО, 1997г.
Задача 8.11. Влияет ли уровень интеллекта на профессиональные достижения?
Решение. (Первый способ решения по формуле 8.10). Для решения этой задачи 90 человек оценили по степени их профессиональных достижений и по уровню интеллекта. При разбиении на уровни (градации признака) по обоим признакам было взято три уровня. Для показателя профессиональных достижений были получены следующие частоты признака: 20 человек с высоким уровнем профессиональных достижений, 40 со средним и 30 с низким. Первая группа составляет 22,2% выборки, вторая — 44,4% и третья — 33,3% от всей выборки. При разбиении по уровню интеллекта было взято три равных по численности группы, в каждой по 30 человек: уровень интеллекта ниже среднего, средний и выше среднего. В процентах каждая группа составляет 33,3% от всей выборки. Все эмпирические данные (частоты) представлены ниже в таблице 8.14:
Таблица 8.14
IQ |
Оценка профессиональных достижений |
Всего |
||
Ниже среднего |
Средняя |
Выше среднего |
||
Ниже среднего |
20 А (10) |
5 В (13,3) |
5 С (6,7) |
30 |
Средний |
5 D (10) |
15 E (13,3) |
10 F (6,7) |
30 |
Выше среднего |
5 G (10) |
20 H (13,3) |
5 J (6,7) |
30 |
Итого |
30 |
40 |
20 |
90 |
Для удобства каждая ячейка таблицы обозначена соответствующей латинской буквой: А, В, С и т.д. Таблица 8.14 устроена следующим образом: в ячейку, обозначенную символом А, заносятся эмпирические частоты (или число) тех испытуемых, которые одновременно обладают следующей характеристикой: ниже среднего по уровню профессиональных достижений и ниже среднего по интеллекту. Таких испытуемых (эмпирических частот) оказалось 20. В ячейку, обозначаемую символом В, заносятся эмпирические частоты (или число) тех испытуемых, которые одновременно обладают характеристикой: средние по уровню профессиональных достижений и ниже среднего по интеллекту. Таких испытуемых (эмпирических частот) оказалось 5. В ячейку, обозначенную символом С, заносятся эмпирические частоты (или число) тех испытуемых, которые одновременно обладают характеристикой: выше среднего по уровню профессиональных достижений и ниже среднего по интеллекту. Таких испытуемых (эмпирических частот) оказалось также 5. Заметим, что 20 + 5 + + 5 = 30, т.е. числу испытуемых, имеющих уровень интеллекта ниже среднего. Подобные «разбиения» были проделаны для каждой ячейки таблицы 8.14. Подчеркнем, что в круглых скобках в каждой ячейке таблицы представлены вычисленные для этой ячейки «теоретические» частоты.
Покажем, как для каждой ячейки таблицы 8.14 найти соответствующую «теоретическую» частоту. Это делается следующим образом. Для каждого столбца таблицы подсчитываются так называемые «частости» в процентах:
Полученные величины «частостей» дают возможность подсчитать «теоретические» частоты для каждой ячейки таблицы 8.14. Они служат основой для подсчета «гипотетических» (а по сути теоретических) частот, т.е. таких частот, которые при заданном соотношении экспериментальных данных должны были бы быть расположены в соответствующих ячйках таблицы 8.14. (Вспомним решение задачи 8.5).
Согласно этому положению «теоретическая» частота для ячейки А подсчетывается следующим образом. 30 человек имеют уровень интеллекта ниже среднего, поэтому 33,3% от этого числа должны были бы попасть в группу с профессиональными достижениями ниже среднего уровня. Находим эту «гипотетическую» величину так: 30 ∙ 33,3%/ 100 = 9,99 = 10.
Аналогично «теоретическая» частота для ячейки D считается следующим образом: 30 человек имеют средний уровень интеллекта, поэтому 33,3% от этого числа должны были бы попасть в группу с профессиональными достижениями среднего уровня. Находим эту «гипотетическую» величину так:
30 ∙ 33,3%/ 100 = 9,99 = 10.
Аналогично «теоретическая» частота для ячейки G считается следующим образом: 30 человек имеют высокий уровень интеллекта, поэтому 33,3% от этого числа должны были бы попасть в группу с профессиональными достижениями выше среднего уровня. Находим эту «гипотетическую» величину так: 30 ∙ 33,3%/ 100 = 9,99 = 10.
Рассмотрим, как производится подсчет для ячейки В. 30 человек имеют низкий уровень интеллекта, поэтому 44,4% от этого числа должны были бы попасть в группу с профессиональными достижениями среднего уровня. Находим эту «гипотетическую» величину так: 30∙-44,4%./100% = 13,3.
Аналогично производится подсчет для ячейки Е. 30 человек имеют средний уровень интеллекта, поэтому 44,4% от этого числа должны были бы попасть в группу с профессиональными достижениями среднего уровня. Находим эту «гипотетическую» величину так: 30∙-44,4%./100% = 13,3.
Аналогично
производится подсчет для ячейки Н.
30
человек имеют уровень интеллекта выше
среднего, поэтому 44,4% от этого числа
должны были бы попасть в группу с
профессиональными достижениями среднего
уровня. Находим эту «гипотетическую»
величину так: 30∙-44,4%./100%
= 13,3.
Рассмотрим, наконец, как производится подсчет для ячейки С 30 человек имеют низкий уровень интеллекта, поэтому 22,2% от этого числа должны были бы попасть в группу с профессиональными достижениями выше среднего уровня. Находим эту «гипотетическую» величину так: 30∙-22,2%./100% = 6,7.
Расчет «теоретических гипотетических» частот для оставшихся ячеек проведите самостоятельно.
Проверим правильность расчета «теоретических» частот для всех столбцов таблицы 8.14: 10 + 10 + 10 = 30; 13,3 + 13,3 + 13,3 = = 39,9 = 40; 6,7 + 6,7 + 6,7 = 20,1 = 20.
Теперь все готово для использования формулы (8.1).
Для проверки правильности расчета «теоретических» частот в случае сравнения двух эмпирических наблюдений (см. раздел 8.2) или для сравнения показателей внутри одной выборки может использоваться следующая формула (8.12):
Проверим по этой формуле правильность наших расчетов:
Число степеней свободы подсчитаем по знакомой формуле:
ν = (k - 1) ∙ (с - 1) = (3 - 1) • (3 - 1) - 4 где k число строк, а с-число столбцов и в соответствии с таблицей 12 Приложения 1 находим:
Строим «ось значимости»:
Полученные эмпирическая величина критерия хи-квадрат попала в зону значимости. Иными словами, следует принять гипотезу H1 о том, что уровень интеллекта влияет на успешность профессиональной деятельности.
Решение. (Второй способ решения по формуле 8.11). Подставим данные таблицы 8.14 в формулу (8.11) получим:
Как и следовало ожидать, эмпирическое значение хи-квадрат получено то же самое, что и при первом способе решения. Все дальнейшие операции уже проделаны выше при первом способе решения данной задачи, поэтому не будем их повторять. Безусловно, что второй способ существенно проще первого, однако, при расчетах по формуле (8.11) можно легко допустить ошибки. Подчеркнем, что как первый, так и второй способы расчета эмпирического значения хи-квадрат позволяют работать с таблицами практически любой размерности: 3 х 4, 4 х 4, 5 х 3, 5 х 6 и т.п.
Для применения критерия хи-квадрат необходимо соблюдать следующие условия:
Измерение может быть проведено в любой шкале.
Выборки должны быть случайными и независимыми.
Желательно, чтобы объем выборки был > 20. С увеличением объема выборки точность критерия повышается.
Теоретическая частота для каждого выборочного интервала не должна быть меньше 5.
Сумма наблюдений по всем интервалам должна быть равна общему количеству наблюдений.
Таблица критических значений критерия хи-квадрат рассчитана для числа степеней свободы ν, которое каждый раз рассчитывается по определенным правилам.
В общем случае число степеней свободы определяется по формуле: ν = с - 1, где с — число альтернатив (признаков, значений, элементов) в сравниваемых переменных. Для таблиц число степеней свободы определяется по формуле:
ν = (k - 1) ∙ (с - 1), где k — число столбцов, c — число строк.
