
- •Глава 7
- •Часть II. Методы статистического вывода; проверка гипотез
- •Глава 7. Введение в проблему статистического вывода
- •Глава 7. Введение в проблему статистического вывода
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 7. Введение в проблему статистического вывода
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 7. Введение в проблему статистического вывода
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 7. Введение в проблему статистического вывода статистическое решение и вероятность ошибки
- •Глава 7- введение в проблему статистического вывода
- •Глава 7. Введение в проблему статистического вывода
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 7. Введение в проблему статистического вывода
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 8
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 8. Выбор метода статистического вывода Связь Хи y Рис. 8.1. Классификация методов статистического вывода о связи двух явлений и зависимости от типа шкал, в которых они измерены
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 8. Выбор метода статистического вывода Анализ классификаций
- •Анализ таблиц сопряженности
- •Общий случай: число градаций больше двух
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 8. Выбор метода статистического вывода
- •Сравнение двух независимых выборок
- •Сравнение 2-х зависимых выборок
- •Глава 8. Выбор метода статистического вывода
- •Сравнение более двух выборок
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 8. Выбор метода статистического вывода
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 9
- •Часть II, методы статистического вывода: проверка гипотез
- •Глава 9. Анализ номинативных данных
- •Анализ классификации:
- •Распределений Две градации
- •Часть 11. Методы статистического вывода: проверка гипотез
- •Обработка на компьютере: биномиальный критерий
- •Глава 9. Анализ номинативных данных
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 9. Анализ номинативных данных
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 9. Анализ номинативных данных Число градаций больше двух
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 9. Анализ номинативных данных
- •Независимые выборки
- •Глава 9. Анализ номинативных данных
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 9. Анализ номинативных данных
- •Повторные измерения
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 9. Анализ номинативных данных
- •Часть 11. Методы статистического вывода: проверка гипотез
- •Глава 9. Анализ номинативных данных
- •Глава 9. Анализ номинативных данных
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 10
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 10. Корреляционный анализ
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 10. Корреляционный анализ
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 10. Корреляционный анализ
- •Часть II. Методы статистического вывода: проверка гипотез
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 10. Корреляционный анализ
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 10. Корреляционный анализ
- •Глава 10. Корреляционный анализ
- •Глава 11
- •Глава II. Параметрические методы сравнения двух вы1юрок
- •Глава 11. Параметрические методы сравнения двух выборок
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава II. Параметрические методы сравнения двух выборок критерий г-стьюдента для зависимых выборок
- •Часть II. Методы статистического вывода: проверка гипотез
- •Обработка на компьютере
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава It. Параметрические методы сравнения двух выборок
- •Глава 12
- •Общие замечания
- •Глава 12. Непараметрические методы сравнения выборок
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 12. Непараметрические методы сравнения выборок
- •Обработка на компьютере: критерий (7-Манна-Уитни
- •Глава 12. Непараметрические методы сравнения выборок
- •Обработка на компьютере: критерий г-Вилкоксона
- •Глава 12. Непараметрические методы сравнения выборок
- •Сравнение более двух независимых выборок
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 12. Непараметрические методы сравнения выборок
- •Обработка на компьютере: критерий я-Краскала-Уоллеса
- •Часть II. Методы статистического вывода: проверка гипотез
- •Сравнение более двух зависимых выборок
- •Глава 12. Непараметрические методы сравнения выборок
- •Часть II. Методы статистического вывода: проверка гипотез Обработка на компьютере: критерий х2-Фридмана
- •Глава 13
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 13. Дисперсионный анализ (anova)
- •Глава 13. Дисперсионный анализ (anova)
- •Однофакторный anova
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 13. Дисперсионный анализ (anova)
- •Глава 13. Дисперсионный анализ (anova)
- •Глава 13. Дисперсионный анализ (anova) Обработка на компьютере
- •Глава 13. Дисперсионный анализ (anova)
- •Глава 13. Дисперсионный анализ (anova)
- •Обработка на компьютере
- •Глава 13. Дисперсионный анализ (anova)
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 13. Дисперсионный анализ (anova)
- •Глава 13. Дисперсионный анализ (anova)
- •Глава 13. Дисперсионный анализ (anova)
- •Часть II. Методы статистического вывода: проверка гипотез
- •Глава 13. Дисперсионный анализ (anova)
- •Часть II. Методы статистического вывода: проверка гипотез
Глава 10. Корреляционный анализ
Для статистической проверки подобных гипотез применяется Z-критерий, эмпирическое значение которого вычисляется по формуле:
ПРИМЕР 10.3 (продолжение)
П роверим гипотезу о различии коэффициентов корреляции (а = 0,05).
Ш а г 1. Вычислим эмпирическое значение Z-критерия по формуле 10.5: Z, = 2,l 19.
Ш а г 2. Определим /^-уровень значимости. По таблице стандартных нормальных вероятностей (приложение 1) определяем площадь справа от табличного z, ближайшего меньшегоZ,. Справаотг= 2,11: /*= 0,0174. Уровень значимости определяется по формуле р<2Р. Следовательно, р < 0,035.
Ш а г 3. Принимаем статистическое решение и формулируем содержательный вывод. Статистическое решение: отклоняем Но (о равенстве корреляций в генеральной совокупности). Содержательный вывод: корреляция второй шкалы теста статистически достоверно ниже корреляции первой шкалы со средним баллом отметок студентов 2-го курса (р < 0,05) — прогностическая ценность первой шкалы выше, чем второй шкалы.
Отметим, что для решения такой задачи можно было бы рассматривать выборки как независимые и применять соответствующий метод сравнения корреляций — по формулам 10.3 и 10.4. Но чувствительность (мощность) такой проверки была бы гораздо ниже. В частности, применяя кданным примера 10.3 предыдущий метод, мы получим/? = 0,18, что приводит к принятию Но.
КОРРЕЛЯЦИЯ РАНГОВЫХ ПЕРЕМЕННЫХ
Если к количественным данным неприменим коэффициент корреляции г-Пирсона, то для проверки гипотезы о связи двух переменных после предварительного ранжирования могут быть применены корреляции r-Спирмеиа или т-Кендалла.
r-Спирмена. Этот коэффициент корреляции вычисляется либо путем применения формулы /"-Пирсона к предварительно ранжированным двум переменным, либо, при отсутствии повторяющихся рангов, по упрощенной формуле:
7V(7V2 -1)
153
Часть II. Методы статистического вывода: проверка гипотез
Поскольку этот коэффициент — аналог /--Пирсона, то и применение /•-Спирмена для проверки гипотез аналогично применению /--Пирсона, изложенному ранее1.
Преимущество r-Спирмена по сравнению с /--Пирсона — в большей чувствительности к связи в случае:
существенного отклонения распределения хотя бы одной переменной от нормального вида (асимметрия, выбросы);
криволинейной (монотонной) связи.
Недостаток r-Спирмена по сравнению с /--Пирсона — в меньшей чувствительности к связи в случае несущественного отклонения распределения обеих переменных от нормального вида.
Частная корреляция и сравнение корреляций применимы и к г-Спирмена.
т-Кендалла. Применяется к предварительно ранжированным данным как альтернатива /--Спирмена. т-Кендалла, как отмечалось в главе 6, имеет более выгодную, вероятностную интерпретацию. Общая формула для вычисления r-Кендалла, вне зависимости от наличия или отсутствия повторяющихся рангов (связей):
P^Q
J[N(N-\)/2]-Kj[N(N-\)/2]-Ky '
где Р — число совпадений, Q — число инверсий, Кх и Ку — поправки на связи в рангах (см. главу 6: Проблема связанных (одинаковых) рангов). Если связей в рангах нет, то знаменатель формулы равен Р+ Q= N(N~\)/2.
Поскольку природа г-Кендалла иная, чем у r-Спирмена и /--Пирсона, то /^-уровень определяется по-другому: применяется г-критерий и единичное нормальное распределение. Эмпирическое значение вычисляется по формуле:
где Р — число совпадений, Q — число инверсий, Кх и Ку — поправки на связи в рангах (см. главу 6: Проблема связанных (одинаковых) рангов). Если связей в рангах нет, то знаменатель формулы равен Р+ Q= N(N~\)/2.
(.0.6,
Поскольку природа г-Кендалла иная, чем у г-Спирмена и /--Пирсона, то /^-уровень определяется по-другому: применяется г-критерий и единичное нормальное распределение. Эмпирическое значение вычисляется по формуле:
При вычислениях «вручную» /^-уровень определяется по следующему алгоритму:
а) вычисляется эмпирическое значение гэ;
б) по таблице «Стандартные нормальные вероятности» (приложение 1) определяется теоретическое значение х, ближайшее меньшее к эмпири ческому значению z3',
в) определяется площадь Рпод, кривой справа от гт;
г) вычисляется ^-уровень по формуле/? < 2Р.
Проверяемая статистическая гипотеза, порядок принятия статистического решения и формулировка содержательного вывода те же, что и для случая г-Пирсона или г-Спирмена.
1
В некоторых источниках по непонятным
причинам для /--Пирсона и r-Спирмена
приводят
разные таблицы критических значений.
В компьютерных программах (SPSS,
STATISTICA) уровни
значимости для одинаковых /--Пирсона и
r-Спирмена
всегда совпадают.
154
При вычислениях на компьютере статистическая программа (SPSS, Statistica) сопровождает вычисленный коэффициент корреляции более точным значением /ьуровня.
ПРИМЕР 10.4
Предположим, для каждого из 12 учащихся одного класса известно время решения тестовой арифметической задачи в секундах (X) и средний балл отметок по математике за последнюю четверть (Y). При подсчете т-Кендалла были получены следующие результаты: Р= 18; Q= 48; т = —0,455. Проверим гипотезу о связи времени решения тестовой задачи и среднего балла отметок по математике.
Ш а г 2. По таблице «Стандартные нормальные вероятности» (приложение 1) находим ближайшее меньшее, чем z3, теоретическое значение zT и площадь справа от этого z,: zT - 1,98; площадь справа Р = 0,024.
Ш а г 3. Вычисляемр-уровень по формуле/) < 2Р;р < 0,048.
Ш а г 4. Принимаем статистическое решение. Нулевая гипотеза об отсутствии связи в генеральной совокупности отклоняется на уровне а = 0,05.
Ш а г 5. Формулируем содержательный вывод. Обнаружена отрицательная связь между временем решения тестовой арифметической задачи и средним баллом отметок по математике за последнюю четверть (х = -0,455; N= \2;p< 0,048). Величина корреляции показывает, что при сравнении испытуемых друг с другом более высокий средний балл будет сочетаться с меньшим временем решения задач чаще, чем в 70% случаях, так как вероятность инверсий P{q) = (1 — т)/2 = = (1+0,455)/2 = 0,728.
(Отметим, что при вычислении т-Кендалла по этим данным на компьютере были получены следующие результаты: т = -0,455; р = 0,040.)
Сравнениеr-Спирменаих-Кендалла. Интерпретация r-Спирмена аналогична интерпретации r-Пирсона. Квадрат и того, и другого коэффициента корреляции (коэффициент детерминации) показывает долю дисперсии одной переменной, которая может быть объяснена влиянием другой переменной. х-Кен-далла имеет другую интерпретацию: это разность вероятностей совпадений и инверсий в рангах. Кроме того, по величине х-Кендалла можно судить о вероятности совпадений Р{р) = (1 + т)/2 или инверсий P{q) = (1 — х)/2.
Для одних и тех оке данных величина r-Спирмена всегда больше, чем х-Кендалла, исключая крайние значения 0 и 1. Это отражает тот факт, что х-Кендалла зависит от силы связи линейно, а r-Спирмена — не линейно. В то же время для одних и тех же данных р-уровень i-Кендалла и r-Спирмена примерно одинаков, а иногда х-Кендалла имеет преимущество в уровне значимости.
Замечания к применению. Если связь (статистически достоверная) не обнаружена, но есть основания полагать, что связь на самом деле есть, то следует
155