m08-37
.pdfПодставляем полученные данные в формулу расчета коэффициента корреляции Спирмена:
rs |
=1 − |
|
|
6 52 |
|
|
= 0,76 . |
|
11 |
(11 11 |
−1) |
||||||
|
|
|
По табл. VIII приложения 1 определяем критические значения коэффициента ранговой корреляции для числа испытуемых n = 11.
rкр = 0,61 для α ≤ 0,05; rкр = 0,76 для α ≤ 0,01.
Полученное эмпирическое значение коэффициента корреляции совпало с критическим значением для уровня значимости α ≤ 0,01.
Ответ: Гипотеза Н0 отвергается, принимается гипотеза Н1. Иными словами, можно утверждать, что показатели психологической готовности к школе и оценки успеваемости первоклассников положительно связаны между собой – чем выше уровень готовности к школе, тем выше показатели школьной успеваемости первоклассников.
Коэффициент корреляции Кендалла τ
Назначение
Коэффициент корреляции Кендалла позволяет определить силу и направление корреляционной связи между двумя признаками или двумя профилями (иерархиями) признаков.
Описание метода
Коэффициент корреляции «τ» (тау) Кендалла относится к числу непараметрических, т. е. при вычислении этого коэффициента не играет роли характер распределения сравниваемых переменных. Как и коэффициент корреляции Спирмена, коэффициент «τ» предназначен для работы с данными, полученными по ранговой шкале. Иногда этот коэффициент можно использовать вместо коэффициента корреляции Спирмена, поскольку способ его вычисления более прост. Он основан на вычислении суммы инверсий и совпадений. В общем виде формула для подсчета рангового коэффициента корреляции Кендалла такова:
τ = 1 |
|
P −Q |
, |
2 |
n (n −1) |
||
|
|
|
где P – число совпадений,
Q – число инверсий,
n – число ранжируемых признаков (черт).
Гипотезы
Н0: Корреляция между переменными (иерархиями) X и Y не отличается от нуля.
Н1: Корреляция между переменными (иерархиями) X и Y достоверно отличается от нуля.
51
Ограничения коэффициента корреляции Кендалла
1.Сравниваемые признаки должны быть измерены в порядковой
шкале.
2.Число варьирующих признаков в сравниваемых переменных X и Y должно быть одинаковым.
3.При расчетах этого коэффициента не допускается использование одинаковых рангов.
4.Для оценки уровня достоверности коэффициента «τ» следует пользоваться формулой расчета и таблицей критических значений для t- критерия Стьюдента при df = n – 2.
Алгоритм расчета коэффициента корреляции Кендалла τ
1.Определить, какие два признака или две иерархии признаков будут участвовать в сопоставлении как переменные X и Y.
2.Проранжировать значения переменной X, начисляя ранг 1 наименьшему значению, в соответствии с правилами ранжирования. То же выполнить для переменной Y.
3.Упорядочить значения рангов переменной Х по возрастанию, соответственно поменяются местами и соответствующие ранги переменной Y. Занести ранги Х в первый столбец таблицы по порядку номеров испытуемых или признаков.
4.Занести ранги переменной Y в соответствующие ячейки второго столбца таблицы.
5.Подсчитать количество совпадений (P) и инверсий (Q). Для этого потребуется тольковторойстолбецтаблицы(порядокранговпеременнойY).
Подсчет совпадений происходит следующим образом: берем самое
верхнее число второго столбца – y1. Подсчитываем, сколько всего чисел, больших y1, встречаются ниже в этом же столбце. Ставим соответствующее значение в соседнюю ячейку в столбце «Совпадения». Затем берем сле-
дующее число y2 – проделываем те же действия и ставим соответствующее значение ниже в соседнюю ячейку в столбце «Совпадения». И так далее.
Для определения количества инверсий опять берем самое верхнее
число второго столбца – y1. Подсчитываем, сколько всего чисел встречаются ниже по столбцу, меньших, чем y1. Ставим соответствующее значение напротив числа y1 в столбце «Инверсия». Берем следующее число y2 – проделываем те же действия и ставим соответствующее значение ниже в соседнюю ячейку в столбце «Совпадения». И так далее.
6.Для проверки правильности подсчета числа инверсий и совпадений используется следующая формула:
P +Q = |
(n −1) n |
. |
|
2 |
|||
|
|
52
7. Подсчет коэффициента Кендалла может осуществляться по трем тождественным формулам. Первая формула приведена выше. В двух других формулах используются либо Р, либо Q:
τ =1− |
4 Q |
; |
τ = |
4 P |
−1. |
|
n (n −1) |
n (n −1) |
|||||
|
|
|
|
8. Проверка уровня значимости коэффициента корреляции с помощью t-критерия Стьюдента по формуле:
t =τ |
n − 2 |
1 −τ 2 , |
где τ – полученное эмпирическое значение коэффициента корреляции. Значение t сопоставляется с критическими значениями t-критерия Стьюдента (tкр) по Табл. X Приложения 1 (число степеней свободы df определяется как df = n – 2). Если выполняется неравенство t ≥ tкр, Н0 отклоняется.
Пример
Психолог предложил супружеским парам проранжировать семь личностных черт, имеющих определяющее значение для семейного благополучия. Необходимо определить, в какой степени совпадают оценки супругов в отношении ранжируемых качеств. Полученные данные приведены в таблице.
Черты личности |
Оценки мужа |
Оценки жены |
Ответственность |
7 |
1 |
Общительность |
1 |
5 |
Сдержанность |
3 |
7 |
Выносливость |
2 |
6 |
Жизнерадостность |
5 |
4 |
Терпеливость |
4 |
3 |
Решительность |
6 |
2 |
Сформулируем гипотезы:
Н0: корреляция между показателями ранжирования обозначенных качеств у супругов не отличается от нуля.
Н1: корреляция между показателями ранжирования обозначенных качеств у супругов статистически значимо отличается от нуля.
Для подсчета коэффициента корреляции «τ» необходимо упорядочить значения второго столбца таблицы (оценки мужа) по возрастанию рангов, в нашем случае от 1 до 7. Соответственно этому поменяются местами как сами черты, так и соответствующие ранги третьего ряда. Оформим эти преобразования в новую таблицу:
53
Черты личности |
Оценки му- |
Оценки же- |
Совпадения |
Инверсии Q |
|
жа |
ны |
Р |
|
Общительность |
1 |
5 |
2 |
4 |
Выносливость |
2 |
6 |
1 |
4 |
Сдержанность |
3 |
7 |
0 |
4 |
Терпеливость |
4 |
3 |
1 |
2 |
Жизнерадостность |
5 |
4 |
0 |
2 |
Решительность |
6 |
2 |
0 |
1 |
Ответственность |
7 |
1 |
0 |
0 |
Сумма ∑ |
|
|
4 |
17 |
Рассмотрим, как следует заполнять последние два столбца таблицы. Теперь для работы нам нужен только столбец с рангами, проставленными женой. На его основе заполним последние два столбца таблицы, подсчитав сначала число совпадений.
Подсчет совпадений Р происходит следующим образом: берем самое верхнее число третьего столбца – 5. Подсчитываем, сколько всего чисел, больших 5, встречаются ниже в этом же столбце. Находим их – это 6 и 7. Их всего два. Двойку ставим напротив числа 5 в колонке «Совпадения». Берем затем следующее число 6 – ниже по столбцу и больше его, так же ниже по столбцу, встречается только одно число 7. Ставим напротив 6 в столбце «Совпадения» значение 1. Берем следующее число 7 – больше по величине не может встретиться ни одно число, поскольку 7 – это максимальный ранг. Ставим напротив 7 в столбце «Совпадения» – 0. И т. д.
Для определения количества инверсий Q опять берем самое верхнее число третьего столбца – 5. Подсчитываем, сколько всего чисел встречаются ниже по столбцу, меньших, чем 5. Это числа 4, 3, 2 и 1. Их 4. Ставим напротив числа 5 в столбце «Инверсия» число 4. Берем следующее число 6 – ниже по столбцу и меньше, чем 6, встречаются те же числа, что и для 5. Ставим напротив 6 в столбце «Инверсия» число 4. То же верно и для числа 7. Меньше числа 3 ниже по столбцу встречаются числа 2 и 1. Ставим напротив 3 в столбце «Инверсия» число 2. И так далее.
Проверим правильность подсчета: P +Q = 4 +17 = 21 ;
(n −1) n |
= |
(7 −1) 7 |
= 21. |
|
2 |
2 |
|||
|
|
Следовательно, подсчет числа инверсий и совпадений был произведен правильно.
Проведем подсчет коэффициента корреляции:
τ = |
1 |
|
P −Q |
= |
1 |
|
4 −17 |
= −0,619 . |
|
2 |
n (n −1) |
|
2 |
7 (7 −1) |
|
||
|
|
|
|
|
|
|
Проверим уровень значимости коэффициента корреляции τ с помощью t-критерия Стьюдента по соответствующей формуле:
54
t = −0,619 |
|
7 − 2 |
|
=1,087 . |
1 |
− (−0,619) |
2 |
||
|
|
|
Число степеней свободы в нашем случае будет df = n – 2 = 7 – 2 = 5. По табл. X приложения 1 для df = 5 находим критические значения t-критерия:
tкр = 2,57 для α ≤ 0,05, tкр = 4,03 для α ≤ 0,01.
Неравенство t ≥ tкр не выполняется, соответственно Н0 принимается: коэффициент корреляции «τ» Кендалла достоверно не отличается от нуля. Иными словами, согласованности между супругами в оценке значимых для семейного благополучия личностных черт не обнаружено.
3.5. Параметрические методы сравнения двух выборок
Сравнение двух выборок по признаку, измеренному в метрической шкале, обычно предполагает сравнение средних значений с использованием параметрического t-критерия Стъюдента. Следует различать три ситуа-
ции по соотношению выборок между собой: случай независимых и зависимых выборок (измерений признака) и дополнительно – случай сравнения одного среднего значения с заданной величиной (t-критерий Стьюдента
для одной выборки).
К параметрическим методам относится и сравнение дисперсий двух выборок по F-критерию Фишера. Иногда этот метод приводит к ценным содержательным выводам, а в случае сравнения средних для независимых выборок сравнение дисперсий является обязательной процедурой.
При сравнении средних или дисперсии двух выборок проверяется
ненаправленная статистическая гипотеза о равенстве средних (диспер-
сий) в генеральной совокупности. Соответственно, при ее отклонении допустимо принятие двусторонней альтернативы о конкретном направлении различий в соответствии с соотношением выборочных средних (дисперсий). Для принятия статистического решения в таких случаях применяются двусторонние критерии и, соответственно, критические значения для проверки ненаправленных альтернатив.
Сравнение дисперсий с помощью F-критерия Фишера
Назначение критерия
Метод позволяет проверить гипотезу о том, что дисперсии двух генеральных совокупностей, из которых извлечены сравниваемые выборки, отличаются друг от друга.
55
Описание критерия
Из двух генеральных совокупностей случайно извлекаются две независимые выборки объемами n1 и n 2 с нормальным распределением изучаемого признака. По результатам исследования подсчитываются оценки дисперсий S12 и S 22 . Требуется сравнить эти дисперсии.
Гипотезы
Н0: Выборки 1 и 2 принадлежат генеральным совокупностям с одинаковыми генеральными дисперсиями: S12 = S 22 = S 2 .
H1: Выборки 1 и 2 принадлежат генеральным совокупностям с разными дисперсиями: S12 ≠ S 22 .
Ограничения
Распределения признака и в той, и в другой выборке существенно не отличаются от нормального. Критерий Фишера очень чувствителен к отклонениям распределения данных от нормального. Если вид распределения неизвестен, или проводились порядковые измерения, результаты могут оказаться ошибочными.
Алгоритм расчета F-критерия Фишера3
1.Вычислить значения дисперсий S12 и S 22 для выборок n1 и n 2 .
2.Вычислить эмпирическое значение F – отношение большей дисперсии к меньшей:
F = SБ2 . Sм2
3. Определить критические значения распределения Фишера Fα (df1; df2) для чисел степеней свободы df1 = n Б −1; df2 = n М −1. На первом месте в
Fα (df1; df2) всегда стоит число степеней свободы для большей выборочной дисперсии.
4. Сравнить эмпирическое значение F с критическими значениями по табл. IX приложения 1.
Если Fэмп < Fα (df1; df2), то нулевая гипотеза о равенстве двух генеральных дисперсий принимается. В этом случае обе выборки могут быть объединены в одну, и по двум выборочным дисперсиям можно оценить генеральную дисперсию S 2 :
S 2 = |
df |
1 |
S 2 |
+ df |
2 |
S 2 |
(n |
−1) S 2 |
+(n |
2 |
−1) S 2 |
||
|
1 |
|
2 |
= |
1 |
1 |
|
2 |
. |
||||
|
|
|
df1 + df2 |
|
|
|
n1 + n2 −2 |
Если эмпирические значения критерия попадают в критическую область критерия, т. е. если Fэмп ≥ Fα (df1; df2), нулевая гипотеза (Н0) отвергается и принимается альтернативная (Н1).
3 Перед применением критерия необходимо проверить нормальность распределения данных, рассчитав эмпирические и критические значения асимметрии и эксцесса (см. п. 2.2).
56
Метод может применяться для проверки предположения о равенстве (гомогенности) дисперсий перед проверкой достоверности различия средних по t-критерию Стьюдента для независимых выборок разной численности. Однако содержательная интерпретация статистически достоверного различия дисперсий может иметь и самостоятельную ценность.
Пример
Детям предлагались обычные арифметические задания, после чего одной случайно выбранной половине учащихся сообщали, что они не выдержали испытания, а остальным – обратное. Затем у каждого ребенка спрашивали, сколько секунд ему потребовалось бы для решения аналогичной задачи. Экспериментатор вычислял разность между называемым ребенком временем и результатом выполненного задания (в секундах). Ожидалось, что сообщение о неудаче вызовет некоторую неадекватность самооценки ребенка. Проверяемая гипотеза состояла в том, что дисперсия совокупности самооценок не зависит от сообщений об удаче или неудаче
(H0 : S12 = S 22 ).
Получены следующие данные:
Группа 1: сообщение о неудаче |
|
Группа 2: сообщение об успехе |
|||
n1 = 12 |
|
|
|
|
n 2 = 12 |
S12 = 90,45 |
|
|
|
|
S 22 = 8,16 |
1. Вычислим эмпирическое значение критерия: |
|||||
F = |
S 2 |
90,45 |
|
||
Б |
= |
|
|
=11,08 |
|
|
8,16 |
||||
|
Sм2 |
|
2. Определим критические значения распределения Фишера Fα (df1; df2) для чисел степеней свободы: df1 = n Б −1 = 12 – 1; df2 = n М −1 = 12 – 1.
2,97 (α ≤ 0,05)
Fкр = ( )
4,85 α ≤ 0,01
3. Для принятия статистического решения сравним эмпирическое и критическое значения критерия: Fэмп > Fкр (α < 0,01)
Ответ: H0 отвергается; принимается Н1: дисперсия в группе 1 превышает дисперсию в группе 2 (α < 0,01). Следовательно, после сообщения о неудаче неадекватность самооценки выше, чем после сообщения об удаче.
57
Сравнение средних значений с помощью t-критерия Стьюдента
Назначение критерия
Параметрический критерий Стьюдента позволяет сравнить два выборочных средних значения.
Описание критерия
Из двух нормальных генеральных совокупностей извлекаются независимые выборки объемами n1 и n 2 с нормальным распределением изучаемого признака. По результатам исследования подсчитываются выборочные средние значения и дисперсии: М1 , М2 и S12 , S 22 . Требуется сравнить средние значения.
Гипотезы
Н0: Математическое ожидание (среднее значение) в выборке 1 не превышает математического ожидания в выборке 2 (М1 = М2 ).
H1: Математическое ожидание в выборке 1 превышает математическое ожидание в выборке 2 (М1 > М2 ).
Ограничения критерия t
Нормальное распределение признака в исследуемой выборке. В противном случае следует применить непараметрические критерии (G- критерий знаков, U-критерий Манна – Уитни).
Алгоритм расчета t-критерия Стьюдента 4
1.Вычислить дисперсии с помощью критерия Фишера.
2.В случае равенства дисперсий (S12 = S 22 ) для проверки нулевой ги-
потезы эмпирическое значение t вычисляется по формуле:
t = |
M 1 − M 2 |
|||
|
1 |
|
1 , |
|
|
S |
+ |
||
|
n1 |
n 2 |
||
|
|
|
где М1 – математическое ожидание выборки 1; М2 – математическое ожидание выборки 2;
S – среднеквадратическое отклонение, взвешенное по числам степеней свободы dfi = ni −1:
S = |
df |
1 |
S 2 |
+df |
2 |
S 2 |
(n −1) S 2 |
+(n |
2 |
−1) S 2 |
|
|
1 |
|
2 = |
1 |
1 |
|
2 |
||||
|
|
|
df1 +df2 |
|
|
n1 +n2 −2 |
В случае если дисперсии не равны (S12 ≠ S 22 ), эмпирическое значение критерия Стьюдента вычисляется по формуле:
4 Перед применением критерия необходимо проверить нормальность распределения данных, рассчитав эмпирические и критические значения асимметрии и эксцесса (см. п. 2.2).
58
t = |
M 1 |
− M 2 |
|||
S |
2 |
|
S |
2 |
|
|
+ |
||||
|
1 |
n |
2 |
||
|
n |
1 |
|
2 |
|
|
|
|
|
3. Вычисленное эмпирическое значение сопоставляется с критическим значением, определяемым в зависимости от уровня значимости α и числа степеней свободы df =df1+ df2 = n1 + n2 – 2, по табл. X приложения 1.
Если эмпирическое значение критерия меньше критического (׀t׀ < tкр), принимается нулевая гипотеза (H0). Если эмпирическое значение равно или превышает критическое (׀t׀ ≥ tкр), H0 отвергается и принимается альтернативная гипотеза Н1.
Пример
Для выявления различий в уровне интеллекта студентов 1-го и 5-го курсов случайным образом были отобраны 30 студентов 1 курса и 28 студентов 5 курса, у которых интеллект определялся с помощью одной и той же методики. Полученные результаты представлены в таблице.
Группа 1: 1-й курс |
|
|
|
|
Группа 2: 5-й курс |
|
N1 = 30 |
|
|
|
|
N2 = 28 |
|
M1 = 103 |
|
|
|
|
M2 = 109 |
|
S12 = 10 |
|
|
|
|
S 22 = 12 |
|
1. Вычисляем значение дисперсии: |
|
|||||
F = |
S 2 |
= |
12 |
=1,2 |
||
Б |
|
|
||||
Sм2 |
10 |
|||||
|
|
|
Сопоставив эмпирическое и критические значения дисперсии для чисел степеней свободы df1 = n Б −1 = 28 – 1 = 27; df2 = n М −1 = 30 – 1 = 29, делаем вывод о равенстве дисперсий (Fэмп < Fкр (α < 0,05)).
2. Определяем значение S – среднеквадратического отклонения:
S = |
df |
|
S 2 |
+df |
|
S 2 |
27 12 +29 |
10 |
=3,311 |
|
1 |
1 |
|
2 |
2 = |
28 +30 − |
2 |
||
|
|
|
df1 +df |
2 |
|
|
3. ВычисляемэмпирическоезначениекритерияСтьюдентапоформуле:
t = M 1 |
− M 2 |
|
= |
103 −109 |
= 6,897 |
||||
S |
1 |
+ |
1 |
|
3,311 |
1 |
+ |
1 |
|
|
n |
|
n |
2 |
|
|
28 |
|
30 |
|
1 |
|
|
|
|
|
|
|
4. Определяем критическое значение критерия Стьюдента для числа степеней свободы df =df1+ df2 = 29 + 27 = 56:
59
2,003(α ≤ 0,05) tкр = 2,667(α ≤ 0,01).
Принимаем статистическое решение и формулируем вывод. Сопоставив эмпирическое и критическое значения критерия, получаем: ׀t׀ > tкр (α < 0,01). Соответственно, нулевая гипотеза отвергается, принимается альтернативная Н1. Уровень интеллекта у студентов 5-го курса статистически достоверно выше, чемустудентов1-гокурса(α< 0,01).
60