- •Параметрические и непараметрические процедуры статистического анализа данных. Проверка на нормальность.
- •Уровни статистической значимости, ось значимости, особенности нахождения критических значений различных критериев.
- •Критерий Вилкоксона (общая характеристика, графическая интерпретация, ограничения, примеры использования).
- •Алгоритм 9 Подсчет критерия Вилкоксона
- •5. Критерий Розенбаума (общая характеристика, графическая интерпретация, ограничения, примеры использования).
- •Алгоритм 1 Подсчет критерия q Розенбаума
- •Критерий Фридмана (общая характеристика, ограничения, примеры использования).
- •Алгоритм 10 Подсчет критерия χ2r Фридмана
- •Критерий Манна-Уитни (общая характеристика, представление о ранжировании числовых данных, ограничения, примеры использования).
- •Правила ранжирования
- •Алгоритм 4 Подсчет критерия u Манна-Уитни.
- •Критерий Мак-Немара (общая характеристика, ограничения, примеры использования).
- •9. Критерий Крускала-Уоллиса (общая характеристика, ограничения, примеры использования).
- •Алгоритм 5 Подсчет критерия н Крускала-Уоллиса
- •10.Критерий тенденций Пейджа (общая характеристика, ограничения, примеры использования).
- •Алгоритм 11 Подсчет критерия тенденций l Пейджа
- •Критерий тенденций Джонкира (общая характеристика, графическое представление, ограничения, примеры использования).
- •Алгоритм 6 Подсчет критерия s Джонкира
- •Показатели различий в распределениях признака. Критерии согласия (общая характеристика, алгоритм выбора критериев согласия). Выявление различий в распределении признака
- •14.Критерий Пирсона и особенности его использования при сравнении теоретического и эмпирического распределение и 2 эмпирических.
- •Шутливый пример
- •Алгоритм 13 Расчет критерия χ2
- •15. Критерий Колмогорова-Смирнова и особенности его использования при сравнении теоретического и эмпирического распределение.
- •16. Критерий Колмогорова-Смирнова и особенности его использования при сопоставлении двух эмпирических распределений.
- •Алгоритм 14
- •Алгоритм 15
- •17. Критерии сдвига и особенности их применений в психологических исследованиях. Классификация сдвигов. Алгоритм выбора критерия сдвига.
- •1) Шкала "я сам наказываю"
- •2) Шкала "Бабушка наказывает"
- •3) Шкала "Воспитательница наказывает"
- •18. Критерии различий и особенности их применения в психологических исследованиях. Алгоритм выбора критерия различий.
Критерий Вилкоксона (общая характеристика, графическая интерпретация, ограничения, примеры использования).
Т-критерий Вилкоксона — непараметрический статистический тест (критерий), используемый для проверки различий между двумя выборками парных измерений. Впервые предложен Фрэнком Уилкоксоном[1]. Другие названия — W-критерий Вилкоксона[2], критерий знаковых рангов Вилкоксона, критерий Уилкоксона для связных выборок.
Критерий предназначен для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых. Он позволяет установить не только направленность изменений, но и их выраженность, то есть способен определить, является ли сдвиг показателей в одном направлении более интенсивным, чем в другом.
ритерий применим в тех случаях, когда признаки измерены, по крайней мере, в порядковой шкале. Целесообразно применять данный критерий, когда величина самих сдвигов варьирует в некотором диапазоне (10—15 % от их величины). Это объясняется тем, что разброс значений сдвигов должен быть таким, чтобы появлялась возможность их ранжирования. В случае если сдвиги незначительно различаются между собой и принимают какие-то конечные значения (например. +1, -1 и 0), формальных препятствий к применению критерия нет, но, ввиду большого числа одинаковых рангов, ранжирование утрачивает смысл, и те же результаты проще было бы получить с помощью критерия знаков.
Суть метода состоит в том, что сопоставляются абсолютные величины выраженности сдвигов в том или ином направлении. Для этого сначала все абсолютные величины сдвигов ранжируются, а потом суммируются ранги. Если сдвиги в ту или иную сторону происходят случайно, то и суммы их рангов окажутся примерно равны. Если же интенсивность сдвигов в одну сторону больше, то сумма рангов абсолютных значений сдвигов в противоположную сторону будет значительно ниже, чем это могло бы быть при случайных изменениях.
Минимальное значение величины: {\displaystyle W=n(n+1)/2} , где n — объём второй выборки. Максимальное значение величины {\displaystyle W=n(n+1)/2+mn} , где n — объём второй выборки, m — объём первой выборки.
Ограничения критерия
Объем выборки — от 5 до 50 элементов[источник не указан 1895 дней].
Нулевые сдвиги исключаются из рассмотрения. (Это требование можно обойти, переформулировав вид гипотезы. Например: сдвиг в сторону увеличения значений превышает сдвиг в сторону их уменьшения и тенденцию к сохранению на прежнем уровне.)
Сдвиг в более часто встречающемся направлении принято считать «типичным», и наоборот.
Есть также урезанный вариант для сравнения одной выборки с известным значением медианы.
Алгоритм
Составить список испытуемых в любом порядке, например, алфавитном.
Вычислить разность между индивидуальными значениями во втором и первом замерах. Определить, что будет считаться типичным сдвигом.
Согласно алгоритму ранжирования, проранжировать абсолютные величины разностей, начисляя меньшему значению меньший ранг, и проверить совпадение полученной суммы рангов с расчетной.
Отметить каким-либо способом ранги, соответствующие сдвигам в нетипичном направлении. Подсчитать их сумму Т.
Определить критические значения Т для данного объема выборки. Если Т-эмп. меньше или равен Т-кр. – сдвиг в «типичную» сторону достоверно преобладает.
Фактически оцениваются знаки значений, полученных вычитанием ряда значений одного измерения из другого. Если в результате количество снизившихся значений примерно равно количеству увеличившихся, то гипотеза о нулевой медиане подтверждается.
Пример алгоритма для серии из двух опытов
Пусть имеется две серии эксперимента, в результате которых были получены две выборки объёмами n и m. Пусть нулевая гипотеза H0: Генеральные средние обеих выборок совпадают. Чтобы проверить гипотезу H0, необходимо:
Просуммировать элементы второй выборки (вычислить W)
Вычислить математическое ожидание случайной величины W. {\displaystyle M(W)=n(m+n+1)/2}
При справедливости H0 математическое ожидание случайной величины W близко к статистике W.
Проверка гипотезы начинается с выбора уровня значимости — а
Вычислить пределы значимости (Из симметрии достаточно одного предела) и границу критической области W(a)
Справедливость неравенства W > W(a) свидетельствует о справедливости нулевой гипотезы. H0 принимается на уровне значимости = а
Пример расчета T-критерия Вилкоксона
Допустим мы сравниваем между собой уровень тревожности подростков до и после тренинга уверенности в себе.
Шаг 1. Запишем значения в таблицу.
Шаг 2. Рассчитаем разность значений. Для данного случае типичным сдвигом будет считаться сдвиг в отрицательную сторону (7 значений, красный цвет заливки), а нетипичным в положительную сторону (3 значения, зеленый цвет заливки)
Шаг 3. Найдем значения шага 2 по модулю
Шаг 4. Проранжируем значения по модулю.
Все четыре шага приведены в таблице.
№ |
Уровень тревожности (до тренинга) |
Уровень тревожности (после тренинга) |
Шаг 2: Разность (после-до) |
Шаг 3: Значение разности по модулю |
Шаг 4: Ранг разности |
1 |
15 |
14 |
-1 |
1 |
3 |
2 |
14 |
11 |
-3 |
3 |
8 |
3 |
16 |
17 |
1 |
1 |
3 |
4 |
18 |
19 |
1 |
1 |
3 |
5 |
21 |
20 |
-1 |
1 |
3 |
6 |
21 |
18 |
-3 |
3 |
8 |
7 |
20 |
15 |
-5 |
5 |
10 |
8 |
15 |
17 |
2 |
2 |
6 |
9 |
17 |
14 |
-3 |
3 |
8 |
10 |
13 |
12 |
-1 |
1 |
3 |
Шаг 5. Найдем T эмпирическое вычислив сумму рангов в НЕтипичном направлении (зеленый цвет заливки).
Шаг 6. Используя таблицу критических значений T-критерия Вилкоксона определяем T-критическое
6.1. Находим количество человек в выборке. n=10
6.2. Определяем T-критическое справа от значения количества человек в выборке. для p<0,05 T=10; для p<0,01 T=5
Шаг 7. Сравниваем T-критическо и T-эмпирическое.
Шаг 8 Делаем выводы.
Таблица критических значений T-критерия Вилкоксона
В таблице указаны критические значения T-критерия Вилкоксона в зависимости от уровня значимости.
N |
p<0,05 |
p<0,01 |
5 |
0 |
— |
6 |
2 |
— |
7 |
3 |
0 |
8 |
5 |
1 |
9 |
8 |
3 |
10 |
10 |
5 |
11 |
13 |
7 |
12 |
17 |
9 |
13 |
21 |
12 |
14 |
25 |
15 |
15 |
30 |
19 |
16 |
35 |
23 |
17 |
41 |
27 |
18 |
47 |
32 |
19 |
53 |
37 |
20 |
60 |
43 |
21 |
67 |
49 |
22 |
75 |
55 |
23 |
83 |
62 |
24 |
91 |
69 |
25 |
100 |
76 |
26 |
110 |
84 |
27 |
119 |
92 |
28 |
130 |
101 |
29 |
140 |
110 |
30 |
151 |
120 |
31 |
163 |
130 |
32 |
175 |
140 |
33 |
187 |
151 |
34 |
200 |
162 |
35 |
213 |
173 |
36 |
227 |
185 |
37 |
241 |
198 |
38 |
256 |
211 |
39 |
271 |
224 |
40 |
286 |
238 |
41 |
302 |
252 |
42 |
319 |
266 |
43 |
336 |
281 |
44 |
353 |
296 |
45 |
371 |
312 |
46 |
389 |
328 |
47 |
407 |
345 |
48 |
426 |
362 |
49 |
446 |
379 |
50 |
466 |
397 |
В таблице критических значений T-критерия Вилкоксона находиться Т-критическое.
Если Е-критическое выше Т-эмпирического, то сдвиги в «типичную» сторону достоверное не преобладают.
T-критерий Вилкоксона предназначен для сравнения двух зависимых выборок между собой по уровню выраженности какого-либо признака.
С его помощью можно определить
1) направленность изменений, 2) выраженность изменений в зависимых выборках. С его помощью есть возможность определить в каком направлении сдвиг более интенсивен.
Параметрический аналог: t-критерий Стьюдента.
Непараметрический аналог: G-критерий знаков (менее мощный).
Суть применения T-критерия Вилкоксона сводится к тому, чтобы проранжировать разности значений в двух выборках.
Гипотезы
Н0: Интенсивность сдвигов в типичном направлении не превосходит интенсивности сдвигов в нетипичном направлении.
H1: Интенсивность сдвигов в типичном направлении превышает интенсивность сдвигов в нетипичном направлении.
Особенности применения:
Признаки должны быть измерены в шкале порядка.
Эффективнее применять критерий, если разброс значений достаточно широк например от -30 до 30, если разброс значений не большой лучше применять G-критерий знаков (например от -3 до 3)
Минимальное количество замеров 5
Максимальное количество замеров 50 (ограничение обусловлено использованием таблицы критических значений T-Вилкоксона, при расчете в SPSS ограничение отсутствует)
Нулевые сдвиги не считаются замерами. Например группу могут составлять 50 человек, но у 10 из них сдвиги нулевые, следовательно мы будем рассчитывать значения исходя из 40 замеров)
Расчет T-критерия Вилкоксона заключается в выполнении следующих шагов:
Составить список значений испытуемых в первом и во втором замерах.
Найти разность по каждому замеру, т.е. вычесть из значений второго замера значения первого замера. Важно! Подсчитать количество отрицательных и количество положительных значений. Большее количество значений того или иного вида будет представлять из себя «типичный» сдвиг.
Найти значения разностей по модулю.
Ранжировать полученные на 4-ом шаге значения, по принципу меньшему значения приписывается меньший ранг. т.е. значение 1 — это 1 ранг.
Подсчитать T-эмпирическое, являющееся суммой рангов в НЕтипичном направлении:
,
где
—
ранговые значения сдвигов в НЕтипичном
направленииОпределить T-критическое используя таблицу критических значений T-критерия Вилкоксона 6.1. Определяем количество человек в выборке. 6.2. Определяем T-критическое справа от значения количества человек в выборке в зависимости от уровня значимости.
Сравниваем T-эмпирическое и Т-критическое
Делаем вывод: Если — эмпирическое меньше T-критического, то сдвиг в «типичную» сторону преобладает на уровне значимости p<0,05
Пример
В выборке курсантов военного училища (юноши в возрасте от 18 до 20 лет) измерялась способность к удержанию физического волевого усилия на динамометре. Сначала у испытуемых измерялась максимальная мышечная сила каждой из рук, а на следующий день им предлагалось выдерживать, на динамометре с подвижной стрелкой мышечное усилие, равное 1/2 максимальной мышечной силы данной руки. Почувствовав усталость, испытуемый должен был сообщить об этом экспериментатору, но не прекращать опыт, преодолевая усталость и неприятные ощущения - "бороться, пока воля не иссякнет". Опыт проводился дважды; вначале с обычной инструкцией, а затем, после того, как испытуемый заполнял опросник самооценки волевых качеств по методике А.Ц. Пуни (Пуни А.Ц., 1977), ему предлагалось представить себе, что он уже добился идеала в развитии волевых качеств, и продемонстрировать соответствующее идеалу волевое усилие. Подтвердилась ли гипотеза экспериментатора о том, что обращение к идеалу способствует возрастанию волевого усилия? Данные представлены в Табл. 3.5.
Таблица 3.5
Расчет критерия Т при сопоставлении замеров физического волевого усилия
Код имени испытуемого
|
Длительность удержания усилия на динамометре (с) |
Разность (fпосле- fдо)
|
Абсолютное значение разности
|
Ранговый номер разности |
||
До измерения волевых качеств и обращения к идеалу (fдо) |
После измерения волевых качеств и обращения к идеалу (fпосле) |
|
||||
1 2 3 4 5 6 7 8 9 10 11 |
Г. Кос. Крив. Кур. Л. М. Р. С. Т. X. Ю. |
64 77 74 95 105 83 73 75 101 97 78 |
25 50 77 76 67 75 77 71 63 122 60 |
- 39 - 27 + 3 - 19 - 38 - 8 + 4 - 4 - 38 + 25 - 18 |
39 27 5 19 38 8 4 4 38 25 18 |
11 8 1 6 9,5 4 2,5 2,5 9,5 7 5 |
Сумма |
|
66 |
||||
Для подсчета этого критерия нет необходимости упорядочивать ряды значений по нарастанию признака. Мы можем использовать алфавитный список испытуемых, как в данном случае.
Первый шаг в подсчете критерия Т - вычитание каждого индивидуального значения "до" из значения "после"1. Мы видим из Табл. 3.5, что 8 полученных разностей - отрицательные и лишь 3 - положительные. Это означает, что у 8 испытуемых длительность удержания мышечного усилия во втором замере уменьшилась, а у 3 - увеличилась. Мы столкнулись с тем случаем, когда уже сейчас мы не можем сформулировать статистическую гипотезу, соответствующую первоначальному предположению исследователя. Предполагалось, что обращение к идеалу будет увеличивать длительность мышечного усилия, а экспериментальные данные свидетельствуют, что лишь в 3 случаях из 11 этот показатель действительно увеличился. Мы можем сформулировать лишь гипотезу, предполагающую несущественность сдвига этого показателя в сторону снижения.
Сформулируем гипотезы.
Н0: Интенсивность сдвигов в сторону уменьшения длительности мышечного усилия не превышает интенсивности сдвигов в сторону ее увеличения.
H1: Интенсивность сдвигов в сторону уменьшения длительности мышечного усилия превышает интенсивность сдвигов в сторону ее увеличения.
На следующем шаге все сдвиги, независимо от их знака, должны быть проранжированы по выраженности. В Табл. 3.5 в четвертом слева столбце приведены абсолютные величины сдвигов, а в последнем столбце (справа) - ранги этих абсолютных величин. Меньшему значению соответствует меньший ранг. При этом сумма рангов равна 66, что соответствует расчетной:
Теперь отметим те сдвиги, которые являются нетипичными, в данном случае - положительными. В Табл. 3.5 эти сдвиги и соответствующие им ранги выделены цветом. Сумма рангов этих "редких" сдвигов и составляет эмпирическое значение критерия Т:
где Rr - ранговые значения сдвигов с более редким знаком.
Итак, в данном случае,
Тэмn=1+2,5+7=10,5
По Таблице VI Приложения 1 определяем критические значения Т для n=11:
Зона значимости в данном случае простирается влево. Действительно, если бы "редких", в данном случае положительных, сдвигов не было совсем, то и сумма их рангов равнялась бы нулю. В данном же случае эмпирическое значение Т попадает в зону неопределенности:
Тэмп<Ткр (0,05)
Ответ: Н0 отвергается. Интенсивность отрицательного сдвига показателя физического волевого усилия превышает интенсивность положительного сдвига (р<0,05).
Таким образом, исследователю придется признать, что продолжительность удержания мышечного волевого усилия во втором замере снижается, и этот сдвиг неслучаен. Инструкция, ориентирующая испытуемого на соответствие идеалу в развитии воли, оказалась гораздо менее мощным фактором, чем какая-то иная сила - возможно, мышечное утомление, может быть, разочарование в себе или в возможностях данного психологического эксперимента. А может быть, в момент второго замера просто перестает действовать какой-то мощный фактор, который был активен вначале? На все эти вопросы статистические методы не могут ответить, если в схему эксперимента не включена контрольная группа - в данном случае, выборка, уравновешенная с экспериментальной группой по всем значимым характеристикам (полу, возрасту, профессии, месту обучения), у которой просто измерили бы вторично волевое усилие через такой же промежуток времени, не призывая соответствовать идеалу в развитии воли.
Представим выполненные действия в виде алгоритма:
