
- •Министерство образования, науки и спорта Украины
- •Какие критерии выбрать: параметрические или непараметрические?
- •Какой может быть вариация?
- •Как определить, является ли распределение нормальным?
- •Алгоритм выбора конкретного статистического критерия
- •Алгоритм выбора параметрического критерия
- •1. Анализ действия экспериментального фактора.
- •Алгоритм выбора непараметрического критерия
- •1. Анализ действия экспериментального фактора.
- •2. Анализ различий.
- •Общая характеристика статистических критериев.
- •1. Критерий t Стьюдента для связанных выборок.
- •2. Критерий t Стьюдента для несвязанных выборок
- •3. Критерий t Стьюдента для сопоставления выборочной средней с заданной средней величиной
- •6. Критерий w Вилкоксона для сопряженных рядов
- •7. Критерий q Розенбаума
- •8. Критерий т Уайта
- •9. Критерий u Манна-Уитни
- •10. Критерий λ Смирнова-Колмогорова
- •11. Критерий х Ван-дер-Вардена
- •12. Критерий s Вальда - Вольфовица
- •13. Критерий t Сиджела-Тьюки
- •14. Критерий 2r Фридмана
- •15. Критерий тенденций l Пейджа
- •16. Критерий н Крускала-Уоллиса
- •21. Критерий 2 в многопольных таблицах.
- •22. Критерий Пирсона - Павлика.
- •23. Критерий Мак-Нимара
- •24. Угловое преобразование Фишера (критерий φ*).
- •25. Показатель корреляции Пирсона (r).
- •26. Показатель корреляции Спирмэна (rs).
- •27. Показатель ассоциации Юла rA(показатель контингенции)
- •28. Критерий множественной ранговой корреляции (rw)
- •29. Параметрический критерий множественной корреляции
- •30. Бисериальный коэффициент корреляции.
- •31. Дисперсионный анализ.
- •32. Критерий g Кохрена.
- •2). Средняя длина побега растений данного вида
- •Примеры использования z и φ – преобразования
- •Доли площади под нормальной кривой, отсекаемые t справа и слева от средней
- •Доли площади под нормальной кривой, отсекаемые t слева от средней
- •Доли площади под нормальной кривой, отсекаемые t справа от средней
- •Значения t при различных уровнях значимости р
- •Значения f при уровне значимости p 0,05
- •Стандартные значения критерия t для исключения
- •Значения критерия w Вилкоксона (для сопряженных рядов)
- •Значения к для приблизительного определения σ при разных объемах выборки
- •Критические значения показателя 2 (хи-квадрат)
- •Критические значения критерия r Фридмана
- •Критические значения критерия 2r Фридмана
- •Критические значения критерия тенденций l Пейджа
- •Для 3 с 6 и 2 n 12)Таблица 29
- •Критические значения критерия н Крускала-Уоллиса
- •Критические значения критерия тенденций s Джонкира
- •Значение r при разных величинах z
- •Объем выборки, необходимый для признания корреляции достоверной
- •Критические значения f - критерия для проверки результатов дисперсионного анализа р 0,05
- •Критические значения f - критерия для проверки результатов дисперсионного анализа р 0,01
- •Перевод процентов летальных исходов в пробиты
- •Критические значения q-критерия Кохрена
- •Ответы на задания по определению характера вариации (стр. 8)
- •Литература
10. Критерий λ Смирнова-Колмогорова
Непараметрический критерий, часто использующийся для проверки выборки на нормальность распределения. Может также применяться для анализа действия фактора по схеме: контрольная группа - экспериментальная группа, а также для анализа различий в проявлении переменной в несвязанных выборках. Его целесообразно использовать в тех случаях, когда результаты измерений по обоим выборкам представлены в виде двух вариационных рядов с указанием частот среднеклассовых значений.
Для каждого из вариационных рядов подсчитывается сумма накопленных частот так, как это делается при построении кумуляты. Далее для каждого из классов вычисляется разница d накопленных частот. Максимальное значение разницы подставляется в формулу:
Эта
формула может использоваться только в
том случае, если обе выборки имеют
одинаковый объем. Для отклонения нулевой
гипотезы необходимо, чтобы вычисленное
значение показателя λ
было больше
определенного критического уровня.
Примечательно, что данное критическое
значение не зависит от объема выборок
и определяется только выбранным уровнем
значимости. Для р < 0,1% оно составляет
1,95, для р < 1% уменьшается до 1,63, а для
р < 5 % имеет значение 1,36.
Например, в таблице представлены результаты измерения массы тела двух видов грызунов А и В.
Масса тела ( в г.) |
f A |
f B |
Σ f А |
Σ f В |
d |
30-39 |
2 |
0 |
2 |
- |
2 |
40-49 |
4 |
1 |
6 |
1 |
5 |
50-59 |
10 |
6 |
16 |
7 |
9 |
60-69 |
12 |
10 |
28 |
17 |
11 |
70-79 |
8 |
13 |
36 |
30 |
6 |
80-89 |
4 |
7 |
40 |
37 |
3 |
90-100 |
0 |
3 |
- |
40 |
- |
|
n = 40 |
n = 40 |
|
|
|
λ ф = d max / √ n = 11 / √ 40 = 1,74
λ ф (1,74) > λ т (1,36) ВЫВОД: различия доказаны при р < 5 % .
Если же количество объектов в выборках неодинаково, то для каждого класса следует вычислить отношение накопленной частоты к объему данной выборки. Затем определяется максимальная разница между названными отношениями. Дальнейшие вычисления производятся по формуле:
.
Для иллюстрации изменим количество
объектов в выборке «В».
Масса тела ( в г.) |
f A |
f B |
Σ f А |
Σ f В |
Σ f А/ n1 |
Σ f В/ n2 |
d |
30-39 |
2 |
0 |
2 |
- |
0,05 |
- |
|
40-49 |
4 |
1 |
6 |
1 |
0,15 |
0,05 |
0,1 |
50-59 |
10 |
3 |
16 |
4 |
0,4 |
0,2 |
0,2 |
60-69 |
12 |
5 |
28 |
9 |
0,7 |
0,45 |
0,25 |
70-79 |
8 |
6 |
36 |
15 |
0,9 |
0,75 |
0,15 |
80-89 |
4 |
3 |
40 |
18 |
1,0 |
0,9 |
0,1 |
90-100 |
0 |
2 |
- |
20 |
|
|
- |
|
n1 = 40 |
n2 = 20 |
|
|
|
|
|
=
λ ф (0,91) λ т (1,36) ВЫВОД: при р < 5 % различия не доказаны.
11. Критерий х Ван-дер-Вардена
Применяется для анализа результатов, полученных в исследованиях на несвязанных выборках. Отличается значительной статистической мощностью, но требует более сложных вычислений в сравнении с другими непараметрическими методами. Выборки могут быть неодинакового объема, но различия в количестве объектов не должны превышать 5 единиц.
Сначала, как и при использования критерия Вайта, строится общий ранжированный ряд вариант с присвоением им порядковых номеров - рангов. Далее берутся ранги только одной из выборок (какой именно - не имеет значения, так как конечный результат при правильности подсчетов будет одинаков в любом случае).
Ранговые показатели преобразуются в ряд чисел в диапазоне от 0 до 1, посредством деления значения ранга на общий объем выборки минус единица: R / N + 1. Для каждой из полученных величин по таблице (19)находится производная функция ψ. Значения ψ суммируют с учетом знака. Конечный результат обозначают как Хф. Для отклонения нулевой гипотезы необходимо, чтобы результат вычислений по модулю был больше табличного значения (таблица 20).
В качестве примера вернемся к задаче с определением уровня оперативной памяти. Ниже приводится общий ранжированный ряд Хi с соответствующими рангами R.
Хi: 8 10 10 10 10 10 10 11 11 11 12 12 12
R: 1 4,5 4,5 4,5 4,5 4,5 4,5 9 9 9 12 12 12
Хi: 13 13 13 14 14 14 15 15 15 16 17 18 18
R: 15 15 15 18 18 18 21 21 21 23 24 25,5 25,5
Используем ранги меньшей по объему выборки (12 испытуемых):
R: 4,5 4,5 4,5 4,5 9 9 9 15 15 18 18 23
0,166
0,166 0,166 0,166 0,333 0,333 0,,333 0,556
0,556 0,667 0,667 0,852
ψ: -0,97 -0,97 -0,97 -0,97 -0,43 -0,43 -0,43 0,14 0,14 0,43 0,43 1,05
Σ ψ = -2,98 Общий объем обоих выборок N = 12 + 14 = 26
Хф (2,98) Хт (4,48)
При р < 5 % и N = 26 гендерные различия не доказаны.