- •Глава 3. Непараметрические статистические критерии
- •3.1. Критерий Розенбаума
- •3.2. Критерий Манна-Уитни
- •3.3. Критерий Крускала-Уолиса.
- •3.4. Критерий тенденций Джонкира
- •3.5. Критерий Макнамары
- •3.6. Критерий знаков
- •3.7. Критерий Вилкоксона
- •3.8. Критерий Фридмана
- •3.9. Критерий тенденций Пейджа
- •3.10. Критерий Пирсона
- •3.11. Критерий Колмогорова-Смирнова
- •3.12. Критерий Фишера
3.11. Критерий Колмогорова-Смирнова
К ритерий предназначен для сопоставления двух распределений: а) эмпирического с теоретическим; б) одного эмпирического распределения с другим эмпирическим распределением.
Критерий Колмогорова-Смирнова включает следующие этапы: |
||||||||||||||
1 |
Определить признак, который необходимо исследовать (значение признака может быть представлено в любой шкале измерения). |
|||||||||||||
2 |
Провести наблюдения одной выборки респондентов объема n (Объем выборки должен быть больше 50): x1, x2,…xi,… ,где случайная переменная X характеризует состояние изучаемого свойства в рассматриваемой совокупности. |
|||||||||||||
3 |
Сформулировать гипотезы: |
|||||||||||||
H0 |
Полученное эмпирическое распределение не отличатся от теоретического распределения. |
|||||||||||||
H1 |
Полученное эмпирическое распределение отличатся от теоретического распределения. |
|||||||||||||
4 |
Результаты измерения объектов выборки записать в ряд по возрастанию. |
|||||||||||||
5 |
Исходные выборочные данные сгруппировать и представить в виде интервального статистического ряд распределения частот (для распределения случайной величины по равномерному закону, для нормального распределения):
. |
|||||||||||||
6 |
Для каждой ячейки найти значение эмпирической функции распределения изучаемого свойства: , где а – число значений . |
|||||||||||||
7 |
Для каждой ячейки вычислить по формуле: |
|||||||||||||
а |
для нормального распределения , где , , – правый конец интервала, значение положить равным . Значения определить по таблице № 13 приложения; |
|||||||||||||
б |
для распределения случайной величины по равномерному закону , . |
|||||||||||||
8 |
Вычислить значение по формуле Для нахождения значения , данные можно записать в таблицу:
. |
|||||||||||||
9 |
Определить критические значения λ21кр и λ 22кр, которые отвечают уровням значимости в 5% и 1% по таблице №13 или №14 приложения. |
|||||||||||||
10 |
Расположить эмпирическое значение критерия и критические значения λ 21кр и λ 22кр на оси значимости. |
|||||||||||||
11 |
Если находится в зоне незначимости, то принимается гипотеза Н0 об отсутствии различий. Если находится в зоне значимости, то гипотеза об отсутствии различий Н0 отклоняется и принимается гипотеза Н1 о наличии различий. Если находится в зоне неопределенности, то существует вероятность принятия ложного решения. |
Критерий Колмогорова-Смирнова включает следующие этапы: |
|||||||||||||||||||
1 |
Определить признак, участвующий в сопоставлении (значения признака должны быть представлены не ниже порядковой шкалы). |
||||||||||||||||||
2 |
Произвести выборку двух групп респондентов (при увеличении объема выборки точность критерия повышается). |
||||||||||||||||||
3 |
Провести две серии наблюдений на двух независимых выборках респондентов объема n1, и n2: x1, x2,…xi,… ; y1, y2,…,yj,…, , где случайная переменная х характеризует состояние изучаемого свойства в одной из рассматриваемых совокупностей, а случайная переменная у – состояние того же свойства во второй совокупности. |
||||||||||||||||||
4 |
В зависимости от объема выборки: |
||||||||||||||||||
4.1 |
При небольших объемах выборки: |
||||||||||||||||||
а |
Результаты измерения объектов первой выборки записать в ряд по возрастанию. Для каждого значения переменной х найти значение эмпирической функции распределения изучаемого свойства: , где а – число значений . |
||||||||||||||||||
б |
Результаты измерения объектов второй выборки записать в ряд по возрастанию. Для каждого значения переменной у найти значение эмпирической функции распределения изучаемого свойства: , где b – число значений . |
||||||||||||||||||
в |
Данные записать в таблицу вида:
. |
||||||||||||||||||
4.2 |
При больших объемах выборок: |
||||||||||||||||||
а |
Составить таблицу, в которой значения наблюдений обеих выборок записываются в форме интервального ряда. Для каждого интервала значений наблюдений подсчитываются абсолютные частоты для каждой из выборок и . |
||||||||||||||||||
б |
По каждой выборке на основе абсолютных частот подсчитать накопительные частоты и . |
||||||||||||||||||
в |
Вычислить значения эмпирических функций по формулам: и . |
||||||||||||||||||
г |
Данные записать в таблицу вида:
. |
||||||||||||||||||
5 |
Сформулировать гипотезы: |
||||||||||||||||||
Н0 |
Законы распределения случайных величин X и Y одинаковы в обеих рассматриваемых совокупностях. |
||||||||||||||||||
Н1 |
Законы распределения случайных величин X и Y различны в обеих рассматриваемых совокупностях. |
||||||||||||||||||
6 |
Вычислить значение по формуле , где . Для нахождения значения данные можно записать в таблицу:
. |
||||||||||||||||||
7 |
Определить критические значения λ1кр и λ2кр, которые отвечают уровням значимости в 5% и 1% по таблицам № 13 или №14 приложения. |
||||||||||||||||||
8 |
Расположить эмпирическое значение критерия и критические значения λ1кр и λ2кр на оси значимости. |
||||||||||||||||||
9 |
Если находится в зоне незначимости, то принимается гипотеза Н0 об отсутствии различий. Если находится в зоне значимости, то гипотеза об отсутствии различий Н0 отклоняется и принимается гипотеза Н1 о наличии различий. Если находится в зоне неопределенности, то существует вероятность принятия ложного решения. |
Пример. Для того, чтобы показать преимущества разработанной методической системы обучения решению задач относительно традиционной, в качестве одного из показателей эффективности использовались результаты выполнения студентами тестирования. Извлечены две выборки студентов объемами п1= 40 (новая методическая система обучения) и п2= 50 (традиционная система обучения). Результаты выполнения тестирования двух выборок представлены таблице.
Число верных ответов |
Частота в первой выборке |
Частота во второй выборке |
41-45 |
1 |
1 |
46-50 |
1 |
0 |
51-55 |
1 |
1 |
56-60 |
0 |
1 |
61-65 |
1 |
4 |
66-70 |
1 |
2 |
71-75 |
1 |
2 |
76-80 |
2 |
6 |
81-85 |
3 |
5 |
86-90 |
4 |
2 |
91-95 |
10 |
8 |
96-100 |
15 |
18 |
∑ |
40 |
50 |
Требуется проверить гипотезу H0 : число баллов, набранных на тестировании в обеих выборках, подчиняются одному и тому же закону распределенная. При альтернативной гипотезе H1: число баллов, набранных на тестировании, в обеих выборках подчиняются различным законам распределения.
Число верных ответов |
Абсолютная частота |
Накопительная частота |
Эмпирическая функция |
|
|||
|
|
|
|
|
|
||
41-45 |
1 |
1 |
1 |
1 |
0,03 |
0,02 |
0,01 |
46-50 |
1 |
0 |
2 |
1 |
0,05 |
0.02 |
0,03 |
51-55 |
1 |
1 |
3 |
2 |
0,08 |
0,04 |
0,04 |
56-60 |
0 |
1 |
3 |
3 |
0,08 |
0,06 |
0,02 |
61-65 |
1 |
4 |
4 |
7 |
0,10 |
0.14 |
0,04 |
66-70 |
1 |
2 |
5 |
9 |
0,13 |
0.18 |
0,05 |
71-75 |
1 |
2 |
6 |
11 |
0,15 |
0,22 |
0,07 |
76-80 |
2 |
6 |
8 |
17 |
0,20 |
0,34 |
0,14 |
81-85 |
3 |
5 |
11 |
22 |
0,28 |
0,44 |
0,16 |
86-90 |
4 |
2 |
15 |
24 |
0,38 |
0,48 |
0,10 |
91-95 |
10 |
8 |
25 |
32 |
0,63 |
0,64 |
0,01 |
96-100 |
15 |
18 |
40 |
50 |
1,00 |
1,00 |
0,00 |
Вычислим .
Определим по таблице № 13 приложения критические значения λ1кр и λ2кр, которые отвечают уровням значимости в 5% и 1%:
находится в зоне незначимости. Оснований для отклонения H0 нет, поэтому число баллов, набранных на тестировании в обеих группах, есть случайная величина, распределенная по одному и тому же закону, следовательно, говорить о преимуществах новой системы обучения относительно традиционной нельзя.