- •Глава 3. Непараметрические статистические критерии
- •3.1. Критерий Розенбаума
- •3.2. Критерий Манна-Уитни
- •3.3. Критерий Крускала-Уолиса.
- •3.4. Критерий тенденций Джонкира
- •3.5. Критерий Макнамары
- •3.6. Критерий знаков
- •3.7. Критерий Вилкоксона
- •3.8. Критерий Фридмана
- •3.9. Критерий тенденций Пейджа
- •3.10. Критерий Пирсона
- •3.11. Критерий Колмогорова-Смирнова
- •3.12. Критерий Фишера
3.10. Критерий Пирсона
Критерий Пирсона включает следующие этапы: |
||
1 |
Определить признак, который необходимо исследовать (значения признака может быть представлены в любой шкале измерения). |
|
2 |
Провести наблюдение одной выборки респондентов объема n (Объем выборки должен быть больше 30): x1, x2,…xi,… , где случайная переменная X характеризует состояние изучаемого свойства в рассматриваемой совокупности. |
|
3 |
Сформулировать гипотезы: |
|
H0 |
Полученное эмпирическое распределение не отличатся от теоретического распределения. |
|
H1 |
Полученное эмпирическое распределение отличатся от теоретического распределения. |
4 |
Исходные выборочные данные сгруппировать и представить в виде: |
||||||||||||||
а |
Статистического ряда распределения частот (для нормального распределения):
. |
||||||||||||||
б |
Интервального статистического ряда распределения частот (для распределения случайной величины по равномерному закону, для нормального распределения):
Частота для каждой ячейки таблицы должна быть больше 4. |
||||||||||||||
5 |
Для каждой ячейки вычислить теоретические частоты (частоты, которые следует ожидать, когда гипотеза H0 справедлива) по формуле: , где рi : |
||||||||||||||
5.1 |
Для нормального распределения , где , , – левый конец интервала, значение положить равным , а значение положить равным . Значения определить по таблице № 13 приложения. |
||||||||||||||
|
5.2 |
Для распределения случайной величины по равномерному закону, если исходные выборочные данные сгруппировать и представить в виде: |
|||||||||||||
а |
статистического ряда распределения частот ; |
||||||||||||||
б |
интервального статистического ряда распределения частот . |
||||||||||||||
6 |
Вычислить значение по формуле: . Для нахождения значения , данные можно записать в таблицу:
. |
7 |
Определить количество степеней свободы по формуле: |
|
а |
для нормального распределения df=c-3; |
|
б |
для распределения случайной величины по равномерному закону df=c-1, где c – число элементов в выборке. Если df=1, то внести поправку на «непрерывность». |
|
8 |
Определить критические значения χ21кр и χ22кр, которые отвечают уровням значимости в 5% и 1% по таблице № 4 приложения. |
|
9 |
Расположить эмпирическое значение критерия и критические значения χ21кр и χ22кр на оси значимости. |
|
10 |
Если находится в зоне незначимости, то принимается гипотеза Н0 об отсутствии различий. Если находится в зоне значимости, то гипотеза об отсутствии различий Н0 отклоняется и принимается гипотеза Н1 о наличии различий. Если находится в зоне неопределенности, то существует вероятность принятия ложного решения. |
Пример. Имеются сгруппированные данные о количества баллов, набранных на тестировании по математике студентами:
элементы (хi) |
[40; 50) |
[50; 60) |
[60; 70) |
[70; 80) |
[80; 90) |
[90;100] |
эмпирическая частота ( ) |
10 |
26 |
56 |
64 |
30 |
14 |
Требуется проверить гипотезу H0 : число баллов, набранных на тестировании, есть случайная величина, распределенная по нормальному закону. При альтернативной гипотезе H1: число баллов, набранных на тестировании, есть случайная величина, не распределенная по нормальному закону.
Для каждой ячейки необходимо вычислить теоретические частоты по формуле: , где , .
Для нахождения значения , данные запишем в таблицу:
элементы хi |
[40; 50) |
[50; 60) |
[60; 70) |
[70; 80) |
[80; 90) |
[90;100] |
∑ |
|
10 |
26 |
56 |
64 |
30 |
14 |
200 |
Нормированные интервалы
|
(-∞; -1,70) |
[-1,70; -0,86) |
[-0,86; -0,08) |
[-0,08;0,73) |
[0,73; 1,54) |
[1,54;+ ∞) |
|
|
0,045 |
0,142 |
0,281 |
0,299 |
0,171 |
0,062 |
1 |
|
9 |
28,4 |
56,2 |
59,8 |
34,2 |
12,4 |
200 |
|
1 |
-2,4 |
-0,2 |
4,2 |
-4,2 |
1,6 |
|
|
1 |
5,76 |
0,04 |
17,64 |
17,64 |
2,56 |
|
|
0,11 |
0,20 |
0,00 |
0,29 |
0,52 |
0,21 |
1,33 |
. Количество степеней свободы при этом определяется по формуле: df=6-3=3.
Определим по таблице № 4 приложения критические значения χ21кр и χ22кр, которые отвечают уровням значимости в 5% и 1%:
Оснований для отклонения H0 нет, поэтому число баллов, набранных на тестировании, есть случайная величина, распределенная по нормальному закону.
Критерий Пирсона включает следующие этапы: |
||
1 |
Определить признак, содержащий k разрядов, участвующий в сопоставлении (значения признака должны быть представлены не ниже порядковой шкалы). |
|
2 |
Произвести выборку двух групп респондентов. |
|
3 |
Провести две серии наблюдений на двух независимых выборках респондентов объема n1, и n2: x1, x2,…xi,… ; y1, y2,…,yj,…, , где случайная переменная х характеризует состояние изучаемого свойства в одной из рассматриваемых совокупностей, а случайная переменная у – состояние того же свойства во второй совокупности (число членов в обеих выборках должно быть в сумме больше 40, т. е. >40) |
|
4 |
Сформулировать гипотезы: |
|
Н0 |
Законы распределения случайных величин X и Y одинаковы в обеих рассматриваемых совокупностях. |
|
Н1 |
Законы распределения случайных величин X и Y различны в обеих рассматриваемых совокупностях. |
|
5 |
Распределить элементы каждой выборки объемов n1 и n2 на k категории, соответствующие разрядам исследуемого признака. |
6 |
На основе полученных результатов составить таблицу вида:
Не рекомендуется использовать критерий для проверки гипотез, если хотя бы одно из значений тij меньше 5. |
||||||||||||||||||||||||||||
7 |
Вычислить значение по формуле: . |
||||||||||||||||||||||||||||
8 |
Определить критические значения χ21кр и χ22кр, которые отвечают уровням значимости в 5% и 1% по таблице № 4 приложения. Количество степеней свободы при этом определяется по формуле: . Если df=1, то внести поправку на «непрерывность». |
||||||||||||||||||||||||||||
9 |
Расположить эмпирическое значение критерия и критические значения χ21кр и χ22кр на оси значимости. |
||||||||||||||||||||||||||||
10 |
Если находится в зоне незначимости, то принимается гипотеза Н0 об отсутствии различий. Если находится в зоне значимости, то гипотеза об отсутствии различий Н0 отклоняется и принимается гипотеза Н1 о наличии различий. Если находится в зоне неопределенности, то существует вероятность принятия ложного решения. |
Пример. Чтобы проверить эффективность нового метода обучения были привлечены две случайно отобранные группы студентов в количестве 29 и 31 человек. Первая группа обучалась по традиционному методу, вторая - по новому методу. По окончанию изучаемого курса им был предложен один и тот же тест, результаты которого представлены в таблице.
Число баллов |
Абсолютная частота в первой выборке |
Абсолютная частота во второй выборке |
|
Накопленная частота |
15 |
1 |
0 |
1 |
60 |
14 |
1 |
1 |
2 |
59 |
13 |
0 |
2 |
2 |
57 |
12 |
2 |
0 |
2 |
55 |
11 |
1 |
2 |
3 |
53 |
10 |
0 |
1 |
1 |
50 |
9 |
0 |
5 |
5 |
49 |
8 |
2 |
3 |
5 |
44 |
7 |
4 |
6 |
10 |
39 |
6 |
6 |
3 |
9 |
29 |
5 |
5 |
5 |
10 |
20 |
4 |
4 |
2 |
6 |
10 |
3 |
1 |
0 |
1 |
4 |
2 |
2 |
1 |
3 |
3 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
|
n1=29 |
n2=31 |
N=60 |
|
Проверяется гипотеза Н0: m1=m2 – медианы распределения учащихся по числу баллов, полученных за выполнение работы, одинаковы в совокупностях студентов, обучающихся по традиционному и новому методам. Альтернативная гипотеза Н1: .
Число студентов в двух выборках N=60 — число четное, поэтому медиана равна среднему арифметическому значений, стоящих в упорядоченном ряду на 30-м и 31-м местах. В данном ряду, начиная с 30-го и заканчивая 39-м номером, расположены одинаковые значения, каждое из которых равно 7. Следовательно, среднее арифметическое значений, стоящих на 30-м и 31-м местах, равно , т. е. медиана равна 7.
Распределим значения каждой из выборок учащихся на две категории: больше 7 и меньше или равны 7, и запишем полученные результаты в таблицу, необходимую для подсчета статистики медианного критерия:
|
Число студентов, набравших больше 7 баллов |
Число студентов, набравших 7 или менее баллов |
|
Выборка № 1 |
18 |
11 |
29 |
Выборка №2 |
11 |
20 |
31 |
|
29 |
31 |
60 |
Найдем значение статистики критерия :
.
Определим по таблице № 4 приложения критические значения χ21кр и χ22кр, которые отвечают уровням значимости в 5% и 1%:
Оснований для отклонения H0 нет, поэтому нет достаточных оснований считать различными медианы распределений студентов по числу баллов в совокупностях студентов, обучающихся по новому и традиционному методам.
Пример. Была проведена выборка абитуриентов. Для каждого респондента выборки определены: а) пол; б) одна из 4 предпочитаемых специальностей. Результаты исследования представлены в таблице.
пол |
факультеты |
∑ |
|||
1 |
2 |
3 |
4 |
||
Ж (1) |
4 |
21 |
17 |
9 |
51 |
М (2) |
6 |
25 |
11 |
5 |
47 |
∑ |
11 |
48 |
31 |
18 |
98 |
Проверяется гипотеза Н0: предпочтения у юношей и девушек в выборе специальностей совпадают. Альтернативная гипотеза Н1: предпочтения у юношей и девушек в выборе специальностей не совпадают.
Найдем значение статистики критерия :
.
Определим по таблице № 4 приложения критические значения χ21кр и χ22кр, которые отвечают уровням значимости в 5% и 1% и df=4-1=3:
Оснований для отклонения H0 нет, поэтому предпочтения у юношей и девушек в выборе специальностей совпадают.