Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1 розенбаума.doc
Скачиваний:
10
Добавлен:
11.09.2019
Размер:
1.39 Mб
Скачать

3.10. Критерий Пирсона

Критерий Пирсона включает следующие этапы:

1

Определить признак, который необходимо исследовать (значения признака может быть представлены в любой шкале измерения).

2

Провести наблюдение одной выборки респондентов объема n (Объем выборки должен быть больше 30):

x1, x2,…xi, ,

где случайная переменная X характеризует состояние изучаемого свойства в рассматриваемой совокупности.

3

Сформулировать гипотезы:

H0

Полученное эмпирическое распределение не отличатся от теоретического распределения.

H1

Полученное эмпирическое распределение отличатся от теоретического распределения.

4

Исходные выборочные данные сгруппировать и представить в виде:

а

Статистического ряда распределения частот (для нормального распределения):

Возможные варианты

хi

x1

х2

....

xm

эмпирическая частота

....

.

б

Интервального статистического ряда распределения частот (для распределения случайной величины по равномерному закону, для нормального распределения):

элементы

хi

[x0; x1 )

[x1; x2 )

....

[xm-1;xm]

эмпирическая частота

....

Частота для каждой ячейки таблицы должна быть больше 4.

5

Для каждой ячейки вычислить теоретические частоты (частоты, которые следует ожидать, когда гипотеза H0 справедлива) по формуле: , где рi :

5.1

Для нормального распределения , где , , – левый конец интервала, значение положить равным , а значение положить равным . Значения определить по таблице № 13 приложения.

5.2

Для распределения случайной величины по равномерному закону, если исходные выборочные данные сгруппировать и представить в виде:

а

статистического ряда распределения частот ;

б

интервального статистического ряда распределения частот .

6

Вычислить значение по формуле: .

Для нахождения значения , данные можно записать в таблицу:

элементы

хi

.

7

Определить количество степеней свободы по формуле:

а

для нормального распределения df=c-3;

б

для распределения случайной величины по равномерному закону df=c-1, где c – число элементов в выборке. Если df=1, то внести поправку на «непрерывность».

8

Определить критические значения χ21кр и χ22кр, которые отвечают уровням значимости в 5% и 1% по таблице № 4 приложения.

9

Расположить эмпирическое значение критерия и критические значения χ21кр и χ22кр на оси значимости.

10

Если находится в зоне незначимости, то принимается гипотеза Н0 об отсутствии различий. Если находится в зоне значимости, то гипотеза об отсутствии различий Н0 отклоняется и принимается гипотеза Н1 о наличии различий. Если находится в зоне неопределенности, то существует вероятность принятия ложного решения.

Пример. Имеются сгруппированные данные о количества баллов, набранных на тестировании по математике студентами:

элементы (хi)

[40; 50)

[50; 60)

[60; 70)

[70; 80)

[80; 90)

[90;100]

эмпирическая частота ( )

10

26

56

64

30

14

Требуется проверить гипотезу H0 : число баллов, набранных на тестировании, есть случайная величина, распределенная по нормальному закону. При альтернативной гипотезе H1: число баллов, набранных на тестировании, есть случайная величина, не распределенная по нормальному закону.

Для каждой ячейки необходимо вычислить теоретические частоты по формуле: , где , .

Для нахождения значения , данные запишем в таблицу:

элементы

хi

[40; 50)

[50; 60)

[60; 70)

[70; 80)

[80; 90)

[90;100]

10

26

56

64

30

14

200

Нормированные

интервалы

(-∞; -1,70)

[-1,70; -0,86)

[-0,86; -0,08)

[-0,08;0,73)

[0,73; 1,54)

[1,54;+ ∞)

0,045

0,142

0,281

0,299

0,171

0,062

1

9

28,4

56,2

59,8

34,2

12,4

200

1

-2,4

-0,2

4,2

-4,2

1,6

1

5,76

0,04

17,64

17,64

2,56

0,11

0,20

0,00

0,29

0,52

0,21

1,33

. Количество степеней свободы при этом определяется по формуле: df=6-3=3.

Определим по таблице № 4 приложения критические значения χ21кр и χ22кр, которые отвечают уровням значимости в 5% и 1%:

Оснований для отклонения H0 нет, поэтому число баллов, набранных на тестировании, есть случайная величина, распределенная по нормальному закону.

Критерий Пирсона включает следующие этапы:

1

Определить признак, содержащий k разрядов, участвующий в сопоставлении (значения признака должны быть представлены не ниже порядковой шкалы).

2

Произвести выборку двух групп респондентов.

3

Провести две серии наблюдений на двух независимых выборках респондентов объема n1, и n2:

x1, x2,…xi,… ;

y1, y2,…,yj,…, ,

где случайная переменная х характеризует состояние изучаемого свойства в одной из рассматриваемых совокупностей, а случайная переменная у – состояние того же свойства во второй совокупности (число членов в обеих выборках должно быть в сумме больше 40, т. е. >40)

4

Сформулировать гипотезы:

Н0

Законы распределения случайных величин X и Y одинаковы в обеих рассматриваемых совокупностях.

Н1

Законы распределения случайных величин X и Y различны в обеих рассматриваемых совокупностях.

5

Распределить элементы каждой выборки объемов n1 и n2 на k категории, соответствующие разрядам исследуемого признака.

6

На основе полученных результатов составить таблицу вида:

выборки

разряды исследуемого признака

1

2

k

1

т11

т12

т1k

n1

2

т21

т22

т2k

n2

т11+ т21

т12+ т22

т1k+ т2k

n1+ n2

Не рекомендуется использовать критерий для проверки гипотез, если хотя бы одно из значений тij меньше 5.

7

Вычислить значение по формуле: .

8

Определить критические значения χ21кр и χ22кр, которые отвечают уровням значимости в 5% и 1% по таблице № 4 приложения. Количество степеней свободы при этом определяется по формуле: . Если df=1, то внести поправку на «непрерывность».

9

Расположить эмпирическое значение критерия и критические значения χ21кр и χ22кр на оси значимости.

10

Если находится в зоне незначимости, то принимается гипотеза Н0 об отсутствии различий. Если находится в зоне значимости, то гипотеза об отсутствии различий Н0 отклоняется и принимается гипотеза Н1 о наличии различий. Если находится в зоне неопределенности, то существует вероятность принятия ложного решения.

Пример. Чтобы проверить эффективность нового метода обучения были привлечены две случайно отобранные группы студентов в количестве 29 и 31 человек. Первая группа обучалась по традиционному методу, вторая - по новому методу. По окончанию изучаемого курса им был предложен один и тот же тест, результаты которого представлены в таблице.

Число баллов

Абсолютная частота в первой выборке

Абсолютная частота во второй выборке

Накопленная частота

15

1

0

1

60

14

1

1

2

59

13

0

2

2

57

12

2

0

2

55

11

1

2

3

53

10

0

1

1

50

9

0

5

5

49

8

2

3

5

44

7

4

6

10

39

6

6

3

9

29

5

5

5

10

20

4

4

2

6

10

3

1

0

1

4

2

2

1

3

3

1

0

0

0

0

0

0

0

0

0

n1=29

n2=31

N=60

Проверяется гипотеза Н0: m1=m2 – медианы распределения учащихся по числу баллов, полученных за выполнение работы, одинаковы в совокупностях студентов, обучающихся по традиционному и новому методам. Альтернативная гипотеза Н1: .

Число студентов в двух выборках N=60 — число четное, поэтому медиана равна среднему арифметическому значений, стоящих в упорядоченном ряду на 30-м и 31-м местах. В данном ряду, начиная с 30-го и заканчивая 39-м номером, расположены одинаковые значения, каждое из которых равно 7. Следовательно, среднее арифметическое значений, стоящих на 30-м и 31-м местах, равно , т. е. медиана равна 7.

Распределим значения каждой из выборок учащихся на две категории: больше 7 и меньше или равны 7, и запишем полученные результаты в таблицу, необходимую для подсчета статистики медианного критерия:

Число студентов, набравших больше 7 баллов

Число студентов, набравших 7 или менее баллов

Выборка № 1

18

11

29

Выборка №2

11

20

31

29

31

60

Найдем значение статистики критерия :

.

Определим по таблице № 4 приложения критические значения χ21кр и χ22кр, которые отвечают уровням значимости в 5% и 1%:

Оснований для отклонения H0 нет, поэтому нет достаточных оснований считать различными медианы распределений студентов по числу баллов в совокупностях студентов, обучающихся по новому и традиционному методам.

Пример. Была проведена выборка абитуриентов. Для каждого респондента выборки определены: а) пол; б) одна из 4 предпочитаемых специальностей. Результаты исследования представлены в таблице.

пол

факультеты

1

2

3

4

Ж (1)

4

21

17

9

51

М (2)

6

25

11

5

47

11

48

31

18

98

Проверяется гипотеза Н0: предпочтения у юношей и девушек в выборе специальностей совпадают. Альтернативная гипотеза Н1: предпочтения у юношей и девушек в выборе специальностей не совпадают.

Найдем значение статистики критерия :

.

Определим по таблице № 4 приложения критические значения χ21кр и χ22кр, которые отвечают уровням значимости в 5% и 1% и df=4-1=3:

Оснований для отклонения H0 нет, поэтому предпочтения у юношей и девушек в выборе специальностей совпадают.