Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
statistika_docx2.docx
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
486.4 Кб
Скачать

30. Критерий Пирсона (сравнение двух эмпирических распределений)

Критерий применяется в 2-х случаях: 1) для сопоставления эмпирического распределения признака теоритическому; 2) для сопоставления 2х или более эмпирических распределений одного и того же признака. Критерий построен так, что при полном совпадении экспериментального и теоритического (или 2х экспериментальных) распределений величина = 0 и чем больше расхождение между распределениями, тем больше величина .

Основная расчётная формула критерия выглядит так: = ∑

f - частота

Расчётная формула для сравнения 2-х эмпирических распределений выглядит так: = ∙

и - числа элементов, составляющих первую и вторую выборки. Они могут совпадать, а могут и не совпадать.

Если при расчёте критерия данные даются в виде таблицы, то число степеней свободы находится по формуле: = ( k - 1) (c - 1); k - кол-во строк, c - столбцов

На практике значительно чаще встречаются задачи, в которых необходимо сравнивать не экспериментальное с теоритическим, а 2 экспериментальных распределения.

Рассмотрим следующий пример.

Одинаков ли уровень подготовленности учащихся в 2-х школах, если в 1-й школе из 100 человек поступили в ВУЗ 82 человека, а во 2-й из 87 - 44?

Представим данные задачи в виде четырёхпольной таблицы, ячейки которой будет обозначать буквами A, B, C, D.

1 школа

2 школа

Число поступивших

А 82

В 44

Число не поступивших

С 18

D 43

100

87

Теоритические частоты в подобных случаях вычисляются на основе эмпирических разными способами в зависимости от типа решаемой задачи. Важно сразу определить, что будем считать долей признака. Из таблицы видно, что 18 и 43 чел-ка соответственно из1й и 2й школ не поступили в ВУЗ. Относительно этих величин подсчитаем так называемую долю признака непоступаимости. P = =(примерно) 0,33

Теперь подсчиатем сколько учащихся из каждой школы теоритически не должны были поступить в ВУЗ. = 0,33 · 100 = 33; = 0,33 ∙ 87 = 8,71

Теперь понятно, как подсчитать число теоритически поступивших. = 100 - 33 = 67; = 87 - 28,71 = 58, 29

1школа

2школа

Число поступивших

= 67

= 58,29

Число не поступивших

= 33

= 28, 71

100

87

= + + + = 20,9

  • = (2 - 1) (2 - 1) = 1

= 3, 84 α = 0,05

6, 64 α = 0,01

Таким образом, нужно применить гипотезу о наличии различий между двумя эмпирическими распределениями. Т.о. ур-нь подготовки в 2-х школах оказался различным.

Преимущества критерия заключ-ся в том, что он позволяет сопоставлять распределения признаков в любой шкале, начиная со шкалы наименоаний.

31. Ограничения применения критерия Пирсона

Ограничения применения критерия Пирсона имеет ряд преимуществ.

Для него установлены достаточно жестокие ограничения.

1)Объём выборки должен быть достаточно большим (не меньше 30). Если объём выборки меньше, то критерий даёт очень приближённые результаты.

2)Теоретическая частота для каждой ячейки таблицы не должна быть меньше 5. Это значит, что если число разрядов в шкале измерений задано заранее и не может быть изменено, то нельзя начинать обработку данных, пока не накоплено минимальное кол-во наблюдений, которое в каждом конкретном случае может быть определено. Например, мы хотим проверить какой день недели является самым тяжёлым. Поскольку в неделе 7 дней, то потребуется как минимум сделать опрос 5*7=35. Т.о. если кол-во разрядов К. задано заранее, то минимальное число наблюдений находим по формуле n=5К.

3)Выбранные разряды д/п исчерпывать всё распределение охватывая весь диапазон изменения признака при этом группировка на разряды долна быть одинаковой во всех сопоставляемых распределениях.

4)Необходимо вносить в случае использования дихотомической шкалы т.н. «поправку на непрерывность», поскольку формула для вычисления критерия даёт несколько завышенные значения при работе с четырёхполыми таблицами. Причина в том, что распределения самого критерия это непрерывная функция, а разряды шкалы дискретные «да» и «нет». В связи с этим принято вводить т.н. поправку на непрерывность.

5)Разряды должны быть непересекающимися. Если наблюдение отнесено к первому разряду, то его нельзя отнести ко второму. Сумма наблюдений по разрядам должна быть равна общему числу наблюдений.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]