- •1.Генеральная и выборочная совокупности
- •2.Условия,которым должна удовлетворять выборка
- •3.Зависимые и независимые выборки
- •4.Измерения и виды шкал
- •5.Номинативная и порядковая шкалы
- •6.Шкала интервалов и шкала отношений
- •7.Таблица распределения частот
- •8. Таблица сгрупированных частот для разбиения на классы
- •9.Ранжирование
- •10. Меры центральной тенденции.
- •11. Меры изменчивости
- •12. Распределение исследуемого признака.
- •13. Метод Плохинского
- •14. Метод Пустыльника
- •15. Статистические гипотезы
- •16. Уровни значимости
- •17.Ось значимости
- •22. Критерий Стьюдента.
- •23. Критерий Фишера.
- •24 Понятие корреляционной связи
- •25. Линейная регрессия
- •26. Множественная линейная регрессия
- •27. Обоснование задачи сравнения распределений исследуемого признака
- •28.Понятие критерия Пирсона
- •29. Критерий Пирсона (сравнение эмпирического распределения с теоретическим).
- •30. Критерий Пирсона (сравнение двух эмпирических распределений)
- •31. Ограничения применения критерия Пирсона
- •32. Сдвиги
- •33.Критерий знаков
- •34. Критерий Вилкоксона
- •35. Понятие дисперсионного анализа.
- •36. Факторы и результативные признаки дисперсионного анализа.
- •37. Градации фактора
- •38.Уравнение дисперсионного анализа.
- •39. Создание комплексов дисперсионного анализа
- •40.Преобразование эмпирических данных
- •41.Ода для несвязных выборок
- •42. Однофакторный дисперсионный анализ для связанных выборок.
- •43. Понятие корреляции.
- •44. Коэффициент корреляции Фехнера.
- •45. Коэффициент корреляции Пирсона.
- •46.Коэффициент корреляции Спирмена
- •47. Коэффициент ранговой корреляции Кендала
- •48. Дихотомический коэффициент корреляции.
- •49.Точечный бисериальный коэффициент корреляции.
- •50. Рангово-бисериальный коэффициент корреляции.
30. Критерий Пирсона (сравнение двух эмпирических распределений)
Критерий применяется в 2-х случаях: 1) для сопоставления эмпирического распределения признака теоритическому; 2) для сопоставления 2х или более эмпирических распределений одного и того же признака. Критерий построен так, что при полном совпадении экспериментального и теоритического (или 2х экспериментальных) распределений величина = 0 и чем больше расхождение между распределениями, тем больше величина .
Основная расчётная формула критерия выглядит так: = ∑
f - частота
Расчётная формула для сравнения 2-х эмпирических распределений выглядит так: = ∙
и - числа элементов, составляющих первую и вторую выборки. Они могут совпадать, а могут и не совпадать.
Если при расчёте критерия данные даются в виде таблицы, то число степеней свободы находится по формуле: = ( k - 1) (c - 1); k - кол-во строк, c - столбцов
На практике значительно чаще встречаются задачи, в которых необходимо сравнивать не экспериментальное с теоритическим, а 2 экспериментальных распределения.
Рассмотрим следующий пример.
Одинаков ли уровень подготовленности учащихся в 2-х школах, если в 1-й школе из 100 человек поступили в ВУЗ 82 человека, а во 2-й из 87 - 44?
Представим данные задачи в виде четырёхпольной таблицы, ячейки которой будет обозначать буквами A, B, C, D.
|
1 школа |
2 школа |
Число поступивших |
А 82 |
В 44 |
Число не поступивших |
С 18 |
D 43 |
∑ |
100 |
87 |
Теоритические
частоты в подобных случаях вычисляются
на основе эмпирических разными способами
в зависимости от типа решаемой задачи.
Важно сразу определить, что будем считать
долей признака. Из таблицы видно, что
18 и 43 чел-ка соответственно из1й и 2й школ
не поступили в ВУЗ. Относительно этих
величин подсчитаем так называемую долю
признака непоступаимости. P
=
=(примерно) 0,33
Теперь
подсчиатем сколько учащихся из каждой
школы теоритически не должны были
поступить в ВУЗ.
=
0,33 · 100 = 33;
= 0,33 ∙ 87 = 8,71
Теперь
понятно, как подсчитать число теоритически
поступивших.
= 100 - 33 = 67;
= 87 - 28,71 = 58, 29
|
1школа |
2школа |
Число поступивших |
= 67 |
= 58,29 |
Число не поступивших |
= 33 |
= 28, 71 |
∑ |
100 |
87 |
=
+
+
+
= 20,9
= (2 - 1) (2 - 1) = 1
= 3, 84 α = 0,05
6, 64 α = 0,01
Таким образом, нужно применить гипотезу о наличии различий между двумя эмпирическими распределениями. Т.о. ур-нь подготовки в 2-х школах оказался различным.
Преимущества критерия заключ-ся в том, что он позволяет сопоставлять распределения признаков в любой шкале, начиная со шкалы наименоаний.
31. Ограничения применения критерия Пирсона
Ограничения применения критерия Пирсона имеет ряд преимуществ.
Для него установлены достаточно жестокие ограничения.
1)Объём выборки должен быть достаточно большим (не меньше 30). Если объём выборки меньше, то критерий даёт очень приближённые результаты.
2)Теоретическая частота для каждой ячейки таблицы не должна быть меньше 5. Это значит, что если число разрядов в шкале измерений задано заранее и не может быть изменено, то нельзя начинать обработку данных, пока не накоплено минимальное кол-во наблюдений, которое в каждом конкретном случае может быть определено. Например, мы хотим проверить какой день недели является самым тяжёлым. Поскольку в неделе 7 дней, то потребуется как минимум сделать опрос 5*7=35. Т.о. если кол-во разрядов К. задано заранее, то минимальное число наблюдений находим по формуле n=5К.
3)Выбранные разряды д/п исчерпывать всё распределение охватывая весь диапазон изменения признака при этом группировка на разряды долна быть одинаковой во всех сопоставляемых распределениях.
4)Необходимо вносить в случае использования дихотомической шкалы т.н. «поправку на непрерывность», поскольку формула для вычисления критерия даёт несколько завышенные значения при работе с четырёхполыми таблицами. Причина в том, что распределения самого критерия это непрерывная функция, а разряды шкалы дискретные «да» и «нет». В связи с этим принято вводить т.н. поправку на непрерывность.
5)Разряды должны быть непересекающимися. Если наблюдение отнесено к первому разряду, то его нельзя отнести ко второму. Сумма наблюдений по разрядам должна быть равна общему числу наблюдений.
