Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
MSM.doc
Скачиваний:
49
Добавлен:
27.04.2019
Размер:
1.8 Mб
Скачать
  1. Выборочный коэффициент ранговой корреляции Кендалла и проверка гипотезы о его значимости.

В случае отсутствия связных рангов:

Инверсия: - минимальное число перестановок соседних элементов последовательности rk, необходимое, чтобы привести ее к последовательности rj.

При совпадающих ранжировках

При полностью противоположных ранжировках:

Для связных рангов:

Для проверки нулевой гипотезы Н0: = 0 (генеральный коэффициент ранговой корреляции Кендалла равен нулю) при альтернативной гипотезе Н1:  0 необходимо найти критическую точку:

(по таблицам функции Лапласа)

Следовательно, нулевая гипотеза принимается (ранговая корреляционная связь между признаками незначима).

Также можно проверить с помощью коэффициента Стьюдента (при n > 7) также как для коэффициента Спирмена:

  1. Критерий независимости для таблиц сопряженности.

Если таблица 2×2, то имеем биномиальный закон распределения.

Этот критерий очень важен, т.к. экономисты очень часто работают с таблицами частот и таблицами сопряженности.

Рассмотрим пример о заболеваемости (грипп)

Не заболели (y)

Заболели ( )

Всего

Привитые (x)

72

28

100

Непривитые ( )

31

69

100

Всего

103

97

200

P(y,x) ≠ P(y)P(x), следовательно, H0: x и y - независимы

Статистическая гипотеза (словесное описание):

Прививка (вакцинация) не оказывает влияние на y, а полученный результат (по вероятностям) – это случайная флуктуация.

А) случайно выбранный представитель из группы привитых людей будет инфицирован

Б) случайно выбранный представитель из группы людей без прививки будет инфицирован

Таблица ожидаемых частот:

Не заболели (y)

Заболели ( )

Всего

Привитые (x)

1-p

p

100

Непривитые ( )

1-p

p

100

Всего

103

97

200

Не заболели (y)

Заболели ( )

Всего

Привитые (x)

51,5

48,5(=(97/200)*100)

100

Непривитые ( )

51,5

48,5

100

Всего

103

97

200

y

Наблюдаемые частоты

Ожидаемые частоты

Разность

72

51,5

20,5

28

48,5

-20,5

Наблюдаемые частоты

Ожидаемые частоты

Разность

31

51,5

-20,5

69

48,5

20,5

Расчетная статистика (хи-квадрат):

- наблюдаемые частоты

- ожидаемые частоты (теоретические)

Если ожидаемые и наблюдаемые частоты совпадут, мы везде в расчетной статистике получим ноль, а вероятность была бы равна единицы.

Число степеней свободы: υ – 1 – 2 (2 – кол-во признаков (прививка и не заболеть))

U

(пишем в формуле Х, т.к. мы точно не знаем, что это 2) – нормально распределенная величина

Изначально вероятность делится на 2, т.к. берем только правый хвост распределения (оно симметрично). Впоследствии, избавляясь от модуля, мы снова возвращаемся к целому распределению и перестаем делить на 2.

На самом деле мы проверяли совпадение распределения наблюдаемых частот и ожидаемых частот.

Если ожидаемые и наблюдаемые частоты совпадут, мы везде в расчетной статистике получим ноль, а вероятность была бы равна единицы.

H0:

В данном случае мы отвергаем гипотезу о равенстве распределений. Тем самым мы доказали, что x и y зависимы.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]