- •Лабораторные работы №№ 6 – 8 Анализ корреляционных связей. Цель работы.
- •Двойная группировка данных.
- •Корреляционное поле
- •Расчет параметров линейной модели.
- •Оценка тесноты и значимости корреляционной связи.
- •Доверительные интервалм на цетры групп.
- •Оценка тесноты и значимости линейной модели.
- •Проверка адекватности (линейности) модели.
- •Выбор нелинейной формы связи
- •Доверительные интервалы на расчетные значения.
- •Коэффициенты контингенции.
- •Контрольні питання
- •Роз’яснити зміст “діагональної регресії”, відповісти, чи є діагональна регресія регресією взагалі (згідно з визначенням цього поняття), у яких випадках доцільно використовувати цю модель.
- •Викласти ідею принципу Лежандра (мнк), роз’яснити зміст системи нормальних рівнянь, скласти систему нормальних рівнянь для лінійної і квадратичної моделей однієї змінної.
- •Перелічити основні передумови регресійного аналізу. Сформулювати ідею принципу максимальної правдоподібності і показати, що по цьому принципу найкращими оцінками параметрів моделі є мнк–оцінки.
- •Викласти ідею розрахунку дисперсій коефіцієнтів регресії і дисперсій розрахункових значень. Описати графічний спосіб побудови 95%-вої довірчої смуги на лінію регресії.
Коэффициенты контингенции.
Корреляционное поле очень похоже на таблицу сопряженности категорий двух качественных показателей (назовем их А и В, чтобы не было ассоциаций с количественными переменными Х и У).
|
А1 |
А2 |
А3 |
А4 |
А5 |
А6 |
А7 |
А8 |
l |
В1 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
В3 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
2 |
В5 |
0 |
3 |
4 |
0 |
0 |
0 |
0 |
0 |
7 |
В6 |
0 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
2 |
В7 |
0 |
0 |
2 |
5 |
0 |
0 |
0 |
0 |
7 |
В8 |
0 |
0 |
0 |
1 |
3 |
8 |
7 |
0 |
19 |
В9 |
0 |
0 |
0 |
0 |
0 |
2 |
1 |
2 |
5 |
k |
2 |
5 |
7 |
6 |
3 |
10 |
8 |
2 |
43 |
В1 |
0,500 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
|
В3 |
0,250 |
0,100 |
0 |
0 |
0 |
0 |
0 |
0 |
|
В5 |
0 |
0,257 |
0,327 |
0 |
0 |
0 |
0 |
0 |
|
В6 |
0 |
0,100 |
0,071 |
0 |
0 |
0 |
0 |
0 |
|
В7 |
0 |
0 |
0,082 |
0,595 |
0 |
0 |
0 |
0 |
|
В8 |
0 |
0 |
0 |
0,009 |
0,158 |
0,337 |
0,322 |
0 |
|
В9 |
0 |
0 |
0 |
0 |
0 |
0,080 |
0,025 |
0,400 |
|
Нуль-гипотеза заключается в утверждении независимости показателей А и В. Но тогда, согласно теореме умножения вероятностей, ожидаемые частоты совместного появления категорий (Ai , Bj) должны быть равны . Сравниваем по критерию Пирсона два ряда частот – наблюдаемых и ожидаемых при справедливости 0-гипотезы:
.
Эту статистику надо сравнивать с табличными значениями критерия Пирсона при ЧСС = (р – 1)(q – 1). Для нашего примера ЧСС = (8 – 1)(7 – 1) = 42. Функцией ХИ2ОБР находим Сразу под таблицей сопряженности вычислены отношения , их сумма равна 3,613, откуда получаем 2 = 43(3,613 – 1) = 112,36.
Т.к. вычисленное значение 2 больше табличного , нуль-гипотеза отвергается и делаем заключение о существовании значимой связи между показателями А, В. Теснота этой связи оценивается коэффициентами контингенции Крамера (С) и Кендала (К, КК):
, где d = min{p, q} = 7;
; .
Заметим, что коэффициент контингенции Кедала КК = 0,919, не использующий никаких сведений о числовой природе переменных, оказался очень близким к наиболее объективной мере тесноты связи – корреляционному отношению .