- •Лабораторные работы №№ 6 – 8 Анализ корреляционных связей. Цель работы.
- •Двойная группировка данных.
- •Корреляционное поле
- •Расчет параметров линейной модели.
- •Оценка тесноты и значимости корреляционной связи.
- •Доверительные интервалм на цетры групп.
- •Оценка тесноты и значимости линейной модели.
- •Проверка адекватности (линейности) модели.
- •Выбор нелинейной формы связи
- •Доверительные интервалы на расчетные значения.
- •Коэффициенты контингенции.
- •Контрольні питання
- •Роз’яснити зміст “діагональної регресії”, відповісти, чи є діагональна регресія регресією взагалі (згідно з визначенням цього поняття), у яких випадках доцільно використовувати цю модель.
- •Викласти ідею принципу Лежандра (мнк), роз’яснити зміст системи нормальних рівнянь, скласти систему нормальних рівнянь для лінійної і квадратичної моделей однієї змінної.
- •Перелічити основні передумови регресійного аналізу. Сформулювати ідею принципу максимальної правдоподібності і показати, що по цьому принципу найкращими оцінками параметрів моделі є мнк–оцінки.
- •Викласти ідею розрахунку дисперсій коефіцієнтів регресії і дисперсій розрахункових значень. Описати графічний спосіб побудови 95%-вої довірчої смуги на лінію регресії.
Оценка тесноты и значимости линейной модели.
Теснота линейной связи оценивается с помощью коэффициента детерминации (квадрата коэффициента корреляции). Коэффициент детерминации показывает, какая часть полной изменчивости определяется регрессионной моделью (75,3%): Значимость регрессионной модели устанавливается или по готовой формуле, или же после заполнения Таблицы дисперсионного анализа 2, в которой сумма квадратов расчетных значений вычисляется с помощью коэффициента детерминации: SSp = (Rxy)2SSy . Остальные графы таблицы заполняются обычным образом.
Таблица дисперсионного анализа 2
Изменчивость |
Суммы квадратов |
ЧСС |
Средние квадраты |
Дисп. отнош. |
Табл. знач. |
||||||
Регрессия |
(Ур |
SSр = |
10319,84 |
dfр = |
1 |
MSр = |
10319,84 |
Fr = |
125,26 |
F0,05 = |
4,08 |
Остаток |
(е) |
SSе = |
3377,84 |
dfе = |
41 |
MSе = |
82,39 |
|
|
F0,01 = |
7,30 |
Общая |
(Y) |
SSy = |
13697,67 |
dfy = |
42 |
|
|
|
|
Alpha = |
0,00 |
Т.к. вычисленное дисперсионное отношение Fr = 125,26 превышает табличное F0,01 = 7,30, нуль-гипотеза о незначимости линейной модели отвергается.
Дисперсионное отношение можно было вычислить по готовой формуле
.
Проверка адекватности (линейности) модели.
Остаток модели (е) слагается из случайнй ошибки () и систематической ошибки неверного выбора формы связи (ошибки спецификации модели). Обозначим эту ошибку через А (неадекватность). Если нам известна мера изменчивости случайной ошибки, можно проверить значимость ошибки неадекватности. Из таблицы дисперсионного анализа 1 выписываем все сведения об изменчивости данных внутри групп – это и есть случайнвя изменчивость. Из таблицы дисперсионного анализа 2 выписываем сведения об остатке модели. Разности между суммами квадратов и числами степеней свободы характеризуют систематическую ошибку спецификации модели. Заполняем Таблицу дисперсионного анализа 3.
Таблица дисперсионного анализа 2
Изменчивость |
Суммы квадратов |
ЧСС |
Средние квадраты |
Дисп. отнош. |
Табл. знач. |
||||||
Неадекватность |
(А |
SSА = |
1824,14 |
dfр = |
6 |
MSр = |
304,02 |
FА = |
6,84 |
F0,05 = |
2,37 |
Случайность |
() |
SS = |
1553,69 |
df = |
35 |
MS = |
44,39 |
|
|
F0,01 = |
3,37 |
Остаток |
(е) |
SSе = |
3377,84 |
dfе = |
41 |
MSе = |
82,39 |
|
|
Alpha = |
0,00 |
Т.к. вычисленное дисперсионное отношение FА = 6,84 превышает табличное F0,01 = 3,37, нуль-гипотеза о незначимости систематической ошибки отвергается. Динейная модель – неадекватная, надо искать более подходящую форму связи.
Дисперсионное отношение можно было вычислить по готовой формуле
.