- •Лабораторные работы №№ 6 – 8 Анализ корреляционных связей. Цель работы.
- •Двойная группировка данных.
- •Корреляционное поле
- •Расчет параметров линейной модели.
- •Оценка тесноты и значимости корреляционной связи.
- •Доверительные интервалм на цетры групп.
- •Оценка тесноты и значимости линейной модели.
- •Проверка адекватности (линейности) модели.
- •Выбор нелинейной формы связи
- •Доверительные интервалы на расчетные значения.
- •Коэффициенты контингенции.
- •Контрольні питання
- •Роз’яснити зміст “діагональної регресії”, відповісти, чи є діагональна регресія регресією взагалі (згідно з визначенням цього поняття), у яких випадках доцільно використовувати цю модель.
- •Викласти ідею принципу Лежандра (мнк), роз’яснити зміст системи нормальних рівнянь, скласти систему нормальних рівнянь для лінійної і квадратичної моделей однієї змінної.
- •Перелічити основні передумови регресійного аналізу. Сформулювати ідею принципу максимальної правдоподібності і показати, що по цьому принципу найкращими оцінками параметрів моделі є мнк–оцінки.
- •Викласти ідею розрахунку дисперсій коефіцієнтів регресії і дисперсій розрахункових значень. Описати графічний спосіб побудови 95%-вої довірчої смуги на лінію регресії.
Выбор нелинейной формы связи
Обычно принимают двухпараметрическую форму связи F(x, y) = a + bФ(х, у), которая является линейной после функционального преобразования переменных. Чаще всено проверяют или обратные преобразования переменных, или же их логарифмирование. Таким образом, предлагается рассмотреть шесть двухпараметрических моделей:
у = а + b / х – с обратным преобразованием переменной х;
1 / у = а + bх – с обратным преобразованием переменной у;
1 / у = а + b / х – с обратным преобразованием обеих переменных;
у = а + blnх – с логарифмированием переменной х;
lnу = а + bх – с логарифмированием переменной y;
lnу = а + blnх – с логарифмированием обеих переменных.
Наилучшей среди двухпараметрических моделей будет та, для которой получится наибольший коэффициент корреляции. Графиком линейной зависимости является прямая линия; отсюда следует такой визуальный критерий выбора наилучшей нелинейной формы связи – в функциональных масштабах эмпирические точки должны группироваться вокруг некоторой прямой.
Работа эта не такая тяжелая, как может показаться с первого взгляда. Рабочий лист Excel с уже набранными формулами и построенными графиками представляет собой работающую программу обработки данных. Сделаем работающую копию этого листа Excel и в копии заменим одну из переменных на функционально преобразованную. Практически все автоматически пересчитывается и потребуется, в основном, только заменить разметку осей на графиках.
Zcp = |
1,193 |
Ycp = |
75,233 |
Sz = |
0,294 |
Sy = |
17,848 |
Rzy = |
0,901 |
b = |
54,767 |
a = |
9,895 |
|
|
|
Удалась первая же попытка найти подходящую нелинейную форму связи.
Доверительные интервалы на расчетные значения.
Ширина 95%-ного доверительного интервала на расчетное значение yp = a + bx для линейной модели равна ур(х), где .
n = |
43 |
Zcp = |
1,193 |
Dz = |
0,0862 |
Sy = |
17,848 |
Rzy = |
0,901 |
t0,05 = |
2,020 |
min = |
2,441 |
b = |
54,767 |
a = |
9,895 |
Границы доверительной полосы наносим на графики пунктиром. Наличие на графике ренресии 95%-ной доверительной полосы определяет пределы применимости модели.
|
|