- •Лабораторные работы №№ 6 – 8 Анализ корреляционных связей. Цель работы.
- •Двойная группировка данных.
- •Корреляционное поле
- •Расчет параметров линейной модели.
- •Оценка тесноты и значимости корреляционной связи.
- •Доверительные интервалм на цетры групп.
- •Оценка тесноты и значимости линейной модели.
- •Проверка адекватности (линейности) модели.
- •Выбор нелинейной формы связи
- •Доверительные интервалы на расчетные значения.
- •Коэффициенты контингенции.
- •Контрольні питання
- •Роз’яснити зміст “діагональної регресії”, відповісти, чи є діагональна регресія регресією взагалі (згідно з визначенням цього поняття), у яких випадках доцільно використовувати цю модель.
- •Викласти ідею принципу Лежандра (мнк), роз’яснити зміст системи нормальних рівнянь, скласти систему нормальних рівнянь для лінійної і квадратичної моделей однієї змінної.
- •Перелічити основні передумови регресійного аналізу. Сформулювати ідею принципу максимальної правдоподібності і показати, що по цьому принципу найкращими оцінками параметрів моделі є мнк–оцінки.
- •Викласти ідею розрахунку дисперсій коефіцієнтів регресії і дисперсій розрахункових значень. Описати графічний спосіб побудови 95%-вої довірчої смуги на лінію регресії.
Расчет параметров линейной модели.
По графику разброса и виду корреляционного поля делаем заключение, что эмпирические точки явно уклоняются от линейной зависимости и в принципе требуется дополнительное исследование по определению типа нелинейной зависимости. Однако изучение линейной модели является обязательным, поэтому рассчитываем ее параметры как по исходным, так и по сгуппированным данным.
Расчеты по исходным данным х, у – диапазоны исходных данных |
Расчеты по сгруппированным данным Х, У – диапазоны центров интервалов; k, l – диапазоны частот |
Хср = сумм(х) / n Хср = срзнач(х) |
Хср = суммпроизв(Х; k) / n |
Yср = сумм(y) / n Yср = срзнач(y) |
Yср = суммпроизв(Y; l) / n |
(XХ)ср = суммпроизв(x; x) / n |
(XХ)ср = суммпроизв(X; X; k) / n |
(YY)ср = суммпроизв(y; y) / n |
(YY)ср = суммпроизв(Y; Y; l) / n |
(XY)ср = суммпроизв(x; y) / n |
(XY)ср = суммпроизв(X; mY) / n (XY)ср = суммпроизв(Y; mX) / n |
Dx = (XX)cp – (Xcp)^2 Dx = диспр(х) |
Dx = (XX)cp – (Xcp)^2 |
Dу = (YY)cp – (Ycp)^2 Dу = диспр(у) |
Dу = (YY)cp – (Ycp)^2 |
Sxy = (XY)ср – XcpYcp Sxy = ковар(х; у) |
Sxy = (XY)ср – XcpYcp |
Sx = корень(Dx) |
Sx = корень(Dx) |
Sу = корень(Dу) |
Sу = корень(Dу) |
Rxy = Sxy / Sx / Sy Rxy = коррел(х, у) |
Rxy = Sxy / Sx / Sy |
b1 = Rxy*Sy / Sx |
b1 = Rxy*Sy / Sx |
b0 = Ycp – b1*Xcp |
b0 = Ycp – b1*Xcp |
В основном, различия в методиках расчета заключаются в способах вычисления средних: Хср , Уср , (ХХ)ср , (УУ)ср , (ХУ)ср . При расчете на компьютере по исходным данным можно использовать также некоторые альтернативные формулы.
Исходные данные |
Сгруппированные |
Погрешн. |
||
Xcp = |
0,884814 |
Xcp = |
0,874419 |
-1,17% |
Ycp = |
76,62791 |
Ycp = |
75,23256 |
-1,82% |
(XX)cp = |
0,816391 |
(XX)cp = |
0,803721 |
-1,55% |
(YY)cp = |
6180,209 |
(YY)cp = |
5978,488 |
-3,26% |
(XY)cp = |
64,89865 |
(XY)cp = |
62,72093 |
-3,36% |
Dx = |
0,033496 |
Dx = |
0,039113 |
16,77% |
Dy = |
308,3732 |
Dy = |
318,5506 |
3,30% |
Sxy = |
-2,90279 |
Sxy = |
-3,06382 |
5,55% |
Sx = |
0,183018 |
Sx = |
0,19777 |
8,06% |
Sy = |
17,56056 |
Sy = |
17,84798 |
1,64% |
Rxy = |
-0,9032 |
Rxy = |
-0,86799 |
-3,90% |
b1 = |
-86,6619 |
b1 = |
-78,3324 |
-9,61% |
b0 = |
153,3075 |
b0 = |
143,7279 |
-6,25% |
а1 = |
-0,00941 |
а1 = |
-0,00962 |
2,18% |
а0 = |
1,606131 |
а0 = |
1,598005 |
-0,51% |
Кроме параметров (коэффициентов регрессии) линейной модели yp = b0 + b1x рассчитаны также параметры сопряженной модели хp = а0 + а1у, когда у считается объясняющей, а х – результативной переменной: а1 = Rxy*Sх / Sу, а0 = Хcp – b1*Уcp.
Графики обеих моделей приведены ниже.
|
|
На этих же графиках построены эмпирические линии регрессии (Xi , Ui) и (Vj , Yj). При построении эмпирической линии регрессии X / Y для сопряженной модели было небольшое затруднение – диапазоны значений V (а, значит, и соответствующие диапазоны Y) не являются смежными, поэтому их надо задавать при нажатой клавише Ctrl (иначе линия регрессии будет с пропусками). Эмпирические линии регрессии явно указывают на нелинейный характер зависимости.