Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

к паре

.docx
Скачиваний:
6
Добавлен:
20.12.2015
Размер:
994.44 Кб
Скачать

Матрица XTX.

16

4909

136

148.7

250.4

274.1

1715.7

4909

1664861

46707

50519.4

77211.1

84495.2

532080.2

136

46707

1496

1301.3

2141.7

2325.7

14892.9

148.7

50519.4

1301.3

1744.03

2326.89

2564.55

16036.2

250.4

77211.1

2141.7

2326.89

3936

4302.45

26867.79

274.1

84495.2

2325.7

2564.55

4302.45

4715.15

29394.46

1715.7

532080.2

14892.9

16036.2

26867.79

29394.46

184282.13

Полученная матрица имеет следующее соответствие:

∑n

∑y

∑x1

∑x2

∑x3

∑x4

∑x5

∑y

∑y2

∑x1 y

∑x2 y

∑x3 y

∑x4 y

∑x5 y

∑x1

∑yx1

∑x1 2

∑x2 x1

∑x3 x1

∑x4 x1

∑x5 x1

∑x2

∑yx2

∑x1 x2

∑x2 2

∑x3 x2

∑x4 x2

∑x5 x2

∑x3

∑yx3

∑x1 x3

∑x2 x3

∑x3 2

∑x4 x3

∑x5 x3

∑x4

∑yx4

∑x1 x4

∑x2 x4

∑x3 x4

∑x4 2

∑x5 x4

∑x5

∑yx5

∑x1 x5

∑x2 x5

∑x3 x5

∑x4 x5

∑x5 2

Найдем парные коэффициенты корреляции.

Признаки x и y

∑xi

∑yi

∑xiyi

Для y и x1

136

8.5

4909

306.813

46707

2919.188

Для y и x2

148.7

9.294

4909

306.813

50519.4

3157.463

Для y и x3

250.4

15.65

4909

306.813

77211.1

4825.694

Для y и x4

274.1

17.131

4909

306.813

84495.2

5280.95

Для y и x5

1715.7

107.231

4909

306.813

532080.2

33255.013

Для x1 и x2

148.7

9.294

136

8.5

1301.3

81.331

Для x1 и x3

250.4

15.65

136

8.5

2141.7

133.856

Для x1 и x4

274.1

17.131

136

8.5

2325.7

145.356

Для x1 и x5

1715.7

107.231

136

8.5

14892.9

930.806

Для x2 и x3

250.4

15.65

148.7

9.294

2326.89

145.431

Для x2 и x4

274.1

17.131

148.7

9.294

2564.55

160.284

Для x2 и x5

1715.7

107.231

148.7

9.294

16036.2

1002.263

Для x3 и x4

274.1

17.131

250.4

15.65

4302.45

268.903

Для x3 и x5

1715.7

107.231

250.4

15.65

26867.79

1679.237

Для x4 и x5

1715.7

107.231

274.1

17.131

29394.46

1837.154

Признаки x и y

Для y и x1

21.25

9919.902

4.61

99.599

Для y и x2

22.628

9919.902

4.757

99.599

Для y и x3

1.078

9919.902

1.038

99.599

Для y и x4

1.217

9919.902

1.103

99.599

Для y и x5

19.092

9919.902

4.369

99.599

Для x1 и x2

22.628

21.25

4.757

4.61

Для x1 и x3

1.078

21.25

1.038

4.61

Для x1 и x4

1.217

21.25

1.103

4.61

Для x1 и x5

19.092

21.25

4.369

4.61

Для x2 и x3

1.078

22.628

1.038

4.757

Для x2 и x4

1.217

22.628

1.103

4.757

Для x2 и x5

19.092

22.628

4.369

4.757

Для x3 и x4

1.217

1.078

1.103

1.038

Для x3 и x5

19.092

1.078

4.369

1.038

Для x4 и x5

19.092

1.217

4.369

1.103

Матрица парных коэффициентов корреляции R:

-

y

x1

x2

x3

x4

x5

y

1

0.678

0.646

0.233

0.226

0.816

x1

0.678

1

0.106

0.174

-0.051

0.96

x2

0.646

0.106

1

-0.00335

0.204

0.273

x3

0.233

0.174

-0.00335

1

0.698

0.235

x4

0.226

-0.051

0.204

0.698

1

0.0308

x5

0.816

0.96

0.273

0.235

0.0308

1

Коллинеарность – зависимость между факторами. В качестве критерия мультиколлинеарности может быть принято соблюдение следующих неравенств: r(xjy) > r(xkxj) ; r(xky) > r(xkxj). Если одно из неравенств не соблюдается, то исключается тот параметр xk или xj, связь которого с результативным показателем Y оказывается наименее тесной. Для отбора наиболее значимых факторов xi учитываются следующие условия: - связь между результативным признаком и факторным должна быть выше межфакторной связи; - связь между факторами должна быть не более 0.7. Если в матрице есть межфакторный коэффициент корреляции rxjxi > 0.7, то в данной модели множественной регрессии существует мультиколлинеарность.; - при высокой межфакторной связи признака отбираются факторы с меньшим коэффициентом корреляции между ними. Если факторные переменные связаны строгой функциональной зависимостью, то говорят о полной мультиколлинеарности. В этом случае среди столбцов матрицы факторных переменных Х имеются линейно зависимые столбцы, и, по свойству определителей матрицы, det(XTX = 0). Вид мультиколлинеарности, при котором факторные переменные связаны некоторой стохастической зависимостью, называется частичной. Если между факторными переменными имеется высокая степень корреляции, то матрица (XTX) близка к вырожденной, т. е. det(XTX ≧ 0) (чем ближе к 0 определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии). Вычисление определителя показано в шаблоне решения Excel В нашем случае rx1 x5 имеют |r|>0.7, что говорит о мультиколлинеарности факторов и о необходимости исключения одного из них из дальнейшего анализа. Анализ первой строки этой матрицы позволяет произвести отбор факторных признаков, которые могут быть включены в модель множественной корреляционной зависимости. Факторные признаки, у которых |ryxi| < 0.5 исключают из модели. Можно дать следующую качественную интерпретацию возможных значений коэффициента корреляции (по шкале Чеддока): если |r|>0.3 – связь практически отсутствует; 0.3 ≤ |r| ≤ 0.7 - связь средняя; 0.7 ≤ |r| ≤ 0.9 – связь сильная; |r| > 0.9 – связь весьма сильная. Проверим значимость полученных парных коэффициентов корреляции с помощью t-критерия Стьюдента. Коэффициенты, для которых значения t-статистики по модулю больше найденного критического значения, считаются значимыми. Рассчитаем наблюдаемые значения t-статистики для ryx1 по формуле: где m = 1 - количество факторов в уравнении регрессии. По таблице Стьюдента находим Tтабл tкрит(n-m-1;α/2) = (14;0.025) = 2.145 Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим Рассчитаем наблюдаемые значения t-статистики для ryx2 по формуле: Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим Рассчитаем наблюдаемые значения t-статистики для ryx3 по формуле: Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим Рассчитаем наблюдаемые значения t-статистики для ryx4 по формуле: Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим Рассчитаем наблюдаемые значения t-статистики для ryx5 по формуле: Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим Таким образом, связь между (y и xx1 ), (y и xx2 ), (y и xx5 ) является существенной. Наибольшее влияние на результативный признак оказывает фактор x5 (r = 0.82), значит, при построении модели он войдет в регрессионное уравнение первым. Тестирование и устранение мультиколлинеарности. Наиболее полным алгоритмом исследования мультиколлинеарности является алгоритм Фаррара-Глобера. С его помощью тестируют три вида мультиколлинеарности: 1. Всех факторов (χ2 - хи-квадрат). 2. Каждого фактора с остальными (критерий Фишера). 3. Каждой пары факторов (критерий Стьюдента). 1. Проверим переменные на мультиколлинеарность методом Фаррара-Глоубера по первому виду статистических критериев (критерий "хи-квадрат"). Формула для расчета значения статистики Фаррара-Глоубера: χ2 = -[n-1-(2m+5)/6]ln(det[R]) = -[16-1-(2*5+5)/6]ln(0.00193) = 78.12 где m = 5 - количество факторов, n = 16 - количество наблюдений, det[R] - определитель матрицы парных коэффициентов корреляции R. Сравниваем его с табличным значением при v = m/2(m-1) = 10 степенях свободы и уровне значимости α. Если χ2 > χтабл2, то в векторе факторов присутствует мультиколлинеарность. χтабл2(10;0.05) = 18.30704 2. Проверим переменные на мультиколлинеарность по второму виду статистических критериев (критерий Фишера). Определяем обратную матрицу D = R-1:

9.15

5.683

-2.916

0.618

-1.24

-12.233

5.683

24.642

1.858

1.826

-0.783

-29.212

-2.916

1.858

2.818

0.597

-0.228

-0.309

0.618

1.826

0.597

2.516

-1.833

-2.956

-1.24

-0.783

-0.228

-1.833

2.499

2.181

-12.233

-29.212

-0.309

-2.956

2.181

39.745

Вычисляем F-критерии Фишера: где dkk - диагональные элементы матрицы. Рассчитанные значения критериев сравниваются с табличными при v1=n-m и v2=m-1 степенях свободы и уровне значимости α. Если Fk > FТабл, то k-я переменная мультиколлинеарна с другими. v1=16-5 = 11; v2=5-1 = 4. FТабл(11;4) = 5.94 Поскольку F1 > Fтабл, то переменная y мультиколлинеарна с другими. Поскольку F2 > Fтабл, то переменная x1 мультиколлинеарна с другими. Поскольку F3 ≤ Fтабл, то переменная x2 немультиколлинеарна с другими. Поскольку F4 ≤ Fтабл, то переменная x3 немультиколлинеарна с другими. Поскольку F5 ≤ Fтабл, то переменная x4 немультиколлинеарна с другими. Поскольку F6 > Fтабл, то переменная x5 мультиколлинеарна с другими. 3. Проверим переменные на мультиколлинеарность по третьему виду статистических критериев (критерий Стьюдента). Для этого найдем частные коэффициенты корреляции. Частные коэффициенты корреляции. Коэффициент частной корреляции отличается от простого коэффициента линейной парной корреляции тем, что он измеряет парную корреляцию соответствующих признаков (y и xi) при условии, что влияние на них остальных факторов (xj) устранено. На основании частных коэффициентов можно сделать вывод об обоснованности включения переменных в регрессионную модель. Если значение коэффициента мало или он незначим, то это означает, что связь между данным фактором и результативной переменной либо очень слаба, либо вовсе отсутствует, поэтому фактор можно исключить из модели. Теснота связи сильная Определим значимость коэффициента корреляции ryx1 /x2 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: где k = 1 - число фиксируемых факторов. По таблице Стьюдента находим Tтабл tкрит(n-k-2;α/2) = (13;0.025) = 2.16 Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим Как видим, связь y и x1 при условии, что x2 войдет в модель, стала сильнее. Теснота связи умеренная Определим значимость коэффициента корреляции ryx1 /x5 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: где k = 1 - число фиксируемых факторов. По таблице Стьюдента находим Tтабл tкрит(n-k-2;α/2) = (13;0.025) = 2.16 Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим Как видим, связь y и x1 при условии, что x5 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x1 остается нецелесообразным. Теснота связи сильная Определим значимость коэффициента корреляции ryx2 /x1 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим Как видим, связь y и x2 при условии, что x1 войдет в модель, стала сильнее. Теснота связи сильная Определим значимость коэффициента корреляции ryx2 /x5 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим Как видим, связь y и x2 при условии, что x5 войдет в модель, стала сильнее. Теснота связи низкая. Определим значимость коэффициента корреляции ryx3 /x1 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим Как видим, связь y и x3 при условии, что x1 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x3 остается нецелесообразным. Теснота связи не сильная Определим значимость коэффициента корреляции ryx3 /x2 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим Как видим, связь y и x3 при условии, что x2 войдет в модель, стала сильнее. Теснота связи низкая. Определим значимость коэффициента корреляции ryx3 /x5 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим Как видим, связь y и x3 при условии, что x5 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x3 остается нецелесообразным. Теснота связи не сильная Определим значимость коэффициента корреляции ryx4 /x1 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим Как видим, связь y и x4 при условии, что x1 войдет в модель, стала сильнее. Теснота связи низкая. Определим значимость коэффициента корреляции ryx4 /x2 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим Как видим, связь y и x4 при условии, что x2 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x4 остается нецелесообразным. Теснота связи не сильная Определим значимость коэффициента корреляции ryx4 /x5 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим Как видим, связь y и x4 при условии, что x5 войдет в модель, стала сильнее. Теснота связи сильная Определим значимость коэффициента корреляции ryx5 /x1 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим Как видим, связь y и x5 при условии, что x1 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x5 остается нецелесообразным. Теснота связи сильная Определим значимость коэффициента корреляции ryx5 /x2 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим Как видим, связь y и x5 при условии, что x2 войдет в модель, стала сильнее. Теснота связи умеренная Определим значимость коэффициента корреляции ryx2 /x5 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим Как видим, связь y и x2 при условии, что x5 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x2 остается нецелесообразным. Теснота связи низкая. Межфакторная связь слабая. Определим значимость коэффициента корреляции ryx3 /x2 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим Как видим, связь y и x3 при условии, что x2 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x3 остается нецелесообразным. Теснота связи низкая. Межфакторная связь слабая. Определим значимость коэффициента корреляции ryx3 /x5 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим Как видим, связь y и x3 при условии, что x5 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x3 остается нецелесообразным. Теснота связи низкая. Межфакторная связь слабая. Определим значимость коэффициента корреляции ryx4 /x2 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим Как видим, связь y и x4 при условии, что x2 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x4 остается нецелесообразным. Теснота связи низкая. Межфакторная связь слабая. Определим значимость коэффициента корреляции ryx4 /x5 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим Как видим, связь y и x4 при условии, что x5 войдет в модель, стала сильнее. Теснота связи сильная Определим значимость коэффициента корреляции ryx5 /x2 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим Как видим, связь y и x5 при условии, что x2 войдет в модель, стала сильнее. Теснота связи низкая. Межфакторная связь слабая. Определим значимость коэффициента корреляции ryx3 /x1 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим Как видим, связь y и x3 при условии, что x1 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x3 остается нецелесообразным. Теснота связи низкая. Межфакторная связь слабая. Определим значимость коэффициента корреляции ryx3 /x5 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим Как видим, связь y и x3 при условии, что x5 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x3 остается нецелесообразным. Теснота связи низкая. Межфакторная связь слабая. Определим значимость коэффициента корреляции ryx4 /x1 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим Как видим, связь y и x4 при условии, что x1 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x4 остается нецелесообразным. Теснота связи низкая. Межфакторная связь слабая. Определим значимость коэффициента корреляции ryx4 /x5 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим Как видим, связь y и x4 при условии, что x5 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x4 остается нецелесообразным. Теснота связи умеренная Определим значимость коэффициента корреляции ryx5 /x1 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим Как видим, связь y и x5 при условии, что x1 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x5 остается нецелесообразным. Теснота связи сильная Определим значимость коэффициента корреляции ryx4 /x1 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим Как видим, связь y и x4 при условии, что x1 войдет в модель, стала сильнее. Теснота связи сильная Определим значимость коэффициента корреляции ryx4 /x2 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим Как видим, связь y и x4 при условии, что x2 войдет в модель, стала сильнее. Теснота связи сильная Определим значимость коэффициента корреляции ryx4 /x5 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим Как видим, связь y и x4 при условии, что x5 войдет в модель, стала сильнее. Теснота связи низкая. Межфакторная связь слабая. Определим значимость коэффициента корреляции ryx5 /x1 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим Как видим, связь y и x5 при условии, что x1 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x5 остается нецелесообразным. Теснота связи низкая. Межфакторная связь слабая. Определим значимость коэффициента корреляции ryx5 /x2 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим Как видим, связь y и x5 при условии, что x2 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x5 остается нецелесообразным. Теснота связи низкая. Межфакторная связь слабая. Определим значимость коэффициента корреляции ryx5 /x1 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим Как видим, связь y и x5 при условии, что x1 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x5 остается нецелесообразным. Теснота связи низкая. Межфакторная связь слабая. Определим значимость коэффициента корреляции ryx5 /x2 . Для этого рассчитаем наблюдаемые значения t-статистики по формуле: Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим Как видим, связь y и x5 при условии, что x2 войдет в модель, снизилась. Отсюда можно сделать вывод, что ввод в регрессионное уравнение x5 остается нецелесообразным. Можно сделать вывод, что при построении регрессионного уравнения следует отобрать факторы x1 , x2 , x5 . Модель регрессии в стандартном масштабе. Модель регрессии в стандартном масштабе предполагает, что все значения исследуемых признаков переводятся в стандарты (стандартизованные значения) по формулам: где хji - значение переменной хji в i-ом наблюдении. Таким образом, начало отсчета каждой стандартизованной переменной совмещается с ее средним значением, а в качестве единицы изменения принимается ее среднее квадратическое отклонение S. Если связь между переменными в естественном масштабе линейная, то изменение начала отсчета и единицы измерения этого свойства не нарушат, так что и стандартизованные переменные будут связаны линейным соотношением: ty = ∑βjtxj Для оценки β-коэффициентов применим МНК. При этом система нормальных уравнений будет иметь вид: rx1y1+rx1x2•β2 + ... + rx1xm•βm rx2y=rx2x1•β1 + β2 + ... + rx2xm•βm ... rxmy=rxmx1•β1 + rxmx2•β2 + ... + βm Для наших данных (берем из матрицы парных коэффициентов корреляции): 0.678 = β1 + 0.106β2 + 0.174β3 -0.051β4 + 0.96β5 0.646 = 0.106β1 + β2 -0.00335β3 + 0.204β4 + 0.273β5 0.233 = 0.174β1 -0.00335β2 + β3 + 0.698β4 + 0.235β5 0.226 = -0.051β1 + 0.204β2 + 0.698β3 + β4 + 0.0308β5 0.816 = 0.96β1 + 0.273β2 + 0.235β3 + 0.0308β4 + β5 Данную систему линейных уравнений решаем методом Гаусса: β1 = -0.621; β2 = 0.319; β3 = -0.0675; β4 = 0.136; β5 = 1.337;  Стандартизированная форма уравнения регрессии имеет вид: y0 = -0.621x1 + 0.319x2 -0.0675x3 + 0.136x4 + 1.337x5  Найденные из данной системы β–коэффициенты позволяют определить значения коэффициентов в регрессии в естественном масштабе по формулам: 3. Анализ параметров уравнения регрессии. Перейдем к статистическому анализу полученного уравнения регрессии: проверке значимости уравнения и его коэффициентов, исследованию абсолютных и относительных ошибок аппроксимации Для несмещенной оценки дисперсии проделаем следующие вычисления: Несмещенная ошибка ε = Y - Y(x) = Y - X*s (абсолютная ошибка аппроксимации)

Соседние файлы в предмете Эконометрика