(множественная регрессия)
.docЗадача№2
yt – нарастающая по кварталам прибыль коммерческого банка (КБ);
x1t – процентная ставка КБ по кредитованию юридических лиц;
x2t – процентная ставка КБ по депозитным вкладам.
№ |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
yt |
15 |
20 |
22 |
14 |
25 |
28 |
25 |
28 |
30 |
31 |
x1t |
32 |
34 |
41 |
38 |
42 |
48 |
50 |
52 |
54 |
51 |
x2t |
32 |
28 |
26 |
24 |
25 |
23 |
19 |
27 |
22 |
20 |
Предположим, что форма связи между результативным и факторными признаками линейная.
Определим множественную линейную модель ŷ = a + b1 x1+ b2 x2. Находим коэффициенты a и b, которые получаются в результате решения системы нормальных уравнений, полученной на основе МНК.
ΣY – an – b1 ΣX1 b2 ΣX2 =0;
ΣYX1 – aΣX1 – b1 ΣX12 – b2 Σ X1X2 =0;
ΣYX2 – aΣX2 – b1 Σ X1X2 – b2 ΣX22=0;
10a + 442b1 + 246b2 = 238;
442a + 20094b1 + 10670b2 = 10895;
246a + 10670b1 + 6188b2 = 5728;
a = - 12,48802292 ≈ - 12,488
b1 = 0,731706475 ≈ 0,7317
b2 = 0,160430761 ≈ 0,16
Таким образом, ŷ = - 12,488 + 0,7317x1 + 0,16x2.
Экономическая интерпретация: Коэффициент регрессии при каждой переменной x дает оценку ее влияния на величину y в случаи неизменности влияния на нее всех остальных переменных.
b1: С увеличением средней процентной ставки КБ по кредитованию юридических лиц на 1 % прибыль КБ в среднем увеличится на 0,7317 млн руб. Из каждого дополнительного процента в ставке процента по кредитованию юридических лиц КБ получает 0,7317 млн руб. прибыли. Так как коэффициент b1 положительный, связь между x1 и y прямая.
b2: С увеличением средней процентной ставки КБ по депозитным вкладам на 1 % прибыль КБ в среднем увеличится на 0,16 млн руб. Из каждого дополнительного процента в ставке процента по депозитным вкладам КБ получает прибыль в 0,16 млн руб. Так как коэффициент b2 положительный, связь между x2 и y прямая.
Коэффициент а не следует интерпретировать, поскольку x = 0 далеко от выборочных значений. Буквальная интерпретация может привести к неверным результатам. (Коэффициент а говорит о том, что без увеличения обеих процентных ставок прибыль КБ уменьшится на 12,488 млн руб).
В виду того, что существует различие единиц измерения результативного признака и факторных признаков, для непосредственной оценки влияния x1 и x2 на y вычисляются коэффициенты эластичности и β-коэффициенты.
kэл1 = 1,358883454 ≈ 1,359
При увеличении процентной ставки КБ по кредитованию юридических лиц на 1 % от ее среднего уровня прибыль КБ в среднем увеличится на 1,359%.
kэл2 = 0,165823391 ≈ 0,166
При увеличении процентной ставки КБ по депозитным вкладам на 1 % от ее среднего уровня прибыль КБ в среднем увеличится на 0,166%.
β1 = 0,966484505 ≈ 0,966
Увеличение процентной ставки КБ по кредитованию юридических лиц на величину среднеквадратичного отклонения этого показателя (44,2) приведет к увеличению прибыли КБ на 0,966 среднеквадратичного отклонения y (23,8).
β2 = 0,104807278 ≈ 0,105
Увеличение процентной ставки КБ по депозитным вкладам на величину среднеквадратичного отклонения этого показателя (24,6) приведет к увеличению прибыли КБ на 0,105 среднеквадратичного отклонения y (23,8).
Средняя ошибка аппроксимации – среднее отклонение расчетных значений от фактических: Ā = 10,47%. Ошибка находится в пределах нормы.
Анализ показателей тесноты связи в уравнении множественной регрессии проводят, используя корреляционный анализ.
Найдем парные коэффициенты корреляции:
ryx1 = 0,889261521 ≈ 0,8893
По абсолютной величине ryx1 > 0,7 – значит, связь между x1 и y является тесной.
ryx2 = - 0,607307554 ≈ - 0,6073
По абсолютной величине ryx2 < 0,7, но ryx2 > 0,4 – значит, связь, существующая между x2 и y является не очень сильной, но достаточно тесной.
rx1x2 = - 0,736809363 ≈ - 0,7368
По абсолютной величине rx1x2 > 0,7 – значит, связь между факторными признаками тесная.
Найдем частные коэффициенты корреляции. Они показывают тесноту связи между результативным и одним из факторных признаков при неизменных значениях других факторных признаков, а также тесноту связи факторов при неизменных значениях результата.
ryx1/x2 = 0,8224896 ≈ 0,822 – связь между y и x1 при неизменном x2 прямая, т.к. ryx1/x2 > 0 и тесная, т.к. ryx1/x2 > 0,7;
ryx2/x1 = 0,15491998 ≈ 0,155 – связь между y и x2 при неизменном x2 прямая, т.к. ryx2/x1 > 0 и слабая, т.к. ryx2/x1<0,4;
rx1x2/y = - 0,5414430 ≈ - 0,541 – связь между x1и x2 при неизменном y обратная, т.к. ryx1/x2 < 0 и не очень тесная, т.к. ryx1/x2 < 0,7. Поскольку существует неслабая связь между факторами, можно говорить о явлении мультиколлинеарности регрессии, т.е. факторы оказывают совместное влияние на y.
Коэффициент множественной корреляции рассматривает тесноту связи между y и всеми факторами:
Ryx1x2 = 0,892080282 ≈ 0,892
Таким образом, степень тесноты связи прибыли КБ с факторами процентной ставки по кредитованию юридических лиц и процентной ставки по депозитным вкладам является высокой.
Найдем совокупный коэффициент детерминации на основе коэффициента множественной корреляции:
R2 = 0,7958072 ≈ 0,796
Это означает, что совместное влияние процентной ставки по кредитованию юридических лиц и процентной ставки по депозитным вкладам объясняет почти 80% изменения среднеквартальной прибыли КБ. 20% вариации среднеквартальной прибыли КБ определяется вариацией факторов, неучтенных в модели.
Проверим статистическую значимость коэффициентов уравнения регрессии. Выдвигаем основную гипотезу и альтернативную:
H0: b1 = 0
H1: b1 ≠ 0
Найдем стандартную ошибку оценки b1: Sb1 = √D[b1]; Sb1 = 0,191
tфакт = 3,826; tтабл = 2,3646 (степеней свободы k = n-m-1 = 7; вероятность 95%)
tфакт > tтабл , принимаем гипотезу H1 , следовательно коэффициент b значимый.
Построим доверительный интервал: b1 - Sb1t < β1 < b1 + Sb1t
0,279472 < β1 < 1,183941
Данный доверительный интервал накрывает истинное значение параметра β1 с вероятностью 95%. Чем меньше доверительный интервал, тем точнее оценка. Имеем небольшой доверительный интервал, значит, полученная оценка достаточно точна.
H0: b2 = 0
H1: b2 ≠ 0
Найдем стандартную ошибку оценки b2: Sb2 = √D[b2]; Sb2 = 0,387
tфакт = 0,415; tтабл = 2,3646 (степеней свободы k = n-m-1 = 7; вероятность 95%)
tфакт < tтабл , принимаем гипотезу H0 , следовательно коэффициент b незначимый.
Построим доверительный интервал: b2 - Sb2t < β2 < b2 + Sb2t
- 0,7539307 < β2 < 1,074792
Данный доверительный интервал накрывает истинное значение параметра β2 с вероятностью 95%. Полученный доверительный интервал больше предыдущего, значит, полученная оценка менее точна.
H0: a = 0
H1: a ≠ 0
Найдем стандартную ошибку оценки a: Sa = √D[a]; Sa = 16,7741
tфакт = - 0,744; tтабл = 2,3646 (степеней свободы k = n-m-1 = 7; вероятность 95%)
tфакт < tтабл , принимаем гипотезу H0 , следовательно коэффициент a незначимый.
Построим доверительный интервал: a – Sat < α < a + a2t
- 52,152491 < α < 27,17644
Данный доверительный интервал накрывает истинное значение параметра α с вероятностью 95%. Полученный доверительный интервал очень большой, значит, полученная оценка неточная.
Проверим качество модели в целом с помощью F-критерия Фишера.
Выдвинем гипотезу H0 о том, что уравнение в целом статистически незначимо и конкурирующую гипотезу H1 :
H0: R2 = 0
H1: R2 ≠ 0
Fфакт = 13,64066556 ≈ 13,64
Fтабл = 4,46 (уровень значимости α = 5%, число степеней свободы k = 8)
Fфакт > Fтабл Значит, следует принять гипотезу H1 , т.е. уравнение в целом статистически значимо, y зависит от x1 и x2 неслучайно.
Проверим выполнимость предпосылки статистической независимости отклонений между собой, т.е. их некоррелированность. На практике используют критерий Дарбина-Уотсона.
DW = 2,2672; 1,5 < DW < 2,5 → отсутствует автокорреляция остатков, т.е. отклонения независимы между собой.
Это означает, что построенная линейная регрессия, скорее всего, отражает реальную зависимость и не осталось неучтенных существенных факторов, влияющих на зависимую переменную.
Остатки на графике расположены в виде горизонтальной полосы, значит, они независимы от факторного признака и оценка коэффициента b1 является несмещенной.
|
Почти все остатки на графике расположены в виде горизонтальной полосы, значит, они независимы от факторного признака и оценка коэффициента b2 является несмещенной.
|