
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ
ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«УДМУРТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
ИНСТИТУТ ЭКОНОМИКИ И УПРАВЛЕНИЯ
КАФЕДРА МАТЕМАТИЧЕСКИХ МЕТОДОВ В ЭКОНОМИКЕ
Лабораторная работа
на тему: «Множественная регрессия»
по дисциплине «Эконометрика»
Вариант 9
Выполнил студент гр. 061800-31 |
Нуриева Г. Р. |
Проверил Ассистент кафедры «Математических методов экономике» |
Неустроев Г.В. |
Ижевск, 2011 г.
Содержание
Постановка задачи 3
Решение задачи 4
Вывод 10
Приложение 1 12
Приложение 2 18
Постановка задачи
Изучается зависимость по 79 административно-территориальным единицам фактического конечного потребления домашних хозяйств yt от следующих параметров:
-
среднедушевых доходов населения,
-
ВРП на душу населения,
-
основных фондов организаций на душу населения,
-
средний размер банковского вклада физ. лиц,
-
сальдированный финансовый результат на душу населения,
-
инвестиции в основной капитал на душу населения,
-
индексы потребительских цен,
-
сальдо внешнеторгового баланса на душу населения.
Исходные данные представлены в приложении 1.
-
Вычислить описательные статистики.
-
Построить матрицу парных коэффициентов корреляций. Установить какие факторы коллинеарны.
-
Построить уравнение множественной регрессии в нормальном и стандартизованном масштабе, включив в модель все факторы.
-
Рассчитать средний коэффициент эластичности.
-
Определить частные и множественные коэффициенты корреляции.
-
Оценить статистическую значимость уравнения множественной регрессии с помощью критериев Стьюдента и Фишера. Определить какие факторы значимо воздействуют на формирование зависимого фактора в этом уравнении.
Решение задачи
-
Вычисление описательных характеристик.
Обозначим все переменные как y и x. Пусть
-
фактическое конечное потребление домашних хозяйств обозначается как yt,
-
среднедушевых доходов населения x1t,
-
ВРП на душу населения x2t,
-
основных фондов организаций на душу населения x3t,
-
средний размер банковского вклада физ. лиц x4t,
-
сальдированный финансовый результат на душу населения x5t,
-
инвестиции в основной капитал на душу населения x6t,
-
индексы потребительских цен x7t,
-
сальдо внешнеторгового баланса на душу населения x8t.
К ним относятся математическое ожидание и среднеквадратическое отклонение переменных. Найдем оценки математического ожидания, как:
В итоге получаем следующие результаты:
yt |
x1t |
x2t |
x3t |
x4t |
x5t |
x6t |
x7t |
x8t |
42107,11 |
4338,65 |
63450,82 |
212096,31 |
2434,97 |
5038,47 |
14974,22 |
112,71 |
351,27 |
Оценки дисперсий определяются по следующим формулам:
|
|
|
|
|
|
|
|
|
436695254,80 |
5709704,53 |
2385412200,80 |
16860444377,65 |
1022085,85 |
116356921,95 |
463280089,36 |
4,51 |
758405,26 |
Таким образом, оценка среднеквадратического отклонения равна:
|
|
|
|
|
|
|
|
|
20897,25 |
2389,50 |
48840,68 |
129847,77 |
1010,98 |
10786,89 |
21523,94 |
2,12 |
870,86 |
-
Построение матрицы парных коэффициентов корреляций.
Расчет матрицы парных корреляций произведем по формулам:
В результате получаем следующую матрицу парных коэффициентов корреляции, представленные в таблице ниже.
r |
yt |
x1t |
x2t |
x3t |
x4t |
x5t |
x6t |
x7t |
x8t |
yt |
1,0000 |
0,9726 |
0,8004 |
0,5186 |
0,9042 |
0,7340 |
0,5782 |
0,0754 |
0,3273 |
x1t |
0,9726 |
1,0000 |
0,8806 |
0,6128 |
0,8825 |
0,7356 |
0,6924 |
0,0979 |
0,3951 |
x2t |
0,8004 |
0,8806 |
1,0000 |
0,8472 |
0,7392 |
0,7808 |
0,8423 |
0,0952 |
0,6711 |
x3t |
0,5186 |
0,6128 |
0,8472 |
1,0000 |
0,5057 |
0,5707 |
0,6154 |
0,0646 |
0,8128 |
x4t |
0,9042 |
0,8825 |
0,7392 |
0,5057 |
1,0000 |
0,7320 |
0,4955 |
0,1393 |
0,2981 |
x5t |
0,7340 |
0,7356 |
0,7808 |
0,5707 |
0,7320 |
1,0000 |
0,5273 |
0,0190 |
0,5884 |
x6t |
0,5782 |
0,6924 |
0,8423 |
0,6154 |
0,4955 |
0,5273 |
1,0000 |
0,1670 |
0,4306 |
x7t |
0,0754 |
0,0979 |
0,0952 |
0,0646 |
0,1393 |
0,0190 |
0,1670 |
1,0000 |
-0,0895 |
x8t |
0,3273 |
0,3951 |
0,6711 |
0,8128 |
0,2981 |
0,5884 |
0,4306 |
-0,0895 |
1,0000 |
Можно сделать вывод о том, что между экзогенными переменными x1, x2, x3, x4 существует корреляционная связь, что может привести к появлению мультиколлинеарности, что может сказаться на качестве модели прогнозов, сделанных по полученной модели.
-
Построение уравнения множественной регрессии в нормальном и стандартизованном масштабе.
Рассчитаем
параметры эконометрической модели
множественной регрессии в стандартизованном
масштабе:
где
—
стандартизованные переменные:
для которых среднее значение равно
нулю, а среднее квадратическое отклонение
равно единице;
— стандартизованные коэффициенты
регрессии. Стандартизованные значения
приведены в приложении 2.
Оценки стандартизованных коэффициентов будут равны:
|
|
|
|
|
|
|
|
1,0220 |
-0,1142 |
-0,0654 |
0,1167 |
0,0572 |
-0,0889 |
-0,0100 |
0,0223 |
Оставим
наиболее значимые оценки, то есть
,
и
.
Можно сделать вывод о том, что среднедушевые
доходы населения, ВРП на душу населения
и средний размер банковского вклада
физ. лиц имеют более значимую связь для
фактического
конечного потребления домашних хозяйств.
Так как стандартизованные коэффициенты
регрессии можно сравнивать между собой,
то можно сказать о том, что среднедушевые
доходы населения влияют гораздо больше,
чем другие факторы.
Таким образом, после преобразования получаем уравнение:
С учетом выброса пересчитаем оценки стандартизованных коэффициентов. Они будут равны соответственно 1,0184; -0,2214 и 0,1690.
Зная стандартизованные коэффициенты, находим уравнение регрессии в нормальном масштабе. Оценки коэффициентов в нормальном и стандартизованном масштабах связаны между собой следующими соотношениями:
.
Тогда,
.
Свободный член
определяется по формуле
.
То есть
.
Следовательно,
.
-
Расчет среднего коэффициента эластичности.
Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности:
.
Вычисляя,
получаем
То есть увеличение только среднедушевых доходов населения (от своего среднего значения) или только среднего размера банковского вклада физ. лиц на 1% увеличивает в среднем фактическое конечное потребление домашних хозяйств на 0,9177% и 0,0855% соответственно. Однако, увеличение ВРП на душу населения на 1% снижает в среднем фактическое конечное потребление домашних хозяйств на 2,9174%.
-
Определение частных и множественных коэффициентов корреляции.
Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии.
Показатели частной корреляции представляют собой отношение сокращения остаточной дисперсии за счет дополнительного включения в анализ нового фактора к остаточной дисперсии, имевшей место до введения его в модель.
Найдем частные коэффициенты корреляции по формулам:
Получаем:
|
|
|
|
|
|
|
|
|
0,2117 |
0,1923 |
0,2082 |
-0,1145 |
0,0927 |
0,3511 |
0,2635 |
0,0057 |
0,0111 |
Для последующих расчетов необходимо найти и другие частные коэффициенты корреляции. Их можно найти через матрицу парных коэффициентов корреляции по следующей формуле:
,
Где
—
определитель матрицы парный коэффициентов корреляции;
—
определитель матрицы межфакторной
корреляции (по i-ой
строчке и i‑ому
столбцу).
Таким образом, получаем
|
|
|
|
|
|
0,9046 |
0,8182 |
0,9134 |
0,8343 |
0,9875 |
0,9751 |
Теперь
рассчитаем совокупный коэффициент
корреляции
.
Для этого воспользуемся формулой:
.
Он равен 0,983.
Из полученных результатов можно сделать вывод, что коэффициент множественной корреляции свидетельствует о тесной зависимости переменной yt от x1t , x2t и x4t, так как она равна 98,3%. Соответственно прочие факторы составляют 1,7% от общей вариации yt.
-
Оценка статистической значимости уравнения множественной регрессии с помощью критериев Стьюдента и Фишера.
Значимость уравнения множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью F-критерия Фишера:
где R2 —
совокупный коэффициент корреляции, Т
— число наблюдений, n
— количество параметров в модели. Для
нашей модели получаем:
,
поэтому можно сделать вывод о том, что
с вероятностью 0,95 уравнение, сформированное
под неслучайным воздействием факторов
x1t
, x2t
и x4t,
признается статистически значимым в
целом. Частный F-критерий
оценивает значимость коэффициентов
чистой регрессии.
Таким
образом, для представленной модели
коэффициенты будут равны
и
.
,
следовательно, сравнивая полученные
значения, приходим к выводу о
целесообразности включения в модель
факторов x2t
и x4t
и нецелесообразности включения фактора
x1t.
Зная
величины
можно определить t-критерий
для коэффициентов регрессии при i-ом
факторе по формуле:
.
В результате получаем
.
Оценки
являются статистически значимыми, так
как (
:
t(0,05;75) = 1,9921).
Оценка же
не является статистически значимой.
Вывод
В данной работе была определена регрессия по 79 административно-территориальным единицам фактического конечного потребления домашних хозяйств на следующие параметры:
-
среднедушевые доходы населения,
-
ВРП на душу населения,
-
основные фонды организаций на душу населения,
-
средний размер банковского вклада физ. лиц,
-
сальдированный финансовый результат на душу населения,
-
инвестиции в основной капитал на душу населения,
-
индексы потребительских цен,
-
сальдо внешнеторгового баланса на душу населения.
При построении матрицы парных коэффициентов корреляции было выявлено наличие тесной связи между некоторыми экзогенными переменными, что свидетельствует о мультиколлинеарности.
При расчете модели множественной регрессии в стандартизованном масштабе были отклонены 5 параметров:
-
основные фонды организаций на душу населения,
-
сальдированный финансовый результат на душу населения,
-
инвестиции в основной капитал на душу населения,
-
индексы потребительских цен,
-
сальдо внешнеторгового баланса на душу населения.
Так как оценки стандартизованных коэффициентов были достаточны малы.
Совокупный коэффициент множественной корреляции свидетельствует о тесной зависимости переменной yt от x1t , x2t и x4t, так как она равна 98,3%. Соответственно прочие факторы составляют 1,7% от общей вариации yt.
-
При нахождении F-критерия Фишера оказалось, что построенную модель можно считать статистически значимой в целом, но частный F-критерий показал нецелесообразность включения в модель фактора среднедушевых доходов населения. Факторы: ВРП на душу населения, средний размер банковского вклада физ. лиц, наоборот, показали целесообразность включения в модель и с помощью t-критерия подтвердили свою статистическую значимость.