
Эконометрика / glava6_standartiz1
.docТема 6. Уравнение множественной регрессии в стандартизованном масштабе. Оценка коэффициентов i
6.1. Построение факторов в преобразованном масштабе. Оценка коэффициентов i.
6.2. Экономический смысл оценённых коэффициентов. Проверка вычислений с помощью перехода от уравнения множественной регрессии в натуральном масштабе к уравнению в стандартизованном масштабе и обратно.
6.3. Задание к лабораторной работе № 5 «Уравнение множественной линейной регрессии в стандартизованном масштабе».
6.1. Построение факторов в преобразованном масштабе. Оценка коэффициентов i
Другой подход к определению параметров множественной регрессии состоит в том, что на основе матрицы парных корреляций строится уравнение регрессии в стандартизованном масштабе:
, (6.1)
удовлетворяющее соотношению
, (6.2)
где
– стандартизованные переменные, среднее
значение которых равно нулю, а
среднеквадратическое отклонение равно
1, т.е.
ty
= txi
= 1, i
– неизвестные стандартизованные
коэффициенты регрессии.
Согласно методу наименьших квадратов рассматриваем задачу определения значений коэффициентов из решения задачи
.(6.3)
Применяя МНК, из необходимого условия минимума функции многих переменных (6.3) (равенства нулю вектора частных производных в точке минимума), после соответствующих преобразований получим систему нормальных уравнений
(6.4)
Решая её любым методом (Крамера или методом исключений Гаусса или с помощью вычисления обратной матрицы), найдём коэффициенты i.
6.2. Экономический смысл оценённых коэффициентов. Проверка вычислений с помощью перехода от уравнения множественной регрессии в натуральном масштабе к уравнению в стандартизованном масштабе и обратно
Смысл перехода и рассмотрения этих коэффициентов состоит в следующем. Эти стандартизованные коэффициенты регрессии показывают, на сколько (сигм) изменится в среднем результативный фактор, если соответствующий фактор xi изменится на одну (сигму) при неизменном среднем уровне других факторов. В силу того, что все переменные заданы как центрированные и нормированные, стандартизованные коэффициенты регрессии сравнимы между собой.
Пример 1. Пусть издержки производства у (тыс. руб.) характеризуются уравнением вида
Y = 200 + 1,2x1 +1,1x2+ ,
где х1 – основные производственные фонды (тыс. руб.); х2 – численность занятых в производстве (чел.).
Из уравнения видно, что при той же занятости дополнительный рост стоимости основных производственных фондов на одну тысячу руб. влечёт за собой увеличение затрат в среднем на 1200 руб., а увеличение численности занятых на одного человека способствует при той же технической оснащённости предприятия росту затрат в среднем на 1100 руб. Однако это не означает, что фактор х1 оказывает более сильное на издержки производства по сравнению с фактором х2. Такое сравнение возможно, если обратиться к уравнению регрессии в стандартизованном масштабе. Предположим, оно выглядит следующим образом
ty = 0,5tx1 + 0,8tx2 .
Это означает, что с ростом фактора х1 на одну сигму при неизменной численности занятых затраты на продукцию увеличиваются в среднем на 0,5 сигмы. Так как 1 < 2 (0,5 < 0,8), то можно предположить, что большее влияние на затраты производства оказывает фактор х2, а не х1, как кажется из уравнения регрессии в натуральном масштабе.
В парной зависимости стандартизованный коэффициент регрессии есть не что иное, как линейный коэффициент корреляции rxy. Так же как и в парной зависимости, коэффициенты регрессии и корреляции связаны между собой (rxy = b∙x/y), так и во множественной регрессии коэффициенты «чистой» регрессии bi связаны со стандартизованными коэффициентами i, а именно
.
(6.5)
Это позволяет от уравнения регрессии в стандартизованном масштабе
переходить к уравнению регрессии в натуральном масштабе переменных
.
Значение коэффициента а определяется как
.
(6.6)
Рассмотренный смысл стандартизованных коэффициентов регрессии j позволяет их использовать при отсеве факторов – из модели исключаются факторы с наименьшим по модулю значением j.
С некоторой степенью приближения можно вместо j использовать относительные коэффициенты регрессии
.
6.3. Задание к лабораторной работе № 5 «Уравнение множественной линейной регрессии в стандартизованном масштабе»
Имеются статистические данные о динамике ВВП США (переменная Y) и валовых внутренних инвестиций в экономику США (X), в млрд долл.
Требуется определить величину запаздывания (в годах), которое наиболее сильно влияет на ВВП.
Год |
Yt, ВВП США в млрд долл. |
Xt, валовые внутренние инвестиции в экономику США (X), млрд. долл. |
Xt-1 |
Xt-2 |
Xt-3 |
Xt-4 |
1959 |
1931,3 |
296,4 |
|
|
|
|
1960 |
1973,2 |
290,8 |
296,4 |
|
|
|
1961 |
2025,6 |
289,4 |
290,8 |
296,4 |
|
|
1962 |
2129,8 |
321,2 |
289,4 |
290,8 |
296,4 |
|
1963 |
2218 |
343,3 |
321,2 |
289,4 |
290,8 |
296,4 |
1964 |
2343,3 |
371,8 |
343,3 |
321,2 |
289,4 |
290,8 |
1965 |
2473,5 |
413 |
371,8 |
343,3 |
321,2 |
289,4 |
1966 |
2622,3 |
438 |
413 |
371,8 |
343,3 |
321,2 |
1967 |
2690,3 |
418,6 |
438 |
413 |
371,8 |
343,3 |
1968 |
2801 |
440,1 |
418,6 |
438 |
413 |
371,8 |
1969 |
2877,1 |
461,3 |
440,1 |
418,6 |
438 |
413 |
1970 |
2875,8 |
429,7 |
461,3 |
440,1 |
418,6 |
438 |
1971 |
2965,1 |
481,5 |
429,7 |
461,3 |
440,1 |
418,6 |
1972 |
3107,1 |
532,2 |
481,5 |
429,7 |
461,3 |
440,1 |
1973 |
3268,5 |
591,7 |
532,2 |
481,5 |
429,7 |
461,3 |
1974 |
3248,1 |
543 |
591,7 |
532,2 |
481,5 |
429,7 |
1975 |
3221,7 |
437,6 |
543 |
591,7 |
532,2 |
481,5 |
1976 |
3380,8 |
520,6 |
437,6 |
543 |
591,7 |
532,2 |
1977 |
3533,2 |
600,4 |
520,6 |
437,6 |
543 |
591,7 |
1978 |
3703,5 |
664,6 |
600,4 |
520,6 |
437,6 |
543 |
1979 |
3796,8 |
669,7 |
664,6 |
600,4 |
520,6 |
437,6 |
1980 |
3776,3 |
594,4 |
669,7 |
664,6 |
600,4 |
520,6 |
1981 |
3843,1 |
631,1 |
594,4 |
669,7 |
664,6 |
600,4 |
1982 |
3760,3 |
540,5 |
631,1 |
594,4 |
669,7 |
664,6 |
1983 |
3906,6 |
599,5 |
540,5 |
631,1 |
594,4 |
669,7 |
1984 |
4148,5 |
757,5 |
599,5 |
540,5 |
631,1 |
594,4 |
1985 |
4279,8 |
745,9 |
757,5 |
599,5 |
540,5 |
631,1 |
1986 |
4404,5 |
735,1 |
745,9 |
757,5 |
599,5 |
540,5 |
1987 |
4540 |
749,3 |
735,1 |
745,9 |
757,5 |
599,5 |
1988 |
4781,6 |
773,4 |
749,3 |
735,1 |
745,9 |
757,5 |
1989 |
4836,9 |
789,2 |
773,4 |
749,3 |
735,1 |
745,9 |
1990 |
4884,9 |
744,5 |
789,2 |
773,4 |
749,3 |
735,1 |
1991 |
4848,4 |
672,6 |
744,5 |
789,2 |
773,4 |
749,3 |
Средние |
3556,448 |
575,520 |
563,4 |
547,7 |
530,5 |
514,1 |
Ср.кв.о. |
906,7583 |
156,519 |
157,2 |
155,1 |
150,1 |
144,9 |
Задание к лабораторной работе № 5 «Уравнение множественной линейной регрессии в стандартизованном масштабе»
Шаг 1. В качестве Y возьмите ВВП США в млрд долл., в качестве X – массив из пяти векторов Xt, Xt-1, Xt-2, Xt-3, Xt-4. Постройте новые столбцы соответствующих стандартизованных переменных ty, txt, txt-1, txt-2, txt-3, txt-4.
Шаг 2. Постройте модель линейной регрессии вторым способом с помощью Сервис, Анализ данных, Регрессия. В качестве Y возьмите ty, в качестве X – массив из пяти векторов txt, txt-1, txt-2, txt-3, txt-4. Поскольку в последнем векторе нет первых четырёх данных, все эти массивы нужно взять, начиная с пятой строки.
Шаг 3. По величине максимального по модулю коэффициента βi определить величину запаздывания (в годах), которое наиболее сильно влияет на ВВП. Усреднением этих коэффициентов определите среднюю величину запаздывания.