ННГУ им. Лобачевского
Отчет по лабораторной работе №3
по предмету эконометрика
«Множественный регрессионный анализ».
Работу выполнила
Группа 725-1
Губанова Юлия
2012г
Постановка задачи:
Вариант 8
По 20 предприятиям
региона изучается зависимость выработки
продукции на одного работника
(тыс. руб.) от ввода в действие новых
основных фондов
(% от стоимости фондов на конец года) и
от удельного веса рабочих высокой
квалификации в общей численности
рабочих
(%) (смотри таблицу своего варианта).
|
Номер предприятия |
|
|
|
Номер предприятия |
|
|
|
|
1 |
7 |
3,8 |
9 |
11 |
11 |
7,1 |
22 |
|
2 |
7 |
4,1 |
14 |
12 |
11 |
7,5 |
23 |
|
3 |
7 |
4,3 |
16 |
13 |
12 |
7,8 |
25 |
|
4 |
7 |
4,1 |
17 |
14 |
12 |
7,6 |
27 |
|
5 |
8 |
4,6 |
17 |
15 |
12 |
7,9 |
29 |
|
6 |
8 |
4,7 |
18 |
16 |
13 |
8,1 |
30 |
|
7 |
9 |
5,3 |
20 |
17 |
13 |
8,5 |
32 |
|
8 |
9 |
5,5 |
20 |
18 |
14 |
8,7 |
32 |
|
9 |
11 |
6,9 |
21 |
19 |
14 |
9,6 |
33 |
|
10 |
10 |
6,8 |
21 |
20 |
15 |
9,8 |
36 |
Требуется:
-
Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.
-
Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их. Проверить наличие мультиколлинеарности.
-
Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.
-
С помощью
-критерия
Фишера оценить статистическую надежность
уравнения регрессии и коэффициента
детерминации
. -
С помощью t-критерия Стьюдента оценить статистическую значимость коэффициентов регрессии.
-
Доверительные интервалы для статистически значимых коэффициентов регрессии.
-
Доверительные интервалы для функции регрессии.
-
Доверительные интервалы для индивидуальных значений зависимой переменной.
-
С помощью частных
-критериев
Фишера оценить целесообразность
включения в уравнение множественной
регрессии фактора
после
и фактора
после
. -
Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор.
Описание выполнения работы.
-
Линейная модель множественной регрессии.
–
фактическая
зависимость выработки продукции на
одного работника
(тыс. руб.) от ввода в действие новых
основных фондов
(% от стоимости фондов на конец года) и
от удельного веса рабочих высокой
квалификации в общей численности
рабочих
(%)
–
теоретическая
зависимость выработки продукции на
одного работника
(тыс. руб.) от ввода в действие новых
основных фондов
(% от стоимости фондов на конец года) и
от удельного веса рабочих высокой
квалификации в общей численности
рабочих
(%)
Остаточная сумма:

|
|
(y-yt)^2 |
|
сумма |
0,111161 |
Матричный вид:
–вектор
выработки продукции на одного работника
(тыс. руб.)
X
=
-
матрица новых основных фондов
(% от стоимости фондов на конец года) и
удельного веса рабочих высокой
квалификации в общей численности рабочих
(%)
–
вектор параметров
модели


Оценка параметров классической регрессионной модели методом наименьших квадратов.
B =

=

|
|
20 |
132,7 |
462 |
|
Xт*Х= |
132,7 |
951,41 |
3317,6 |
|
|
462 |
3317,6 |
11658 |

|
|
210 |
|
Хт*Y= |
1488,8 |
|
|
5196 |
|
|
0,673209 |
-0,11305 |
0,005493 |
|
(Xт*Х) в -1 степени= |
-0,11305 |
0,156028 |
-0,03992 |
|
|
0,005493 |
-0,03992 |
0,011229 |
|
|
1,604313 |
b0 |
|
((Xт*Х) в -1 степени )*Хт*Y= |
1,11984 |
b1 |
|
|
0,063444 |
b2 |

-
Множественный коэффициент детерминации
, где


|
R^2= |
0,983029 |
0,983029 |
Коэффициент
детерминации свидетельствует о том,
что вариация выработки продукции на
одного работника
(тыс. руб.) на 98,3 % объясняется изменчивостью
включенных в модель новых основных
фондов
(% от стоимости фондов на конец года) и
удельного веса рабочих высокой
квалификации в общей численности
рабочих
(%)
-
Скорректированный коэффициент детерминации

, где

|
Rск^2= |
0,981032 |
Чем больше число
объясняющих переменных m,
тем меньше
по сравнению с

-
Критерий Фишера
Используется для оценки значимости уравнения регрессии в целом.


|
F |
492,3517 |
|
Fтабл |
3,554557 |
модель
надежна, т. е. выработка продукции на
одного работника
(тыс. руб.) достаточно хорошо описывается
включенными в модель новыми основными
фондами
(% от стоимости фондов на конец года) и
удельным весом рабочих высокой
квалификации в общей численности
рабочих
(%)
-
Критерий Стьюдента
Используется для оценки значимости коэффициентов регрессии.
Стандартные ошибки вычислений параметров модели:

Статистика:

|
mb1 |
0,142846 |
|
t1 |
7,839505 |
|
tтабл |
2,109816 |
|
mb2 |
0,038321 |
|
t2 |
1,655593 |
|
|
|
t1 >
tтабл, следовательно новые
основные фонды
(% от стоимости фондов на конец года)
значимы в данной регрессионной модели.
t2 <
tтабл, следовательно удельный
вес рабочих высокой квалификации в
общей численности рабочих
(%) не значим в данной регрессионной
модели.
-
Доверительные интервалы для статистически значимых коэффициентов регрессии.

|
дов.инт. для х1 |
0,818462 |
1,421218 |
-
Коэффициент эластичности.
Частный
коэффициент эластичности показывает
на сколько процентов в среднем изменяется
выработка
продукции на одного работника
(тыс. руб.) с увеличением какого - либо
фактора на 1% от своего среднего уровня
при фиксированном значении остальных
факторов модели.

|
Э1 |
0,707632 |
|
Э2 |
0,139576 |
следовательно
удельный
вес рабочих высокой квалификации в
общей численности рабочих
(%) влияет на выработку продукции на
одного работника
(тыс. руб.) меньше, чем новые основные
фонды
(% от стоимости фондов на конец года) в
данной регрессионной модели.
Выработка продукции
на одного работника
(тыс. руб.) увеличится на 0,707632%
при
увеличении новых основных фондов
(% от стоимости фондов на конец года) на
1% от своего среднего уровня при
фиксированном значении удельного веса
рабочих высокой квалификации в общей
численности рабочих
(%).
Выработка продукции
на одного работника
(тыс. руб.) увеличится на
0,139576%
при
увеличении удельного веса рабочих
высокой квалификации в общей численности
рабочих
(%)на 1% от своего среднего уровня при
фиксированном значении новых основных
фондов
(% от стоимости фондов на конец года).
-
Стандартизованные β – коэффициенты.
Показывают на
какую часть своего среднего квадратического
отклонения
изменится выработка продукции на одного
работника
(тыс. руб.) с увеличением соответствующего
фактора на величину своего среднего
квадратического отклонения
при неизменном влиянии прочих факторов
модели. Используются для ранжирования
факторов по силе влияния на результат.



|
сигма у |
2,559297 |
|
сигма х1 |
1,883421 |
|
сигма х2 |
7,020684 |
|
|
|
|
бэтта1 |
0,824105 |
|
бэтта2 |
0,174039 |
следовательно
удельный
вес рабочих высокой квалификации в
общей численности рабочих
(%) влияет на выработку продукции на
одного работника
(тыс. руб.) меньше, чем новые основные
фонды
(% от стоимости фондов на конец года) в
данной регрессионной модели.
показывает
на какую часть своего среднего
квадратического отклонения
изменится выработка продукции на одного
работника
(тыс. руб.) с увеличением новых основных
фондов
(% от стоимости фондов на конец года) на
величину своего среднего квадратического
отклонения
при неизменном влиянии удельного веса
рабочих высокой квалификации в общей
численности рабочих
(%).
0,174039
показывает
на какую часть своего среднего
квадратического отклонения
изменится выработка продукции на одного
работника
(тыс. руб.) с увеличением удельного веса
рабочих высокой квалификации в общей
численности рабочих
(%)на величину своего среднего
квадратического отклонения
7,020684
при
неизменном влиянии новых основных
фондов
(% от стоимости фондов на конец года).
-
Уравнение регрессии в стандартизованном масштабе переменных

0,174039
В
данном уравнении коэффициенты
показывают
силу влияния j-того
фактора на выработку
продукции на одного работника
(тыс. руб.)
-
Матрица коэффициентов в парной корреляции.

|
|
у |
х1 |
х2 |
|
у |
1 |
0,990097 |
0,960039 |
|
х1 |
0,990097 |
1 |
0,953762 |
|
х2 |
0,960039 |
0,953762 |
1 |
-
Косвенное влияние
Во
множественной регрессии фактор
оказывает не только прямое, но и косвенное
влияние, то есть влияет на результат
через другие фаторы.
Косвенное
влияние определяется по формуле:
без учета j-того
-коэффициента.
|
х1 косв.вл. |
0,165992 |
|
х2 косв.вл. |
0,786 |
-
∆ - коэффициенты
Характеризуют
вклад каждого фактора в суммарное
влияние на выработку
продукции на одного работника
(тыс. руб.)
при условии независимости новых
основных фондов
(% от стоимости фондов на конец года) и
удельного веса рабочих высокой
квалификации в общей численности
рабочих
(%).

|
дельта1 |
0,830031 |
|
дельта2 |
0,169969 |
|
сумма |
1 |
-
Коэффициент детерминации для множественной регрессии
, где

– определитель матрицы парных коэффициентов корреляции;

– определитель матрицы межфакторной корреляции.
|
определитель r |
0,001533 |
|
определитель r11 |
0,090339 |
|
|
|
|
R x1x2..xm |
0,991478 |
-
Уравнение регрессии в стандартизованном масштабе.
При построении уравнении множественной регрессии в стандартном масштабе все значения исследуемых признаков переводятся в стандарты по формулам:
(
)

Где
значение
переменной
в i-ом
наблюдении,
,
,
….,
-
стандартизованные переменные, для
которых среднее значение равно нулю
,
.
Среднее квадратическое отклонение
равно единице

Таким образом, начало отсчета каждой стандартизованной переменной совмещается с ее средним значением, а в качестве единицы измерения принимается ее среднее квадратическое отклонение.
Если связь между
переменными в естественном (натуральном)
масштабе линейная, то изменение начала
отсчета и единицы измерения этого
свойства не нарушат, так что и
стандартизованные переменные будут
связаны линейным соотношением:

-
коэффициенты могут быть оценены с
помощью МНК. Применяя МНК к уравнению
регрессии в стандартизованном масштабе,
после соответствующих преобразований
получим систему нормальных уравнений:

|
|
0,990097 |
0,953762 |
|
|
|
|
|
|
опр бэтта 1 |
0,960039 |
1 |
0,074448 |
|
бэтта1 |
0,824105132 |
|
|
|
|
|
|
|
|
|
|
|
|
1 |
0,990097 |
|
|
|
|
|
|
опр бэтта 2 |
0,953762 |
0,960039 |
0,015722 |
|
бэтта2 |
0,174039402 |
|
0,174039
-
Переход от стандартизованного масштаба к натуральному.
Предположим, что
мы не знаем уравнения регрессии в
натуральном масштабе и найдем его, зная
-
коэффициенты по формулам
и
,
где
;

|
b0 |
1,604313 |
|
b1 |
1,11984 |
|
b2 |
0,063444 |

-
Мультиколлинеарность
Мультиколлинеарность – это нестрогая линейная зависимость между факторными признаками (что противоречит 1-й предпосылке нормальной линейной множественной роегрессионной модели о независимости факторных признаков), которая может привести к следующим нежелательным последствиям.
-
Оценки параметров становятся ненадежными.
-
Затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом» виде, ибо факторы коррелированны; параметры линейной регрессии теряют экономический смысл.
На практике о наличии мультиколлинеарности судят по матрице парных линейных коэффициентов корреляции между факторами
Если бы факторы
не коррелировали между собой, то матрица
парных коэффициентов корреляции между
факторами была бы единичной матрицей,
поскольку все ее недиагональные элементы
были бы равны нулю. Так, для включающего
две объясняющие переменные уравнения
матрица коэффициентов корреляции между
факторами имела бы определитель, равный
единице
.
Если же наоборот, между факторами
существует полная линейная зависимость
и все коэффициенты корреляции равны
единице, то


Чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнеен мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. И, наоборот, чем ближе к единице определитель матрицы межфакторной корреляции, тем меньше мультиколлинеарность факторов.
-
=
0,960039
> 0,7 , следовательно факторы коррелируют,
=
0,990097
,
= 0,960039,
значит
больше связан с y,
следовательно исключаем
. -
=
0,174039
<
=
0,824105
, следовательно
исключаем
.
-
Э1= 0,707632 > Э2= 0,139576, следовательно исключаем
.






