![](/user_photo/76865_HWWN2.png)
- •Е.И. Ермолаева, е.И. Куимова Основы эконометрики: практикум
- •Предисловие
- •Лабораторная работа №1 Парная линейная регрессия
- •Лабораторная работа №2 Нелинейные модели парной регрессии
- •Лабораторная работа №3 Множественная регрессия
- •Лабораторная работа №4 Проверка адекватности модели регрессии по особенностям остаточных величин
- •Лабораторная работа №5 Анализ построенной модели регрессии на гетерокедастичность остатков
- •Лабораторная работа №6 Анализ динамики временных рядов
- •Лабораторная работа №7 Моделирование временных рядов с сезонными колебаниями
- •Лабораторная работа №8 Анализ взаимосвязи двух временных рядов
- •Уравнение линейной регрессии по уровням временных рядов
- •Уравнение регрессии по уровням временных рядов с включенным фактором времени
- •Уравнение регрессии по первым разностям
- •Лабораторная работа №9 Моделирование временных рядов с распределенным лагом
- •Лабораторная работа №10 Авторегрессионные модели временных рядов
- •Лабораторная работа №11 Модели систем одновременных уравнений и их составляющие
- •Проблема идентификации
- •Значения статистики Дарбина-Уотсона
- •Содержание
- •Библиографический список
Лабораторная работа №3 Множественная регрессия
Линейная
множественная регрессия:
Степенная функция:
Экспонента:
Гипербола:
Оценка параметров линейной множественной регрессии
1) в натуральном масштабе, т.е. для уравнения система нормальных уравнений имеет вид:
Ее решение может быть найдено, например, методом определителей.
Вычисление параметров линейной множественной регрессии можно провести с помощью инструмента Сервис/Анализ данных/Регрессия.
2) в стандартизированном масштабе:
,
где
–
стандартизированные переменные
;
,
– стандартизированные
коэффициенты регрессии. Решают систему
нормальных уравнений вида
Решая ее методом
определителей, найдем
-коэффициенты.
Определение -коэффициентов:
1) Находим матрицу парных коэффициентов корреляции. Для двухфакторной линейной регрессии она имеет вид:
|
y |
|
|
y |
1 |
|
|
|
|
1 |
|
|
|
|
1 |
Удобнее всего найти эту матрицу Excel, используя инструмент анализа данных Корреляция. Для этого в главном меню нужно последовательно выбрать Сервис/Анализ данных/Корреляция.
2) для стандартизированного уравнения регрессии
имеем
;
.
Коэффициенты «чистой» регрессии связаны с -коэффициентами следующим образом:
.
Методика построения
уравнения регрессии при двухфакторном
регрессионном анализе
приводит к следующим формулам для оценки параметров:
,
,
.
Методика построения
уравнения регрессии в виде степенной
функции
Преобразуем ее в линейный вид:
,
где переменные выражены в логарифмах. Далее процедура МНК такая же, что и описана выше: строится система нормальных уравнений и определяются параметры, которые затем следует потенцировать.
Оценка тесноты связи и статистической значимости во множественной регрессии
1) коэффициент множественной детерминации ,
;
2) индекс множественной корреляции R;
3)линейный коэффициент множественной корреляции (для )
;
4)в случае двухфакторной линейной модели индекс множественной корреляции R может быть найден по формуле:
.
5) Скорректированный индекс (коэффициент) корреляции:
;
k
– число
параметров при переменных.
В статистических пакетах прикладных программ в процедуре множественной регрессии обычно приводится скорректированный коэффициент (индекс) множественной корреляции (детерминации).
6) дельта-коэффициенты
:
,
где
–
коэффициент парной корреляции между y
и
;
– множественный коэффициент детерминации.
7) частные коэффициенты эластичности:
,
где
– коэффициент «чистой» регрессии при
факторе
;
–
среднее значение
результативного признака;
– среднее значение
признака
.
Значимость уравнения множественной регрессии в целом
оценивается с помощью F-критерия Фишера:
,
где n
– число наблюдений, m
– число
параметров при переменной x.
Если расчетное значение критерия с
и
степенями свободы больше табличного
при заданном уровне значимости, то
модель считается значимой.
Прогнозирование по уравнению линейной множественной регрессии
г
де
–
ошибка прогнозного значения, вычисляемая
по формуле
для двухфакторной модели.
Мерой для оценки включения фактора в модель
служит частный
F-критерий,
т.е.
.
Так, если оцениваем значимость влияния
фактора
после включения в модель факторов
,
то формула частного F-критерия
примет вид:
.
Если фактическое значение критерия с и степенями свободы больше табличного при заданном уровне значимости, то дополнительное включение фактора в модель статистически оправдано и коэффициент регрессии при данном факторе статистически значим.
Оценка значимости коэффициентов «чистой» регрессии
Для каждого фактора используется формула
,
где
– коэффициент «чистой» регрессии при
факторе
;
– средняя квадратическая ошибка
коэффициента регрессии
,
,
где
– среднее квадратическое отклонение
для признака y;
–
коэффициент
детерминации для уравнения множественной
регрессии;
–
среднее квадратическое
отклонение для признака
;
–
коэффициент
детерминации для зависимости фактора
со всеми другими факторами уравнения
множественной регрессии.
Практические рекомендации по выполнению расчетов
с помощью табличного редактора MS Excel
Исследуется
зависимость производительности труда
y
(т/ч) от уровня механизации работ
(%), среднего возраста работников
(лет)
и энерговооруженности
(кВт/100
работающих) по данным 14 промышленных
предприятий.
|
32 |
30 |
36 |
40 |
41 |
47 |
56 |
54 |
60 |
55 |
61 |
67 |
69 |
76 |
|
33 |
31 |
41 |
39 |
46 |
43 |
34 |
38 |
42 |
35 |
39 |
44 |
40 |
41 |
|
300 |
290 |
350 |
400 |
400 |
480 |
500 |
520 |
590 |
540 |
600 |
700 |
700 |
750 |
y |
20 |
24 |
28 |
30 |
31 |
33 |
34 |
37 |
38 |
40 |
41 |
43 |
45 |
48 |
Необходимо:
1. Рассчитать параметры линейного уравнения множественной регрессии с полным перечнем факторов.
2. Оценить значимость уравнения в целом, используя значение множественного коэффициента корреляции и общего F-критерия Фишера.
3. Оценить статистическую значимость параметров регрессионной модели с помощью t-критерия.
4. Исследовать коллинеарность между факторами. При наличии мультиколлинеарности исключить какой-либо фактор из уравнения регрессии.
5. Построить новое уравнение множественной регрессии, провести все необходимые исследования, аналогичные проведенным выше.
6. На основании результатов п. 5 найти
а) средние коэффициенты эластичности фактора y от независимых факторов;
б) прогнозное значение результата при значении важнейшей объясняющей переменной, равном максимальному наблюденному значению, увеличенному на 10 %, и при значении второй объясняющей переменной, равном минимальному наблюденному значению, уменьшенному на 15%.
в) Интервальное предсказание значения y с надежностью 0,95.
1. Получение протокола расчета. Операция проводится с помощью инструмента Анализ данных/Регрессия. Она аналогична расчету параметров парной линейной регрессии, рассмотренной выше, только в отличие от парной регрессии при заполнении строки входной интервал X в диалоговом окне следует указать сразу все столбцы значений факторных переменных.
Результаты анализа имеют вид:
ВЫВОД ИТОГОВ |
|
|
|
|
|
|
|
|
|
|
|
Регрессионная статистика |
|
|
|
|
|
Множественный R |
0,97517313 |
|
|
|
|
R-квадрат |
0,950962633 |
|
|
|
|
Нормированный R-квадрат |
0,936251423 |
|
|
|
|
Стандартная ошибка |
2,038864298 |
|
|
|
|
Наблюдения |
14 |
|
|
|
|
|
|
|
|
|
|
Дисперсионный анализ |
|
|
|
|
|
|
df |
SS |
MS |
F |
|
Регрессия |
3 |
806,1446094 |
268,7148698 |
64,64204 |
|
Остаток |
10 |
41,56967627 |
4,156967627 |
|
|
Итого |
13 |
847,7142857 |
|
|
|
|
|
|
|
|
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
|
|
Y-пересечение |
5,711742473 |
6,18918556 |
0,922858495 |
|
|
x1 |
0,148601283 |
0,340417689 |
0,436526326 |
|
|
x2 |
0,064880259 |
0,162051974 |
0,400366976 |
|
|
x3 |
0,037784221 |
0,033824423 |
1,11706919 |
|
|
2. Оцениваем статистическую значимость в целом. Изучив результаты, отмечаем, что в целом полученное уравнение линейной множественной регрессии
является статистически
значимым. Действительно,
.
Сравним это число с критическим значением
критерия Фишера, полученным при числе
степеней свободы
и
,
где n
– число наблюдений, m
– число
параметров при переменной x.
В нашем случае
,
.
Критическое значение даст функция
FРАСПОБР.
,
что существенно меньше расчетного
значения.
О доле вариации результативного признака y, объясненной построенным уравнением множественной регрессии лучше всего судить по значению нормированного коэффициента корреляции, в данном случае он равен 0,9363. То есть построенное уравнение объясняет почти 94% всей вариации признака y.
3. Оцениваем
статистическую значимость по отдельным
параметрам.
Чтобы оценить статистическую значимость
параметров регрессионной модели с
помощью t-критерия,
найдем соответствующее нашим параметрам
критическое значение с помощью функции
СТЬЮДРАСПОБР
при заданном
уровне значимости 0,05 и числе степеней
свободы
.
Коэффициент признается значимым, если
выполняется неравенство
.
Имеем
|
|
|
|
|
0,44 |
0,4 |
1,12 |
|
2,2281 |
Таким образом, ни один из факторов не имеет статистически значимого коэффициента регрессии, и построенное уравнение для прогнозирования непригодно.
4. Исследуем коллинеарность между факторами. Матрицу парных коэффициентов корреляции можно получить, используя инструмент Анализ данных/Корреляция. Заполнив диалоговое окно,
получим следующий результат:
Для оценки мультиколлинеарности факторов вычислим определитель матрицы парных коэффициентов корреляции факторов.
.
Поскольку определитель матрицы межфакторной корреляции близок к нулю, имеем мультиколлинеарность факторов и вытекающую отсюда ненадежность результатов множественной регрессии.
Оценка значимости
мультиколлинеарности факторов может
быть проведена методом испытания
гипотезы о независимости переменных,
т.е.
.
Доказано, что величина
имеет приближенное распределение
с числом степеней свободы
.
Если фактическое значение
превосходит табличное (критическое),
то гипотеза
отклоняется, и мультиколлинеарность
считается доказанной.
Имеем
.
Критическое
значение
можно найти через статистическую функцию
ХИ2ОБР(
),
где
–
уровень значимости (по условию 0,05), а n
– число степеней свободы. В нашем случае
степеней свободы
.
Получаем
.
.
Мультиколлинеарностью факторов
пренебречь нельзя.
Особенно высока
коллинеарность факторов
и
,
.
Один из этих факторов следует исключить
из уравнения регрессии. Логично исключить
тот, который имеет меньший коэффициент
парной корреляции. Поскольку
,
а
,
исключаем фактор
.
5. Построим регрессию на факторах и .
ВЫВОД ИТОГОВ |
|
|
|
|
|
|
|
|
|
Регрессионная статистика |
|
|
|
|
Множественный R |
0,974693901 |
|
|
|
R-квадрат |
0,950028201 |
|
|
|
Нормированный R-квадрат |
0,940942419 |
|
|
|
Стандартная ошибка |
1,962415214 |
|
|
|
Наблюдения |
14 |
|
|
|
|
|
|
|
|
Дисперсионный анализ |
|
|
|
|
|
df |
SS |
MS |
F |
Регрессия |
2 |
805,3524775 |
402,6762388 |
104,5621 |
Остаток |
11 |
42,3618082 |
3,851073473 |
|
Итого |
13 |
847,7142857 |
|
|
|
|
|
|
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
|
Y-пересечение |
7,265656067 |
4,873196972 |
1,490942416 |
|
x2 |
0,031021017 |
0,136948082 |
0,226516625 |
|
x3 |
0,052435862 |
0,004030875 |
13,00855684 |
|
Получили результаты:
,
,
,
что много больше, чем
.
|
|
|
|
0,22 |
13 |
|
2,2281 |
Таким образом, при весьма удовлетворительной значимости уравнения регрессии в целом, мы добились значимости коэффициента регрессии при переменной .
6.
а) Найдем коэффициенты эластичности:
, (6.18)
где – коэффициент «чистой» регрессии при факторе ;
– среднее значение результативного признака;
– среднее значение признака .
Имеем
|
y |
|
|
Среднее |
35,14285714 |
39 |
508,5714286 |
Эластичность |
|
|
|
Таким образом, при изменении фактора (среднего возраста работников) на 1%, производительность возрастает незначительно, на 0,03%; при изменении фактора (энерговооруженности) на 1%, производительность труда увеличивается на 0,72%.
б) Выполним прогнозирование. Максимальное наблюденное значение фактора – 750. Минимальное значение фактора – 31. Прогнозные значения факторов:
;
.
Тогда
.
в) Доверительный
интервал для данного прогнозного
значения y
можно найти, зная предельную ошибку
прогноза
,
где
– соответствующее критическое значение
критерия Стьюдента, а
– ошибка прогнозного значения. В нашем
случае
.
Ошибку прогнозного значения функции регрессии получим по формуле
.
Шаг 1.
Параметр S
– стандартная ошибка регрессии приведен
в последней регрессионной статистике
.
Шаг 2.
Матрица
состоит из чисел:
.
То есть
,
.
Шаг 3.
Матрица X
состоит из чисел
.
Составляем вспомогательную таблицу:
|
|
|
|
|
|
|
….. |
….. |
…. |
….. |
….. |
Сумма |
|
|
|
|
|
В данном случае,
.
Шаг 4. Транспонируем матрицу X. Поскольку она симметрическая, то
.
Шаг 5.
Найдем произведение матриц
.
В Exсel
это можно сделать с помощью функции
МУМНОЖ.
|
58537523,04 |
2158299716 |
29989312607 |
2158299716 |
79577299061 |
1,10572E+12 |
|
29989312607 |
1,10572E+12 |
1,53641E+13 |
Шаг 6.
Найдем обратную матрицу к матрице
произведения
.
В Exсel
это можно сделать с помощью функции
МОБР.
|
0,281568563 |
-0,007773123 |
9,81695E-06 |
-0,007773123 |
0,000215175 |
-3,13231E-07 |
|
9,81695E-06 |
-3,13231E-07 |
3,38079E-09 |
Шаг 7.
Найдем произведение матриц
(размерность матрицы произведения
).
|
0,083373216 |
-0,002314683 |
3,84533E-06 |
Шаг 8.
Найдем произведение матриц
(размерность матрицы произведения
,
то есть только одно число).
.
Шаг 9.
.
Шаг 10.
.
Шаг 11.
Таким образом, прогнозное значение
результата будет с вероятностью 95%
находиться в интервале
.
Задания для самостоятельной работы
Вариант 1
x1 |
32 |
30 |
36 |
40 |
41 |
47 |
56 |
54 |
60 |
55 |
61 |
67 |
69 |
76 |
x2 |
33 |
31 |
41 |
39 |
46 |
43 |
34 |
38 |
42 |
35 |
39 |
44 |
40 |
41 |
x3 |
30 |
29 |
35 |
40 |
40 |
48 |
50 |
52 |
59 |
54 |
60 |
70 |
70 |
75 |
y |
20 |
24 |
28 |
30 |
31 |
33 |
34 |
37 |
38 |
40 |
41 |
43 |
45 |
48 |
Вариант 2
x1 |
55 |
46 |
40 |
39 |
35 |
29 |
31 |
75 |
68 |
66 |
60 |
54 |
59 |
53 |
x2 |
33 |
42 |
45 |
38 |
40 |
30 |
32 |
40 |
39 |
43 |
38 |
34 |
41 |
37 |
x3 |
50 |
45 |
39 |
40 |
34 |
30 |
30 |
74 |
69 |
66 |
59 |
54 |
60 |
52 |
y |
33 |
32 |
30 |
29 |
27 |
23 |
19 |
47 |
44 |
42 |
40 |
39 |
37 |
36 |
Вариант 3
x1 |
48 |
57 |
55 |
61 |
56 |
62 |
68 |
70 |
77 |
42 |
41 |
37 |
31 |
33 |
x2 |
44 |
35 |
39 |
43 |
36 |
40 |
45 |
41 |
42 |
47 |
40 |
42 |
32 |
34 |
x3 |
47 |
56 |
54 |
62 |
56 |
62 |
67 |
70 |
76 |
42 |
40 |
37 |
30 |
32 |
y |
34 |
35 |
38 |
39 |
41 |
42 |
44 |
46 |
49 |
32 |
31 |
29 |
25 |
21 |
Вариант 4
x1 |
52 |
54 |
45 |
39 |
38 |
34 |
28 |
30 |
74 |
67 |
65 |
59 |
53 |
58 |
x2 |
36 |
32 |
41 |
44 |
37 |
39 |
29 |
31 |
39 |
38 |
42 |
37 |
33 |
40 |
x3 |
52 |
53 |
45 |
38 |
38 |
34 |
28 |
31 |
73 |
66 |
65 |
60 |
52 |
57 |
y |
35 |
32 |
31 |
29 |
28 |
26 |
22 |
18 |
46 |
43 |
41 |
39 |
33 |
36 |
Вариант 5
x1 |
43 |
49 |
58 |
56 |
62 |
57 |
63 |
69 |
71 |
78 |
34 |
32 |
38 |
42 |
x2 |
48 |
45 |
36 |
40 |
44 |
37 |
41 |
46 |
42 |
43 |
35 |
33 |
43 |
41 |
x3 |
42 |
48 |
58 |
55 |
61 |
56 |
62 |
70 |
70 |
78 |
35 |
32 |
38 |
41 |
y |
33 |
35 |
36 |
39 |
40 |
42 |
43 |
45 |
47 |
50 |
22 |
26 |
30 |
32 |
Вариант 6
x1 |
52 |
57 |
51 |
53 |
44 |
38 |
37 |
33 |
27 |
29 |
73 |
66 |
64 |
58 |
x2 |
32 |
39 |
35 |
31 |
40 |
43 |
36 |
38 |
28 |
30 |
38 |
37 |
41 |
36 |
x3 |
52 |
56 |
50 |
53 |
45 |
37 |
37 |
32 |
28 |
30 |
72 |
66 |
64 |
59 |
y |
37 |
35 |
34 |
31 |
30 |
28 |
27 |
25 |
21 |
17 |
45 |
42 |
40 |
38 |
Вариант 7
x1 |
39 |
43 |
44 |
50 |
59 |
57 |
63 |
58 |
64 |
70 |
72 |
79 |
35 |
33 |
x2 |
44 |
42 |
49 |
46 |
37 |
41 |
45 |
38 |
42 |
47 |
43 |
44 |
36 |
34 |
x3 |
45 |
42 |
50 |
46 |
38 |
40 |
45 |
39 |
41 |
48 |
43 |
44 |
35 |
34 |
y |
31 |
33 |
34 |
36 |
37 |
40 |
41 |
43 |
44 |
46 |
48 |
51 |
23 |
27 |
Вариант 8
x1 |
63 |
57 |
51 |
56 |
50 |
52 |
43 |
37 |
36 |
32 |
26 |
28 |
72 |
65 |
x2 |
40 |
35 |
31 |
38 |
34 |
30 |
39 |
42 |
35 |
37 |
27 |
29 |
37 |
36 |
x3 |
39 |
38 |
35 |
35 |
32 |
31 |
28 |
28 |
25 |
25 |
21 |
15 |
45 |
40 |
y |
39 |
37 |
36 |
34 |
33 |
30 |
29 |
27 |
26 |
24 |
20 |
16 |
44 |
41 |
Вариант 9
x1 |
64 |
59 |
65 |
71 |
73 |
80 |
36 |
34 |
40 |
44 |
45 |
51 |
60 |
58 |
x2 |
46 |
39 |
43 |
48 |
44 |
45 |
37 |
35 |
45 |
43 |
50 |
47 |
38 |
42 |
x3 |
50 |
40 |
50 |
55 |
50 |
60 |
35 |
34 |
42 |
41 |
48 |
49 |
50 |
50 |
y |
42 |
44 |
45 |
47 |
49 |
52 |
24 |
28 |
32 |
34 |
35 |
37 |
38 |
41 |
Вариант 10
x1 |
46 |
52 |
61 |
59 |
65 |
60 |
66 |
72 |
74 |
81 |
37 |
35 |
41 |
45 |
x2 |
51 |
48 |
39 |
43 |
47 |
40 |
44 |
49 |
45 |
46 |
38 |
36 |
46 |
44 |
x3 |
46 |
52 |
60 |
58 |
64 |
61 |
65 |
72 |
74 |
80 |
38 |
34 |
40 |
44 |
y |
36 |
38 |
39 |
42 |
43 |
45 |
46 |
48 |
50 |
53 |
25 |
29 |
33 |
35 |