- •Раздел 1. Введение в эконометрику
- •Тема 1.1. Основные понятия теории вероятностей и статистики, применяемые в эконометрике
- •Раздел 2. Парная регрессия
- •Тема 2.1. Метод наименьших квадратов
- •Тема 2. 2. Экономическая и статистическая интерпретация модели парной регрессии (2 занятия)
- •Раздел 3. Множественная регрессия
- •Тема 3.3. Мультиколлинеарность
- •Тема 3.4. Гетероскедастичность
- •Тема 3.5. Автокорреляция
- •Тема 3.6. Модели с фиктивными переменными
- •Раздел 4. Временные ряды
- •Тема 4.1. Характеристики временных рядов
- •Тема 4.2. Стационарные и нестационарные временные ряды.
- •Тема 4.3. Динамические эконометрические модели
- •Раздел 5. Системы одновременных уравнений.
- •Тема 5.1. Понятие о системах эконометрических уравнений.
- •Тема 5.2. Методы оценки системы одновременных уравнений.
Тема 3.3. Мультиколлинеарность
Решение типовой задачи на компьютере с помощью ППП EXCEL
Задача 1. Имеются данные об объеме реализации торговой фирмы:
-
Объем
реализации,тыс. руб., Y
Время, мес., X1
Расходы
на рекламу, тыс. руб., Х2
Цена, руб., Х3
Цена конкурента, руб., Х4
Индекс потребительских расходов, %, Х5
Тип упаковки, D
126
1
4
15
17
100
0
137
2
4,8
14,8
17,3
98,4
0
148
3
3,8
15,2
16,8
101,2
0
191
4
8,7
15,5
16,2
103,5
0
274
5
8,2
15,5
16
104,1
0
370
6
9,7
16
18
107
1
432
7
14,7
18,1
20,2
107,4
1
445
8
18,7
13
15,8
108,5
1
367
9
19,8
15,8
18,2
108,3
1
367
10
10,6
16,9
16,8
109,2
1
321
11
8,6
16,3
17
110,1
0
307
12
6,5
16,1
18,3
110,7
0
331
13
12,6
15,4
16,4
110,3
0
345
14
6,5
15,7
16,2
111,8
0
364
15
5,8
16
17,7
112,3
1
384
16
5,7
15,1
16,2
112,9
1
Задание:
1. Постройте матрицу линейных коэффициентов парной корреляции. |
2. Постройте линейную модель множественной регрессии, исключив из нее коллинеарные и слабоинформативные факторы. |
3. Оцените тесноту связи с помощью показателей корреляции и детерминации. |
4. Проверьте с помощью F-критерия Фишера статистическую значимость результатов регрессии. |
5. Проверьте с помощью t-статистики Стьюдента статистическую значимость параметров уравнения. |
Решение:
Для получения матрицы линейных коэффициентов парной корреляции применим инструмент Корреляция: Выберите в меню Сервис/Анализ данных/Корреляция.
Рисунок 2.1. Диалоговое окно ввода параметров инструмента Корреляция
В окне Корреляция в поле Входной интервал введите диапазон ячеек,
содержащих исходные данные. Выберите параметры вывода, установите переключатель Новый рабочий лист (см. рисунок 2.1). Щелкните ОК.
Матрица линейных коэффициентов парной корреляции
|
y |
X1 |
X2 |
X3 |
X4 |
X5 |
y |
1 |
|
|
|
|
|
X1 |
0,6779845 |
1 |
|
|
|
|
X2 |
0,6459184 |
0,1064553 |
1 |
|
|
|
X3 |
0,2328951 |
0,1737175 |
-0,003354 |
1 |
|
|
X4 |
0,2263193 |
-0,051001 |
0,2040426 |
0,6977508 |
1 |
|
X5 |
0,8160179 |
0,9602043 |
0,2733728 |
0,2354285 |
0,0307844 |
1 |
Анализ матрицы коэффициентов парной корреляции показывает, что наблюдается тесная статистическая связь между объемом реализации и индексом потребительских расходов (ryx5=0,816) и умеренная связь объема реализации с расходами на рекламу (ryx2=0,646) и со временем (ryx1=0,678). В модель целесообразно отобрать именно эти факторы. Однако факторы x1 и x5 тесно связаны между собой (rx1x5=0,960). Также наблюдается тесная взаимосвязь между факторами x3 и x4 (rx3x4=0,698), что свидетельствует о наличии в модели коллинеарных факторов. Чтобы из каждой пары устранить коллинеарный фактор, проанализируем их взаимосвязь с другими факторами. Фактор x1 имеет слабую связь с другими факторами (rx1x2=0,11; rx1x3=0,17; rx1x4=-0,05). Фактор x5 также слабо связан с другими факторами (rx2x5=0,27; rx3x5=0,24; rx4x5=0,03). Поэтому из факторов x1 и x5 разумно оставить в модели индекс потребительских расходов (ryx5=0,816 > ryx1=0,678). Факторы x3 и x4 являются слабоинформативными (ryx3=0,23; ryx4=0,23), поэтому их не включаем в модель. В нашем примере количество наблюдений n=16, число независимых факторов m=5, после исключения факторов n=16, k=m-3=2.
Таким образом, оценим двухфакторную линейную модель множественной регрессии, подбор факторов в которую в ППП EXCEL выполнили вручную (по анализу матрицы коэффициентов парной корреляции):
Yx=a+b2x2+b5x5, где x2 – расходы на рекламу, x5 – индекс потребительских расходов.
Оценка регрессии выполняется методом наименьших квадратов с использованием пакета Анализ данных и инструмента Регрессия.
Замечание: Входной интервал Х –диапазон ячеек, содержащий данные независимых факторов (расходы на рекламу, индекс потребительских расходов). Получены следующие результаты:
-
Регрессионная статистика
Множественный R
0,9269
R-квадрат
0,8591
Нормированный R-квадрат
0,8374
Стандартная ошибка
41,4729
Наблюдения
16
Коэффициент множественной корреляции, равный 0,927, свидетельствует о тесной связи между объемом реализации, расходами на рекламу и индексом потребительских цен. Коэффициент детерминации, равный 0,859, показывает, что 85,9% дисперсии объема реализации формируется в результате влияния расходов на рекламу и индекса потребительских цен и 14,1% дисперсии объема реализации формируются под влиянием не учтенных в модели факторов.
-
Дисперсионный анализ
df
SS
MS
F
Значимость F
Регрессия
2
136358,3
68179,17
39,63887
2,93E-06
Остаток
13
22360,1
1720,008
Итого
15
158718,4
Факторная дисперсия объема реализации составила 68179,17, остаточная дисперсия – 1720,01. Наблюдаемое значение критерия Фишера 39,64 (значимость 0, 000293<0,05) при критическом 3,80 (=0,05, v1=2, v2=13) подтверждает статистическую надежность уравнения регрессии и коэффициента детерминации. Рассчитаем частные F-критерии. Fx2 проверяет гипотезу о целесообразности включения в модель фактора х2 после фактора х5.Fx5 проверяет гипотезу о целесообразности включения в модель фактора х5 после фактора х2.
Таким образом, подтверждается гипотеза о целесообразности включения в модель обоих факторов (F крит(0,05;1,13) = 4,67).
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Y-пересечение |
-1471,31 |
259,766 |
-5,664 |
7,75E-05 |
-2032,5 |
-910,124 |
Переменная X2 |
9,5684 |
2,2659 |
4,2227 |
0,0009 |
4,6731 |
14,4636 |
Переменная X5 |
15,7528 |
2,4668 |
6,3858 |
2,4E-05 |
10,4235 |
21,0822 |
Запишем уравнение регрессии (в скобках указаны стандартные ошибки коэффициентов и наблюдаемая t-статистика):
Y=-1471,31+9,57x2+15,75x5
(259,77) (2,27) (2,47)
(-5,66) (4,22) (6,39)
Все оценки коэффициентов значимы, критическое значение критерия Стьюдента (=0,05/2,v=13) составляет 2,16.
Согласно полученным регрессионным коэффициентам с увеличением расходов на рекламу на одну тысячу рублей объем реализации возрастает в среднем на 9,57 тысяч рублей при постоянном индексе потребительских расходов; с ростом индекса потребительских расходов на один процентный пункт объем реализации возрастает в среднем на 15,75 тысяч рублей при неизменных расходах на рекламу.