Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
tipovye_zadachi_ekonometr.doc
Скачиваний:
58
Добавлен:
14.11.2019
Размер:
1.21 Mб
Скачать

Тема 3.3. Мультиколлинеарность

Решение типовой задачи на компьютере с помощью ППП EXCEL

Задача 1. Имеются данные об объеме реализации торговой фирмы:

Объем

реализации,тыс. руб., Y

Время, мес., X1

Расходы

на рекламу, тыс. руб., Х2

Цена, руб., Х3

Цена конкурента, руб., Х4

Индекс потребительских расходов, %, Х5

Тип упаковки, D

126

1

4

15

17

100

0

137

2

4,8

14,8

17,3

98,4

0

148

3

3,8

15,2

16,8

101,2

0

191

4

8,7

15,5

16,2

103,5

0

274

5

8,2

15,5

16

104,1

0

370

6

9,7

16

18

107

1

432

7

14,7

18,1

20,2

107,4

1

445

8

18,7

13

15,8

108,5

1

367

9

19,8

15,8

18,2

108,3

1

367

10

10,6

16,9

16,8

109,2

1

321

11

8,6

16,3

17

110,1

0

307

12

6,5

16,1

18,3

110,7

0

331

13

12,6

15,4

16,4

110,3

0

345

14

6,5

15,7

16,2

111,8

0

364

15

5,8

16

17,7

112,3

1

384

16

5,7

15,1

16,2

112,9

1

Задание:

1. Постройте матрицу линейных коэффициентов парной корреляции.

2. Постройте линейную модель множественной регрессии, исключив из нее коллинеарные и слабоинформативные факторы.

3. Оцените тесноту связи с помощью показателей корреляции и детерминации.

4. Проверьте с помощью F-критерия Фишера статистическую значимость результатов регрессии.

5. Проверьте с помощью t-статистики Стьюдента статистическую значимость параметров уравнения.

Решение:

Для получения матрицы линейных коэффициентов парной корреляции применим инструмент Корреляция: Выберите в меню Сервис/Анализ данных/Корреляция.

Рисунок 2.1. Диалоговое окно ввода параметров инструмента Корреляция

В окне Корреляция в поле Входной интервал введите диапазон ячеек,

содержащих исходные данные. Выберите параметры вывода, установите переключатель Новый рабочий лист (см. рисунок 2.1). Щелкните ОК.

Матрица линейных коэффициентов парной корреляции

y

X1

X2

X3

X4

X5

y

1

X1

0,6779845

1

X2

0,6459184

0,1064553

1

X3

0,2328951

0,1737175

-0,003354

1

X4

0,2263193

-0,051001

0,2040426

0,6977508

1

X5

0,8160179

0,9602043

0,2733728

0,2354285

0,0307844

1

Анализ матрицы коэффициентов парной корреляции показывает, что наблюдается тесная статистическая связь между объемом реализации и индексом потребительских расходов (ryx5=0,816) и умеренная связь объема реализации с расходами на рекламу (ryx2=0,646) и со временем (ryx1=0,678). В модель целесообразно отобрать именно эти факторы. Однако факторы x1 и x5 тесно связаны между собой (rx1x5=0,960). Также наблюдается тесная взаимосвязь между факторами x3 и x4 (rx3x4=0,698), что свидетельствует о наличии в модели коллинеарных факторов. Чтобы из каждой пары устранить коллинеарный фактор, проанализируем их взаимосвязь с другими факторами. Фактор x1 имеет слабую связь с другими факторами (rx1x2=0,11; rx1x3=0,17; rx1x4=-0,05). Фактор x5 также слабо связан с другими факторами (rx2x5=0,27; rx3x5=0,24; rx4x5=0,03). Поэтому из факторов x1 и x5 разумно оставить в модели индекс потребительских расходов (ryx5=0,816 > ryx1=0,678). Факторы x3 и x4 являются слабоинформативными (ryx3=0,23; ryx4=0,23), поэтому их не включаем в модель. В нашем примере количество наблюдений n=16, число независимых факторов m=5, после исключения факторов n=16, k=m-3=2.

Таким образом, оценим двухфакторную линейную модель множественной регрессии, подбор факторов в которую в ППП EXCEL выполнили вручную (по анализу матрицы коэффициентов парной корреляции):

Yx=a+b2x2+b5x5, где x2 – расходы на рекламу, x5 – индекс потребительских расходов.

Оценка регрессии выполняется методом наименьших квадратов с использованием пакета Анализ данных и инструмента Регрессия.

Замечание: Входной интервал Х –диапазон ячеек, содержащий данные независимых факторов (расходы на рекламу, индекс потребительских расходов). Получены следующие результаты:

Регрессионная статистика

Множественный R

0,9269

R-квадрат

0,8591

Нормированный R-квадрат

0,8374

Стандартная ошибка

41,4729

Наблюдения

16

Коэффициент множественной корреляции, равный 0,927, свидетельствует о тесной связи между объемом реализации, расходами на рекламу и индексом потребительских цен. Коэффициент детерминации, равный 0,859, показывает, что 85,9% дисперсии объема реализации формируется в результате влияния расходов на рекламу и индекса потребительских цен и 14,1% дисперсии объема реализации формируются под влиянием не учтенных в модели факторов.

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

2

136358,3

68179,17

39,63887

2,93E-06

Остаток

13

22360,1

1720,008

Итого

15

158718,4

Факторная дисперсия объема реализации составила 68179,17, остаточная дисперсия – 1720,01. Наблюдаемое значение критерия Фишера 39,64 (значимость 0, 000293<0,05) при критическом 3,80 (=0,05, v1=2, v2=13) подтверждает статистическую надежность уравнения регрессии и коэффициента детерминации. Рассчитаем частные F-критерии. Fx2 проверяет гипотезу о целесообразности включения в модель фактора х2 после фактора х5.Fx5 проверяет гипотезу о целесообразности включения в модель фактора х5 после фактора х2.

Таким образом, подтверждается гипотеза о целесообразности включения в модель обоих факторов (F крит(0,05;1,13) = 4,67).

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

-1471,31

259,766

-5,664

7,75E-05

-2032,5

-910,124

Переменная X2

9,5684

2,2659

4,2227

0,0009

4,6731

14,4636

Переменная X5

15,7528

2,4668

6,3858

2,4E-05

10,4235

21,0822

Запишем уравнение регрессии (в скобках указаны стандартные ошибки коэффициентов и наблюдаемая t-статистика):

Y=-1471,31+9,57x2+15,75x5

(259,77) (2,27) (2,47)

(-5,66) (4,22) (6,39)

Все оценки коэффициентов значимы, критическое значение критерия Стьюдента (=0,05/2,v=13) составляет 2,16.

Согласно полученным регрессионным коэффициентам с увеличением расходов на рекламу на одну тысячу рублей объем реализации возрастает в среднем на 9,57 тысяч рублей при постоянном индексе потребительских расходов; с ростом индекса потребительских расходов на один процентный пункт объем реализации возрастает в среднем на 15,75 тысяч рублей при неизменных расходах на рекламу.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]