- •Компьютерный практикум Задание 1
- •Условия задачи (Вариант 1)
- •Построить матрицу парных коэффициентов корреляции. Выполнить тест на мультиколлинеарность Фаррара – Глоубера. Обосновать отбор факторов для регрессионного анализа.
- •Построить уравнение регрессии. Дать экономическую интерпретацию коэффициентов регрессии.
- •Привести график остатков. Проверить условие гомоскедастичности остатков.
- •Рассчитать прогнозное значение результата, если прогнозные значения факторов составляют 80% от их максимальных значений.
Построить матрицу парных коэффициентов корреляции. Выполнить тест на мультиколлинеарность Фаррара – Глоубера. Обосновать отбор факторов для регрессионного анализа.
В таблице 2 представлена матрица коэффициентов парной корреляции для всех переменных, участвующих в рассмотрении. Матрица получена с помощью инструмента Корреляция из пакета Анализ данных в Excel.
Таблица 2. Матрица коэффициентов парной корреляции
|
Y |
X1 |
X2 |
X3 |
X4 |
Y |
1,00 |
|
|
|
|
X1 |
0,93 |
1,00 |
|
|
|
X2 |
0,84 |
0,71 |
1,00 |
|
|
X3 |
0,68 |
0,54 |
0,72 |
1,00 |
|
X4 |
0,69 |
0,60 |
0,36 |
0,54 |
1,00 |
Визуальный анализ матрицы позволяет установить:
У имеет довольно высокие парные корреляции со всеми переменными (>0,5);
большинство переменных анализа демонстрируют довольно высокие парные корреляции, что обуславливает необходимость проверки факторов на наличие между ними мультиколлинеарности. Тем более, что одним из условий классической регрессионной модели является предположение о независимости объясняющих переменных.
Для выявления мультиколлинеарности факторов выполним тест Фаррара-Глоубера по факторам Х1,Х2,Х3,Х4.
Проверка теста Фаррара-Глоубера на мультиколлинеарность факторов включает несколько этапов.
Проверка наличия мультиколлинеарности всего массива переменных.
Одним из условий классической регрессионной модели является предположение о независимости объясняющих переменных. Для выявления мультиколлинеарности между факторами вычисляется матрица межфакторных корреляций R с помощью Пакета анализа данных (таблица 3).
Таблица 3. Матрица межфакторных корреляций R
|
X1 |
X2 |
X3 |
X4 |
X1 |
1 |
0,707522 |
0,542067 |
0,596058 |
X2 |
0,707522 |
1 |
0,717606 |
0,362125 |
X3 |
0,542067 |
0,717606 |
1 |
0,544837 |
X4 |
0,596058 |
0,362125 |
0,544837 |
1 |
Наиболее слабая зависимость наблюдается между факторами Х2 и Х4 (<0,5).
Определитель det (R) = 0,11952 вычисляется с помощью функции МОПРЕД. Определитель матрицы R стремится к нулю, что позволяет сделать предположение об общей мультиколлинеарности факторов.
Проверка наличия мультиколлинеарности каждой переменной с другими переменными:
Вычислим обратную матрицу R-1 с помощью функции Excel МОБР (таблица 4):
Таблица 4. Обратная матрица R-1
|
X1 |
X2 |
X3 |
X4 |
X1 |
2,8465927 |
-1,94656 |
0,560625 |
-1,29729 |
X2 |
-1,946556 |
3,397816 |
-1,91266 |
0,971915 |
X3 |
0,5606248 |
-1,91266 |
2,664202 |
-1,0931 |
X4 |
-1,2972858 |
0,971915 |
-1,0931 |
2,016862 |
Вычисление F-критериев
,
где
–
диагональные элементы матрицы
(таблица 5).
Таблица 5. Значения F-критериев
F1 (Х1) |
F2 (Х2) |
F3 (Х3) |
F4 (Х4) |
0,369319 |
0,4795632 |
0,33284 |
0,203372 |
Фактические значения F-критериев сравниваются с табличным значением Fтабл=2,87 (FРАСПОБР(0,05;4;20)) при 1= 4 и 2 = n - k – 1=25-4-1=20 степенях свободы и уровне значимости α=0,05, где k – количество факторов.
Все значения F-критериев меньше табличного, данный метод свидетельствует об отсутствии мультиколлинеарности между факторами.
Проверка наличия мультиколлинеарности каждой пары переменных
Вычислим частные коэффициенты корреляции по формуле
где
–
элементы матрицы
(таблица
6)
Таблица
6. Матрица
коэффициентов частных корреляций
|
Х1 |
Х2 |
Х3 |
Х4 |
Х1 |
|
|
|
|
Х2 |
0,6258991 |
|
|
|
Х3 |
-0,2035758 |
0,635704 |
|
|
Х4 |
0,5414208 |
-0,37127 |
0,47156 |
|
Вычисление t-критериев по формуле
(таблица 7)
n-число данных = 25
k – число факторов = 4
Таблица 7. t-критерии для коэффициентов частной корреляции
|
Х1 |
Х2 |
Х3 |
Х4 |
Х1 |
|
|
|
|
Х2 |
3,5890386 |
|
|
|
Х3 |
-0,9298912 |
3,682907 |
|
|
Х4 |
2,8799314 |
-1,78818 |
2,391471 |
|
tтабл = СТЬЮДРАСПОБР(0,05;20) = 2,086
Фактические значения t-критериев сравниваются с табличным значением при степенях свободы n-k-1 = 25-4-1=20 и уровне значимости α=0,05.
t21 > tтабл
t32 > tтабл
t41 > tтабл
t43 > tтабл
Из таблиц 6 и 7 видно, что четыре пары факторов X1 и Х2, Х3 и Х2, Х4 и Х1, Х4 и Х3 имеют высокую статистически значимую частную корреляцию, то есть являются мультиколлинеарными.
Для того чтобы избавиться от мультиколлинеарности, можно исключить одну из переменных коллинеарной пары. В паре Х1 и Х2 оставляем Х1, так как у нее меньше связи с другими факторами; в паре Х3 и Х2 оставляем Х3 так как у нее меньше значение F-критерия и, значит, она меньше влияет на общую мультиколлинеарность факторов; в паре Х4 и Х1 оставляем Х4 так как у нее меньше значение F-критерия и, значит, она меньше влияет на общую мультиколлинеарность факторов; в паре Х4 и Х3 оставляем Х4 так как у нее меньше значение F-критерия и, значит, она меньше влияет на общую мультиколлинеарность факторов.
Таким образом, в результате проверки теста Фаррара-Глоубера остается три фактора: Х1, Х3, Х4.
Завершая процедуры корреляционного анализа, целесообразно посмотреть частные корреляции выбранных факторов с результатом Y.
Построим матрицу парных коэффициентов корреляции, исходя из данных таблицы 8.
Таблица 8. Данные выпуска продукции с отобранными факторами Х1, Х3, Х4
№ наблюдения |
Y |
X1 |
X3 |
X4 |
1 |
62240 |
2890 |
13,9 |
1258 |
2 |
88569 |
4409 |
55,3 |
16304 |
3 |
3118 |
210 |
5,7 |
250 |
4 |
186256 |
5436 |
87,2 |
8306 |
5 |
56262 |
1559 |
56,2 |
17663 |
6 |
19216 |
940 |
27,6 |
2861 |
7 |
16567 |
1197 |
31,1 |
734 |
8 |
203456 |
8212 |
60,5 |
42392 |
9 |
13425 |
459 |
33,5 |
4740 |
10 |
31163 |
1405 |
35,1 |
9469 |
11 |
30109 |
1575 |
26,5 |
5206 |
12 |
14781 |
964 |
4,4 |
-1437 |
13 |
41138 |
1866 |
24,9 |
9948 |
14 |
69202 |
4419 |
13,2 |
-9135 |
15 |
10201 |
802 |
14,9 |
857 |
16 |
75282 |
2600 |
2,4 |
12729 |
17 |
47064 |
1110 |
5,8 |
8887 |
18 |
57342 |
1147 |
50,4 |
15503 |
19 |
32900 |
864 |
4,9 |
7960 |
20 |
18135 |
763 |
25,9 |
2522 |
21 |
29589 |
1003 |
43,5 |
4412 |
22 |
22604 |
1680 |
3,1 |
3304 |
23 |
1878 |
77 |
0,6 |
172 |
24 |
49378 |
2505 |
43,1 |
6264 |
25 |
6896 |
1556 |
0,7 |
1745 |
В последнем столбце таблицы 9 представлены значения t-критерия для столбца У.
Таблица 9. Матрица коэффициентов частной корреляции с результатом Y
Переменная |
Y |
X1 |
X3 |
X4 |
t критерий (t табл(0,05;25-4-1=20) = 2,0860 |
Y |
1 |
0,926883 |
0,676276 |
0,68555 |
|
X1 |
0,926883 |
1 |
0,542067 |
0,596058 |
8,45442433 |
X3 |
0,676276 |
0,542067 |
1 |
0,544837 |
2,441423208 |
X4 |
0,68555 |
0,596058 |
0,544837 |
1 |
1,565832479 |
tтабл=2,086
Из таблицы 9 видно, что переменная Y имеет высокую и одновременно статистически значимую частную корреляцию с фактором Х1.
