Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лр №1.docx
Скачиваний:
3
Добавлен:
01.04.2025
Размер:
119.11 Кб
Скачать
  1. Построить матрицу парных коэффициентов корреляции. Выполнить тест на мультиколлинеарность Фаррара – Глоубера. Обосновать отбор факторов для регрессионного анализа.

В таблице 2 представлена матрица коэффициентов парной корреляции для всех переменных, участвующих в рассмотрении. Матрица получена с помощью инструмента Корреляция из пакета Анализ данных в Excel.

Таблица 2. Матрица коэффициентов парной корреляции

Y

X1

X2

X3

X4

Y

1,00

X1

0,93

1,00

X2

0,84

0,71

1,00

X3

0,68

0,54

0,72

1,00

X4

0,69

0,60

0,36

0,54

1,00

Визуальный анализ матрицы позволяет установить:

  1. У имеет довольно высокие парные корреляции со всеми переменными (>0,5);

  2. большинство переменных анализа демонстрируют довольно высокие парные корреляции, что обуславливает необходимость проверки факторов на наличие между ними мультиколлинеарности. Тем более, что одним из условий классической регрессионной модели является предположение о независимости объясняющих переменных.

Для выявления мультиколлинеарности факторов выполним тест Фаррара-Глоубера по факторам Х1,Х2,Х3,Х4.

Проверка теста Фаррара-Глоубера на мультиколлинеарность факторов включает несколько этапов.

  1. Проверка наличия мультиколлинеарности всего массива переменных.

Одним из условий классической регрессионной модели является предположение о независимости объясняющих переменных. Для выявления мультиколлинеарности между факторами вычисляется матрица межфакторных корреляций R с помощью Пакета анализа данных (таблица 3).

Таблица 3. Матрица межфакторных корреляций R

X1

X2

X3

X4

X1

1

0,707522

0,542067

0,596058

X2

0,707522

1

0,717606

0,362125

X3

0,542067

0,717606

1

0,544837

X4

0,596058

0,362125

0,544837

1

Наиболее слабая зависимость наблюдается между факторами Х2 и Х4 (<0,5).

Определитель det (R) = 0,11952 вычисляется с помощью функции МОПРЕД. Определитель матрицы R стремится к нулю, что позволяет сделать предположение об общей мультиколлинеарности факторов.

  1. Проверка наличия мультиколлинеарности каждой переменной с другими переменными:

  • Вычислим обратную матрицу R-1 с помощью функции Excel МОБР (таблица 4):

Таблица 4. Обратная матрица R-1

X1

X2

X3

X4

X1

2,8465927

-1,94656

0,560625

-1,29729

X2

-1,946556

3,397816

-1,91266

0,971915

X3

0,5606248

-1,91266

2,664202

-1,0931

X4

-1,2972858

0,971915

-1,0931

2,016862

  • Вычисление F-критериев , где – диагональные элементы матрицы (таблица 5).

Таблица 5. Значения F-критериев

F1 (Х1)

F2 (Х2)

F3 (Х3)

F4 (Х4)

0,369319

0,4795632

0,33284

0,203372

  • Фактические значения F-критериев сравниваются с табличным значением Fтабл=2,87 (FРАСПОБР(0,05;4;20)) при 1= 4 и 2 = n - k – 1=25-4-1=20 степенях свободы и уровне значимости α=0,05, где k – количество факторов.

  • Все значения F-критериев меньше табличного, данный метод свидетельствует об отсутствии мультиколлинеарности между факторами.

  1. Проверка наличия мультиколлинеарности каждой пары переменных

  • Вычислим частные коэффициенты корреляции по формуле где – элементы матрицы (таблица 6)

Таблица 6. Матрица коэффициентов частных корреляций

Х1

Х2

Х3

Х4

Х1

Х2

0,6258991

Х3

-0,2035758

0,635704

Х4

0,5414208

-0,37127

0,47156

  • Вычисление t-критериев по формуле

(таблица 7)

n-число данных = 25

k – число факторов = 4

Таблица 7. t-критерии для коэффициентов частной корреляции

Х1

Х2

Х3

Х4

Х1

Х2

3,5890386

Х3

-0,9298912

3,682907

Х4

2,8799314

-1,78818

2,391471

tтабл = СТЬЮДРАСПОБР(0,05;20) = 2,086

Фактические значения t-критериев сравниваются с табличным значением при степенях свободы n-k-1 = 25-4-1=20 и уровне значимости α=0,05.

t21 > tтабл

t32 > tтабл

t41 > tтабл

t43 > tтабл

Из таблиц 6 и 7 видно, что четыре пары факторов X1 и Х2, Х3 и Х2, Х4 и Х1, Х4 и Х3 имеют высокую статистически значимую частную корреляцию, то есть являются мультиколлинеарными.

Для того чтобы избавиться от мультиколлинеарности, можно исключить одну из переменных коллинеарной пары. В паре Х1 и Х2 оставляем Х1, так как у нее меньше связи с другими факторами; в паре Х3 и Х2 оставляем Х3 так как у нее меньше значение F-критерия и, значит, она меньше влияет на общую мультиколлинеарность факторов; в паре Х4 и Х1 оставляем Х4 так как у нее меньше значение F-критерия и, значит, она меньше влияет на общую мультиколлинеарность факторов; в паре Х4 и Х3 оставляем Х4 так как у нее меньше значение F-критерия и, значит, она меньше влияет на общую мультиколлинеарность факторов.

Таким образом, в результате проверки теста Фаррара-Глоубера остается три фактора: Х1, Х3, Х4.

Завершая процедуры корреляционного анализа, целесообразно посмотреть частные корреляции выбранных факторов с результатом Y.

Построим матрицу парных коэффициентов корреляции, исходя из данных таблицы 8.

Таблица 8. Данные выпуска продукции с отобранными факторами Х1, Х3, Х4

наблюдения

Y

X1

X3

X4

1

62240

2890

13,9

1258

2

88569

4409

55,3

16304

3

3118

210

5,7

250

4

186256

5436

87,2

8306

5

56262

1559

56,2

17663

6

19216

940

27,6

2861

7

16567

1197

31,1

734

8

203456

8212

60,5

42392

9

13425

459

33,5

4740

10

31163

1405

35,1

9469

11

30109

1575

26,5

5206

12

14781

964

4,4

-1437

13

41138

1866

24,9

9948

14

69202

4419

13,2

-9135

15

10201

802

14,9

857

16

75282

2600

2,4

12729

17

47064

1110

5,8

8887

18

57342

1147

50,4

15503

19

32900

864

4,9

7960

20

18135

763

25,9

2522

21

29589

1003

43,5

4412

22

22604

1680

3,1

3304

23

1878

77

0,6

172

24

49378

2505

43,1

6264

25

6896

1556

0,7

1745

В последнем столбце таблицы 9 представлены значения t-критерия для столбца У.

Таблица 9. Матрица коэффициентов частной корреляции с результатом Y

Переменная  

Y

X1

X3

X4

t критерий

(t табл(0,05;25-4-1=20) = 2,0860

Y

1

0,926883

0,676276

0,68555

X1

0,926883

1

0,542067

0,596058

8,45442433

X3

0,676276

0,542067

1

0,544837

2,441423208

X4

0,68555

0,596058

0,544837

1

1,565832479

tтабл=2,086

Из таблицы 9 видно, что переменная Y имеет высокую и одновременно статистически значимую частную корреляцию с фактором Х1.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]