- •Введение: Методические указания для работы с материалом
- •Проверка множественной регрессионной линейной модели на адекватность.
- •1. Основные определения и формулы
- •2. Подбор объясняющих переменных для множественной линейной модели
- •3. Теорема Гауса-Маркова и проверка ее гипотез
- •4. Оценка параметров множественной линейной эконометрической модели и их качества
- •5. Проверка множественной регрессионной линейной модели на адекватность
- •6. Пример: «Как повысить производительность труда сотрудников Компании»
- •6.1. Занятие 1
- •1. Метод «Исключение квазинеизменных переменных»
- •2. Метод анализа вектора и матрицы коэффициентов корреляции
- •3. Выбор существенных объясняющих переменных с помощью коэффициента множественной корреляции
- •4. Выбор существенных объясняющих переменных методом показателей информационной емкости
- •6.2. Занятие 2
- •6.3. Занятие 3
- •Список использованных и рекомендуемых источников
- •Приложение 1
- •Приложение 2 Распределение Стьюдента (t-распределение)
- •Критические точки распределения Стьюдента
- •Распределение Дарбина-Уотсона
- •Проверка адекватности полученной регрессии
6.1. Занятие 1
Выбор формы представления модели
Будем предполагать, что производительность труда y линейным образом зависит от каждого из выбранных факторов xi, т.е. мы выбираем модель в виде линейной множественной регрессии
yi = а0 + а1∙x1i + а2∙x2i + а3∙x3i + а4∙x4i+ а5∙x5i+ а6∙x6i +ui (6.1)
где yi - объясняемая переменная, i – номер наблюдения, аi – параметры модели (коэффициенты перед переменными), xji – j-я объясняющая переменная в i-ом наблюдении, ui – случайный остаток (ошибка, отклонение), как результат воздействия множества других факторов, не вошедших в модель.
Проверка однородности выборки
При визуальном просмотре исходной матрицы данных легко улавливается аномалия на пятом объекте в таблице 6.1. Скорее всего, в данном случае, мы сталкиваемся с заводом-гигантом. Поэтому данное наблюдение мы исключаем из рассмотрения. Обновлённая матрица данных представлена в табл. 6.2.
Таблица 6.2
-
№ объекта
наблюдения
y
x1
x2
x3
x4
x5
x6
1
10,4
865
651
2627
54
165
4,2
2
19,7
9571
1287
9105
105
354
13,3
3
17,7
1334
1046
3045
85
400
4
4
17,5
6944
944
2554
79
312
5,6
5
13,1
4425
1084
4089
92
341
4,1
6
14,4
4662
1260
6417
105
496
7,3
7
15,1
2100
1212
4845
101
264
8,7
8
11,9
1215
254
10300
19
78
1,9
9
13,9
5191
1795
9602
150
375
10,1
10
19,5
4965
2851
12542
240
404
12
11
14,5
2067
1156
6718
96
461
9,2
12
12,5
2262
1040
6920
103
422
9,8
13
19,8
3210
1421
3120
126
542
11,6
Выбор существенных объясняющих переменных модели
1. Метод «Исключение квазинеизменных переменных»
На основе заданных исходных данных множественной линейной модели (см. Табл. 6.2) и заданного критического значения v* (например, v*=0,5) проведем исключение квазинеизменных переменных xi. Для рассматриваемого примера рассчитаем средние арифметические значения переменных x1, x2, x3, x4, x5, x6 по формуле (2.4). Они будут следующими:
х1 = 3754,69, х2 = 1230,85, х3 = 6299,77, х4 = 104,23, х5 = 354,92, х6 =7,83.
Рассчитаем далее по формуле (2.5) стандартные отклонения для переменных x1, x2, x3, x4, x5, x6 (см. рис. 6.1).
№ |
(x1-xср)2 |
(x2-xср)2 |
(x3-xср)2 |
(x4-xср)2 |
(x5-xср)2 |
(x6-xср)2 |
1 |
8350321,63 |
336221,56 |
13481889 |
2523,13 |
36070,78 |
13,18 |
2 |
33829435,17 |
3153,25 |
7874931 |
0,59 |
0,85 |
29,91 |
3 |
5859751,25 |
34168,10 |
10587014 |
369,82 |
2031,93 |
14,67 |
4 |
10171683,56 |
82280,72 |
14023297 |
636,59 |
1842,39 |
4,98 |
5 |
449312,40 |
21563,79 |
4883080 |
149,59 |
193,85 |
13,92 |
6 |
823207,25 |
849,95 |
13978,51 |
0,59 |
19902,70 |
0,28 |
7 |
2738006,63 |
355,18 |
2113445 |
10,44 |
8267,01 |
0,76 |
8 |
6450037,02 |
954228,41 |
16009848 |
7264,28 |
76686,39 |
35,17 |
9 |
2062979,79 |
318269,56 |
10911334 |
2094,82 |
403,08 |
5,15 |
10 |
1464844,71 |
2624898,49 |
38977930 |
18433,28 |
2408,54 |
17,38 |
11 |
2848305,33 |
5601,95 |
175754,4 |
67,75 |
11252,31 |
1,87 |
12 |
2228130,33 |
36422,25 |
385927,7 |
1,51 |
4499,31 |
3,88 |
13 |
296689,71 |
36158,49 |
10104574 |
473,90 |
34997,78 |
14,21 |
|
|
|
|
|
|
|
∑ |
77572704,77 |
4454171,69 |
129543002 |
32026,31 |
198556,92 |
155,37 |
Si=√ |
2442,77 |
585,34 |
3156,71 |
49,63 |
123,59 |
3,46 |
Рисунок 6.1
Стандартные отклонения потенциальных объясняющих переменных равны соответственно:
Коэффициенты вариации рассматриваемых переменных принимают следующие значения (рассчитываются по формуле 2.3):
Поскольку значения коэффициентов вариации только у переменных x1 и x3 больше заданного критического значения v*, то по данному методу только эти переменные и остаются в числе множества потенциальных объясняющих переменных. Тем самым, используя данный метод, множественная линейная модель будет иметь следующую спецификацию:
Y= a0 +a1·x1 + a3·x3 + u
Тем самым, на основании данного метода выбора существенных показателей и имеющемуся набору исходных статистических данных для линейной эконометрической модели в качестве основных показателей (значащих факторов), влияющие на производительность труда, следует выбрать x1 – стоимость сырья и материалов (тыс. руб.) и x3 – основные промышленно-производственные фонды (тыс. руб.).
