
3. Модель множествнной линейной регрессии
МЕТОДИЧЕСКИЕ УКАЗАНИЯ
Уравнением множественной линейной регрессии называется уравнение вида
,
(3.1)
где b0, b1, b2, …, bm – оценки параметров уравнения регрессии.
Параметры уравнения (3.1) оценивают при помощи МНК. Для линейного уравнения множественной регрессии их можно найти, построив систему нормальных уравнений (3.2).
(3.2)
Решив систему (3.2), получим значения коэффициентов уравнения (3.1). Для n наблюдений уравнение (3.1) можно записать также в матричной форме
,
(3.3)
где
,
,
,
.
Тогда матрицу коэффициентов В можно рассчитать по формуле
,
(3.4)
где
– матрица, транспонированная к X.
Статистическую значимость коэффициентов уравнения регрессии оценивают на основе расчета t-статистик:
,
,
,
(3.5)
где
– стандартная ошибка уравнения регрессии,
– j-й
диагональный элемент матрицы
,
– стандартная ошибка коэффициента
.
Качество уравнения регрессии проверяют на основе расчета коэффициента множественной детерминации:
.
(3.6)
Коэффициент детерминации показывает, на сколько процентов факторы, включенные в модель регрессии, объясняют вариацию результативного фактора y.
Значимость (адекватность) уравнения регрессии в целом проверяется с помощью F-статистики Фишера:
.
(3.7)
Построенная модель
считается адекватной, если расчетное
значение
.
Значение
– критическая точка распределения
Фишера для уровня значимости
и числа степеней свободы df1
= m,
df2
= n
– m
– 1, где m
– число независимых переменных, n
– число наблюдений.
При построении
уравнения множественной регрессии
может возникнуть проблема
мультиколлинеарности, т.е. тесной
линейной зависимости, независимых
факторов. Считается, что переменные xi
и xj
явно коллинеарны, если частный коэффициент
линейной корреляции
.
Этот коэффициент легко найти, используя
формулу (1.3). Простейшим способом
устранения мультиколлинеарности
является включение в модель только тех
факторов, которые довольно сильно влияют
на результирующий признак и имеют
наименьшую тесноту связи между собой.
Средние коэффициенты эластичности для линейной регрессии рассчитываются по формуле:
.
(3.8)
Для построения уравнения множественной регрессии можно также использовать линеаризуемые функции:
степенная –
,
экспоненциальная –
,
гиперболическая –
.
Пример 3. По 16 предприятиям региона (табл. 3.1) изучается зависимость прибыли y (тыс. руб.) от объема продажи товаров x1 (тыс. шт.) и себестоимости x2 (руб.).
Таблица 3.1
-
Номер предприятия
Прибыль
Объем продаж
Себестоимость
i
y
x1
x2
1
209
11,6
146
2
304
14,5
98
3
303
15,4
145
4
338
17,9
140
5
392
19,5
122
6
351
21,3
150
7
467
25
112
8
460
28
129
9
478
30
130
10
507
39
142
11
540
22,5
104
12
559
21,5
122
13
570
38
104
14
635
40
102
15
679
44
100
16
700
45
96
Проанализировать коэффициенты парной линейной корреляции.
Составить уравнение линейной регрессии зависимости прибыли от объема продаж и себестоимости продукции.
Оценить статистическую значимость коэффициентов уравнения.
Оценить качество и статистическую значимость построенного уравнения. Найти среднюю ошибку аппроксимации.
Рассчитать коэффициенты эластичности и сравнить на их основе силу влияния каждого фактора на результативный показатель.
Рассчитать прогноз прибыли, если планируемые значения объема продаж и себестоимости составят 90% от среднего уровня.
Решение.
Рассчитаем коэффициент парной линейной корреляции между факторами х1 и х2. Для этого составим рабочую таблицу (табл. 3.2).
Таблица 3.2
i |
x1 |
x2 |
x1x2 |
1 |
11,6 |
146 |
1693,6 |
2 |
14,5 |
98 |
1421 |
3 |
15,4 |
145 |
2233 |
4 |
17,9 |
140 |
2506 |
5 |
19,5 |
122 |
2379 |
6 |
21,3 |
150 |
3195 |
7 |
25 |
112 |
2800 |
8 |
28 |
129 |
3612 |
9 |
30 |
130 |
3900 |
10 |
39 |
142 |
5538 |
11 |
22,5 |
104 |
2340 |
12 |
21,5 |
122 |
2623 |
13 |
38 |
104 |
3952 |
14 |
40 |
102 |
4080 |
15 |
44 |
100 |
4400 |
16 |
45 |
96 |
4320 |
Сумма |
433,2 |
1942 |
50992,6 |
Среднее |
27,08 |
121,38 |
3187,04 |
σ |
10,64 |
18,71 |
|
Используя формулу (1.3) и данные таблицы 3.2, получим
,
что говорит о слабой линейной зависимости между факторами x1 и x2.
Аналогично
рассчитаем коэффициенты парной корреляции
,
.
Значит между факторами х1
и y
наблюдается тесная, а между факторами
x2
и y
умеренная линейная зависимость.
Найдем коэффициенты линейного уравнения множественной регрессии, используя формулу (3.4):
,
,
,
.
Итак, мы получили
уравнение регрессии:
.
Значит при увеличении объема продаж
товаров на 1 тыс. шт. прибыль предприятия
должна увеличиться в среднем на 9,67 тыс.
руб. при неизменном уровне себестоимости.
Если себестоимость продукции увеличится
на 1 руб. при неизменности объема продаж,
прибыль уменьшится на 2,26 тыс. руб.
Рассчитаем t-статистики для коэффициентов построенного уравнения.
Таблица 3.3
i |
y |
x1 |
x2 |
|
e |
e2 |
А |
1 |
209 |
11,6 |
146 |
262,95 |
-53,95 |
2910,276 |
25,81% |
2 |
304 |
14,5 |
98 |
399,59 |
-95,59 |
9137,681 |
31,44% |
3 |
303 |
15,4 |
145 |
301,94 |
1,06 |
1,121866 |
0,35% |
4 |
338 |
17,9 |
140 |
337,42 |
0,58 |
0,336613 |
0,17% |
5 |
392 |
19,5 |
122 |
393,62 |
-1,62 |
2,609094 |
0,41% |
6 |
351 |
21,3 |
150 |
347,66 |
3,34 |
11,17676 |
0,95% |
7 |
467 |
25 |
112 |
469,41 |
-2,41 |
5,79029 |
0,52% |
8 |
460 |
28 |
129 |
459,94 |
0,06 |
0,0039 |
0,01% |
9 |
478 |
30 |
130 |
477,01 |
0,99 |
0,986183 |
0,21% |
10 |
507 |
39 |
142 |
536,85 |
-29,85 |
890,929 |
5,89% |
11 |
540 |
22,5 |
104 |
463,34 |
76,66 |
5876,261 |
14,20% |
12 |
559 |
21,5 |
122 |
412,95 |
146,05 |
21331,36 |
26,13% |
13 |
570 |
38 |
104 |
613,17 |
-43,17 |
1863,421 |
7,57% |
14 |
635 |
40 |
102 |
637,03 |
-2,03 |
4,100747 |
0,32% |
15 |
679 |
44 |
100 |
680,21 |
-1,21 |
1,475858 |
0,18% |
16 |
700 |
45 |
96 |
698,93 |
1,07 |
1,140679 |
0,15% |
Сумма |
7492 |
433,2 |
1942 |
7492 |
0,00 |
42038,67 |
114,31% |
Среднее |
468,25 |
27,08 |
121,38 |
468,25 |
|
|
7,14% |
σ |
139,05 |
10,64 |
18,71 |
|
|
|
|
Стандартная ошибка уравнения регрессии (см. табл. 3.3):
.
Стандартные ошибки коэффициентов уравнения:
,
,
.
t-статистики коэффициентов уравнения:
;
;
.
Для уровня значимости 0,05 и 13 степеней свободы tкр = 2,16. Все расчетные t-статистики оказались удовлетворительными, т.к. они по абсолютной величине больше tкр.
Рассчитаем коэффициент детерминации (табл. 3.3):
.
Факторы, включенные в модель, на 86% объясняют изменение прибыли предприятия.
Модель является
адекватной, т.к.
больше Fкр
= 3,81, найденного для
= 0,05, df1
= 2, df2
= 13.
Средняя ошибка аппроксимации (табл. 3.3) равна:
,
что говорит о хорошем качестве подбора модели.
Коэффициенты эластичности:
,
.
Увеличение объема продаж на 1% приводит к увеличению прибыли предприятия на 0,56%. Увеличение себестоимости единицы продукции на 1% приведет к снижению прибыли на 0,59%. Таким образом, более сильное влияние на прибыль оказывает изменение себестоимости.
Рассчитаем прогноз прибыли:
,
,
тыс. руб.
Итак, если объем продаж будет составлять 24,37 тыс. шт., а себестоимость – 109,24 руб., то прибыль должна оказаться на уровне 469,54 тыс. руб.