- •Компьютерный практикум
- •1. Типы роста и трендовые модели
- •2. Множественная регрессия
- •Independent variable list – независимые переменные )
- •3. Обобщенный регрессионный анализ
- •4. Регрессионные модели
- •5. Регрессионные модели
- •6. Авторегрессионные процессы и их модели
- •7. Адаптивные модели прогнозирования
- •Объем продаж новых автомобилей в сша, шт.
- •8. Прогнозирование сезонных колебаний
2. Множественная регрессия
Пример 2. Руководство ОАО «Железные дороги» вынуждено периодически повышать цены на свои услуги. То, что повышение цен явно негативным образом влияет на число пассажиров, пользующихся услугами железной дороги, можно понять, проанализировав, в частности, данные табл. 8.
Т а б л и ц а 8
Показатели, характеризующие деятельность ОАО «Железные дороги»
Стоимость проезда 1 чел. в поезде Воронеж – Москва, руб. |
Среднемесячное число пассажиров поезда Воронеж – Москва |
Стоимость проезда 1 чел. в поезде Воронеж – Москва, руб. |
Среднемесячное число пассажиров поезда Воронеж – Москва |
180 |
12390 |
460 |
11460 |
180 |
12600 |
460 |
11010 |
230 |
11910 |
460 |
10620 |
230 |
11940 |
575 |
9690 |
230 |
11580 |
575 |
9510 |
345 |
11730 |
685 |
9870 |
345 |
11490 |
685 |
8910 |
345 |
11400 |
685 |
8580 |
Руководство планирует в следующем периоде поднять цены на билеты для пассажиров поезда Воронеж – Москва. В этой связи было решено поручить студенту экономического факультета, проходящему практику в отделе экономического анализа управления железной дороги, известным ему методом спрогнозировать среднемесячное число пассажиров поезда при условии, что билет на этот поезд будет стоить 690 руб. Студент-практикант решил применить к имеющимся данным регрессионный анализ и, воспользовавшись его результатами, получить требуемую прогнозную оценку.
Решение с помощью MS Excel
-
Ввод исходных данных.
-
Подготовка данных для расчета оценок коэффициентов линейной регрессии и оформление их в виде табл. 9.
Т а б л и ц а 9
Промежуточные расчеты оценок коэффициентов регрессионного уравнения
№ п.п. |
|||||
1. |
180 |
12390 |
32400 |
2230200 |
153512100 |
2. |
180 |
12600 |
32400 |
2268000 |
158760000 |
3. |
230 |
11910 |
52900 |
2739300 |
141848100 |
4. |
230 |
11940 |
52900 |
2746200 |
142563600 |
5. |
230 |
11580 |
52900 |
2663400 |
134096400 |
6. |
345 |
11730 |
119025 |
4046850 |
137592900 |
7. |
345 |
11490 |
119025 |
3964050 |
132020100 |
8. |
345 |
11400 |
119025 |
3933000 |
129960000 |
9. |
460 |
11460 |
211600 |
5271600 |
131331600 |
10. |
460 |
11010 |
211600 |
5064600 |
121220100 |
11. |
460 |
10620 |
211600 |
4885200 |
112784400 |
12. |
575 |
9690 |
330625 |
5571750 |
93896100 |
13. |
575 |
9510 |
330625 |
5468250 |
90440100 |
14. |
685 |
9870 |
469225 |
6760950 |
97416900 |
15. |
685 |
8910 |
469225 |
6103350 |
79388100 |
16. |
685 |
8580 |
469225 |
5877300 |
73616400 |
Средние значения |
416,88 |
10918,13 |
205268,75 |
4349625,00 |
120652931,25 |
-
Расчет оценок коэффициентов регрессии
, .
Таким образом, построенная модель может быть записана в виде
.
Коэффициент этой модели показывает, что в среднем увеличение стоимости проезда на 1 руб. приводит к уменьшению числа пассажиров на 6 человек.
-
Расчет коэффициентов корреляции и детерминации
; ;
; .
Коэффициент корреляции достаточно высокий, что свидетельствует о существенной зависимости среднемесячного числа пассажиров от стоимости проезда. Коэффициент детерминации также достаточно высокий, он показывает, что число пассажиров объясняется стоимостью проезда на 89%.
-
Расчет дисперсионного отношения Фишера
.
Сравнение расчетного значения F-критерия с табличным для 5%-го уровня значимости (см. Приложение) позволяет сделать вывод об адекватности построенной модели.
-
Расчет стандартных ошибок по формулам, в которых используется средняя квадратическая ошибка , вычисленная в соответствии с данными табл. 10.
, .
Т а б л и ц а 10
Промежуточные расчеты стандартных ошибок
№ п.п. |
||||
1. |
180 |
12390 |
12436,92 |
2201,04 |
2. |
180 |
12600 |
12436,92 |
26596,64 |
3. |
230 |
11910 |
12116,33 |
42570,52 |
4. |
230 |
11940 |
12116,33 |
31090,95 |
5. |
230 |
11580 |
12116,33 |
287645,85 |
6. |
345 |
11730 |
11378,97 |
123220,91 |
7. |
345 |
11490 |
11378,97 |
12327,30 |
8. |
345 |
11400 |
11378,97 |
442,19 |
9. |
460 |
11460 |
10641,62 |
669750,71 |
10. |
460 |
11010 |
10641,62 |
135706,02 |
11. |
460 |
10620 |
10641,62 |
467,30 |
12. |
575 |
9690 |
9904,26 |
45908,38 |
13. |
575 |
9510 |
9904,26 |
155442,84 |
14. |
685 |
9870 |
9198,97 |
450285,72 |
15. |
685 |
8910 |
9198,97 |
83501,74 |
16. |
685 |
8580 |
9198,97 |
383119,74 |
Сумма квадратов отклонений расчетных от фактических значений |
2450277,85 |
|||
Среднеквадратическая ошибка |
418,35 |
-
Расчет t-статистик Стьюдента
, .
Сравнение расчетных значений с табличным (см. Приложение) подтверждает значимость коэффициентов регрессии.
-
Расчет доверительных границ для коэффициентов регрессии
, ,
; ;
; .
-
Построение линейного уравнения регрессии и расчет всех его характеристик с помощью пакета «Анализ данных» Excel (см. Вывод итогов 3)
ВЫВОД ИТОГОВ 3 |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
Регрессионная статистика |
|
|
|
|
|||
Множественный R |
0,945622 |
|
|
|
|
|
|
R-квадрат |
0,894201 |
|
|
|
|
|
|
Нормированный R-квадрат |
0,886643 |
|
|
|
|
|
|
Стандартная ошибка |
418,3537 |
|
|
|
|
|
|
Наблюдения |
16 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Дисперсионный анализ |
|
|
|
|
|||
|
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
1 |
20709366 |
20709366 |
118,3258 |
3,26E-08 |
|
|
Остаток |
14 |
2450278 |
175019,8 |
|
|
|
|
Итого |
15 |
23159644 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Коэффи-циенты |
Стандарт-ная ошибка |
t-статис-тика |
P-Зна-чение |
Нижние 95% |
Верхние 95% |
|
Y-пересечение |
13591,04 |
267,0547 |
50,89233 |
2,73E-17 |
13018,26 |
14163,81 |
|
Переменная X 1 |
-6,41178 |
0,589439 |
-10,8778 |
3,26E-08 |
-7,676 |
-5,14756 |
-
Получение прогнозной оценки числа пассажиров
.
-
Расчет доверительных границ прогнозной оценки
,
.
Пример 3. Экономисту-аналитику одной крупной компании было поручено указать обоснованный размер заработной платы руководителя будущего филиала этой компании. Ожидаемый объем среднемесячных продаж филиала составит 6500 тыс. у.е. Сотрудник, который, как планируется, должен занять пост руководителя, имеет законченное высшее образование, а срок работы в должности директора другого филиала компании – 3 года. С целью решения поставленной задачи экономист-аналитик решил сначала изучить опыт других компаний, собрав сведения, представленные в табл. 11, в которой за обозначена среднемесячная заработная плата руководителей, у.е.; за – образование (0 – нет высшего образование, 1 – незаконченное высшее, 2 – высшее); за – срок работы в должности руководителя, лет; за – годовой объем продаж компании, тыс. у.е.
Т а б л и ц а 11
Данные о 30 российских компаниях
Компания |
Компания |
||||||||
1 |
453 |
0 |
26 |
872 |
16 |
1 652 |
2 |
14 |
12 949 |
2 |
1 948 |
2 |
23 |
1 227 |
17 |
782 |
1 |
9 |
5 061 |
3 |
1 735 |
2 |
15 |
1 712 |
18 |
613 |
1 |
1 |
1 929 |
4 |
643 |
1 |
23 |
1 681 |
19 |
1 488 |
2 |
8 |
2 643 |
5 |
1 461 |
2 |
8 |
5 673 |
20 |
447 |
2 |
1 |
1 084 |
6 |
357 |
0 |
1 |
1 117 |
21 |
1 752 |
1 |
14 |
5 137 |
7 |
669 |
1 |
2 |
1 475 |
22 |
2 497 |
0 |
30 |
844 |
8 |
2 094 |
2 |
8 |
10 818 |
23 |
768 |
1 |
8 |
2 097 |
9 |
597 |
0 |
23 |
2 686 |
24 |
2 342 |
2 |
34 |
835 |
10 |
889 |
1 |
5 |
220 |
25 |
3 409 |
1 |
30 |
14 021 |
11 |
514 |
0 |
3 |
661 |
26 |
2 244 |
2 |
5 |
4 451 |
12 |
466 |
1 |
2 |
1 539 |
27 |
601 |
2 |
5 |
1 911 |
13 |
2 833 |
2 |
14 |
11 663 |
28 |
1 554 |
1 |
17 |
1 435 |
14 |
427 |
1 |
15 |
2 366 |
29 |
462 |
0 |
11 |
1 314 |
15 |
1 856 |
2 |
3 |
4 864 |
30 |
587 |
0 |
5 |
2 301 |
Постройте модель множественной регрессии, отражающую зависимость среднемесячной зарплаты от указанных факторов, и оцените ее качество. Используя построенную модель, осуществите прогнозный расчет заработной платы руководителя будущего филиала компании.
Решение с помощью табличного процессора Excel
1. Ввод исходных данных с включением дополнительной переменной , принимающей единственное значение, равное 1.
2. Расчет коэффициентов регрессии с использованием матричных функций Excel: ТРАНСП, МУМНОЖ, МОБР.
;
; .
Таким образом, построенная модель имеет следующий вид:
.
3. Расчет стандартных ошибок коэффициентов регрессии
3.1. Проведение промежуточных расчетов, требуемых для расчета остаточной дисперсии, и оформление их в виде табл. 12.
Т а б л и ц а 12
Промежуточные расчеты остаточной дисперсии
Компания |
Компания |
||||||
1 |
453 |
1154,46 |
492052,43 |
17 |
782 |
1228,95 |
199768,26 |
2 |
1948 |
1797,72 |
22583,26 |
18 |
613 |
600,01 |
168,62 |
3 |
1735 |
1517,37 |
47362,93 |
19 |
1488 |
1320,89 |
27926,87 |
4 |
643 |
1475,62 |
693262,60 |
20 |
447 |
884,43 |
191345,71 |
5 |
1461 |
1612,90 |
23074,14 |
21 |
1752 |
1440,71 |
96899,55 |
6 |
357 |
155,91 |
40439,03 |
22 |
2497 |
1315,31 |
1396383,37 |
7 |
669 |
597,15 |
5162,82 |
23 |
768 |
902,41 |
18066,92 |
8 |
2094 |
2108,75 |
217,54 |
24 |
2342 |
2209,70 |
17503,54 |
9 |
597 |
1206,63 |
371645,73 |
25 |
3409 |
2951,09 |
209677,47 |
10 |
889 |
598,86 |
84182,61 |
26 |
2244 |
1372,47 |
759562,00 |
11 |
514 |
193,73 |
102571,43 |
27 |
601 |
1127,68 |
277391,76 |
12 |
466 |
603,32 |
18855,47 |
28 |
1554 |
1206,59 |
120690,40 |
13 |
2833 |
2435,51 |
158000,95 |
29 |
462 |
583,76 |
14825,39 |
14 |
427 |
1214,55 |
620228,48 |
30 |
587 |
433,56 |
23543,75 |
15 |
1856 |
1330,50 |
276149,72 |
Сумма квадратов отклонений |
7132998,11 |
||
16 |
1652 |
2559,44 |
823455,38 |
Остаточная дисперсия |
274346,08 |
3.2. Получение стандартных ошибок
;;
;.
4. Расчет t-статистик
; ;
; .
Сравнение полученных t-статистик с табличным значением (см. Приложение) подтверждает значимость таких коэффициентов регрессии, как , , , и незначимость коэффициента .
5. Вычисление множественного коэффициента корреляции.
5.1. Проведение промежуточных расчетов и оформление их в виде табл. 13.
Т а б л и ц а 13
Промежуточные расчеты множественного коэффициента корреляции
669669,44 |
1,36 |
193,21 |
7187046,08 |
457877,78 |
0,69 |
118,81 |
5409655,75 |
214986,78 |
0,69 |
8,41 |
3388790,08 |
394802,78 |
0,03 |
118,81 |
3503884,82 |
35973,44 |
0,69 |
16,81 |
4494965,35 |
836005,44 |
1,36 |
123,21 |
5933446,42 |
362805,44 |
0,03 |
102,01 |
4317529,88 |
676780,44 |
0,69 |
16,81 |
52782162,35 |
454725,44 |
1,36 |
118,81 |
751457,82 |
146178,78 |
0,03 |
50,41 |
11108000,22 |
573553,78 |
1,36 |
82,81 |
8362892,82 |
648561,78 |
0,03 |
102,01 |
4055658,95 |
2438802,78 |
0,69 |
3,61 |
65774262,68 |
712898,78 |
0,03 |
8,41 |
1408652,48 |
341835,11 |
0,69 |
82,81 |
1719070,62 |
144907,11 |
0,69 |
3,61 |
88287321,62 |
239447,11 |
0,03 |
9,61 |
2274466,15 |
433402,78 |
0,03 |
123,21 |
2636942,95 |
46944,44 |
0,69 |
16,81 |
827857,35 |
679525,44 |
0,69 |
123,21 |
6095302,62 |
231040,44 |
0,03 |
3,61 |
2509478,42 |
1502258,78 |
1,36 |
320,41 |
7337958,62 |
253344,44 |
0,03 |
16,81 |
2119547,75 |
1146327,11 |
0,69 |
479,61 |
7386799,22 |
4569618,78 |
0,03 |
320,41 |
109581815,48 |
946080,44 |
0,69 |
50,41 |
806643,48 |
449346,78 |
0,69 |
50,41 |
2695726,15 |
79900,44 |
0,03 |
24,01 |
4485359,22 |
655020,44 |
1,36 |
1,21 |
5012523,95 |
468312,11 |
1,36 |
50,41 |
1567170,15 |
Сумма квадратов отклонений |
|||
20810934,67 |
18,17 |
2740,70 |
423822389,47 |
Дисперсия |
|||
717618,44 |
0,63 |
94,51 |
14614565,15 |
Среднеквадратическое отклонение |
|||
847,12 |
0,79 |
9,72 |
3822,90 |
5.2. Расчет множественного коэффициента корреляции
.
Множественный коэффициент корреляции достаточно высокий, что свидетельствует о существенной зависимости величины заработной платы от включенных в модель факторов.
6. Расчет бета-коэффициентов
;
;
.
Полученные значения бета-коэффициенты позволяют проранжировать факторы по степени их влияния на моделируемый показатель следующим образом:
1) стаж работы в должности руководителя (в большей степени влияющий фактор);
2) годовой объем продаж компании;
3) образование (в меньшей степени влияющий фактор).
7. Вычисление парных коэффициентов корреляции.
7.1. Проведение промежуточных расчетов и оформление результатов расчетов в виде табл. 14.
Т а б л и ц а 14
Промежуточные расчеты парных коэффициентов корреляции
1 |
2 |
3 |
954,72 |
-11374,83 |
2193842,56 |
563,89 |
7375,67 |
-1573836,44 |
386,39 |
1344,63 |
-853548,51 |
104,72 |
-6848,83 |
1176156,22 |
158,06 |
-777,63 |
402118,62 |
1066,72 |
10149,10 |
2227194,09 |
100,39 |
6083,57 |
1251568,36 |
685,56 |
-3372,93 |
5976783,02 |
786,72 |
-7350,23 |
584557,09 |
63,72 |
2714,57 |
1274266,02 |
883,56 |
6891,73 |
2190107,02 |
134,22 |
8133,87 |
1621833,96 |
1301,39 |
2967,17 |
12665324,89 |
140,72 |
-2448,57 |
1002111,09 |
487,22 |
-5320,47 |
766575,96 |
317,22 |
723,27 |
3576794,76 |
81,56 |
1516,93 |
-737979,91 |
109,72 |
7307,50 |
1069045,56 |
180,56 |
-888,33 |
-197137,78 |
-686,94 |
9150,10 |
2035169,09 |
-80,11 |
913,27 |
761440,09 |
-1429,94 |
21939,43 |
-3320167,58 |
83,89 |
2063,67 |
732786,22 |
892,22 |
23447,60 |
-2909929,24 |
-356,28 |
38264,23 |
22377379,69 |
810,56 |
-6905,93 |
873584,36 |
-558,61 |
4759,37 |
1100597,96 |
Окончание табл. 14
1 |
2 |
3 |
-47,11 |
1385,07 |
-598650,31 |
944,22 |
890,27 |
1811989,42 |
798,39 |
4858,77 |
856694,09 |
Суммы произведений |
||
8877,33 |
117592,00 |
58336670,33 |
7.2. Расчет парных коэффициентов корреляции
; ;
.
8. Вычисление дисперсионного отношения Фишера
.
Сравнение расчетного значения F-критерия с табличным для 5%-го уровня значимости (см. Приложение) позволяет сделать вывод об адекватности построенной модели.
9. Построение с помощью «Пакета анализа» линейного регрессионного уравнения (см. Вывод итогов 4).
ВЫВОД ИТОГОВ 4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Регрессионная статистика |
|
|
|
|
|
|
Множественный R |
0,8107080 |
|
|
|
|
|
R-квадрат |
0,6572475 |
|
|
|
|
|
Нормированный R-квадрат |
0,617699 |
|
|
|
|
|
Стандартная ошибка |
523,78056 |
|
|
|
|
|
Наблюдения |
30 |
|
|
|
|
|
|
|
|
|
|
|
|
Дисперсионный анализ |
|
|
|
|
|
|
|
df |
SS |
MS |
F |
Значимость F |
|
Регрессия |
3 |
13677937 |
4559312,19 |
16,618834 |
3,11E-06 |
|
Остаток |
26 |
7132998,1 |
274346,081 |
|
|
|
Итого |
29 |
20810935 |
|
|
|
|
|
|
|
|
|
|
|
|
Коэффи-циенты |
Стандартная ошибка |
t-статис-тика |
P-Зна- чение |
Нижние 95% |
Верхние 95% |
Y-пересечение |
7,3681327 |
219,864 |
0,033512 |
0,9735221 |
-444,57 |
459,306 |
Переменная X 1 |
365,8528 |
133,786 |
2,734594 |
0,0110946 |
90,8498 |
640,855 |
Переменная X 2 |
40,886834 |
10,2142 |
4,002904 |
0,0004639 |
19,8910 |
61,8826 |
Переменная X 3 |
0,0963746 |
0,02780 |
3,466448 |
0,0018469 |
0,03922 |
0,15352 |
10. Использование построенной модели в прогнозных целях
у.е.
Решение с помощью системы STATISTICA
-
Ввод исходных данных (без включения дополнительной переменной).
-
Вызов модуля «Множественная регрессия» (Статистика / Множественная регрессия, см. рис. 2).
Рис. 2. Меню Статистика
-
Выбор переменных для анализа (Multiple Linear regressions / Variables / OK / Select dependent and independent variable lists / OK, см. рис. 3).
Рис. 3. Выбор переменных для анализа (dependent var. – зависимая переменная;