Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пособие_Часть_2_корр1.doc
Скачиваний:
52
Добавлен:
06.12.2018
Размер:
7.01 Mб
Скачать

2. Множественная регрессия

Пример 2. Руководство ОАО «Железные дороги» вынуждено периодически повышать цены на свои услуги. То, что повышение цен явно негативным образом влияет на число пассажиров, пользующихся услугами железной дороги, можно понять, проанализировав, в частности, данные табл. 8.

Т а б л и ц а 8

Показатели, характеризующие деятельность ОАО «Железные дороги»

Стоимость проезда 1 чел. в поезде Воронеж – Москва, руб.

Среднемесячное число пассажиров поезда Воронеж – Москва

Стоимость проезда 1 чел. в поезде Воронеж – Москва, руб.

Среднемесячное число пассажиров поезда Воронеж – Москва

180

12390

460

11460

180

12600

460

11010

230

11910

460

10620

230

11940

575

9690

230

11580

575

9510

345

11730

685

9870

345

11490

685

8910

345

11400

685

8580

Руководство планирует в следующем периоде поднять цены на билеты для пассажиров поезда Воронеж – Москва. В этой связи было решено поручить студенту экономического факультета, проходящему практику в отделе экономического анализа управления железной дороги, известным ему методом спрогнозировать среднемесячное число пассажиров поезда при условии, что билет на этот поезд будет стоить 690 руб. Студент-практикант решил применить к имеющимся данным регрессионный анализ и, воспользовавшись его результатами, получить требуемую прогнозную оценку.

Решение с помощью MS Excel

  1. Ввод исходных данных.

  2. Подготовка данных для расчета оценок коэффициентов линейной регрессии и оформление их в виде табл. 9.

Т а б л и ц а 9

Промежуточные расчеты оценок коэффициентов регрессионного уравнения

п.п.

1.

180

12390

32400

2230200

153512100

2.

180

12600

32400

2268000

158760000

3.

230

11910

52900

2739300

141848100

4.

230

11940

52900

2746200

142563600

5.

230

11580

52900

2663400

134096400

6.

345

11730

119025

4046850

137592900

7.

345

11490

119025

3964050

132020100

8.

345

11400

119025

3933000

129960000

9.

460

11460

211600

5271600

131331600

10.

460

11010

211600

5064600

121220100

11.

460

10620

211600

4885200

112784400

12.

575

9690

330625

5571750

93896100

13.

575

9510

330625

5468250

90440100

14.

685

9870

469225

6760950

97416900

15.

685

8910

469225

6103350

79388100

16.

685

8580

469225

5877300

73616400

Средние значения

416,88

10918,13

205268,75

4349625,00

120652931,25

  1. Расчет оценок коэффициентов регрессии

, .

Таким образом, построенная модель может быть записана в виде

.

Коэффициент этой модели показывает, что в среднем увеличение стоимости проезда на 1 руб. приводит к уменьшению числа пассажиров на 6 человек.

  1. Расчет коэффициентов корреляции и детерминации

; ;

; .

Коэффициент корреляции достаточно высокий, что свидетельствует о существенной зависимости среднемесячного числа пассажиров от стоимости проезда. Коэффициент детерминации также достаточно высокий, он показывает, что число пассажиров объясняется стоимостью проезда на 89%.

  1. Расчет дисперсионного отношения Фишера

.

Сравнение расчетного значения F-критерия с табличным для 5%-го уровня значимости (см. Приложение) позволяет сделать вывод об адекватности построенной модели.

  1. Расчет стандартных ошибок по формулам, в которых используется средняя квадратическая ошибка , вычисленная в соответствии с данными табл. 10.

, .

Т а б л и ц а 10

Промежуточные расчеты стандартных ошибок

п.п.

1.

180

12390

12436,92

2201,04

2.

180

12600

12436,92

26596,64

3.

230

11910

12116,33

42570,52

4.

230

11940

12116,33

31090,95

5.

230

11580

12116,33

287645,85

6.

345

11730

11378,97

123220,91

7.

345

11490

11378,97

12327,30

8.

345

11400

11378,97

442,19

9.

460

11460

10641,62

669750,71

10.

460

11010

10641,62

135706,02

11.

460

10620

10641,62

467,30

12.

575

9690

9904,26

45908,38

13.

575

9510

9904,26

155442,84

14.

685

9870

9198,97

450285,72

15.

685

8910

9198,97

83501,74

16.

685

8580

9198,97

383119,74

Сумма квадратов отклонений расчетных от фактических значений

2450277,85

Среднеквадратическая ошибка

418,35

  1. Расчет t-статистик Стьюдента

, .

Сравнение расчетных значений с табличным (см. Приложение) подтверждает значимость коэффициентов регрессии.

  1. Расчет доверительных границ для коэффициентов регрессии

, ,

; ;

; .

  1. Построение линейного уравнения регрессии и расчет всех его характеристик с помощью пакета «Анализ данных» Excel (см. Вывод итогов 3)

ВЫВОД ИТОГОВ 3

Регрессионная статистика

Множественный R

0,945622

R-квадрат

0,894201

Нормированный R-квадрат

0,886643

Стандартная ошибка

418,3537

Наблюдения

16

Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

1

20709366

20709366

118,3258

3,26E-08

Остаток

14

2450278

175019,8

Итого

15

23159644

 

 

 

 

Коэффи-циенты

Стандарт-ная ошибка

t-статис-тика

P-Зна-чение

Нижние 95%

Верхние 95%

Y-пересечение

13591,04

267,0547

50,89233

2,73E-17

13018,26

14163,81

Переменная X 1

-6,41178

0,589439

-10,8778

3,26E-08

-7,676

-5,14756

  1. Получение прогнозной оценки числа пассажиров

.

  1. Расчет доверительных границ прогнозной оценки

,

.

Пример 3. Экономисту-аналитику одной крупной компании было поручено указать обоснованный размер заработной платы руководителя будущего филиала этой компании. Ожидаемый объем среднемесячных продаж филиала составит 6500 тыс. у.е. Сотрудник, который, как планируется, должен занять пост руководителя, имеет законченное высшее образование, а срок работы в должности директора другого филиала компании – 3 года. С целью решения поставленной задачи экономист-аналитик решил сначала изучить опыт других компаний, собрав сведения, представленные в табл. 11, в которой за обозначена среднемесячная заработная плата руководителей, у.е.; за – образование (0 – нет высшего образование, 1 – незаконченное высшее, 2 – высшее); за – срок работы в должности руководителя, лет; за – годовой объем продаж компании, тыс. у.е.

Т а б л и ц а 11

Данные о 30 российских компаниях

Компания

Компания

1

453

0

26

872

16

1 652

2

14

12 949

2

1 948

2

23

1 227

17

782

1

9

5 061

3

1 735

2

15

1 712

18

613

1

1

1 929

4

643

1

23

1 681

19

1 488

2

8

2 643

5

1 461

2

8

5 673

20

447

2

1

1 084

6

357

0

1

1 117

21

1 752

1

14

5 137

7

669

1

2

1 475

22

2 497

0

30

844

8

2 094

2

8

10 818

23

768

1

8

2 097

9

597

0

23

2 686

24

2 342

2

34

835

10

889

1

5

220

25

3 409

1

30

14 021

11

514

0

3

661

26

2 244

2

5

4 451

12

466

1

2

1 539

27

601

2

5

1 911

13

2 833

2

14

11 663

28

1 554

1

17

1 435

14

427

1

15

2 366

29

462

0

11

1 314

15

1 856

2

3

4 864

30

587

0

5

2 301

Постройте модель множественной регрессии, отражающую зависимость среднемесячной зарплаты от указанных факторов, и оцените ее качество. Используя построенную модель, осуществите прогнозный расчет заработной платы руководителя будущего филиала компании.

Решение с помощью табличного процессора Excel

1. Ввод исходных данных с включением дополнительной переменной , принимающей единственное значение, равное 1.

2. Расчет коэффициентов регрессии с использованием матричных функций Excel: ТРАНСП, МУМНОЖ, МОБР.

;

; .

Таким образом, построенная модель имеет следующий вид:

.

3. Расчет стандартных ошибок коэффициентов регрессии

3.1. Проведение промежуточных расчетов, требуемых для расчета остаточной дисперсии, и оформление их в виде табл. 12.

Т а б л и ц а 12

Промежуточные расчеты остаточной дисперсии

Компания

Компания

1

453

1154,46

492052,43

17

782

1228,95

199768,26

2

1948

1797,72

22583,26

18

613

600,01

168,62

3

1735

1517,37

47362,93

19

1488

1320,89

27926,87

4

643

1475,62

693262,60

20

447

884,43

191345,71

5

1461

1612,90

23074,14

21

1752

1440,71

96899,55

6

357

155,91

40439,03

22

2497

1315,31

1396383,37

7

669

597,15

5162,82

23

768

902,41

18066,92

8

2094

2108,75

217,54

24

2342

2209,70

17503,54

9

597

1206,63

371645,73

25

3409

2951,09

209677,47

10

889

598,86

84182,61

26

2244

1372,47

759562,00

11

514

193,73

102571,43

27

601

1127,68

277391,76

12

466

603,32

18855,47

28

1554

1206,59

120690,40

13

2833

2435,51

158000,95

29

462

583,76

14825,39

14

427

1214,55

620228,48

30

587

433,56

23543,75

15

1856

1330,50

276149,72

Сумма квадратов отклонений

7132998,11

16

1652

2559,44

823455,38

Остаточная дисперсия

274346,08

3.2. Получение стандартных ошибок

;;

;.

4. Расчет t-статистик

; ;

; .

Сравнение полученных t-статистик с табличным значением (см. Приложение) подтверждает значимость таких коэффициентов регрессии, как , , , и незначимость коэффициента .

5. Вычисление множественного коэффициента корреляции.

5.1. Проведение промежуточных расчетов и оформление их в виде табл. 13.

Т а б л и ц а 13

Промежуточные расчеты множественного коэффициента корреляции

669669,44

1,36

193,21

7187046,08

457877,78

0,69

118,81

5409655,75

214986,78

0,69

8,41

3388790,08

394802,78

0,03

118,81

3503884,82

35973,44

0,69

16,81

4494965,35

836005,44

1,36

123,21

5933446,42

362805,44

0,03

102,01

4317529,88

676780,44

0,69

16,81

52782162,35

454725,44

1,36

118,81

751457,82

146178,78

0,03

50,41

11108000,22

573553,78

1,36

82,81

8362892,82

648561,78

0,03

102,01

4055658,95

2438802,78

0,69

3,61

65774262,68

712898,78

0,03

8,41

1408652,48

341835,11

0,69

82,81

1719070,62

144907,11

0,69

3,61

88287321,62

239447,11

0,03

9,61

2274466,15

433402,78

0,03

123,21

2636942,95

46944,44

0,69

16,81

827857,35

679525,44

0,69

123,21

6095302,62

231040,44

0,03

3,61

2509478,42

1502258,78

1,36

320,41

7337958,62

253344,44

0,03

16,81

2119547,75

1146327,11

0,69

479,61

7386799,22

4569618,78

0,03

320,41

109581815,48

946080,44

0,69

50,41

806643,48

449346,78

0,69

50,41

2695726,15

79900,44

0,03

24,01

4485359,22

655020,44

1,36

1,21

5012523,95

468312,11

1,36

50,41

1567170,15

Сумма квадратов отклонений

20810934,67

18,17

2740,70

423822389,47

Дисперсия

717618,44

0,63

94,51

14614565,15

Среднеквадратическое отклонение

847,12

0,79

9,72

3822,90

5.2. Расчет множественного коэффициента корреляции

.

Множественный коэффициент корреляции достаточно высокий, что свидетельствует о существенной зависимости величины заработной платы от включенных в модель факторов.

6. Расчет бета-коэффициентов

;

;

.

Полученные значения бета-коэффициенты позволяют проранжировать факторы по степени их влияния на моделируемый показатель следующим образом:

1) стаж работы в должности руководителя (в большей степени влияющий фактор);

2) годовой объем продаж компании;

3) образование (в меньшей степени влияющий фактор).

7. Вычисление парных коэффициентов корреляции.

7.1. Проведение промежуточных расчетов и оформление результатов расчетов в виде табл. 14.

Т а б л и ц а 14

Промежуточные расчеты парных коэффициентов корреляции

1

2

3

954,72

-11374,83

2193842,56

563,89

7375,67

-1573836,44

386,39

1344,63

-853548,51

104,72

-6848,83

1176156,22

158,06

-777,63

402118,62

1066,72

10149,10

2227194,09

100,39

6083,57

1251568,36

685,56

-3372,93

5976783,02

786,72

-7350,23

584557,09

63,72

2714,57

1274266,02

883,56

6891,73

2190107,02

134,22

8133,87

1621833,96

1301,39

2967,17

12665324,89

140,72

-2448,57

1002111,09

487,22

-5320,47

766575,96

317,22

723,27

3576794,76

81,56

1516,93

-737979,91

109,72

7307,50

1069045,56

180,56

-888,33

-197137,78

-686,94

9150,10

2035169,09

-80,11

913,27

761440,09

-1429,94

21939,43

-3320167,58

83,89

2063,67

732786,22

892,22

23447,60

-2909929,24

-356,28

38264,23

22377379,69

810,56

-6905,93

873584,36

-558,61

4759,37

1100597,96

Окончание табл. 14

1

2

3

-47,11

1385,07

-598650,31

944,22

890,27

1811989,42

798,39

4858,77

856694,09

Суммы произведений

8877,33

117592,00

58336670,33

7.2. Расчет парных коэффициентов корреляции

; ;

.

8. Вычисление дисперсионного отношения Фишера

.

Сравнение расчетного значения F-критерия с табличным для 5%-го уровня значимости (см. Приложение) позволяет сделать вывод об адекватности построенной модели.

9. Построение с помощью «Пакета анализа» линейного регрессионного уравнения (см. Вывод итогов 4).

ВЫВОД ИТОГОВ 4

Регрессионная статистика

Множественный R

0,8107080

R-квадрат

0,6572475

Нормированный R-квадрат

0,617699

Стандартная ошибка

523,78056

Наблюдения

30

Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

3

13677937

4559312,19

16,618834

3,11E-06

Остаток

26

7132998,1

274346,081

Итого

29

20810935

 

 

 

 

Коэффи-циенты

Стандартная ошибка

t-статис-тика

P-Зна-

чение

Нижние 95%

Верхние 95%

Y-пересечение

7,3681327

219,864

0,033512

0,9735221

-444,57

459,306

Переменная X 1

365,8528

133,786

2,734594

0,0110946

90,8498

640,855

Переменная X 2

40,886834

10,2142

4,002904

0,0004639

19,8910

61,8826

Переменная X 3

0,0963746

0,02780

3,466448

0,0018469

0,03922

0,15352

10. Использование построенной модели в прогнозных целях

у.е.

Решение с помощью системы STATISTICA

  1. Ввод исходных данных (без включения дополнительной переменной).

  2. Вызов модуля «Множественная регрессия» (Статистика / Множественная регрессия, см. рис. 2).

Рис. 2. Меню Статистика

  1. Выбор переменных для анализа (Multiple Linear regressions / Variables / OK / Select dependent and independent variable lists / OK, см. рис. 3).

Рис. 3. Выбор переменных для анализа (dependent var. – зависимая переменная;