Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
o.merenkova834164l.doc
Скачиваний:
65
Добавлен:
20.02.2016
Размер:
1.97 Mб
Скачать

2.9 Етапи дослідження загальної лінійної моделі множинної регресії

Розглядається багатофакторна лінійна регресійна модель

(2.62)

що описує залежність між результативною змінною у та деякими впливовими факторами х1, х2, ..., хm. Інформація про значення у, х1, х2, ..., хm міститься у відповідних статистичних даних – n спостереженнях (вимірюваннях) кожного показника.

Для дослідження зазначеної моделі слід виконати такі кроки.

1. За даними спостережень оцінити параметри α1, α2, ..., αm.

2. Для перевірки адекватності отриманої моделі обчислити:

а) залишки моделі – розбіжності між спостереженими та розрахунковими значеннями залежної змінної

б) відносну похибку залишків та її середнє значення;

в) залишкову дисперсію;

г) коефіцієнт детермінації;

д) вибірковий коефіцієнт множинної кореляції.

3. Перевірити статистичну значущість отриманих результатів:

а) перевірити адекватність моделі загалом: за допомогою F-критерію Фішера перевірити гіпотезу

(2.63)

проти альтернативної HA: існує хоча б один коефіцієнт аj0;

б) перевірити значущість коефіцієнта множинної кореляції, тобто розглянути гіпотезу H0 : R = 0;

в) перевірити істотність кожного коефіцієнта регресії: за допомогою t-критерію Стьюдента перевірити гіпотезу

(2.64)

проти відповідних альтернативних гіпотез

(2.65)

г) оцінити вплив кожного регресора на якість моделі, тобто обчислити часткові коефіцієнти детермінації ΔRj2, скоригувати їх за Тейлом і за Амемією та дати їх відповідну інтерпретацію;

д) оцінити вплив окремих груп регресорів на змінювання регресанда, застосувавши F-критерій Фішера.

4. Обчислити та інтерпретувати коефіцієнти еластичності.

5. Визначити довірчі інтервали регресії при рівні значущості .

6. Побудувати довірчі інтервали для параметрів регресії.

7. Обчислити прогнозні значення yр за значеннями x1p, x2p, …, xmp, що перебувають за межами базового періоду, і знайти межі довірчих інтервалів індивідуальних прогнозованих значень і межі довірчих інтервалів середнього прогнозу.

Розглянемо етапи побудови та аналізу економетричних моделей на прикладі:

Практичне завдання 1

Дано:

Статистичні дані - показники депозитів домашніх господарств Х(i) за місяцями 2007 – 2008 р.р. в залежності від строку (табл. 2.5):

–іпотечні кредити строком до 1 року;

–іпотечні кредити строком від 1 року до 5 років;

–іпотечні кредити на придбання, будівництво та реконструкцію нерухомості;

–усього іпотечні кредити.

Знайти:

  1. Обрати форму багатофакторної моделі.

  2. Оцінити усі параметри моделі.

  3. Визначити зони надійності при рівні значущості а=95.

  4. Оцінити коефіцієнти детермінації, автокореляції і перевірити показники на мультіколінеарність між факторами.

Таблиця 2.5.

Кредити, надані домашнім господарствам, за цільовим спрямуванням і строками погашення за місяцями 2007-2008р.Р. (залишки коштів на кінець періоду, млн.Грн.)

Період

Усього

Кредити на поточні потреби

Іпотечні кредити

Інші кредити

усього

у тому числі за строками

усього

у тому числі за строками

з них на придбання, будівництво та реконструкцію нерухомості

у тому числі за строками

усього

у тому числі за строками

до 1 року

від 1 року до 5 років1

більше 5 років

до 1 року

від 1 року до 5 років1

більше 5 років

до 1 року

від 1 року до 5 років1

від 5 року до 10 років

більше 10 років

до 1 року

від 1 року до 5 років1

більше 5 років

2007

січень

83 489

56 789

12 626

44 162

21 105

325

20 780

20 988

323

20 666

5 596

195

5 401

лютий

87 181

59 633

12 887

29 496

17 251

25 744

376

2 360

23 008

21 586

342

1 985

4 728

14 532

1 803

183

719

901

березень

93 262

63 695

13 503

30 522

19 670

27 607

433

4 524

22 650

23 172

392

2 967

4 872

14 941

1 960

217

831

913

квітень

99 339

67 736

14 058

31 661

22 017

29 625

466

3 539

25 619

24 759

423

3 031

5 161

16 144

1 978

213

740

1 025

травень

105 060

71 694

14 714

32 663

24 317

31 222

494

3 731

26 997

26 047

447

3 198

5 434

16 967

2 145

186

826

1 133

червень

111 819

76 293

15 097

34 091

27 105

33 205

524

3 766

28 916

27 754

479

3 212

5 913

18 150

2 321

208

864

1 249

липень

120 244

82 655

17 084

35 763

29 809

35 049

547

3 950

30 553

29 437

487

3 397

6 196

19 357

2 539

190

941

1 408

серпень

127 244

87 501

17 539

37 425

32 536

36 916

519

4 142

32 254

31 229

488

3 522

6 461

20 758

2 827

332

983

1 512

вересень

134 011

92 189

17 891

38 575

35 724

38 887

540

4 223

34 124

33 118

504

3 577

6 724

22 314

2 934

292

1 036

1 606

жовтень

141 712

97 513

18 684

40 444

38 385

41 077

547

4 409

36 121

35 352

510

3 735

7 007

24 100

3 123

282

1 066

1 775

листопад

150 108

103 171

19 435

42 008

41 729

43 586

538

4 501

38 547

37 821

499

3 749

7 425

26 149

3 351

235

1 128

1 988

грудень

160 386

110 121

19 990

44 593

45 538

46 626

534

4 568

41 523

40 826

503

3 828

7 875

28 619

3 640

208

1 272

2 160

2008

січень

164 775

113 355

20 884

45 332

47 138

47 445

573

4 526

42 345

41 889

524

3 808

8 034

29 523

3 976

206

1 324

2 446

лютий

174 234

120 350

22 773

47 056

50 521

50 103

685

4 618

44 800

44 221

605

3 862

8 328

31 426

3 782

155

1 309

2 317

березень

183 580

126 593

23 757

48 914

53 922

53 023

825

4 785

47 413

47 173

746

4 013

8 785

33 630

3 964

137

1 390

2 438

квітень

191 899

132 109

24 826

50 123

57 160

55 294

833

4 775

49 686

49 894

738

3 952

9 284

35 920

4 497

139

1 409

2 949

травень

193 546

133 933

25 894

50 077

57 962

55 157

845

4 615

49 698

50 011

749

3 791

9 120

36 352

4 455

148

1 377

2 930

червень

198 650

137 291

25 429

51 063

60 800

56 746

841

4 581

51 323

51 658

763

3 779

9 376

37 739

4 613

149

1 401

3 063

Хід виконання:

  1. Вивчення зв'язку між трьома і більше зв'язаними між собою ознаками носить назву множинної (багатофакторної) регресії.

У нашому випадку залежна змінна – усього іпотечні кредити (тис.грн), позначимо .

Пояснюючі змінні:

–іпотечні кредити строком до 1 року;

–іпотечні кредити строком від 1 року до 5 років;

–іпотечні кредити на придбання, будівництво та реконструкцію нерухомості;

Число спостережень n=9.

Вимагається побудувати статистичну модель, що виражає залежність результативної ознаки від чотирьох пояснюючих змінних – факторів і проаналізувати побудовану модель.

Загальна множинна лінійна регресійна модель може бути записана у вигляді:

(2.66)

де – незалежні змінні (фактори);

–параметри моделі;

ɛ – чисто випадкова величина.

У нашому випадку маємо модель множинної регресії з 3 факторами:

(2.67)

Багатофакторна модель (2.67) може бути записана у вигляді:

(2.68)

де

– векторний стовпець розмірності;

– вектор-стовбець розмірності невідомих параметрів рівняння;

Х – матриця спостережень розмірності ;

Е – вектор – стовпець розмірності випадкових величин – помилок.

Вектор невідомих параметрів ми знаходимо методом найменших квадратів (МНК), мінімізуючи суму квадратів залишків:

(2.69)

Після знаходження часних похідних і прирівнявши їх до нуля, після відповідних перетворень ми одержимо систему з (р+1) невідомим:

(2.70)

У нашому випадку ми маємо:

(2.71)

У матричному вигляді (т.к.р.=3, n=9):

(2.72)

У скороченому вигляді можна записати:

(2.73)

Звідси одержуємо рівняння для знаходження невідомих параметрів в матричному вигляді:

(2.74)

де

З таблиці 1 одержуємо, що

Значення для матриць беремо з таблиці 1 з рядка «РАЗОМ» і стовпців, а також стовпців, враховуючи, що n=9.

Потім знаходимо зворотну матрицю і множимо її на матрицю .

В результаті одержуємо вектор-стовпець із знайденими параметрами регресійної моделі:

Тепер можемо записати лінійну модель множинної регресії:

.

  1. Коефіцієнт детермінації – так називають квадрат R – коефіцієнта множинної кореляції. Його шукаємо по формулі:

(2.75)

Використовуючи таблицю 1 рядок «РАЗОМ» стовпців і, знаходимо, значить, рівняння регресії достовірне. Коефіцієнт детермінації показує, що 99,95% варіації залежної ознаки (Y) пояснюється включеними в модель факторами.

R=0,99 – чим ближче до 1 коефіцієнт множинної кореляції, тим більше сильний зв'язок між Y і безліччю Х.

Для подальших розрахунків скористаємося таблицею:

Таблиця 2.6

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]