Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Navch._posibnuk_Ivaschyk

.pdf
Скачиваний:
106
Добавлен:
12.02.2016
Размер:
4.89 Mб
Скачать

Отримане значення коефіцієнта кореляції вказує на ступінь тісноти зв’язку між вибраними факторами у вигляді прямолінійної залежності.

Значення коефіцієнта детермінації показує, що 86,26 % варіація прибутку підприємств регіону пояснюється за рахунок варіації основних фондів. На долю неврахованих та випадкових факторів припадає лише 13,74 %.

7.Знаходження довірчих інтервалів для оцінок.

Знаходження довірчих інтервалів для оцінок а та b почнемо із обчислення граничних похибок оцінок:

a = σatp , b = σbtp ,

де σ2a ,σb2 – відповідно дисперсії для оцінок а та b, які в свою чергу обчислюються за формулами:

 

 

n

 

 

σ2

=

xi2σнепоясн2 .

=

i=1

 

n

2

a

 

 

 

 

n(xi x )

 

 

i=1

181,51 0,2577

= 0.3716,σa =

0,3716 = 0,6096.

10 12,589

 

 

Далі знайдемо

σв2 =

 

σнепоясн2

=

 

0,2577

= 0,0205;σи =

0,1432,

10

 

12,589

 

(xi x )2

 

 

 

 

i=1

a = σa tp = 0.6096 1,65 =1,0058 ,

 

 

 

 

b = σb tp

= 0.1432 1,65 = 0,236 .

 

Отже, нами отримано такі інтервали довіри для оцінки α:

α[a a ;a + a ],

α[1,8989 1,0058;1,8989 +1,0058],

α[2,9047;0,8931],

для оцінки β:

β [b

b ;b +

b ],

]

 

[

0,1432;1,2114 + 0,1432

,

β 1,2114

 

1,0632 ≤ β ≤1,3546.

8. Перевірка нульових гіпотез відносно коефіцієнта кореляції та кутового коефіцієнта.

Знайдений коефіцієнт кореляції є випадковою величиною. Виконаємо для нього перевірку нульової гіпотези, відповідно до неї

461

коефіцієнт кореляції у генеральній сукупності дорівнює нулю. Тобто відсутній кореляційний зв’язок між у і х у генеральній сукупності. Нам необхідно дослідити сумісність коефіцієнта кореляції r із нашої вибірки з нульовою гіпотезою.

Отже, маємо: нульова гіпотеза Но:rген = 0, альтернативна гіпотеза

Н1:rген 0.

Далі для заданої вибірки з k=n–2 ступенями вільності обчислимо значення статистики для критерію Стьюдента:

tемп =

r n 2

=

0,9286 10 2

= 7,1691.

 

10,8626

 

1r2

 

Для заданої ймовірності, наприклад, Р=0,95 і k ступенів вільності знаходимо табличне значення tkp = 2.306.

Якщо tемп tkp , то із надійністю Р=0,95 гіпотезу Но необхідно

відкинути і прийняти альтернативну гіпотезу Н1 про існування залежності між цими випадковими величинами. Оскільки в нашому прикладі tемп tkp ,тому нульова гіпотеза відхиляється і приймається

альтернативна. Отже, у 95 % вибірок із генеральної сукупності коефіцієнт кореляції не дорівнює нулю.

Далі виконаємо перевірку нульової гіпотези відносно оцінки b, Но: b=0, проти альтернативної Н1: b 0. Для цього знаходимо емпіричне значення за формулою:

t

емп

=

 

b

 

=

1,2114

= 8,4595 .

 

 

 

σв

 

0,1432

 

 

 

 

Оскільки емпіричне значення t більше критичного (tемп > tкр), тому нульова гіпотеза відхиляється і робиться висновок, що кутовий коефіцієнт b розрахований за окресленою вибіркою вважається статистично значущим з ймовірністю Р =0,95.

9. Перевірка адекватності побудованої економетричної моделі. Для оцінки рівня адекватності побудованої економетричної моделі експериментальним даним використовуємо критерій Фішера

F, основу якого складає формула:

F =

 

 

r2

 

n m 1

=

0,8626

 

10

1

1

= 50,2242 .

 

 

 

 

 

 

 

 

 

 

 

 

 

1

r2

m

1

0,8626

 

 

1

 

 

 

 

 

 

 

 

 

 

 

Отже, Fрозр. = 50,2242.

Знайдемо табличне значення даного кретерію (F табл.), для рівня надійності Р=0,95 та числа ступенів вільності:

462

k1=m=1, k2=nm–1==10–1–1=8, F табл. = 5,32,

F розр. > F табл.

Оскільки F табл. > F розр., то отриману економетричну модель

ˆy = −1,8989 +1,2114x

з надійністю P=0,95 можна вважати адекватною експериментальним даним і на її основі доцільно проводити всебічний економетричний аналіз.

Цю задачу можна розв’язати з допомогою системи STADIA, використавши при цьому процедуру «Простая регрессия» блоку «Регрессионный анализ» [24].

15.10. Питання для самоконтролю

1.

Дайте тлумачення регресії та її класифікація.

 

 

 

2.

У чому сутність моделі простої лінійної регресії?

 

 

3.

Опишіть основні причини існування збурення.

 

 

 

4.

Дайте тлумачення діаграми розсіювання та її основні форми.

5.

Охарактеризуйте параметри оціночної функції лінійної

 

регресії.

 

 

 

 

 

 

 

 

6.

Опишіть алгоритм методу найменших квадратів.

 

 

 

7.

Побудувати економетричну модель впливу ставки податку на

 

кількість підприємств, які будуть функціонувати в

 

окресленому регіоні при діючій системі оподаткування.

 

Статистичні дані для розрахунків наведено у наступній

 

таблиці:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Кількість підприємств

94

82

70

69

 

52

44

 

Ставка податку

10

16

22

25

 

30

34

 

8.

Дайте економічну інтерпретацію одержаних результатів.

9.

Опишіть методи знаходження оціночних параметрів рівняння

 

регресії.

 

 

 

 

 

 

 

 

10.Дайте визначення коефіцієнта коваріації.

11.Сформулюйте основні властивості простої лінійної регресії.

12.Дайте тлумачення коефіцієнта кореляції та детермінації. Покажіть зв’язки між ними.

463

13.

Що таке загальна, пояснювальна та непояснювальна

 

 

дисперсії?

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

14.

Опишіть умови Гаусса-Маркова для випадкової змінної.

15.

Назвіть та охарактеризуйте основні властивості оцінок

 

 

параметрів регресії.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

16.

Сформулюйте теорему Гаусса-Маркова.

 

 

 

 

 

 

 

 

 

17.

Дайте визначення нульової та альтернативної гіпотез.

 

 

 

18.

Дайте тлумачення ступенів вільності.

 

 

 

 

 

 

 

 

 

 

 

 

 

19.

Що таке надійність оцінки і як вона визначається?

 

 

 

20.

Як визначаються довірчі інтервали оціночного параметра?

21.

Назвіть дефініцію критерію Фішера, запишіть формулу його

 

 

знаходження.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

22.

Дайте визначення критерію Стьюдента та запишіть формулу

 

 

його знаходження.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

23.

Опишіть критерій перевірки якості лінійної економетричної

 

 

моделі.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

24.

Дайте тлумачення нелінійної регресії та назвіть її основні

 

 

види.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

25.

Охарактеризуйте основні класи нелінійних регресій.

 

 

 

26.

Опишіть етапи використання тесту Бокса-Кокса для

 

 

перевірки альтернативних моделей і вибору виду функції.

27.

Опишіть алгоритм побудови економетричної моделі та

 

 

оцінку її достовірності.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

28.

Побудуйте економетричну модель залежності прибутку

 

 

підприємства від вартості основних виробничих фондів та

 

 

виконайте оцінку достовірності і адекватності оціночних

 

 

параметрів моделі. Звітні дані наведені у таблиці:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Прибуток, млн. грн.

20,5

 

20,4

 

 

35,3

 

 

38,2

 

 

43,1

 

 

Вартість основних виробничих

36.1

 

42,5

 

 

44,5

 

 

50,2

 

 

57.3

 

 

 

Фондів, млн. грн.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

29. Побудуйте економетричну

модель

залежності податкових

 

 

надходжень до бюджету регіону від рівня ставок податку та

 

 

наведіть оцінку параметрів моделі для даних:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Надходження до бюджету, млн. грн.

35

 

60

 

82

 

90

 

75

 

 

54

 

 

 

Ставка податку

 

10

 

25

 

30

 

45

 

52

 

 

65

 

 

464

Розділ 16. Моделі множинної регресії та їх економетричний аналіз

16.1. Класична лінійна багатофакторна модель

Більшість економічних показників формується під впливом багатьох різноманітних факторів. Їх виявлення та оцінювання ступеня цього впливу складає основу множинного регресійного аналізу.

Розглянемо схематичну інтерпретацію багатофакторної моделі економічної системи з вхідними факторами та вихідними показниками:

В

х1

Економічна

 

y1

В

х

.

 

.

и

і

.

система

 

.

х

д

.

 

 

.

і

 

xm

 

 

yn

д

Припустимо, що деяка змінна y залежить від множини

незалежних

змінних

x1 , x2 ,, xn . Тоді

у випадку лінійної форми

взаємозв’язку економетрична модель матиме вид:

y = b0 +b1 x1

+…+bm xm +u ,

(16.1)

де y – залежна змінна; x1 ,, xm

незалежні змінні;

b0 ,b1 ,,bm

параметри моделі, для яких потрібно буде знайти оцінки; u – збурення або залишок.

Тоді оціночне рівняння для окресленої моделі буде:

 

 

 

ˆ =

a0

+

a1x1

+

+

am xm ,

(16.2)

 

 

 

y

 

 

 

 

де {aj , j =

 

 

} – оцінки невідомих параметрів {b j

, j =

 

}.

0;m

0; m

Нехай задано сукупність спостережень за залежною змінною

y = {yi , i =1; n

}і незалежною змінною x j

= {xij , i =

 

}, j =1; m .

1; n

Як і у випадку парного регресійного аналізу, коефіцієнти регресії повинні розглядатися як випадкові змінні, випадковість компонентів яких зумовлена наявністю в моделях випадкового члена. Кожний коефіцієнт регресії обчислюється як функція значень y та незалежних змінних у вибірці, а y в свою чергу визначається незалежними змінними і вільним членом. Далі виберемо значення коефіцієнтів регресії таким чином, щоб сума квадратів відхилень

465

фактичних даних від теоретичних була мінімальною. Цю вимогу можна представити таким чином:

 

 

n

ˆ

2 =

n

 

 

 

F (a0 , a1,, am )

=

(yi

2

min ,

(16.3)

 

yi )

 

ei

 

 

 

i=1

 

 

i=1

 

 

 

де ei є оцінкою для ui та залишком в i-спостереженні, тобто різниця між фактичним значенням у спостереженні та розрахованим значенням ˆy за рівнянням (16.2).

Таким чином, наша задача зводиться до мінімізації функції (16.3). Необхідною умовою цього є перетворення в нуль перших частинних похідних цієї функції стосовно кожної змінної

{a j , j =1; m}.

Оскільки

F(a

n

a0 a1 xi1 a2 xi 2 −…− am xim )2 ,

0 ,a1 ,,am )= (yi

 

i=1

 

то отримаємо таку систему нормальних рівнянь:

 

F

 

n

 

 

 

 

= −2(yi a0 a1xi1 −…− am xim )= 0,

a0

 

 

i=1

 

F

 

 

n

 

 

= −2(yi a0 a1xi1 −…− am xim )xi1 = 0,

a

 

=

1

 

 

i 1

 

F

 

 

 

 

n

 

 

 

 

= −2(yi a0 a1xi1 −…− am xim )xim = 0.

am

 

 

 

i=1

(16.4)

(16.5)

Після виконання відповідних перетворень (16.5) матиме вигляд:

 

 

n

 

n

n

n

 

 

 

 

 

na0 + a1 xi1

+ a2

xi2 ++ am xim =

yi ,

 

 

 

 

 

 

 

i=1

 

i=1

i=1

i=1

 

 

 

 

 

n

n

 

n

n

 

n

 

 

 

 

 

2

 

 

 

 

 

a0

xi1

+ a1 xi1

+ a2 xi2 xi1

++ am xim xi1 = yi xi1,

(16.6)

 

i=1

i=1

i=1

i=1

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

n

n

 

n

n

 

 

 

 

a0 xim

+ a1 xi1xim + a2 xi2 xim ++ am xim2

= yi xim .

 

 

 

 

i=1

i=1

i=1

 

i=1

i=1

 

 

 

 

Розв’язавши систему рівнянь (16.6), отримаємо множину оцінок

{bj , j = 0; m}

для

відповідних

параметрів регресії

{βj ; j =

 

}.

0; m

Побудуємо систему (16.6) для випадку m=2, тобто знайдемо ефект впливу двох факторів x1 i x2 на y.

466

Отримаємо:

 

 

 

n

n

n

 

 

 

 

 

na0 + a1 xi1 + a2

xi2

= yi ,

 

 

 

 

 

 

i=1

i=1

i=1

 

 

 

 

 

n

n

n

 

 

n

 

 

 

 

 

 

 

a0

xi1

+ a1 xi21

+ a2 xi1xi2

=

yi xi1, .

(16.7)

 

 

i=1

i=1

i=1

 

i=1

 

 

 

n

n

 

n

 

n

 

 

a0

xi2

+ a1 xi1xi 2 + a2 xi22

=

yi xi2 .

 

 

 

i=1

i=1

 

i=1

 

i=1

 

Таким чином, нами отримано систему рівнянь (16.7) з трьома

невідомими величинами: a0 , a1 , a2 . З першого рівняння маємо:

 

 

 

a0

= y a1x1 a2 x2 .

 

 

 

(16.8)

Використовуючи останній вираз і два інших рівняння, після

відповідних перетворень, знайдемо значення a1:

 

a1 =

cov(x1 , y)var(x2 )cov(x2 , y)cov(x1 , x2 )

.

(16.9)

 

 

var(x1 )var(x2 ){cov(x1 , x2 )}2

 

 

 

Аналогічно можна знайти значення для a2, зробивши перестановку x1 i x2 у виразі (16.9).

Властивості методу найменших квадратів. Властивості МНК для випадку множинної регресії збігаються з його властивостями для парної регресії.

1. Багатофакторна регресійна модель правильна для середніх точок y, x1 , x2 ,, xm .

Тобто для моделі

yi = a0 + a1 x1i +…+ am x1m +ei

має місце a0 = y a1 x1 −…−am xm .

2. Середнє значення оцінки дорівнює середньому значенню фактичних даних: yˆ = y .

n

3. Сума помилок дорівнює нулю: ei = e = 0 .

i=1

4. Помилки ei некорельовані з x1i , x2i ,, xmi , тобто має місце:

n

x1i

n

x2i

ei

= ei

i=1

 

i=1

 

n

=…= ei xmi = 0 .

i=1

5. Помилки ei некорельовані з yˆi , тобто має місце:

n

ei yˆi = 0 .

i=1

467

6. Якщо правильні припущення класичної лінійної регресійної моделі, то МНК – оцінки є не тільки лінійними, без відхилень оцінками, але мають найменшу дисперсію.

Вираження для a1 , a2 ,, am стає досить складним, тому

доцільно це зробити з допомогою матричної алгебри.

Розглянемо узагальнення моделі множинної регресії для m пояснювальних змінних з допомогою математичного апарату матричної алгебри.

Припустимо, що економетрична модель (16.1) у матричній формі має вигляд:

 

Y = XB +U ,

(16.10)

де Y – вектор значень залежної

змінної; X – матриця значень

незалежних змінних

(n×m); B

вектор

параметрів моделі; U

вектор залишків моделі.

Для постійної величини a0 в (16.2) введемо фіктивну змінну x0 =1. Тоді (16.2) набуде вигляду:

ˆ

=

a0 x0

+

a1x1

+

+

am xm .

(16.11)

y

 

 

 

 

Результати досліджень {y1 , y2 ,, yn } запишемо за допомогою

вектора-стовпця Y, значення змінних {x0 , x1 ,, xm } у вигляді матриці

X розмірності n ×(m +1), а

решту

складових у вигляді

вектор-

стовпців:

 

y

 

 

x

x

x

 

1

x

 

1

 

 

10

11

1m

 

 

11

Y

= y2

 

; X

= x20

x21

x2m

= 1

x21

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xn1

 

 

 

xn1

 

yn

 

 

xn0

xnm

1

x1m

x2m ; A

xnm

a0a1 = ˆa2 ;Y

am

 

ˆy1

 

e1

 

 

 

ˆy

 

 

e

 

,

=

 

2

 

;e = 2

 

 

 

 

 

 

 

 

 

ˆyn

 

 

 

 

 

 

en

 

 

де вектори A та e є операторами оцінювання відповідно векторів B i U. Отже, економетрична модель у матричній формі матиме вигляд:

 

 

 

Y = XA + e .

 

(16.12)

Для знаходження оцінок параметрів використаємо МНК.

 

Рівняння (16.12) представимо у вигляді:

e =Y XA. Далі

запишемо суму квадратів залишків таким чином:

 

 

 

n

 

ˆ

ˆ

 

 

2

 

 

e(A)= ei

= ee = (Y Y ) (Y Y )=(Y XA) (Y XA)=

(16.13)

 

i=1

 

 

 

 

′ ′

 

 

 

=Y Y 2A X Y + A X XA min,

 

 

 

ˆ =

де символ штрих ( ) означає операцію транспонування; Y X A.

468

Знайдемо частинну похідну окресленого виразу за

компонентами вектора A і прирівняємо до нуля:

 

 

(A)

(16.14)

 

A

 

= −2X Y + 2X XA = 0 .

Звідси, отримаємо систему рівнянь у матричній формі, якій повинен задовольняти вектор A при дотриманні вимоги (16.12):

X XA = X Y . (16.15)

Якщо матриця X X зворотна, тобто існує обернена їй матриця (X X )1 , то отримаємо розв’язком системи нормальних рівнянь вектор-стовпець шуканих оцінок параметрів регресії:

1

(16.16)

A = (X X )

 

X Y .

На відміну від простої моделі регресії алгоритм визначення параметрів багатофакторної моделі є більш складним та трудомістким і містить у собі ряд послідовних етапів:

1. Постановка задачі та апріорне дослідження економічної проблеми.

Відповідно до мети дослідження на основі знань економічної теорії конкретизуються явища, процеси, залежності між якими потрібно оцінити. Тут насамперед необхідно чітко визначити економічні явища, встановити об’єкти та періоди дослідження. На початковому етапі повинні бути сформульовані та економічно обґрунтовані можливі гіпотези про залежність економічних явищ.

2. Формування множини факторів і їх логічний аналіз.

Проводиться ретроспективний аналіз відносно вибору найбільш характерних факторів, під дією яких формуються результативні показники або заданий економічний процес. При визначенні найбільш сприятливого числа змінних в регресійній моделі насамперед орієнтуються на розуміння професійно-теоретичного характеру процесу дослідження.

3. Формування інформаційної бази даних.

Для побудови моделі вхідна інформація може бути сформована

учотирьох видах:

динамічні (часові) ряди;

варіаційні ряди;

просторова інформація, тобто інформація про функціонування декількох об’єктів в одному часовому періоді;

змінна – таблична форма, тобто інформація про роботу декількох об’єктів за різні періоди.

469

Обсяг вибірки залежить від числа факторів, які входять до моделі з урахуванням вільного члена. Так для отримання статистично значимої моделі необхідно, щоб мінімальний обсяг вибірки становив:

nmin = 5(m + k ),

де m – число факторів, які входять до моделі; k – число вільних членів у рівнянні.

4. Специфікація функції регресії.

На цьому етапі дослідження проводиться конкретний опис гіпотези про форму зв’язку (лінійна або нелінійна, проста або множинна і т.д.). З цією метою використовуються різні критерії для перевірки обґрунтованості гіпотетичного виду залежності. Крім цього перевіряються умови кореляційно-регресійного аналізу.

5. Оцінювання параметрів регресійної моделі.

З допомогою відповідного математичного апарату визначаються числові значення параметрів регресії та обчислюється ряд статистичних показників, які характеризують точність регресійного аналізу.

6. Вибір головних факторів.

Окреслений етап є основою для побудови багатофакторної моделі. На цьому етапі формується множина всеможливих факторів. Як результат, така модель містить велике число факторів. Вона, поперше, незручна при проведенні економетричного аналізу, а по-друге, буде нестійкою.

Разом з тим, включення до моделі малого числа факторів приводить до порушення принципу адекватності процесів дослідження, що в свою чергу приводить до помилок при прийнятті рішень. Тому виникає необхідність у раціональному виборі певної кількості найбільш важливих і впливових факторів. При цьому проводиться аналіз факторів на мультиколінеарність.

Процес відбору факторів для моделі містить процедуру, яка складається із таких послідовних кроків:

аналіз факторів на мультиколінеарність та її усунення;

аналіз тісноти взаємозв’язку незалежних факторів із залежною змінною;

аналіз бета-коефіцієнтів;

перевірка коефіцієнтів регресії на статистичну значимість;

аналіз факторів на керованість;

побудова нової регресійної моделі без виключених факторів;

470

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]