Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконометрика. курс лекций.docx
Скачиваний:
8
Добавлен:
20.09.2019
Размер:
149.61 Кб
Скачать

1.6.3. Перевірка значущості регресії

Значущість регресії означає, що незалежні змінні впливають на залежну змінну. Для простої лінійної регресіі це еквівалентно тому, що коефіцієнт нахилу не дорівнює нулю (тобто коли гіпотеза про рівність β нулю

16

відхиляється) . Якщо b = 0, то = 0. Тому логічно будувати критерій, який грунтується на значенні коефіцієнта детермінації. Дійсно, можна показати, що R2FRRnFn=−−−2212112~, (1.23)

коли β = 0, де через F1,n–2 позначено розподіл Фішера з 1, n–2 ступенями свободи. За вибраним рівнем значущості α в таблиці розподілу Фішера з 1, n-2 ступенями свободи знаходимо критичне значення F кр. Якщо |F|<Fкр, то гіпотеза приймається. Якщо |F|≥Fкр, то гіпотеза відхиляється. У випадку простої регресії застосування F-критерія (1.23) не дає нової інформації порівняно з t-критерієм (1.20), оскільки tF22=і . Але це не так у випадку множинної регресії, що ми побачимо пізніше. tFкр2кр2=

1.7. Прогнозування за допомогою простої лінійної регресії

Припустимо, ми хочемо одержати інформацію про можливі значення залежної змінної y0 за умови, що незалежна змінна x приймає деяке значення x0. Внаслідок (1.1) yx00=++0αβε. Точковий прогноз знаходиться за формулою

$yabx0 0 =+ (1.24).

Оскільки Ea = α і Eb = β, тоEEE$()yabxx000 y0 =+=+=αβ. Отже, прогноз (1.24) є незміщеним. Дисперсія прогнозу (1.24) дорівнює D$y0 D$()ynxxSxx020211=++−⎡⎣⎢⎤⎦⎥σ (1.25).

Для того, щоб (1.25) можна було б використовувати для інтервального оцінювання залишилось замінити дисперсію збурень на її оцінку. Позначимо SE($)$()ynxxSxx020211=++−⎡⎣⎢⎤⎦⎥σ– (1.26)

стандартна похибка прогнозу. Інтервальний прогноз з рівнем довіри

1-α знаходиться за наступною формулою:

($..($);$..($))yytyyt0000−⋅+⋅seseкркр,

17

де – точковий прогноз (1.24), а значення t$y0кр знаходиться за вибраним α в таблиці розподілу Стьюдента з n-2 ступенями свободи.

1.8.Приклад

В Таблиці 1.1. наведено обсяги сукупного доходу у розпорядженні та сукупного споживання для США у постійних доларах 1972 р. Дані з Таблиці 1.1. зображено графічно на на Рис.1.3. З графіка видно, що точки, які відповідають спостереженням, розташовані навколо деякої прямої, отже доцільно розглянути лінійну функцію споживання. Оцінимо її за допомогою моделі простої лінійної регресії:

yi = α + βxi + εi ,i=110,, (1.27)

де через xi та yi позначено відповідно рівень доходу і споживання в році 1969 + i (наприклад i = 5 відповідає 1974 року). Спочатку обчислимо

Таблиця 1.1.

Рік

Доход у розпорядженні

Особисте споживання

1970

751,6

672,1

1971

779,2

696,8

1972

810,3

737,1

1973

864,7

767,9

1974

857,5

762,8

1975

874,9

779,4

1976

906,8

823,1

1977

942,9

864,3

1978

988,8

903,2

1979

1015,7

927,6

18

8008509009501000Доход700750800850900Споживання

Рис. 1.3. x=(751,6+779,2+810,3+864,7+857,5+874,9+906,8+942,9+988,8+1015,7)/10 =

= 879,24; y=(672,1+696,8+737,1+767,9+762,8+779,4+823,1+864,3+903,2+927,6)/10 =

= 793,43;

Sxx = ((751,6 – 879,24)2 + (779,2 – 879,24)2 + (810,3 – 879,24)2 +

+ (864,7 – 879,24)2 + (857,5 – 879,24)2 + (874,9 – 879,24)2 +

+ (906,8 – 879,24)2 + (942,9 – 879,24)2 + (988,8 – 879,24)2 +

+ (1015,7879,24)2 )/9 = 67192,4;

Syy = ((672,1 – 793,43)2 + (696,8 – 793,43)2 + (737,1 – 793,43)2 +

+ (767,9 – 793,43)2 + (762,8 – 793,43)2 + (779,4 – 793,43)2 +

+ (823,1 – 793,43)2 + (864,3 – 793,43)2 + (903,2 – 793,43)2 +

+ (927,6 – 793,43)2 )/9 = 64972,1;

Sxy = ((751,6 – 879,24) (672,1 – 793,43) + (779,2 – 879,24) (696,8 – 793,43) +

+ (810,3 – 879,24) (737,1 – 793,43) + (864,7 – 879,24) (767,9 – 793,43) +

+ (857,5 – 879,24) (762,8 – 793,43) + (874,9 – 879,24) (779,4 – 793,43) +

+ (906,8 – 879,24) (823,1 – 793,43) + (942,9 – 879,24) (864,3 – 793,43) +

+(988,8 – 879,24) (903,2 – 793,43) + (1015,7879,24) (927,6 – 793,43) )/9 =

= 65799,3.

За формулами (1.7) знаходими оцінки методу найменших квадратів коефіцієнгів моделі (1.27):

19

bSSaybx,xyxx====−=−×65799,367192,40,979;0,979879,24=-67,58.79343

Отже, рівняння вибіркової регресійної прямої (рівняння фунцції споживання) має вигляд:

$y= – 67,58 + 0.979x. (1.28) 8008509009501000Доход700750800850900Споживання

Рис 1.4

Графік цієї прямої зображено на Рис. 1.4. разом з фактичними даними.

Щоб мати уявлення про тісноту зв’язку між доходом і споживанням, обчислимо коефі-цієнт детемінації.

За формулою (1.17а) маємо:

R 2 = bSxy/Syy =

= 0.979×65799,3/64972,1 = 0.990702.

Як ми бачимо, зв’язок між споживанням і доходом є вельми тісним. Перед тим, як використовувати рівняння (1.28) для економічного аналізу або побудови прогнозів, модель (1.27) потрібно перевірити на адекватність. Перевіримо гіпотезу про значущість регресії двома способами. Спочатку використаємо F-статистику (1.23): FRRn=−−=−=221121180.9907020.990702959,917.

Нехай, рівень значущості α дорівнює 0,05. В Таблиці 3. Додатку знаходимо, що критичне значення F кр = 5,32. Ми бачимо, що |F|≥Fкр, отже гіпотеза про рівність β нулю відхиляється, тим самим модель (1.27) є значущою.

Обчислимо стандартні похибки оцінок. Спочатку знайдемо суму квадратів залишків RSS. За формулою (1.15)

RSS = Syy b2Sxx = 64972,1 – 0.9792×67192,4 = 537,0.

Далі знаходимо оцінку дисперсії збурень

20

$σ22=−==RSSn537,0867,13.

Стандартна похибка b дорювнює:

SE(b) = $

σ2Sxx==67,13/67192,40.0316071.

Перевіримо гіпотезу про те, що коефіцієнт нахилу регресійної прямої β дорівнює нулю за допомогою t-статистики (1.20): tbb===SE() 0.9790.031607130.9825.

Нехай, рівень значущості α дорівнює 0,05. В Таблиці 1. Додатку знаходимо, що критичне значення tкр = 2,306. Ми бачимо, що |t|≥tкр, отже гіпотеза відхиляється.

Отже, ми можемо вважати модель адекватною (читач не повинен забувати, що повна перевірка моделі на адекватність включає аналіз залишків, з елементами якого ми ознайомимось в розділах 3 та 4).

З теорії споживання відомо, що коефіцієнт нахилу лінійної функції споживання є маргінальною або граничною схильністю до споживоння. Таким чином, ми встановили, що в середньому 0.979×100 = 97,9% прирісту доходу витрачається на споживання1). Обчислене значення граничної схильності до споживання знаходиться в інтервалі (0; 1), що узгоджується з економічною теорією.

1) Слід зазначити, що лінійні функції споживання у вигляді (1.27) не розглядаються в серйозних дослідженнях починаючи з 50-х років, тому наведені результати мають лише учбове значення.

21

РОЗДІЛ 2. МНОЖИННА ЛІНІЙНА РЕГРЕСІЯ