Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Елисеева И.И. - Практикум по эконометрике.doc
Скачиваний:
3
Добавлен:
24.12.2019
Размер:
7.87 Mб
Скачать

Оцените значимость уравнений регрессии в целом и их парамет­ров. Сравните полученные результаты, выберите лучшее уравнение регрессии.Раздел

МНОЖЕСТВЕННАЯ РЕГРЕССИЯ

И КОРРЕЛЯЦИЯ

2.1. Методические указания

Множественная регрессия - уравнение связи с несколькими не­зависимыми переменными:

где у - зависимая переменная (результативный признак); xuxj хр - независимые переменные (факторы).

Для построения уравнения множественной регрессии чаще ис­пользуются следующие функции:

  • линейная - у=а 22 + + хр +е;

»

  • степенная - у=а •хftх-...'Хрр е;

a +bi xi +bo-хб +...+6„ JC„ +£

  • экспонента - у = е р р ;

  • гипербола - у = *

а + Ь\ • ху + b2 • х2 +... + bp xp + е

f 1

Можно использовать и другие функции, приводимые к линейно­му виду.

Для оценки параметров уравнения множественной регрессии применяют метод наименьших квадратов (МНК). Для линейных уравнений и нелинейных уравнений, приводимых к линейным, строится следующая система нормальных уравнений, решение кото­рой позволяет получить оценки параметров регрессии:

49

2>*p =а1*Хр+Ь\1,Х1Хр+Ь2Ъх2Хр+... + ЬрЪх2р.

-3272

Для ее решения может быть применён метод определителей:

А а , А &

д=—, bx =—1

- стандартизованные переменные;

А А

*

п

1*1 а

1*2

1Хр

. 1X^X1

где А =

*

Х*2

1*1*2

У.

рх2

- определитель системы;

Ъхр

хр

1x2 хр

... 1хр

Ад, ЛЬ/ ш>р - частные определители; которые получаются путем

соответствующего столбца матрицы определителя системы данными лев системы.

Другой вид уравнения множественной регрессии - уравнение регрессии в стандартизованном масштабе:

У-У

ПРАКТИКУМ ПО ЭКОНОМЕТРИКЕ 1

Г = С+В х, . 14

1. д; = а + £х3+е, 36

+e2. 43

[у\ =Sir*l+8i2-X2, 3

Qf = Pi + № + Рз Yt + Ч (спрос), 19

= а + bi • у,.3 + Ьг • Ум + и„ 45

\ 26

К уравнению множественной регрессии в стандартизованном масштабе применим МНК. Стандартизованные коэффициенты рег­рессии (р-коэффициенты) определяются из следующей системы уравнений:

г

-Pi

+ Р2'*2*1

+ Рз^з*,

+ .

••• Рprx„xJ •

Гул 2

= Pir*2*i

+ P2

+ РЗГ*3*2

+ .

••• + РрГХрХ2,

= Pi'*,*!

+ ^1Гхрхг

+ P3 ГХгХ

+

... + р р.

Связь коэффициентов множественной регрессии со стандарт зованными коэффициентами (3/ описывается соотношением

bt = Р,

Параметр а определяется как a = y-bixl -62*2 ~—~bpxp.Средние коэффициенты эластичности для линейной регрессии рассчитываются по формуле

xi

Э =6 —

y*j J у '

Для расчета частных коэффициентов эластичности применяет ся следующая формула:

X

Э = h 1

^ Vv. Ul

y*i V

S Xj Х\ ,Х2 *ХМ»—»х р

Тесноту совместного влияния факторов на результат оценивает индекс множественной корреляции:

а2

R „ = 11- у«*

ух }х2,...,хр 2 •

° У

Значение индекса множественной корреляции лежит в пределах от 0 до 1 и должно быть больше или равно максимальному парному индексу корреляции:

Ryx ix2^xp ^ ryxt 0'-

Ryxix2 " •

Индекс множественной корреляции для уравнения в стандарти­зованном масштабе можно записать в виде

УХ iX2 Хр

г

При линейной зависимости коэффициент множественной кор­реляции можно определить через матрицу парных коэффициентов корреляции:-f^ V Аги

jij

ух 1*2 »••■' * р

где

1

Тух\

ГУХ2

ТУХр

Лг =

Тух\

1

Гх\Х2

Тх\ хр

ТУХ2

ГХ2Х1

1

Гхг хр

- определитель матрицы

ГУХр

ГХрХ\

ГХрХ2 "

. 1

парных коэффициентов корреляции;

А гп =

1

гх2хх

ТХ\Х2 1

" Гх\Хр ' гхгХр

- определитель матрицы

ТХрХ 1

ТХрХ 2 •

... 1

межфакторной корреляции.

Частные коэффициенты (или индексы) корреляции, измеряющие влияние на у фактора х,- при неизменном уровне других факторов, можно определить по формуле

УХ | X ^ X j >«»X р

ух j х\Х2 ... */-!*/+1 » *р

R

ух\х2 ... ... Хр

или по рекуррентной формуле:

ryxi xlx2 .xp_I ~ гухРХХ2 -Хp_irxtxр хух2 ^х

ryxi 'х\х2 —хр " I 2 2 *

f ~ ryxp'Xix2...xp-i )(1 " }

Частные коэффициенты корреляции изменяются в пределах от -1до1.

Качество построенной модели в целом оценивает коэффициент (индекс) детерминации. Коэффициент множественной детермина­ции рассчитывается как квадрат индекса множественной корреля­ции:

R2

УХ\Х2,.~,Х

рСкорректированный индекс множественной детерминации со­держит поправку на число степеней свободы и рассчитывается по формуле

0»-1)

(п-т -1)

R2 = 1 — (1 -R2)

где п - число наблюдений; т- число факторов.

Значимость уравнения множественной регрессии в целом оцени­вается с помощью F-критерия Фишера:

R2 п-т-1 1-Я2 т'

Частный F-критерий оценивает статистическую значимость присутствия каждого из факторов в уравнении. В общем виде для фактора Xi частный F-критерий определится как

'част*,- I '

ух| •• ***Хр

Оценка значимости коэффициентов чистой регрессии с помо­щью f-критерия Стьюдента сводится к вычислению значения

Ь;

' mbt У '

где т -средняя квадратическая ошибка коэффициента регрессии t„ она

может быть определена по следующей формуле:

а у • J

т^. = 1* il.

' a Jl-R2 -Jn-m-l

р

При построении уравнения множественной регрессии может возникнуть проблема мультиколлинеарности факторов, их тесной линейной связанности.

Считается, что две переменные явно коллинеарны} т.е. находятся между собой в линейной зависимости, если rX(Xj £ 0,7.

\

По величине парных коэффициентов корреляции обнаруживает­ся лишь явная коллинеарность факторов. Наибольшие трудности в использовании аппарата множественной регрессии возникают при наличии мультиколлинеарности факторов. Чем сильнее мультикол- линеарность факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью метода наименьших квадратов.

Для оценки мультиколлинеарности факторов может использо­ваться определитель матрицы парных коэффициентов корреляции между факторами.

Если бы факторы не коррелировали между собой, то матрица парных коэффициентов корреляции между факторами была бы еди­ничной матрицей, поскольку все недиагональные элементы г .

ДCjXj

i Ф xj) были бы равны нулю. Так, для включающего три объясняю­щих переменных уравнения

y = a + biXi + Ъ2х2 + 63X3 + £

матрица коэффициентов корреляции между факторами имела бы определитель, равный 1:

гх}хг

гх2хх

гхгх\

гх}х2

Тх2хг

тхъх2

гх{х3

тх2хг

г*з*з

Det R

1 О О

О 1 о

О 0 1

=1,

так как л, м - rX2X% ~ -1 и гХ]Х2 - гХхХъ - гХгХъ - 0.

Если же, наоборот, между факторами существует полная линей ная зависимость и все коэффициенты корреляции равны 1, то опре делитель такой матрицы равен 0

:

Det Д =

= 0.

1 1 1 1 1 1 1 1 i

Чем ближе к 0 определитель матрицы межфакторной корреля ции, тем сильнее мультиколлинеарность факторов и ненадежнее ре зультаты множественной регрессии. И наоборот, чем ближе к 1 оп ределитель матрицы межфакторной корреляции, тем меньше муль тиколлинеарность факторов.

Проверка мультиколлинеарности факторов может быть проведе­на методом испытания гипотезы о независимости переменных

#О : DetlR\ = 1. Доказано, что величина (2 • т + 5)lg DetR

имеет приближенное распределение х2 с - л (л-1) степенями

свободы. Если фактическое значение х превосходит табличное (критическое) Хфакг > Хтабл(#а)> то гипотеза Н0 отклоняется. Это

означает, что Det|/?| Ф1, недиагональные ненулевые коэффициенты

корреляции указывают на коллинеарность факторов. Мультиколли- неарность считается доказанной.

Для применения МНК требуется, чтобы дисперсия остатков бы­ла гомоскедастичной. Это значит, что для каждого значения фактора xj остатки Е/ имеют одинаковую дисперсию. Если это условие не со­блюдается, то имеет место гетероскедастичность.

При нарушении гомоскедастичности мы имеем неравенства

в

d2,

Z( Ej J

При малом объеме выборки для оценки гетероскедастичности может использоваться метод Гольдфельда - Квандта. Основная идея теста Гольдфельда - Квандта состоит в следующем:

  1. упорядочение п наблюдений по мере возрастания переменной х;

  2. исключение из рассмотрения С центральных наблюдений; при этом (л-С):2>/?, где р - число оцениваемых параметров;

  3. разделение совокупности из (п - С) наблюдений на две группы (соответственно с малыми и с большими значениями фактора jc) и определение по каждой из групп уравнений регрессии;

  4. определение остаточной суммы квадратов для первой (Si) и вто­рой (5г) групп и нахождение их отношения: R-S\\ S2.

При выполнении нулевой гипотезы о гомоскедастичности отно­шение R будет удовлетворять F-критерию со степенями свободы ({п - С - 2р) : 2) для каждой остаточной суммы квадратов. Чем больше величина R превышает табличное значение F-критерия, тем более нарушена предпосылка о равенстве дисперсий остаточных величин.

Уравнения множественной регрессии могут включать в качестве независимых переменных качественные признаки (например, про­фессия, пол, образование, климатические условия, отдельные регио­ны и т.д.). Чтобы ввести такие переменные в регрессионную модель, их необходимо упорядочить и присвоить им те или иные значения, т.е. качественные переменные преобразовать в количественные

.

Такого вида сконструированные переменные принято в эконометри­ке называть фиктивными переменными. Например, включать в мо­дель фактор «пол» в виде фиктивной переменной можно в следую­щем виде:

f 1 - мужской пол, \0 - женский пол.

Коэффициент регрессии при фиктивной переменной интерпре­тируется как среднее изменение зависимой переменной при перехо­де от одной категории (женский пол) к другой (мужской пол) при неизменных значениях остальных параметров. На основе f-критерия Стьюдента делается вывод о значимости влияния фиктивной пере­менной, существенности расхождения между категориями.